mercoledì 4 dicembre 2013

SCALE - OUT NAS: ISILON porta lo storage nel futuro (parte 1)


Scale-Out non è solo un termine di marketing, sebbene sia usato spesso impropriamente. La “scalabilità orizzontale” indica la capacità di un sistema storage di far crescere in maniera lineare e organica tutte le proprie componenti: la capacità, le risorse computazionali, i collegamenti di front-end, senza far aumentare contestualmente gli OPEX e la complessità dell’architettura (ad esempio con componenti non nativi del sistema), migliorando la gestione, l’efficienza e la resilienza al crescere delle dimensioni del sistema. Solo un sistema progettato e ingegnerizzato sin dal principio in tal senso può realizzare il paradigma Scale-Out senza compromessi.

Gli storage legacy hanno dei limiti architetturali che li rendono estremamente inefficienti nel mondo dei Big Data. Innanzitutto, non sono in grado di scalare agilmente e velocemente: l’architettura a doppio controller, definita retroattivamente “Scale-UP”, crea implicitamente delle “isole” di storage che faticano a interfacciarsi tra loro e richiedono una costante manutenzione (migrazioni, bilanciamenti delle connessioni di front-end…). Sul fronte della protezione, la tecnologia RAID presenta un conto troppo salato da pagare sul piatto del rapporto usable / raw quando le quantità di dati in gioco sono nell’ordine dei PETAbyte (e oltre…) . L’architettura gerarchica controller + array di dischi costringe infine a pianificare gli acquisti con largo anticipo e impedisce un utilizzo intelligente e adattivo delle risorse computazionali.

EMC ISILON vanta un’esperienza decennale nel campo dei Big Data: sebbene faccia parte della famiglia EMC solo da pochi anni, è adottato con successo da oltre un decennio in tutti i Vertical che per primi hanno affrontato la tematica dei Big  Data (si pensi al Vertical dei M&E, con l’esplosione del video in alta risoluzione e del 3D o alla quantità di dati elaborata ed immagazzinata quotidianamente da un qualunque social network).

In questo articolo, introdurremo l’architettura di ISILON evidenziandone in sintesi le caratteristiche principali e le componenti che lo rendono unico nel panorama degli Scale-Out NAS.


IL CLUSTER: UN APPROCCIO ARCHITETTURALE INNOVATIVO

Isilon abbandona l’architettura gerarchica tipica dei NAS Scale-Up, per adottare una topologia cluster, ovvero l’insieme di elementi gerarchicamente paralleli in grado di distribuire e bilanciare il carico di lavoro a seconda delle esigenze. L’elemento atomico di un cluster Isilon è un’appliance chiamata “nodo”.
Un cluster Isilon è composto di almeno 3 nodi uguali tra loro, e può scalare fino a 144 nodi, indirizzando una capacità di 20 PB in un unico filesystem.
Esistono varie tipologie di nodi, differenti per capacità è prestazioni, ma ogni nodo contiene: 

  • CAPACITA’: i nodi Isilon contengono 12, 24 o 36 dischi, SSD, SAS o SATA a  seconda dei modelli
  • CPU, RAM: ogni nodo Isilon lavora come una testa NAS tradizionale, apportando la propria capacità computazionale al cluster
  • FRONT-END  I/O: ogni nodo dispone di 4 porte per il front-end (4 x 1 GbE oppure 2 x 1 GbE + 2 x 10GbE)
  • BACK-END: i nodi Isilon sono interconnessi con una rete InfiniBand 20Gbps dedicata e ridondata
  • SISTEMA OPERATIVO: OneFS, il sistema operativo proprietario di Isilon, è installato su ciascun nodo

Ogni nodo pertanto include una parte della capacità complessiva del sistema, una parte delle risorse computazionali e una parte delle porte di front-end. OneFS aggrega e virtualizza tutte queste risorse, ottimizzando nativamente le prestazioni del sistema, semplificando enormemente la gestione e presentando il cluster alla rete di front-end come un’unica entità.

OneFS: UN SISTEMA OPERATIVO RIVOLUZIONARIO


Giunto alla release 7.1, OneFS è l’unico sistema operativo sul mercato in grado di virtualizzare nativamente le risorse del sistema, rendendo obsolete operazioni come configurazione del RAID, creazione dei volumi, bilanciamento manuale del carico e virtualizzazione del namespace con software non nativi di fornitori terzi. OneFS è in grado di gestire semplicemente un cluster che scala da 18 TB fino a 20 PB in un unico filesystem, da 3 nodi fino a 144, consentendo da un lato l’abbattimento degli OPEX e dall’altro di utilizzare in maniera semplice ed efficiente il sistema, con le seguenti caratteristiche esclusive:

  • Autobalance: quando nuovi nodi sono aggiunti al cluster, OneFS ridistribuisce i dati in modo che i nodi siano sempre tutti utilizzati allo stesso modo, evitando la formazione di hot-spot ed eliminando per sempre la necessità di migrare i dati per ottimizzare le prestazioni 
  • Autoconfiguration: I nuovi nodi connessi alla rete di back-end sono in grado di autoconfigurare gli indirizzi di front-end e in 60 secondi un nuovo nodo è connesso al sistema e pronto per l’uso
  • No Single Point of Failure: L’architettura ISILON è completamente ridondata e un file non risiede mai su un unico nodo, pertanto il failure di un componente non comporta in alcun caso indisponibilità o perdita di dati 
  • Unmatched Resiliency: Ogni nodo si comporta come una testa NAS attiva, pertanto anche nella minima configurazione possibile, ci sono tre teste contemporaneamente al lavoro in front-end, ovvero una o due in più rispetto alle configurazioni base dei sistemi legacy
  • Unmatched Efficiency: OneFS, utilizzando un innovativo sistema di layout dei file sui dischi, consente di ottenere un’efficienza media dell’80% di spazio utile rispetto al raw, che può crescere al crescere del sistema e non è legata alla configurazione dei dischi come nei sistemi RAID tradizionali
  • Autotiering: OneFS è in grado di gestire nodi con caratteristiche capacitive e computazionali diverse tra loro, consentendo di impostare delle policy di movimentazione dei dati dai dischi più pregiati e dai nodi più performanti verso i nodi di archiving (famiglia NL) e viceversa.


LE FAMIGLIE DI NODI

L’offerta attuale di Isilon comprende tre tipologie di nodi, ognuna caratterizzata da diversi tagli capacitivi, prestazioni di targa e best practices.

OneFS è in grado di gestire in maniera ottimizzata un cluster composto di nodi eterogenei, con l’unico vincolo che ogni tipologia di nodo deve essere presente almeno con tre elementi, per ragioni legate all’algoritmo di protezione dei dati. OneFS associa di default un tier logico a ogni tipologia di nodo presente nel cluster, che può essere gestito in maniera indipendente (con policy di management e di protezione specifiche) e/o inserito in una strategia di autotiering per cui i dati sono movimentati da un tier all’altro in base alle policy stabilite dall’utente.

Le tre famiglie di nodi sono:

NODI S  - I nodi S200 (2RU, 24 dischi SAS e SSD) sono in grado di erogare fino a 1.6 milioni di IOPS CIFS e 1.1 milioni di IOPS NFS, ingegnerizzati per ambienti transazionali e carichi di lavoro random, ottimizzati per l’uso dei dischi SAS e SSD.

NODI X – La famiglia di nodi X contiene due modelli, gli X200 (2 RU, 12 dischi SATA e SSD) e gli X400 (4 RU, 36 dischi SATA e SSD). Entrambi i modelli sono pensati per ambienti con carichi sequenziali e accessi concorrenti, realizzano il miglior compromesso tra capacità e prestazioni.

NODI NL – I nodi NL400 (4 RU, 36 dischi SATA) sono pensati per ambienti di archiviazione near-line o a basse prestazioni, realizzando il miglior rapporto $/TB della famiglia ISILON.


Per maggiori informazioni su EMC Isilon visitate la pagina della nostra Community e il sito di ISILON

To be continued….

Nessun commento:

Posta un commento