Visualizzazione post con etichetta FAST. Mostra tutti i post
Visualizzazione post con etichetta FAST. Mostra tutti i post

lunedì 29 dicembre 2014

La tecnologia Flash/SSD: uno sguardo da più vicino.

Perchè questa tecnologia è "disruptive" ? 

La tecnologia Flash/SSD sta guadagnando rapidamente consensi e quote di mercato nel panorama IT. Ne consegue che un sempre maggior numero di vendors propone queste soluzioni, ma con architetture e “media” ben differenti.
Se per quanto riguarda l' architettura migliore per un All-Flash-Array rimando alla lettura di altri posts (è sufficiente inserire XtremIO nel nostro motore di ricerca), per quanto riguarda i tipi di Flash media cercherò di dare qualche elemento in più di valutazione per dimostrare in sintesi che non tutti sono equivalenti o adatti a qualsiasi tipo di use-case.
Nella slide sottostante riassumiamo i pro/contro della tecnologia "consolidata" e di quella "emergente" per evidenziare perchè la seconda sta trasformando questo settore.
Una facile conclusione sarebbe “Non c’e storia!”, per lo meno se i costi fossero comparabili.
Oltre all’aspetto economico (ampiamente indirizzabile con tecnologie di efficienza quali deduplica o compressione) va considerato un altro fattore, forse meno noto: a differenza degli HDD, le prestazioni dei Flash degradano nel corso del tempo (anche nel lasso di poche ore), soprattutto con un workload con distribuzione bilanciata

venerdì 7 marzo 2014

Ottimizzare la Virtual Desktop Infrastructure con le Tecnologie Flash EMC

Le soluzioni EMC VDI basate su tecnologia Flash sono in grado di portare il desktop computing ad alti livelli di prestazioni, efficienza e semplicità. Queste potenti soluzioni soddisfano le mutevoli esigenze di un azienda e del suo business, consentendo in qualsiasi momento, ovunque e a qualsiasi dispositivo di accedere alle applicazioni desktop e ai relativi servizi.

In questa infografica vediamo come le soluzioni EMC VDI con tecnologia flash trasformano il "virtual desktop computing", consentendo prestazioni elevate per organizzazioni di tutte le dimensioni attraverso diverse possibilità di scelta per il cliente.


Luigi De Meo
Advisory Systems Engineer
twitter: @geniusbee

venerdì 27 settembre 2013

Gestione dinamica dei dati: dall'HSM a FAST VP

La gestione gerarchica del dato.

Quando fu introdotto il concetto di “Hierarchical Storage Management”, il principio alla base di questa tecnica era molto chiaro: ridurre il costo di memorizzazione dati (su disco) e semplificare il recupero di dati da supporti più lenti (tipicamente nastri); un processo schedulabile (batch)  analizzava le informazioni relative all’acceso ai file, decideva quali di questi potevano essere “migrati” su supporti più lenti ed a basso costo ed operava lo spostamento.
Questa tecnica è possibile in quanto la densità di accesso ai dati, identificata come skew, cioè la percentuale di spazio disco che soddisfa la maggioranza delle operazioni di lettura e scrittura, da sempre vede il concentrarsi della maggioranza delle attività su una piccola porzione dello spazio a disposizione delle applicazioni.
Le varie tecniche, ancorché tutte validissime, avevano però un piccolo difetto: il dato “migrato” doveva essere riportato sui supporti “primari” per poter essere fruibile e le attività di “migrazione” erano a carico del server.
Gli anni a venire ci hanno consegnato nuovi acronimi: da ILM o “Information Lifecycle Management” arrivando ai più recenti quali: Automated Tiered Storage o, ancora, Auto Tiering.
Se è vero che il principio alla base non è cambiato è altrettanto vero che le tecniche di movimentazione del dato si sono evolute negli anni, spostando i processi di gestione direttamente all’interno dei sistemi Storage, divenuti via via più intelligenti, invece che essere governati dai server come in passato.
Questo, per altro, garantisce una granularità di movimentazione decisamente più efficente (ad esclusione di alcune implementazioni) nel momento in cui l’elemento interessato alla “migrazione” non è più un intero file ma una “porzione” del “volume logico” (Chunk).

Questa ottimizzazione si deve grazie all’introduzione di tecnologie quali il “Virtual Provisioning”, anche conosciuto come “Thin Provisioning”, una tecnica che consente di presentare ai server un volume “Logico” o “Virtuale” che ha una corrispondenza “Fisica” equamente distribuita all’interno del sistema Storage.

Anche se il principio è concettualmente lo stesso, ogni produttore di sistemi Storage ha implementato questa funzionalità in modo differente.

Tornando ai concetti di “Gestione Gerarchica del Dato”, o se preferite “Gestione del Ciclo di Vita del Dato”, in casa EMC la soluzione, disponibile su tutte le piattaforme storage, è conosciuta come FAST o, nella sua accezione più diffusa, come FAST VP (Fully Automated Storage Tiering for Virtual Pool).
Il principio è abbastanza semplice: monitorando continuamente le attività di accesso ai dati è possibile identificare quali, tra questi, risultano essere più o meno “attivi” ed assegnare, in base a politiche definite dinamicamente dall’utente, il livello di Storage (Tier) più appropriato. In questo modo i dati più “attivi” verranno posizionati sul livello in grado di offrire le migliori prestazioni, mentre quelli “inattivi” saranno spostati sul livello meno prestazionale ed a più basso costo.

A questo punto è importante considerare alcuni aspetti che determinano l’efficacia di questa tecnologia ed in particolare:
  • La frequenza di movimentazione dei dati.
  • La dimensione dell’elemento che viene movimentato.
Nella maggior parte dei casi, un singolo dato assumerà nel tempo attributi differenti: in alcune fasi risulterà utilizzato con alta frequenza, mentre in altre risulterà “inattivo”: è molto importante che la reazione del sistema storage al cambio di “accesso” avvenga in modo tempestivo, in modo da allineare il posizionamento del dato in funzione del livello di servizio più appropriato; un sistema storage che ad esempio “risponda” a questo cambiamento nell’arco di  pochi minuti risulterà molto più efficace di un sistema apparente simile ma che abbia bisogno di qualche ora prima di riuscire ad individuare quali dati devono essere spostati e dove.

La dimensione dell’elemento che viene movimentato ha invece una ripercussione diretta sulla efficienza di utilizzo dei livelli di Storage (tier); a parità di numero di blocchi da movimentare, più piccole sono le dimensioni degli stessi e più efficace è l’utilizzo del livello storage più prestazionale, ovvero i dischi allo stato Solido (SSD o EFD), che sono quelli a costo più elevato.

I due aspetti sopra descritti incidono, oltre che sull’efficacia della soluzione, anche sull’utilizzo delle risorse “computazionali” che ogni sistema Storage possiede. Ad esempio, sui sistemi della fascia High End di EMC, i sistemi Symmetrix VMAX, la dimensione minima dell’elemento movimentato è 8MB e la movimentazione stessa del dato è continua, con una finestra di analisi minima di 10 minuti.

Come accennato in precedenza, ogni produttore di sistemi storage utilizza parametri differenti; è quindi fondamentale analizzare quanto le diverse soluzioni possano rendere questa tecnologia più o meno efficace.

La tecnologica di Storage Tiering è ovviamente indipendente rispetto alla tipologia di Server e/o Sistema Operativo: le funzionalità messe a disposizione dello storage quindi risultano disponibili per tutte le applicazioni in modo trasparente. Sui sistemi Storage EMC, questa tecnologia è disponibile per tutti, o quasi, gli ambienti operativi Open Systems, Mainframe e iSeries (AS/400).

L’evoluzione più recente, in casa EMC, ha visto l’introduzione di concetti di movimentazione del dato al di fuori dei sistemi Storage, verso livelli ancor più prestazionali, all’interno dei server, o, al contrario, verso sistemi Storage a loro volta “virtualizzati” attraverso i sistemi Storage principali.
In futuro è prevedibile che queste tecniche assumano una connotazione gestionale eterogenea; sistemi Storage in grado di muovere i dati verso altri sistemi Storage, aventi caratteristiche differenti quali, ad esempio, deduplica e compressione (quest’ultima già disponibile).

Per saperne di più accedi alla pagina dedicata alle soluzioni Storage EMC su EMC Community Network; posta le tue domande e riceverai supporto.


Stefano Panigada

martedì 17 settembre 2013

Performance On Demand con Next Gen VNX

Due parole su come ottenere le performance desiderate senza essere uno storage guru.

Il tuning dello storage è storicamente complicato e di norma assegnato a personale “esperto” all’interno o all’esterno dell’azienda.

Questi “guru delle performance”, grazie alle competenze acquisite nel corso della loro carriera, sono in grado di analizzare in dettaglio i parametri che regolano le performance dello storage e implementare eventuali azioni correttive; ad esempio, se le applicazioni non rispondono abbastanza velocemente è possibile  spostare i dati su dischi più veloci, oppure distribuire i dati stessi (striping) su più dischi ecc.

Fortunatamente con gli storage moderni, in particolare VNX, non è più così difficile tenere sott’occhio l’infrastruttura, grazie ai diversi strumenti e approcci che vengono messi a disposizione degli utenti finali. Vediamone alcuni.

La prima semplificazione riguarda la possibilità di allineare in modo automatico le performance richieste dall’applicazione grazie all’utilizzo di Pool contenenti dischi di diversa tecnologia, velocità e capacità: questo approccio consente allo spazio dedicato ad un’applicazione (LUN o filesystem) di essere distribuito,in modo automatico, su tipologie disco diverse, in modo da avere performance allineate alle reali necessità.  Nella figura seguente viene rappresentata una LUN composta da blocchi appartenenti a tipologie disco diverse.



Il vantaggio per il cliente che adotta questa tecnologia, consiste nel non dover scegliere a priori la tipologia disco da dedicare ad un’applicazione: una stessa applicazione potrà avere “pezzi” (blocchi) ad alte performance, dove queste sono richieste (ospitate ad esempio su dischi flash) e blocchi che richiedono performance relativamente basse, che potranno usufruire di spazio disco meno pregiato quale ad esempio i dischi SATA/Nearline ad alta capacità.

Questo approccio, denominato Auto-Tiering è stato adottato da diversi vendor storage. Il fattore differenziante in casa EMC riguarda la possibilità di implementare questo approccio con tutti e tre i Tier di storage (Flash Drives o SSD, HDD, HD Nearline) oppure solo con due Tier, con qualunque combinazione il cliente desideri. Per dare massima flessibilità è anche possibile dedicare all’applicazione un singolo Tier storage (ad esempio con dischi HDD oppure Nearline), anche all’interno di un Pool misto.

Il vantaggio di questo approccio è che il cliente viene sgravato dal dover pensare, in anticipo, alla tipologia disco da dedicare ad un’applicazione: questa potrà usare spazio più o meno pregiato, a seconda del carico di lavoro, senza necessità di fine tuning o migrazioni dati da parte dell’amministratore storage. Al cambiare del profilo di lavoro (ad esempio durante periodi di picco) il sistema risponde in modo automatico, senza ulteriori interventi.

Nelle figure di seguito viene riportato come il mix di performance delle applicazioni consolidate sul singolo storage, possa variare in un certo periodo, ad esempio trimestralmente. Nel caso proposto, le performance richieste dalla App3 sono relativamente basse nel primo trimestre, mentre sono il 55% del totale nell’ultima parte dell’anno. Allo stesso modo App4, che nel primo trimestre occupa il 22% delle risorse complessive, nell’ultima parte dell’anno viene addirittura spenta. Un approccio con Auto-Tiering (FAST VP – Fully Automated Storage Tiering) adatta quindi lo storage ai requisiti applicativi nel tempo.


 

Un altro meccanismo per gestire in modo automatizzato il tema delle performance è fornito data dalla possibilità di impiegare dischi Flash per espandere la cache di sistema dello storage. Questo secondo approccio, che permette di dare performance applicative anche a fronte di picchi di carico temporanei, anche all’interno della singola giornata, viene implementato nella famiglia storage VNX con la soluzione Fast Cache, ovvero l’estensione della cache di sistema storage in lettura e scrittura, con dischi Flash.

Questa caratteristica permette di avere fino a 4.2TB di cache disponibile per il buffering applicativo, sia per operazioni di lettura (comune nel traffico transazionale) che di scrittura (ad esempio reporting).

La combinazione delle due tecnologie (FAST VP + Fast Cache), uno dei veri differenzianti del VNX rispetto alle altre soluzioni presenti nel mercato, è quello che permette allo storage di adattarsi al carico applicativo, non solo nel tempo, ma anche alle richieste di performance repentine.

La domanda a questo punto potrebbe essere: ma il mio caso non potrebbe essere diverso? Non potrebbe essere che le mie applicazioni abbiano tutte richieste più o meno simili e quindi una configurazione storage tutta con dischi mediamente veloci (10kRPM o 15kRPM) non si adatti meglio alle mie esigenze? Mi servono davvero i dischi Flash con quello che costano? Non è meglio evitare i dischi Nearline?

Per rispondere a queste domande aggiungo un “bit”. EMC mette a disposizione dei partner e dei propri clienti diversi strumenti per analizzare lo “stato di salute” del sistema storage. Uno di questi tool è in grado, tra le altre cose, di mostrare quale percentuale di spazio esegue la maggior parte del carico di lavoro.

Qui di seguito viene riportato un esempio di questa analisi, eseguita su uno storage realmente in produzione. Nella grande maggioranza dei casi, solo il 20% (o meno) dello spazio disco, esegue la maggior parte del “lavoro” applicativo.




Si può quindi dedurre che un approccio tradizionale con tutti dischi della stessa tipologia, dove l’amministratore storage è costretto ad eseguire tuning successivi per ottenere boost applicativo, non ha senso nella maggior parte dei casi. Dischi mediamente veloci, tutti della stessa tipologia, sarebbero uno spreco per molte applicazioni (dove HD Nearline sarebbero sufficienti), mentre sarebbero troppo lenti per applicazioni ad alte performance (dove qualche disco Flash potrebbe fare la differenza).

Un approccio FASTVP + FAST Cache quindi, implementando una piccola parte di dischi Flash (5% o meno dello spazio totale) e un mix tra dischi HDD e HD Nearline capacitivi, permette di ottenere le massime performance disponibili sul mercato con un costo/TB complessivamente interessante. Nel caso appena riportato ad esempio, circa il 70% dello spazio, potrebbe essere affidato a dischi molto capacitivi. Contemporaneamente una piccola quantità di dischi Flash sarebbe in grado di soddisfare i picchi applicativi, sulla piccola quantità di spazio ad alto carico di lavoro.

Per analizzare la propria configurazione, anche di uno storage concorrente, è possibile chiedere supporto ad un contatto EMC oppure ad un EMC Business Partner qualificato. Se si dispone di uno storage della famiglia Clariion o VNX, è possibile eseguire direttamente un healtcheck del proprio sistema, gratuitamente, al seguente indirizzo:

https://app.mitrend.com/emcefficiency/upload

Caricando sul portale alcuni file di log, è possibile ottenere un report di performance semplice e dettagliato, come mostrato nelle figure di seguito:







In conclusione: EMC mette a disposizione diversi strumenti per comprendere lo stato di salute dello storage e delle applicazione che su di esso insistono. Le analisi che noi e i nostri partner eseguiamo presso i clienti, evidenziano che un approccio con FAST VP e Fast Cache permette di coniugare le performance richieste dalle applicazioni business critical con la gestione dei costi infrastrutturali; il tutto senza necessità di investire ore/uomo nei complicati tuning atti ad inseguire le richieste di performance che le applicazioni richiedono.

Di seguito alcuni link di approfondimento relativi alla famiglia storage Next Gen VNX:

http://www.emc.com/collateral/software/specification-sheet/h8514-vnx-series-ss.pdf
http://www.emc.com/collateral/hardware/data-sheets/h8520-vnx-family-ds.pdf
http://www.emc.com/about/news/press/2013/20130904-03.htm?M=c676bf05-7a74-463b-bdcb-c59f65339a23
http://pulseblog.emc.com/2013/09/04/introducing-the-next-generation-vnx-and-what-it-means-for-customers/?M=c676bf05-7a74-463b-bdcb-c59f65339a23
http://wikibon.org/wiki/v/VMware_Dominant_in_Multi-Hypervisor_Data_Centers#VMware_Storage_Integration

Umberto Galtarossa