lunedì 13 gennaio 2014

Dati "non strutturati" ... solo il Tiering ci salverà !!!

Ogni cliente a cui si mostrano le classiche slide di crescita esponenziale del dato “non strutturato”, dopo un primo momento di diffidenza si trova a riconoscere che anche nel proprio DataCenter tali dati proliferano in maniera incontrollata e con un trend di tipo esponenziale.


Anche da una recente analisi di Gartner (maggio 2013), si evince come il protocollo NAS (classico dei dati non strutturati) ha generato nel 2012 maggiori revenues (più del doppio) rispetto al protocollo FC (classico degli ambienti strutturati a crescita controllata).



Ciascun CTO, pur essendo perfettamente consapevole delle caratteristiche dei dati non strutturati, osteggia molto spesso soluzioni di “tiering” automatizzato soprattutto perché non è in grado di valutarne oggettivamente la misura dei benefici e soprattutto perché non ha gli elementi per produrre un “business case” a supporto della soluzione. 

EMC, proprio per indirizzare in maniera precisa questa mancanza di informazioni, ha messo a disposizione dei propri clienti un tool molto semplice, EMC Workbench,  che permette di analizzare velocemente (circa 400.000 files/ora) i dati non strutturati e fornire quindi in breve tempo una fotografia puntuale e ricca di informazioni per evidenziare i dati poco utilizzati (detti comunemente "cold", "freddi", in contrapposizione ai dati più frequentemente acceduti che sono definiti "hot").
Le metriche raccolte da questo tool sono le seguenti:

  • File Age
  • Last Access Time
  • Largest Files
  • File Types
  • Growth over Time

Per ciascun filesystem analizzato viene generato automaticamente una presentazione completa che riporta numerose viste, ad esempio: 

Di seguito riporto ad esempio l’esito di un analisi effettuata presso un cliente su un campione di 20 Filesystem per complessivi 36TB (di cui scritti quasi 24TB):



Quello che si evince da questa analisi (realizzata nell'arco di due soli giorni) è che su 23.6 TB scritti:
  • il 90% dei dati (oltre 21TB) non viene modificato da oltre 6 mesi 
  •  il 70% non viene acceduto da oltre 6 mesi
Attraverso questo tool è stato quindi possibile individuare velocemente la quantità di dati “Cold” all'interno dei dati non strutturati del cliente:




Partendo da questi risultati, è possibile a questo punto utilizzare la tecnologia EMC Cloud Tiering Appliance (CTA), che è in grado di muovere trasparentemente i dati “cold” sui dispositivi più idonei (con costo/GB inferiore); l'obiettivo è ovviamente quello di ridurre il costo complessivo per i dati non strutturati mantenendo sempre sul Tier primario i dati “Hot”, e muovendo invece sul Tier secondario i dati storici (sempre in maniera automatica e trasparente per l’utente).

Questa soluzione aggiunge numerosi benefici anche a livello di Backup, riducendo sia la finestra di backup che le risorse necessarie per la protezione dei dati non strutturati: è infatti ovvio che i dati "cold" possono essere gestiti a livello di backup con policies molto diverse da quelle associate ai dati "hot"; ancora una volta il meccanismo di tiering automatico permette di demandare alla piattaforma storage le problematiche di individuazione dei dati meno utilizzati e il loro spostamento verso il tier più appropriato.



Maurizio

Nessun commento:

Posta un commento