venerdì 14 marzo 2014

EMC Recoverpoint: RPO zero anche su asincrono!

Il Dilemma: Sincrono o Asincrono ?

Chiunque intenda affrontare la tematica del Disaster Recovery si trova davanti ad un bivio: come effettuare la replica dei dati? sincrona o asincrona?
Alcune aziende hanno la fortuna di disporre di ben tre siti: Primario o sito di produzione, Secondario o sito con copia sincrona (spesso chiamato anche campus, o sito di business continuity) e Terziario o sito con copia asincrona (per molti noto come replica geografica). Quest'ultima soluzione è senza dubbio la più completa, ma non la più economica sia in termini di costi di realizzazione che di costi ricorrenti e di esercizio. La maggior parte delle aziende ha due siti per cui si trova a risolvere il dilemma. Alla base di questa scelta sta il compromesso tra la L'obiettivo di RPO (quanti dati posso perdere al massimo in caso di disastro), quanto ritardo le mie applicazioni possono tollerare sulle operazioni di scrittura.
A questo si aggiunge la distanza che il sito di DR debba avere in modo da fornirmi sufficienti garanzie. Ricordo un ex collega che alla domanda "a quale distanza deve essere posto il nostro sito di DR" rispondeva "deve stare su una differente zolla della tettonica".

EMC Recoverpoint e Axxana Phoenix

Ancora una volta EMC Recoverpoint mette in evidenza le sue unicità rispetto ai software di replica tradizionale, ma in questo caso grazie ad una soluzione sviluppata insieme ad un partner tecnologico. Axxana è una societa' israeliana non a caso come l'azienda che sviluppò Recoverpoint prima dell'acquisizione da parte di EMC (Kashya). Axxana Phoenix è una soluzione rivenduta da EMC come prodotto EMC Select e totalmente integrata con la gestione di Recoverpoint. Nasce dall'idea di un ingegnere areonautico che si ispira agli FDR (flight data recorder) conosciuti volgarmemte con nome di "scatola nera". Partendo da questo concetto gli israeliani inventano L'Enterprise Data Recorder. Per spiegare di cosa si tratta riprendiamo brevemente l'architettura Recoverpoint (per maggiori dettagli si faccia riferimento al post Recoverpoint su questo BLOG).
Come è possibile vedere dalla figura seguente, Recoverpoint utilizza una tecnica di replica basata su journal, dove alcune transazioni vengono mantenute in una cache sul sito primario, prima di essere raggruppate, deduplicate, compresse e spedite al sito di DR.


In caso di replica asincrona, come nella slide precedente l'RPO, la maggiore perdita dati che si possa avere, è relativa a quei dati che sono ancora memorizzati sulla cache di recoverpoint del sito primario. Axxana è un sistema di "mirroring" di questa cache su un sistema storage autoconsistente, autoalimentato, autoraffreddato ed a prova di bomba (nel senso letterale del termine). Nella figura successiva l'achitettura complessiva ottenuta da EMC Recoverpoint + Axxana Phoenix



Vengono introdotte tre componenti aggiuntive: il collector, la blackbox ed il recoverer.
Il collector di occupa di intercettare le I/O ricevute dagli appliance Recoverpoint ed inviarle verso la black box in modalità sincrona. Questo ulteriore split delle I/O introduce una latenza inferiore ad 1 msec, tipicamente microsecondi, quindi assolutamente trascurabile per qualsiasi applicazione.
La blackbox contiene la replica del dato su dischi SSD.
Infine, l'appliance Recoverer, sito sul secondario, entra in gioco solo in caso di DR o test di DR, e coordina tutte le attività di ripristino.
Questa architettura è attuabile con tutti i tipi di splitter supportati dalle ultime release di Recoverpoint: VMAX, VNX, Clariion, VPLEX, Vblock.
Abbiamo parlato di sistema "a prova di bomba" in quanto la blackbox Axxana resiste alle seguenti situazioni avverse:
  • Esposizione diretta alle fiamme (1100 gradi Celsius) per oltre un'ora
  • Fino a 6 ore di esposizione a 250 gradi Celsius
  • Pressione in immersione fino a 10 metri di profondità
  • 40G di shock fisico
  • Ad un crollo con peso incidente di oltre 2300Kg
  • e molto altro. Esistono filmati con i test effettuati su youtube come http://www.youtube.com/watch?v=hu1cmiQjsto
Sostanzialmente quindi Axxana mette al sicuro una copia (sincrona) dei dati "in flight" di recoverpoint (tipicamente massimo 3-4GB anche negli ambienti recoverpoint piu' complessi, spesso nell'ordine delle centinaia di MB). L'integrazione nativa con Recoverpoint, consente all'interno della GUI EMC di stabilire quali Consistency Group debbano essere protetti con RPO zero, tramite una semplice checkbox su "use PHOENIX protection", come è possibile vedere nello screenshot seguente. Questo perchè potrebbero esserci applicazioni che non necessitano di RPO zero, ma su cui sia preferibile avere un RTO (Recovery Time Objective) piu' stringente.




Come recuperare il dato dopo il disastro

In caso di disastro o semplice indisponibilità del primario, prima di procedere alla riattivazione della copia di DR, sarà possibile recuperare dalla blackbox le transazioni che ancora non erano state inviate al secondario. La GUI  consentirà di scegliere anche quali CG recuperare per primi (è disponibile anche un modulo di integrazione con VMware SRM). Il recupero della cache di Recoverpoint puo' avvenire attraverso diverse modalità, a seconda dell'entità del disastro, che vanno dall'utilizzo della LAN/WAN (se ancora utilizzabile), all'uso dei modem cellulari 3G/4G interni al box, fino al caso estremo dell'estrazione fisica dell'unità.


I vantaggi e le unicità della soluzione di Recoverpoint + Axxana sono evidenti:

  • Nessuna perdita di dati: Axxana + Recoverpoint garantiscono un RPO=0 a qualsiasi distanza grazie all’appliance che è in grado di proteggere i dati della cache non ancora replicati.
  • La protezione totale dei dati (RPO= 0), è garantita anche durante periodi di carico di picco rispetto alla banda disponibile e durante un eventuale fault di collegamento WAN. Benefici della replica sincrona, con un infrastruttura asincrona. 
  • Nessun problema di latenza – Axxana abilita i benefici della replica sincrona anche usando un’infrastruttura di tipo asincrono, che non influisce sulle prestazioni dell'applicazione.
  • Risparmio sui costi: RPO zero su asincrono significa potenzialmente due siti invece che tre. Il Business case torna "a mani basse".
Qui sotto trovate link alle soluzioni citate in questo post:

http://www.emc.com/storage/recoverpoint/recoverpoint.htm
http://www.emc.com/collateral/software/solution-overview/h7159-axxana-so.pdf
http://www.emc.com/third-party-products/business-continuity-disaster-recovery.htm

 Cristian Gavazzeni

Nessun commento:

Posta un commento