Un incontro molto interessante che ho avuto l’ultima volta che sono stato nella Silicon Valley è stato quello con Catalogic Software. Quest’azienda, uno spin-off di SyncSort, è specializzata nel Data/Copy management (con un prodotto chiamato ECX). Un argomento molto interessante e che spesso viene sottovalutato.

Gestire le copie

iStock_000011589424MediumDi tutti i dati che gestiamo abbiamo spesso molte copie, il numero è diverso da azienda ad azienda ovviamente, ma il problema è che, secondo alcuni studi, si può arrivare ad avere fino a 12 copie di un singolo dato!
Ma non è finita qui, non è solo il fatto di fare le copie, spesso queste non vengono gestite correttamente e ci si ritrova a lavorare con dati vecchi, non più validi o aggiornati che, in alcuni casi, possono creare problemi anche gravi. Per non parlare poi di eventuali problemi di sicurezza!

Le copie di dati si fanno per mille motivi: test, sviluppo, backup, DR, analytics, migrazioni, auditing… la lista può essere lunghissima. In molti casi queste vengono richieste da dipartimenti diversi e hanno retention diverse. In alcuni casi i dati devono anche essere mascherati per dare modo a chi li utilizza di non guardare dati sensibili.

Insomma la gestione delle copie, soprattutto in ambienti complessi, non è facile e può avere un coso molto elevato. Certo, alcune tecnologie messe a disposizione dagli storage moderni (le snapshot ad esempio) vegnono incontro a queste necessità. Ma anche qui, se l’ambiente è complesso e se le copie vengono fatte fra sistemi di tipo di verso (magari da uno storage NetApp verso uno EMC) le snapshot servono a poco.

C’è anche da considerare l’aspetto applicativo. La copia dei dati deve essere utilizzata spesso da un software e, nel processo di creazione di queste copie, è necessario anche lanciare i necessari tool/script per poterli sfruttare a dovere attraverso l’applicazione che si desidera.

Sono problemi che, in un modo o nell’altro e con diversi gradi di complessità affrontiamo tutti… E il costo per gestire queste copie può essere particolarmente elevato.

Come risolvere il problema

iStock_000000261349SmallEsistono diverse aziende che producono soluzioni di data/copy management. Alcune di queste, come Catalogic, sono solo software mentre altre (Actifio ad esempio) vengono fornite con un hardware specifico o una VSA (nel caso di Delphix). E non tutte fanno lo stesso lavoro!

Infatti alcune di queste soluzioni sono specializzate su alcuni applicazioni specifiche mentre altre sono più “general purpose e permettono di gestire ambienti fra i più disparati ed anche virtualizzati (E qui porto di nuovo l’esempio di Catalogic).

Catalogic in particolare, è molto semplice da utilizzare e compre un numero di problematiche molto ampio. E’ un prodotto che sta crescendo molto velocemente e sta allargando il numero di piattaforme supportate molto velocemente, aggiungendo nel contempo molte funzionalità utili a gestire il processo di gestione delle copie. Il primo briefing con loro l’ho avuto a Marzo e non avevo scritto nulla perché avevo molti dubbi… ma a distanza di pochi mesi sono riusciti a presentare una seconda versione del prodotto molto più completa e questo mi fa ben sperare per la roadmap che mi hanno fatto vedere.

Logo_CatalogicIl prodotto ha un sistema di licenziamento che mi lascia un po interdetto (per controller dello storage), ma non significa che questo alla fine non risulti conveniente per l’utente finale… che magari ha molti TB su un sistema a due controller!

Le caratteristiche che mi piacciono di più di Catalogic sono due: la semplicità d’uso e il supporto di Vmware (soprattuto per ambinti di test e quality può essere molto utile). Un’altra cosa che è sicuramente utile è il fatto che Catalogic sfrutta le funzionalità di snapshot messe a disposizione dallo storage sottostante, facendo quindi risparmiare spazio e tempo grazie alla maggior velocità di esecuzione di “copie virtuali”.

Nota finale

iStock_000012120788MediumNon tutti hanno il problema della gestione delle copie… e altri ignorano di averlo. In ogni caso, se il problema c’è, questo è un costo e software come quelli che ho descritto possono aiutare a risolvere questa problematica brillantemente facendo risparmiare un sacco di tempo (e denaro).

Nelle infrastrutture più piccole, e se le necessità sono semplici e circoscritte a poche applicazioni, copiare i dati può essere semplice e il costo contenuto. Ma se l’ambiente è complicato ed è necessario rispondere velocemente ad un numero di richieste che, per forza di cose, è in crescita… questa è sicuramente una soluzione che può avere senso!

Disclaimer: Sono stato invitato a questo meeting da Condor Consulting Group e loro hanno pagato per il viaggio e l’alloggio. Non sono stato ricompensato in alcun modo per il mio tempo e non sono in obbligo di scrivere articoli. In ogni caso, i contenuti di questi articoli non sono concordati, rivisti o approvati dalle aziende menzionate o da altri al di fuori del team di juku.