La scorsa settimana sono stato allo Storage Networking World, un evento targato SNIA che si è tenuto a Francoforte. L’evento in se è stato particolarmente interessante e ho avuto modo di condividere molte idee e opinioni su come e dove andrà il mercato dello storage.

L’obiettivo di questo post è quello di condensare un po quanto ho visto e, magari, cercare di capire dove stanno andando vendor e tecnologie.

L’esplosione dei dati

Quasi tutte le presentazioni che ho visto partivano da quello che è il trend più osservato: la quantità di dati in azienda sta aumentando in modo sproporzionato: sta esplodendo! (anche se in effetti questa si può classificare come una non notizia). Non sto parlando dei dati strutturati (i DB per fare un esempio) ma di quelli non strutturati (i File), questi ultimi stanno diventando il vero grosso problema delle aziende. Si registra un aumento costante e, spesso, incontrollato, dei dati tanto che tutti gli IT manager stanno cercando di correre ai ripari. I problemi non sono legati solo ai dati in quanto tali ma spesso anche al fatto che i dati non si possono cancellare con tanta facilità, è complicato archiviarli, non ci sono metodi semplici per gestirli: Lo storage è spesso ostaggio di utenti, procedure e processi sbagliati e magari i budget sono anche scarsi.

Ma, al contrario di alcune sentenze che ogni tanto circolano, in futuro non vedremo la fine degli storage a blocchi. Lo storage a blocchi rimarrà la scelta primaria per i DB e le applicazioni più critiche dove i tempi di accesso e le performance devono essere ben definite e controllate. D’altro canto, sono altrettanto sicuro che il futuro dello storage a file (tipo CIFS e NFS: NAS) avrà un futuro roseo ed un ruolo più che centrale nei datacenter di domani grazie alla semplicità d’uso e alle sue buone prestazioni in generale. Ma, quello che abitualmente chiamiamo oggi unified storage no sarà più abbastanza per il futuro: lo scenario non è completo e abbiamo bisogno di qualche cosa di più.

Cloud e object storage

Le grandi quantità di dati che dobbiamo salvare hanno bisogno di storage di tipo cloud (pubblico o privato), abbiamo bisogno di non pensare più in termini di file o blocchi ma in un modo più intelligente con delle nuove unità di misura atomiche: gli oggetti (dati+metadati). Certo, non è sicuramente una novità, sistemi di questo tipo esistono da decenni (ricordate i CAS? content addressable storage) ma sono di tipo proprietario, dedicato e costoso: ma ora le cose stanno cambiando.

Il cloud storage, spesso, è un repository di oggetti accessibile via API, come il CAS nel passato. I vendor e le associazioni stanno lavorando duramente per imporre dei protocolli standard. Certo, per ora l’obiettivo non è stato raggiunto: non c’è ancora uno standard al quali tutti si stanno adattando, ma è vero che vedremo un grande restringimento del numero di protocolli nei prossimi anni.

Il futuro non è chiaro ma la adozione massiva del cloud storage aiuterà molto: i vincitori imporranno gli standard e gli altri cercheranno di usare questi standard in modo più smart per fare dei prodotti migliori (succede sempre così).

Nuovi modi di proteggere i dati

Sono sicuro che averete sentito già più volte discorsi sulla fine del RAID (in termini di capacità di proteggere i dati). Alcuni analisti parlano del 2020 altri dicono molto prima ma nessuno sembra aver dubbi sul fatto che non durerà a lungo. Io non sono sicuro che il RAID morirà, probabilmente vedremo due scenari anche qui: sempre uno per i dati strutturati e l’altro per quelli non strutturati.

Riguardo ai dati strutturati il RAID non morirà, più probabilmente vedremo una evoluzione dei meccanismi di protezione (RAID a tripla o più parità piuttosto che RAID 10 Dual Mirror?), principalmente per due ragioni: tradizionalmente i dati strutturati non sono così tanti in azienda e hai comunque sempre bisogno di essere sicuro di latenze e IOPS.

Nel caso di sistemi che si dovranno occupare di file e oggetti le cose funzionano diversamente, si guarda sempre con più interesse al throughput che alle IOPS o latenze. Qui sono necessari meccanismi di protezione dei dati basati su algoritmi molto diversi e di nuova generazione architettati con il cloud come primo pensiero: dispersione dei dati su più nodi/siti, differenti livelli di resilienza, il tiering, automazioni, ecc. ecc.

Per fare tutto questo c’è bisogno di un diverso tipo di storage non si può più pensare alla scalabilità verticale ma si deve, per forza, cambiare drasticamente.

Scale out storage

Lo scale-out storage è uno dei segmenti più attivi dell’intera industria IT. I grandi big si sono già attrezzati (spesso acquisendo) o si stanno guardando intorno per cercare soluzioni di questo tipo.

Alcune di queste soluzioni sono a blocchi (es.: Equallogic di Dell) altri sono basate sui file (SONAS di IBM o Ibrix di HP) e altre ancora sono basate sugli oggetti (basta vedere le ultime evoluzioni di Caringo, NetApp/Bycast, ecc). Tutti i vendor vogliono un pezzo di questo nuovo mercato.

Gli storage di tipo monolitico, anche nelle ultime implementazioni clusterizzate, hanno una scalabilità limitata e costano troppo come base per i protocolli di tipo file o per gli oggetti.

Lo storage a scalabilità orizzontale invece ha (praticamente) una scalabilità illimitata, le repliche integrate, facilità di management, sono basati su hardware commodity. Questi tipi di storage sono alla base degli attuali cloud pubblici ma lo stanno diventando anche per i cloud privati. I primi ad adottarli sono stati i grandi provider ma le cose stanno cambiando molto rapidamente e ora le aziende grandi iniziano a guardare molto in dettaglio quello che sta succedendo riguardo a queste nuove tecnologie e alle aziende che se ne occupano.

Più integrazione e unificazione

Se è vero che il presente è quello degli storage unificati (blocchi+file) su un unico media (iSCSI, FC, NFS, CIFS viaggiano tutti su ethernet), cosa ci possiamo aspettarre in un prossimo futuro? Una architettura ancora più unificata!

il media rimarrà ethernet (le aziende stanno investendo troppo nella sua evoluzione e, in fondo, conviene quasi a tutti), i protocolli saranno FCoE/iSCSI, pNFS con l’aggiunta di un protocollo per gestire gli oggetti (sicuramente basato su HTTP). Non mi è difficile ipotizzare che lo storage modulare di tipo scale-out sarà lo standard per tutti i vendor. Sicuramente non domani, ma sono convinto che questa sia la strada e che non siamo tanto lontani.