Qualche giorno fa ho letto questo articolo di Chris Mellor e ho deciso di dare il mio contributo alla discussione.

Premessa

Se si da un occhio all’industria dell’object storage si potranno facilmente trovare tre tipi di prodotto:

  • Buoni per i grandi volumi e gli ISP: grande scalabilità, throughput, affidabilità e basati su HW x86.
  • Buoni per l’azienda: meno scalabili ma con una buona integrazione end-to-end e da vendor primari.
  • Buoni per nulla: sono quelli che non possono avere successo perché superati, senza una roadmap chiara e che non hanno uno scopo preciso.

Dividere il mercato in questi tre segmenti aiuta a capire meglio chi sono i diversi player, i prodotti e i risultati che stanno portando.
Inoltre, da un altro punto di vista, se l’object storage fosse paragonabile al block storage sarebbe anch’esso diviso in tre segmenti: high-end, midrange e low end. Dove l’high-end sarebbe ad appannaggio di grandi ISP/CSP, midrange per i piccoli ISP e large enterprise mentre l’entry level sarebbe dedicato all’azienda media (medio grande se guardiamo al panorama strettamente italiano)… E si, si può facilmente notare che un certo slittamento: il nuovo high-end non è più la grande azienda ma il CSP e la piccola azienda (SMB) non implementa object storage localmente.
E ancora, al contrario del block storage, il mercato è ribaltato a testa in giù: il numero di box object storage (o forse meglio i Petabyte) consegnati alle piccole aziende sono meno di quelli consegnati alle aziende del segmento alto del mercato!

I casi d’uso

L’adozione dell’object storage è pilotata da diversi fattori e dipende fortemente dai casi d’uso.
Per esempio, alcuni provider Italiani hanno adottato l’Object storage come backend per i loro sistemi di posta elettronica (milioni di email) per poi utilizzare la stessa infrastruttura anche per erogare altri servizi (Dropbox-like o S3-like).
Sul lato enterprise, ho esperienze dirette di utenti (migliaia di posti di lavoro) che stanno seriamente valutando queste soluzioni per consolidare file server, dispersi in tutto il mondo, in un singolo grande repository con l’obiettivo di dare servizi file e sync&share in una modalità più cloud-like!

La piattaforma orizzontale

In practica si può vedere l’object storage come una piattaforma orizzontale capace di gestire tanti diversi tipi diversi di dati.
Se il primo drive per l’adozione dell’object storage è lo use case (o l’applicazione) la quantità di dati gestiti viene subito dopo. Un esempio? La scorsa settimana, durante lo Storage Field Day 3, Cleversafe ha mostrato un caso di successo con un cliente che ha una infrastruttura con 70PB di dati e che sta puntando a 150. Alcuni vendor stanno anche proponendo interfacce HDFS sopra la loro soluzione.
Allo stesso tempo, le aziende (anche grandi), non hanno decine di Petabyte ma hanno molti tipi di dati diversi da gestire: lo storage ordinario è buono per gestire uno (o due?) problemi alla volta ma sempre aggiungendo una certa complessità, mentre l’object storage potrebbe essere visto come un’unica piattaforma di backend.

E’ tutto legato ai gateway…

Object storgeSe è vero che l’object storage è una piattaforma orizzontale per gestire i dati, è altrettanto vero che gli utenti finali hanno problemi verticali da risolvere! Problemi diversi significano approcci, protocolli e soluzioni diverse. Le API non sono una soluzione out-of-the-box mentre i gateway, specialmente nel segmento midrange menzionato sopra, sono l’unica strada percorribile!
In altre parole, le API sono interessanti per i CSP me risultano poco digeribili dalle aziende… questo tipo di utenti sono abituati ad ascoltare termini come “unified” e “converged” e non vogliono o non possono cambiare: possono cambiare il loro storage ma non possono cambiare il modo in cui lo usano!
Ancora una volta, le similarità con il mercato dei sistemi più generici continua a risaltare: le soluzioni midrange sono le più ricche in termini di funzionalità (hanno anche il maggior numero di gateway e certificazioni terze parti), mentre l’high end è più focalizzato su un singolo protocollo (API in questo caso).

…e TCO

Il terzo motivo di adozione dell’object storage è il TCO (e il valore dei dati). Ho già parlato poco tempo fa del valore dei dati archiviati dentro una piattaforma ad oggetti e ho anche menzionato quanto questo può essere una soluzione interessante per il Big Data.

Il costo di salvare dati è molto diverso da quello di gestirli e mantenerli, anche quando questi sono fermi e mai acceduti!
Backup, archiving, versioning, retention, disaster recovery, compliance (solo per nominarne alcuni) contribuiscono attivamente al TCO dei tuoi dati. Le piattaforme object storage sono gestite attraverso delle politiche e hanno molte di queste funzionalità embedded senza che ci sia la necessità di nessun intervento umano.

Nota finale

Dal mio punto di vista l’object storage sta guadagnado una certa rilevanza ma sot to form diverse!
I CSP ne stanno installando dei PB e servizi come Amazon S3 stanno crescendo esponenzialmente.
Il numero dei clienti qui è veramente limitato ma, in questo caso, non sono da contare i clienti ma i volumi. Faccio un esempio, se Nimble storage è la startup più di successo in termini di sistemi venduti, le startup che si occupano di object storage la stanno sorpassando in termini di spazio installato!
I clienti in questa fascia comprano l’object storage e vogliono le API per costruire le loro soluzioni.

La grande impresa e i piccoli CSP sono abbastanza nuovi a questo mercato. Stanno vedendo una crescita esponenziale dei loro dati non strutturati e nuove vie per accedervi proprio adesso! Sono stufi dello storage tradizionale perché lo vorrebbero più economico, più facile, più gestibile e più scalabile! I vendor primari stanno rendendo pronte le loro soluzioni ora e prima o poi vedremo della bella concorrenza in questo settore. Questi clienti comprano (o compreranno) “object storage camuffato” (object storage + gateways + integrazioni) solo se comparabile con il loro storage tradizionale e gli darà modo di risolvere più problemi di quello che fanno oggi!

Le SMB non sono rilevanti per questo mercato… o meglio, contribuiscono in modo decisamente diverso.
Non comprano l’object storage in casa (è difficile predire se soluzioni come Exablox cambieranno qualche cosa, ma sicuramente non lo faranno a breve). Questi clienti stanno comprando servizi (esempio, Dropbox è ospitato su S3), o compreranno dei gateway per avere accesso ad uno servizio di backend… in qualche modo contribuiranno quindi al successo di questo mercato quando comprano dai CSP.

Ritornando all’articolo di Chris, ora è più facile interpretare il mercato dell’object storage… spero.