Qualche giorno fa, Isilon (una azienda di EMC) ha annunciato di aver aggiunto una nuova interessantissima feature alle sue soluzioni di storage: il supporto per HDFS.
Una gran mossa dal mio punti di vista, ma che si porta dietro anche una risvolto meno piacevole.

Gli storage vendor stanno lavorando molto per fare un passo avanti e portare i dati più vicini alla potenza di calcolo. In questo momento EMC sta guidando il gruppo (hanno fatto un altro annuncio importante questa mattina di cui scriverò a breve: una scheda di memoria flash con funzioni di cache integrata con i loro array di storage). Penso comunque che sarà solo questione di tempo e presto vedremo soluzioni simili da tutti i principali vendor.

Chi è Isilon

Isilon sviluppa una soluzione Scale out NAS basata su hardware standard x86 e il suo sistema operativo OneFS. I prodotti di questa azienda (e di altre simili) hanno riscosso sempre maggiore successo negli ultimi anni, specialmente in ambiente tipo HPC e, in generale, dove sono richieste grandi capacità di storage e performance. I sistemi scale out sono qualcosa di relativamente nuovo nel panorama dello storage aziendale ma gli utenti finali hanno iniziato a guardarci a fondo proprio per cercare soluzioni più efficaci contro il problema dell’esplosione di dati che stanno affrontando. Infatti, possiamo riassumere i vantaggi di uno storage di tipo scale out con due caratteristiche: modulare e scalabile, così che può partire in piccolo e crescere in funzione delle necessità.

Cos’è HDFS

HDFS significa Hadoop Distributed File System. E’ la scelta primaria che si fa quando si sviluppa o si implementa una soluzione Hadoop (in pratica Hadoop sta diventando lo standard di fatto per i sistemi Big Data).
HDFS è stato disegnato per funzionare su server standard x86 e uno dei suoi primi obiettivi è proprio quello di poter reagire brillantemente alle rotture di questo hardware non ridondato. Questo approccio ha prodotto una struttura molto resiliente ma, allo stesso tempo, con un pessimo uso delle risorse in termini di spazio. HDFS ha anche altre caratteristiche peculiari che riguardano principalmente la sua abilità di gestire data set di grandi dimensioni, è particolarmente efficiente su grandi letture sequenziali e ha dei meccanismi per gestire la coerenza dei dati e la replica degli stessi.

Cosa ha fatto Isilon

Isilon ha “semplicemente” integrato HDFS sul suo scale out NAS. Questa accoppiata è perfetta perché Isilon aveva l’esperienza (e la tecnologia necessaria) per farlo e Big Data è un segmento di mercato in grandissima espansione. I vantaggi di portare HDFS su OneFS, dal mio punto di vista, sono diversi:

  1. Facilità d’uso: (uno dei problemi con gli attuali deploy di Hadoop) non dovendo fra la’ltro dover disegnare un cluster specifico per HDFS.
  2. General purpose: Isilon è una soluzione multiprotocollo, utile non solo per risolvere la problematica Big Data ma anche altre necessità di storage aziendali.
  3. Efficienza: L’interfaccia HDFS di Isilon porta i benefici di OneFS, meno spazio sprecato con una buona performance e resilienza.

Dal punto di vista delle performance non posso dire molto (purtroppo). Non so se la velocità di questa soluzione è simile a quella di un cluster nativo HDFS ma sono sicuro che Isilon avrà modo di dimostrarlo presto.

E’ chiaro quindi che EMC Isilon potrebbe essere una soluzione interessante per quelle aziende che stanno valutando soluzioni Big Data, è meno complesso di una soluzione tradizionale e potrebbe risolvere anche problemi “non big data”!

Nota Finale (e negativa)

E’ chiaro che Isilon sta interpretando bene le richieste che vengono dal mercato enterprise: Le aziende, non solo quelle gigantesche, stanno iniziando ad approcciare nuovi modi per raccogliere informazioni ed elaborarle ma, nel contempo, sono terrorizzate dalla complessità dei cluster tradizionali hadoop.

Avevo iniziato questo post scrivendo che Isilon ha fatto un gran bel lavoro ma che non mi piace al 100%. La ragione è semplice: al momento, Isilon supporta HDFS solo con gli appliances Greenplum HD! Posso capire che, soprattutto all’inizio, si cerchi di creare un vantaggio competitivo ai propri cugini (anche Greenplum è di EMC), ma spero che presto apriranno anche ad altri player.
Sono sicuro che questo meccanismo di lock-in che si instaura fra Greenplum e Isilon possa non fare altro che infastidire gli utenti finali.