A prima vista DataCore Parallel I/O può sembrare che prometta troppo per essere vero… però basta provarlo una volta per capire tutto il suo potenziale riguardo alle prestazioni e ai possibili risparmi.
Benchmark e mondo reale
Devo dire che, francamente, ero scettico e avevo ampiamente sottovalutato questa tecnologia. I benchmark erano tutti incredibilmente buoni (troppo buoni??!!)… Si sa, non difficile girare attorno ad alcune specifiche e preparare configurazioni non realistiche per ottenere ciò che ti interessa. ma fortunatamente questo non era il caso.
Quando DataCore mi ha fatto vedere il prodotto non mi ha convinto con i benchmark, ma con test reali su server veri! In fatti sono stato particolarmente impressionato da alcuni workloads fatti girare su dei DB server Windows, e quando Parallel I/O era abilitato i risultati erano dozzine di volte più rapidi ad arrivare… e lo stesso è successo con delle VM sul cloud (che ovviamente è lo stesso visto che qui si parla di software, ma penso sia importante farlo notare).>/p>
Si, incredibilmente più veloce!
Lo so che può sembrare ridicolo, ma non lo è. DataCore Parallel Server è un semplice componente software che modifica come le IO vengono eseguite. Sfrutta il gran numero di core disponibili nelle CPU moderne e la RAM installata nel server per riorganizzare le IO in parallelo invece che sequenzialmente, portando la latenza a microsecondi e, consegueentemente, ad un numero molto più grande di IOPS. (qui il mio paper se siete interessati a saperne di più)
Con questo tipo di prestazioni è possibile costruire cluster più piccoli oppure ottenere risultati più velocemente a parità di nodi… e senza modificare una riga nel codice delle applicazioni o abilitando costose opzioni in-memory sul vostro database. E’ ideale per Big Data Analytics, ma ci sono anche altre occasioni dove un software così può fare la differenza.
E’ solo software
Non voglio diminuire il valore di Parallel I/O dicendo “solo software”, anzi, proprio il contrario! Il fatto che stiamo parlando di software rende questa soluzione ideale per molti casi d’uso e si può installare anche su VM o, ancora meglio, su VM istanziate sul cloud.
In fatti, se si guardano i prezzi dei cloud provider più importanti, il prezzo di VM con configurazioni Large-memory Large-CPU sono migliori di quelli per VM All-Flash… un altro modo per spendere meno, specialmente in configurazioni Big Data dove il numero di nodi può essere consistente.
Nota finale
DataCore è una di quelle aziende di successo che si sentono da tanti anni, con decine di migliaia di installazioni è oltre dodicimila clienti. L’anno scorso, con l’introduzione di Parallel I/O hanno dimostrato che sono ancora in grado di innovare e portare valore ai loro clienti. Ora, grazie all’evoluzione di Parallel I/O, stanno entrando in un nuovo mercato con una soluzione che può far risparmiare tantissimo denaro e portare risultati più velocemente. E non si tratta di magia, è solo che hanno trovato un modo migliore di utilizzare le risorse disponibili nei server moderni.
Parallel Server è perfetto per i workload di tipo Big Data, rendendoli di fatto disponibile anche ad un pubblico più largo, e sono sicuro che vedremo altri interessanti casi d’uso in futuro.
[NOTA: DataCore è un mio cliente e ho scritto questo paper per loro]