Cloudera Enterprise 5.7, support Hive-On-Spark e visibilità multi-tenant

Big DataData storageDatabase

Con la nuova versione di Cloudera Enterprise 5.7 si estende l’efficienza operativa sui carichi di lavoro. Arriva il supporto per Apache Hive e la visibilità sull’utilizzo multi-tenant. Apache Spark pronto per rimpiazzare MapReduce

Cloudera Enterprise è una piattaforma di analisi e gestione dei dati basata su Apache Hadoop, e  con l’annuncio della nuova release 5.7 di inizio aprile migliora le proprie prestazioni (di circa tre volte, secondo il vendor) sui carichi di lavoro più impegnativi assicurando prestazioni avanzate grazie al supporto aggiuntivo per Hive-On-Spark, mentre ci si attende un miglioramento di due volte superiore sulle analisi di business intelligence sulla scorta degli aggiornamenti in fase di progettazione per Apache Impala, il motore analitico d’eccellenza su SQL per Hadoop.

La conquista più importante della versione Cloudera Enterprise 5.7 è però la visibilità sull’utilizzo multi-tenant, sui diversi carichi di lavoro per una gestione ottimizzata delle risorse e il loro pieno controllo. Si tratta di un ulteriore tassello per tutta Hadoop, che ne estende la possibilità di utilizzo. Charles Zedlewski, vice president, Products di Cloudera, spiega: “L’avanzamento della progettazione dei dati e lo sviluppo ETL (Extract Transform and Load, ndr) con Hive-on-Spark segna una tappa fondamentale di questa evoluzione – rafforzando il posizionamento di Spark quale motore standard per l’elaborazione dei dati in Hadoop. Tuttavia, l’engineering dei dati è solo una parte della storia nel mondo business di oggi e, con il rilascio 5.7, i clienti possono abilitare un’ampia gamma di utenti alla piattaforma, il tutto mantenendo prestazioni veloci, facilità di gestione e compliance per la sicurezza”.

cloudera Charles Zedlewsky
Charles Zedlewski, vice president, Products di Cloudera

I tool ETL sono da sempre vero e proprio collo di bottiglia quando si parla di Big Data, e Hadoop con le possibilità di elaborazione in batch indirizza proprio queste problematiche. con MapReduce che è considerato per la maggiore, il motore di esecuzione di eccellenza per Apache Hive (il riepilogatore dei dati, per interrogazione e analisi) ma sempre di più sono i casi in cui questa funzione è affidata a Spark e Cloudera asseconda questo trend.

Cloudera da tempo ha intrapreso questo percorso: ha lanciato One Platform Initiative come roadmap la transizione da MapReduce a Spark e per stimolare lo sviluppo di una migliore integrazione con Hadoop Spark. Con il supporto Hive-On-Spark, assecondato anche da IBM, Intel e persino da MapR, si possono sfruttare le potenzialità di Spark, continuando a stare su Apache Hive.

Per gli addetti ai lavori, resta di fondo in ambito analytics e Big Data, il vantaggio con Hadoop di un supporto in crescita su molteplici casi di utilizzo, in questo caso – con la distribuzione Cloudera – gli amministratori ottengono piena visibilità sull’utilizzo passato e sull’efficienza per utenti, tenant e applicazioni. Nuove sono le funzionalità di reporting di utilizzo del cluster (in Cloudera Manager) che garantisce operazioni efficienti e la corretta allocazione delle risorse tra gruppi e tipologie di carico di lavoro. Ora Cloudera Manager include modelli di cluster che forniscono un semplice flusso di lavoro per replicare le impostazioni di configurazione; questo lo rende facile da dislocare da un ambiente di test ottimizzato alla produzione, da scalare tra diverse aree geografiche o da ripristinare in caso di problemi.

Cloudera Manager_Cluster Utilization Reporting
Cloudera Manager_Cluster Utilization Reporting

Navigator invece propone ora funzioni di derivazione dei dati semplificate per stabilire affidabilità e provenienza degli stessi in modo più semplice, e offre la possibilità di aggiungere metadati gestiti, funzionalità utile per assegnare diversi criteri di reperibilità e coerenza tra i sistemi. La nuova versione di Cloudera Enterprise 5.7 si può scaricare dal sito Cloudera a questo link.

Clicca per leggere la biografia dell'autore  Clicca per nascondere la biografia dell'autore