Big DataCloudData storageM2MNetworkProgettiSoftware vendor

Cloudera SDX, la condivisione dei dati sulle applicazioni multifunzione

Nel 1998 inizia la sua esperienza nel mondo IT in Mondadori e partecipa alla nascita di Web Marketing Tools di cui coordina la redazione. Redattore esperto di software per PC Magazine, e caporedattore di ComputerIdea, segue da circa 20 anni l'evoluzione del mondo hardware, software e dei servizi IT in un confronto continuo con le aziende leader del settore

CLoudera SDX è un framework software modulare per centralizzare l’ambiente di lavoro e permettere alle diverse applicazioni di eseguire le operazioni sui dati con una gestione semplificata

Alla fine di settembre Cloudera ha per la prima volta presentato sul proprio blog la piattaforma SDX. Si tratta di un framework software che rende più semplice lo sviluppo, la sicurezza e la gestione delle applicazioni multifunzione che lavorano sfruttando i dati, quindi nei tipici ambienti basati su DB analitici, operativi, in ambito Data Science e Data Engineering. Parliamo quindi di app deputate alla gestione e alla condivisione dei dati che sfruttano machine learning e strumenti complessi di intelligenza e analisi.

Il framework SDX in questi contesti permette a diverse applicazioni di eseguire e sfruttare insiemi di dati condivisi o sovrapposti in un ambiente di lavoro centralizzato e sicuro nel pieno rispetto dei requisiti aziendali. Possiamo immaginare uno scenario in cui le implementazioni Internet Of Things richiedono analisi ad hoc, mentre il sistema sfrutta i dati acquisiti per l’autoapprendimento, quindi sono necessari elaborazione e riutilizzo dei dati e apprendimento entrambi in tempo reale.

Cloudera SDX
Cloudera SDX

In questi casi alcuni cluster di applicazioni cosiddette “multifunzione” eseguono il loro compito su un’infrastruttura cloud o accedono a basi dati in cloud. Da qui la sfida: mantenere il pieno controllo sullo sviluppo e la distribuzione di queste applicazioni anche in cluster multi-tenant on-premise, come in cloud, e agevolare le soluzioni partner certificate da Clouder in grado di integrarsi con le funzionalità della piattaforma. 

Cloudera SDX sfrutta per esempio un catalogo dati condiviso, come componente chiave, su cui abilitare le funzionalità di sicurezza, e quelle da utilizzare per la gestione delle applicazioni analitiche.
Tramite il catalogo si abilita l’accesso self-service ai dati, senza coinvolgere ogni volta il dipartimento IT. Tre sono le funzionalità chiave di SDX: Cloudera SDX permette la condivsione di dati e metadati persistenti tra le applicazioni, in modo da evitare la generazione de facto dei silos quando i cluster self-service in cloud non li condividono in modo naturale; le funzionalità di sicurezza sono centralizzate, non devono essere riapplicate a ogni copia di set di dati, ma tramite policies pervasive per cui quando i dati vengono spostati o sfruttati da un’altra applicazione non devono essere gestite ulteriormente. Ultimo: il catalogo condiviso di dati e metadati facilita di soddisfare le compliance richieste da GDPR e le conformità HIPAA e PCI-DSS, oltre alla comprensione del contesto dei dati e delle applicazioni self-service. 

Intanto la versione Cloudera 5.13 innalza ulteriormente l’asticella delle capacità di SDX in ambiente cloud. La nuova versione include backup da cluster on-premise su Amazon S3, Cloudera manager come interfaccia di ogni cluster per una facile autenticazione dei dati, controlli di accesso granulari Sentry multi-cluster, funzionalità multi-cluster per Cloudera Navigator, e un metastore Hive basato su Amazon RDS condiviso o MySQL condiviso per gli utenti Azure, per memorizzare e gestire il contesto circa i dati.