Cloudera Altus SDX, Paas per il machine learning

Big DataCloudData storagePaas

Cloudera Altus con SDX permette di costruire e gestire analisi multi-funzione in cloud, integrando l’ingegneria dei dati, l’IoT, l’analisi dei clienti e delle operation grazie all’apprendimento automatico

Lo scenario attuale vede registra la crescita di servizi cloud dedicati all’analisi dei big data ma anch una criticità crescente all’interno delle aziende. Molti servizi cloud, infatti, sono stati sviluppati come shadow IT da diversi team, e gli approcci frammentati sono limitati e non scalabili: questo comporta maggiori costi, sforzi e problemi di compliance associati alla replica e all’accesso ai dati.

In questo contesto Cloudera ha presentato la prima soluzione erogata come Platform As A Service (Paas) per l’apprendimento automatico e l’analisi su framework SDX (acronimo di Shared Data Experience): il nome della soluzione è Cloudera Altus SDX, proposta espressamente dedicata al machine learning e agli analytics con l’offerta di un catalogo dati condiviso che riporta il contesto dei dati aziendali.

Altus supporta diversi casi di utilizzo ed è utilizzabile quando vengono richieste diverse funzionalità di analisi sui dati, i benefici più interessanti arrivano però dalla possibilità di lavorare con diverse funzioni analitiche e combinare i dati provenienti da fonti diverse in un unico screenshot complessivo coerente e attuabile.

In questa prospettiva i casi di utilizzo esemplificativi permettono di rispondere a domande complesse per esempio sulle offerte commerciali future, sulla manutenzione predittiva dell’Internet of Things e sul rilevamento avanzato delle minacce.

Cloudera SDX

Ecco come lavora la soluzione: grazie ad SDX, i servizi in cloud di Altus possono accedere ai dati in modo sicuro attraverso un’esperienza affidabile di condivisione dei dati. Con una unica  fonte di metadati sicura per tutti i servizi e gli utenti nell’ambito del machine learning e delle analisi, Altus porta la semplicità e la scalabilità del cloud all’analisi dei big data, e permette alle persone di utilizzare con semplicità diversi servizi analitici per sfruttare al meglio il valore dei dati di business.

Altus offre, inoltre, il controllo da parte dell’IT grazie alla semplificazione della gestione del carico di lavoro, della governance e della sicurezza, mentre l’utente finale dispone di un accesso self-service ai dati e agli strumenti preferiti.

Dal punto di vista dei vantaggi, la soluzione Cloudera colma un gap riconosciuto in questo ambito. I servizi tradizionali di analisi dei dati infatti sono in grado di gestire solo singoli carichi di lavoro e non sono progettati per lavorare con altri servizi di dati in cloud. Spesso, infatti, i dati devono essere spostati manualmente, archiviati in un nuovo formato, oltre a dover modificare le politiche di utilizzo. Il tentativo di integrare questi servizi richiede uno sviluppo personalizzato che risulta costoso e che potrebbe tradursi in prestazioni scadenti, utilizzi non omogenei, problemi di sicurezza e governance.

Invece Altus con SDX permette proprio di costruire gestire analisi multi-funzione in cloud, integrando l’ingegneria dei dati, l’IoT, l’analisi dei clienti e delle operation grazie all’apprendimento automatico. SDX è infatti un software framework modulare che applica una struttura centralizzata e coerente in termini di schema, sicurezza, governance, importazione dei dati e altro ancora, mentre consente a decine di diverse applicazioni di far fronte a insiemi di dati condivisi o sovrapposti.

Altus, che per il momento funziona su AWS e prevede il supporto per Azure in beta include come servizi in cloud: Altus Data Engineering come piattaforma per facilitare l’ETL e la preparazione dei dati per l’analisi e la data science in cloud. E’ parte di un PaaS orizzontale più strettamente integrato al fine di supportare diversi casi d’uso nell’ambito dell’analisi e della data science; Altus SDK per Java consente invece agli utenti di sfruttare in modo programmatico una PaaS per i carichi di lavoro relativi all’ingegneria dei dati.

Altus Analytic DB (in beta) è possibile portare il warehouse ai dati attraverso un’architettura unica, scalabile e in cloud che elimina movimenti di dati complessi e costosi. Esso fornisce analisi self-service e istantanee di BI e SQL a chiunque, in modo semplice, affidabile e sicuro. Inoltre SDX utilizza gli stessi dati e il catalogo è disponibile per gli analisti, i data scientist, i data engineer e per tutti coloro che utilizzano SQL Python e R, senza bisogno di movimentare dati.

Un altro tassello della piattaforma è Altus Data Science (di cui si attende a breve la versione beta) fornisce ai team di data science servizi Python e R on-demand per analisi avanzate e machine learning e funziona su un framework comune di servizi per la sicurezza, la governance, l’inserimento e la catalogazione dei dati.

Clicca per leggere la biografia dell'autore  Clicca per nascondere la biografia dell'autore