Big DataBusiness intelligenceData storage

SAP Data Hub, oltre la complessità del dato

La soluzione SAP Data Hub integra, orchestra e valorizza il patrimonio dati aziendali, abilitando lo sviluppo di potenti data pipeline per favorire il business

La proliferazione dei dati, a partire proprio anche da fonti eterogenee, genera una complessità che può diventare difficile da gestire. La nuova soluzione SAP Data Hub abilita in questi contesti la possibilità di osservare dall’alto, ma in dettaglio, il panorama dei dati disponibili, da risorse SAP, come Hana – ma anche da Apache Hadoop, o con Apache Spark e SAP Vora – in modo da studiare e ottimizzare le interconnessioni e le possibilità di utilizzo, così come per rilevare fenomeni di cambiamento che altrimenti potrebbero passare inosservati.

Lo scenario, secondo uno studio promosso da SAP, evidenzia come il 74 percento dei decisori IT constati la complessità emergente dei data landscape nella propria realtà al punto da perdere agilità decisionale e operativa, mentre l’86 percento lamenta una mancata valorizzazione del dato perché troppo difficile accedervi.

SAP Data Hub - Soluzione per una visione dall'alto e di insieme sul data landscape aziendale
SAP Data Hub – Soluzione per una visione dall’alto e di insieme sul data landscape aziendale

SAP Data Hub favorisce invece l’integrazione e la gestione delle informazioni, abilita la creazione di data pipeline per attivare ed estendere progetti sui dati a un maggior numero di utenti e rappresenta in un certo senso l’anello di congiunzione tra i Big Data e le informazioni utilizzabili sul campo. 
Sviluppare e accelerare la gestione di data pipeline offre una più veloce gestione delle attività di pipeline, con la distribuzione dei compiti di calcolo dove il dato risiede. Così l’attività di pipeline sono completate in modo più veloce, a vantaggio del business.

I processi di data pipeline operano accedendo all’informazione, la armonizzano, la trasformano e la processano dalle diverse fonti. Una volta generata una data pipeline, il modello può poi essere copiato e modificato per essere utilizzato, sfruttando sempre le librerie per calcoli e machine learning come per esempio TensorFlow.  

In questo modo si possono sviluppare applicazioni che effettivamente possano estrarre valore dai dati sia negli scenari che già poggiano in cloud, sia sui sistemi on premise, possono essere evidenziate nuove opportunità nei dati, ma anche essere risolte per tempo rischi o pericoli emergenti proprio da una vista di insieme.

Nello scenario della proposta SAP, Data Hub rientra a pieno titolo come elemento chiave del sistema SAP Leonardo, e lavora con SAP Vorala soluzione di elaborazione in-memory su Hadoop/Spark per l’analisi dei dati non strutturati – e Cloud Platform Big Data Services