Il prossimo passo verso l’analisi dei Big Data

Che cos'è un Brand Voice ?

I Big Data stanno abilitando cambiamenti significativi nell’ambito della business intelligence, degli analytics, e più in generale dell’infrastruttura IT

A che punto siamo oggi?

Parlando di Big Data e analytics, i dati che siamo abituati a gestire sono dati di business strutturati — organizzati in ordinate file e colonne di sistemi data base relazionali. Gli analytics servono in gran parte per rispondere a domande su ciò che è accaduto nel passato (analisi descrittive) e per avere una visione che ci pertemetta comprendere perché una tal cosa è accaduta (analisi diagnostiche). Le persone di business utilizzano queste informazioni per prendere decisioni più consapevoli.

Qual è la differenza con i Big Data?

Se questo è sicuramente utile, la domanda a cui i business manager dovrebbero rispondere è “Cosa succederà se io faccio una certa azione?” (analisi predittiva) o “Quali azioni alternative sono disponibili, e quali possono essere i risultati per ognuna di queste?” (analisi prescrittive). Questo genere di analisi possono fare leva su nuove fonti di dati — molti dei quali non sono strutturati, come testi, audio, immagini –, nuovi modi per archiviare ed analizzare i dati, e nuovi modi per condividere i risultati delle analisi, esattamente nel momento in cui la decisione deve essere presa. Inoltre, le analisi prescrittive includono una serie di strumenti che correlano l’azione intrapresa con i risultati per migliorare il modello di analisi stesso.
Per rendere le analisi predittive più efficaci, ci aspettiamo che il modello analitico sia incorporato direttamente nelle applicazioni di business, in modo che funzioni in tempo reale e dia i risultati nel momento esatto in cui bisogna prendere una decisione.

big data e analytics

 

Di cosa abbiamo bisogno per arrivare fino a qui?

Disporre di analisi predittive e prescrittive — integrate nei processi e nelle applicazioni di business — richiede attività di processo distribuite nei cluster dei sistemi per velocizzarne l’accesso e l’elaborazione. E questo è l’approccio dei moderni sistemi di Big Data analytics come Apache Hadoop e Spark.
Per fare questo salto verso le analisi predittive e prescrittive occorrono tre cose:

  • avanzamenti nella potenza di calcolo in grado di abilitare elaborazione in-memory in tempo reale di grandi quantità di dati;
  • strumenti che permettano ai data scientist di sviluppare modelli analitici utilizzando tecniche di machine-learning che possono estrarre valore dai dati non strutturati;
  • framework in grado di abilitare gli sviluppatori di software ad incorporare facilmente modelli scientifici di dati nelle applicazioni che stanno sviluppando.

Come Intel può supportare tutto questo?

Intel lavora per rendere possibili analisi predittive e prescrittive su molteplici fronti. Prima di tutto, fornendo le capacità di elaborazione necessarie per processare imponenti quantità di dati non strutturati, in tempo reale in-memory. La nuova famiglia di processori Intel® Xeon® E7-8800/4800 v4 offre margini di crescita con il supporto per quattro e otto socket ed opzioni fino a 64 socket tramite controller di nodo di terze parti. Offre inoltre capacità di memoria leader del settore fino a 24 TB in un sistema a otto socket, consentendo l’archiviazione di enormi set di dati interamente in-memory anziché su dischi fissi, per accelerare l’estrazione di informazioni ed il processo decisionale.

Ma non basta solo la potenza. Intel sta lavorando per fornire gli strumenti ed il framework che i data scientist e gli sviluppatori di software necessitano per rendere l’analisi prescrittiva una realtà. Intel ha dato vita a Trusted Analytics Platform (TAP), un progetto software open source che permette ai data scientist di pubblicare facilmente fonti di dati, data analytical pipeline, ed applicazioni, così che possano focalizzarsi maggiormente sugli analytics e lasciare il codice ai programmatori. Recentemente, TAP è stato ampliato con Gearpump— un framework che aggiunge capacità di ‘key data ingestion’ per abilitare workflow dinamici con bassa latenza ed alta disponibilità.

Dal momento che TAP e Gearpump sono open source, la comunità di data scientist e sviluppatori che costruiscono e migliorano la piattaforma e condividono strumenti e soluzioni è in continua crescita.

industrial-big-data-system-diagram

Cosa significa per le aziende?

Il data warehouse non sparirà. Le aziende avranno ancora bisogno di sapere cosa è successo nel passato. Ma i data center cresceranno in portata e capacità, espandendosi in un cluster di server per raccogliere dati da fonti diverse. I data scientist svilupperanno modelli di analisi prescrittive e collaboreranno con gli sviluppatori di software per incorporarle nelle applicazioni di business. La componente hardware diventerà sempre più potente per supportare queste capacità.

Autore: Silicon
Clicca per leggere la biografia dell'autore  Clicca per nascondere la biografia dell'autore