Big DataCloudData storageDatacenter

Micro Focus verso il machine learning database con Vertica 9

Micro Focus presenta la versione 9 di Vertica, database agnostico rispetto alle piattaforme cloud con machine learning integrato e la possibilità di riutilizzare i modelli predittivi con una semplice operazione di copia da un cluster a un altro

Con gli annunci a Protect 2017 è arrivata anche la nuova versione di Vertica Analytics Platform. Vertica 9 porta nuove funzionalità nell’ambito Machine Learning in-database per semplificare produzione e deployment dei modelli di machine learning. Vertica offre alle aziende un unico database su base Sql integrato con gli analytics, praticamente agnostico nei confronti della piattaforma di riferimento, in grado di supportare i dati nei più popolari formati, con integrazione avanzata per Spark e Kafka.

La piattaforma si caratterizza per la semplicità del deployment nei diversi ambienti operativi, on premise come in cloud, o in modo nativo su Hadoop e ora è disponibile anche all’interno dei marketplace di Google e Microsoft Azure.
Tra i benefici della soluzioni per gli analytics è riconosciuta la sua capacità di analizzare le diverse forme dei dati nel luogo in cui si trovano, nel momento in cui serve, con le performance richieste dai clienti, mentre le prestazioni relative a machine-learning restano indipendenti dall’infrastruttura utilizzata.

Vertica Unified Platform - Piattaforma per il machine learning end to end
Vertica Unified Platform – Piattaforma per il machine learning end to end

Con l’annuncio di Vertica 9 arriva anche la beta di Vertica in Eon Mode per la valutazione della separazione di storage e risorse per il computing su AWS come base infrastrutturale in cloud. In questo modo le aziende possono gestire lo storage AWS S3 e le prestazioni del motore per gli analytics ottimizzato in funzione delle query. 

Vertica dispone già dalla versione 8.0 di una serie di casi d’uso con gli algoritmi supportati in ambito machine learning.
Vi fanno parte, per esempio:
Naive Bayes, con un modello di predizione sulla probabilità per esempio che una determinata email sia spam o no e per la classificazione dei documenti per categorie; così come Support Vector Machine sfruttato in ambiente medicale per determinare la possibilità o meno di contrarre determinate malattia in relazione alla storia famigliare, età, razza e peso, o ancora come Random Forest, utilizzato in ambito finanziario per prevedere se chi chiede un prestito abbia un’alta o bassa probabilità di onorarlo. I modelli possono essere copiati tra diversi cluster, semplicemente esportando il file binario su un disco fisso e reimportandolo nel nuovo cluster.