Big DataData storage

La Talend Data Fabric si rinnova per la qualità del dato

Giornalista e collaboratore di TechWeekEurope, si occupa professionalmente di IT e nuove tecnologie da oltre vent'anni e ha collaborato con le principali testate italiane di settore

Follow on: Linkedin

Nuovo anno e nuova versione per la piattaforma di data integration Talend Data Fabric

Talend inizia il 2017 con una nuova versione della piattaforma Talend Data Fabric denominata appunto Winter 17, che acquista funzioni studiate in particolare per dare un maggior valore effettivo agli investimenti delle aziende nella creazione di data lake e, più ampiamente, nella digital transfromation applicata alla gestione dei Big Data.

Nel percorso della digitalizzazione delle aziende – spiega Massimo Tripodi, Sales Country Leader di Talend in Italia – non bisogna fare gli stessi errori del passato. Il data lake come concetto in fondo c’era già, è l’approccio che è diverso e deve mettere al centro fin da subito concetti come la condivisione, la collaborazione, la data governance e la qualità dei dati. Altrimenti nei data lake si raccolgono sì più informazioni ma queste alla fine sono inutili.

Massimo Tripodi
Massimo Tripodi

Per questo la Talend Data Fabric si è dotata in particolare di strumenti di data management per il self-service e la governance del dato. Trasversale resta l’approccio a integrare velocemente nella piattaforma le versioni e le evoluzioni più recenti dei componenti tecnologici – come ad esempio Spark 2.0, Hadoop e MapR – e delle piattaforme cloud con cui la Data Fabric si integra, come l’integrazione con i mondi AWS e Salesforce.

Uno degli effetti della diffusione dell’approccio open source, spiega infatti Talend. è la velocizzazione nello sviluppo di nuove tecnologie. Questo per gli IT manager delle aziende utenti richiede di poter completare i nuovi progetti in maniera più rapida o quantomeno avere la capacità di recepire subito e senza problemi eventuali evoluzioni tecnologiche all’interno di progetti già in essere. La Talend Data Fabric si propone come piattaforma in grado di farlo.

Data Preparation e Data Stewardship

Tra le novità dell’edizione Winter 17, l’applicazione Data Preparation permette di accedere nativamente ai dati Hadoop e Spark, definendo regole per valutare la qualità del dato e se necessario intervenire direttamente sul data lake. Questo riduce costi e tempi nella gestione delle informazioni perché, per essere validato, il dato non deve uscire dal file system.

La parte di Data Preparation
La parte di Data Preparation nella nuova Data Fabric

L’applicazione Data Stewardship ha invece lo scopo ideale di fare in modo che ci sia una unica “verità” sul dato. Attraverso workflow predefiniti e personalizzabili consente di gestire tutte le eccezioni nella valutazione del dato, ossia legate ai dati la cui validità non è possibile stimare completamente con gli algoritmi di machine learning integrati nella Talend Data Fabric. Per queste eccezioni le figure di business “esperte” del tipo specifico di dato possono decidere in autonomia cosa fare delle informazioni che non passano i controlli automatici.

Le nuove funzioni che “avvolgono” il data lake hanno anche un ruolo dal punto di vista della compliance, potendo garantire un controllo su chi fa cosa operando sul data lake. Questo rende la piattaforma aderente a diverse normative specifiche, ad esempio in ambiente bancario o in altri settori dove la “data lineage” è un requisito.

Il bilancio del 2016

La nuova versione della piattaforma Talend Data Fabric arriva dopo un 2016 che la software house considera particolarmente positivo. Talend ha superato per la prima volta la soglia anche psicologica dei 100 milioni di dollari di ricavi e ha messo in carniere le buone valutazioni di analisti per i classici “quadranti” (Gartner per la data integration e Forrester per un nuovo settore definito di Big Data Fabric).

Una schermata di Open Studio
Una schermata di Talend Open Studio

Buoni risultati anche per l’Italia, che è uno dei nuovi mercati inaugurati nel 2016. La filiale locale in questo momento registra un +156 percento rispetto al budget prefissato e negli ultimi due trimestri ha mostrato un livello di performance maggiore rispetto a mercati più maturi come la Francia o la Germania. Con questi numeri è stato autorizzato un piano degli investimenti 2017-2018 per l’incremento nel numero delle assunzioni della filiale nostrana.

Dal punto di vista tecnico Talend ha inoltre già definito alcune linee tecnologiche evolutive per i prossimi due anni. Tra questi spicca l’impegno su Apache Beam, progetto che è nato proprio dalla collaborazione tra Talend e Google e che secondo la software house è uno dei nuovi approcci con la maggiore potenzialità di essere “disruptive”. Apache Beam si presenta in sintesi come uno strato di “traduzione” tra le procedure di gestione dei dati di un data lake e i linguaggi propri delle piattaforme tecnologiche che lo costituiscono (non è detto che un data lake debba essere per forza uniforme).

Partecipa alla nostra inchiesta: La tua azienda adotta soluzioni cloud?

… per rispondere alle altre tre domande, clicca qui…