Il MIT: per i Big Data la memoria flash può sostituire la RAM

Big DataBusiness intelligenceData storage

Si può fare elaborazione in-memory con la memoria flash e avere prestazioni analoghe alla RAM, basta “scaricare” le CPU di parte della gestione dei dati

Alcuni ricercatori del MIT hanno presentato una nuova architettura per l’elaborazione in-memory dei dati che usa solo memoria flash ed è comparabile in prestazioni con l’approccio convenzionale, ossia mantenere tutti i dati da elaborare nella memoria RAM del sistema. Il campo di applicazione è quello dell’elaborazione parallela, in cui più server accedono a una grande quantità di memoria RAM condivisa, nell’ordine dei Terabye, per le applicazioni analitiche sui Big Data. Per applicazioni del genere di solito non si usa la memoria flash, che costa meno nella RAM ma è anche più lenta.

L’architettura del sistema è stata batezzata BlueDBM. I ricercatori del MIT hanno assemblato in un rack una rete di 20 server, ciascuno connesso a un chip FPGA (Field-Programmable Gate Array), ossia un chip programmabile il cui funzionamento non è univocamente definito al momento in cui la sua rete di transistor viene “incisa” con la microlitografia ma può essere modificato a piacere. Il chip di ogni server fa da “ponte” verso due memorie flash da 500 GB e verso i due FPGA dei due server più vicini nel rack. È un approccio che abbiamo già visto in campo OpenPOWER.

L'architettura generale di BlueDBM
L’architettura generale di BlueDBM

In questo approccio la “rete” di FPGA fa da matrice di connessione tra le CPU dei server e la memoria flash condivisa. I chip FPGA si occupano anche di controllare i flash drive al posto dei loro controller tradizionali e infine eseguono alcuni algoritmi per velocizzare la ricerca delle informazioni nella memoria flash. Gli algoritmi devono essere mirati per l’applicazione che si sta eseguendo e al MIT ne hanno testati tre, tra cui una ricerca basata sulle immagini e una implementazione del sistema PageRank di Google.

Questo approccio velocizza il funzionamento della rete di server perché i FPGA sono molto più veloci delle CPU nell’eseguire le operazioni di ricerca dei dati. I chip FPGA fanno quindi da acceleratori e, poiché sono anche programmabili, un sistema come quello creato dal MIT può essere di volta in volta ottimizzato per la specifica applicazione Big Data che si vuole eseguire. “Non è un sistema per sostituire la DRAM – ha spiegato il professor Arvind del MIT, che ha guidato il gruppo di ricercatori – ma ci possono essere molte applicazioni che possono sfruttare questo nuovo stile di architettura”.

Read also :
Clicca per leggere la biografia dell'autore  Clicca per nascondere la biografia dell'autore