[BigQuery] Analisi di basi di dati alla velocità della luce

Di - 18 January 2012 - in

Lentamente Google BigQuery si sta allontanando dalla fase di sperimentazione su invito, pronta ad entrare stabilmente sul mercato. Il progetto è un sistema di analisi dati integrato con le altre principali soluzioni Google, dedicato al mercato enterprise e che fornisce una velocità di esecuzione strabiliante. Ma di cosa si tratta?

Si tratta in primis di un servizio web nato con il preciso scopo di fornire uno strumento per manipolare enormi database (a modello relazionale) con un bassissimo tempo di latenza per l’esecuzione di query, un RDBMS completo e moderno basato su API di facile utilizzo per integrare le proprie applicazioni (web e non) con questo sistema; del resto, il linguaggio utilizzato per le query è una delle molte varianti dello SQL standard, sicuramente familiare a chiunque manipola più o meno frequentemente basi di dati relazionali.

Attualmente la quantità di documentazione a disposizione degli interessati è considerevole e permette già di farsi un’idea precisa di cosa ci si trova davanti, anche grazie alla nuova versione (la seconda) della Developer Guide presente sul sito del progetto. Nelle pagine di esempio è utilizzato come linguaggio di programmazione Python, presentando code snippets di facile compresione che coprono (quasi) ogni scenario d’utilizzo.

Per ora BigQuery è ancora nella fase di testing “selezionato” in cui a un ristretto gruppo di sviluppatori e professionisti è fornito l’accesso al sistema con l’ormai collaudato sistema di Google per i propri prodotti in sviluppo, ossia gli inviti. Per chi fosse interessato è comunque possibile fare richiesta ed entrare nella lista d’attesa per la attuale versione preview, cosa per la quale rimandiamo al modulo di iscrizione e alla pagina introduttiva.

Lo slogan che campeggia nella pagina ufficiale parla chiaro:

Analizzate terabyte di dati con un semplice click o un singolo richiamo alle API.

Infatti l’infrastruttura offerta da Big G è duale: da una parte le API, utilizzabili come di consueto all’interno delle proprie applicazioni – e la storia dice che Google sa come produrre API accessibili ed efficienti, dall’altra l’applicazione web vera e propria; un’esperienza point-and-click che farà la felicità di molte piccole aziende (ma non solo, chiaramente) che faranno uso del servizio.

Il target dichiarato di questo progetto sono proprio le piccole aziende che, a detta di Google, non hanno accesso in maniera semplice a strumenti di analisi dei dati efficaci – che risultano strategicamente essenziali – quando la mole di dati è considerevole. Naturalmente dentro il GooglePlex si auspicano l’utilizzo di BigQuery anche da aziende di dimensioni maggiori se non top, cosa non improbabile.

Anche se è impossibile fare previsioni quantitative, è già noto che l’uso di BigQuery sarà a pagamento, plausibilmente con forme diverse a seconda delle necessità del cliente.
La questione del “quantum” è stata così sintetizzata da Dave Girouard, vice presidente del compartimento applicazioni di Google e presidente di quello enterprise:

Questa è una di quelle cose per le quali in passato si doveva spendere un’incredibile quantità di denaro. È uno dei benefici del cloud: un’infrastruttura che poteva costare cinque milioni di dollari pochi anni fa oggi costa meno di mezzo milione.

Il vero punto forte, a parere di chi scrive, di questo prodotto sarà l’integrazione totale con altri prodotti già affermati, come Google Docs: avere i risultati di una query SQL di analisi delle vendite direttamente disponibile in real time in un foglio di calcolo… con ridicoli tempi morti d’attesa per l’elaborazione di qualche miliardo di tuple.
Naturalmente, come accennato, un altra questione degna di nota è quella del cloud storage: attraverso Google Storage sarà possibile caricare i propri datasets sulla nuvola e da lì manipolarli remotamente (BigQuery supporta database fino a 70TB di dati non compressi).

Ma questo non è che un piccolo esempio delle potenzialità di BigQuery, il cui progresso è da tenere assolutamente sott’occhio perchè promette di avere un forte impatto sul mercato.

Di seguito vi lasciamo al lungo video di presentazione di BigQuery all’ultimo Google I/O:

Via | Google Developers

Leave a Reply

Federico Ruggi Articolo scritto da

Studente di Ingegneria Informatica, sviluppatore, si interessa di matematica, fisica e ogni tanto un po’ di astronomia; in generale, di qualsiasi cosa riesca a mantenere sotto stress i neuroni. Fissato con i LEGO e i sistemi Unix, è amante corrisposto dell’editor vim. Dal Gennaio 2012 è collaboratore di Googlab.

Contatta l'autore

Previous post:

Next post: