Menu

Già, ma quanto sono grandi 'sti “Big Data”?

Già, ma quanto sono grandi 'sti “Big Data”?

Piano piano, è divenuto il tormentone del 2011, ma la vera esplosione l'avremo nel 2012, con tutti i principali fornitori di Software, Appliances, Servizi di integrazione e “in the Cloud” a sbandierarne vantaggi e pericoli, problematiche e soluzioni...

 Stiamo ovviamente parlando dei Big Data, associati alle pagine Web ed ai Social Network, sulla scia delle esperienze e dei servizi maturati da Google, FaceBook, Yahoo, giusto per citare alcuni protagonisti di nuova generazione, che nel loro incedere stanno trascinando i produttori di Appliances, tipo Teradata, HP e Oracle, ai quali fanno da contr'altare IBM, Microsoft ed EMC, grazie anche alle rispettive acquisizioni di Netezza, DatAllegro e Greenplum.
A questo punto si pongono però due domande obbligate:

  1. Cosa vuol dire “Big Data”? Ovvero, di quali dimensioni stiamo parlando?
  2. Da dove scaturiscono tutti questi dati, e soprattutto, quali sono le aziende che devono veramente preoccuparsi del fenomeno, in quanto dovranno gestirli analizzarli e conservarli?

Partiamo da alcune considerazioni oggettive fatte dai principali analisti di mercato:

  1. Per Forrester, nel corso degli anni '90, solo una minima parte dei Data Warehouse delle imprese più grandi superavano le dimensioni di un Terabyte. Nel 2009, le rilevazioni effettuate hanno constatato che oltre due terzi degli Enterprise Data Warehouses (EDW) si collocavano tra 1 e 10-Terabyte. Seguendo questo trend, Forrester stima che entro il 2015, la maggior parte degli EDW supererà i 100 TB, “con le aziende dei settori telecomunicazioni, banche e commercio elettronico in media proiettate verso Data Warehouse dell'ordine di grandezza dei Petabyte.”
  2. Partendo dal 2007, IDC ha stimato che nel 2008 si è avuto un aumento del 73% dei dati generati a livello mondiale, per un valore complessivo di 487 miliardi di Gigabyte. Valore che sta raddoppiando ogni 18 mesi, per arrivare a fine 2011 a 2.000 Exabyte.
  3. Stando ad un recente studio di Gartner, il volume dei dati generati nel corso del 2009 è stato superiore a quello prodotto in tutti i 5.000 anni della storia dell'uomo per così dire “civilizzato”. Nel corso dei prossimi cinque anni, in media, i dati gestiti dalle Enterprise cresceranno di un ulteriore 650%. “Fino al 2005, l'uomo aveva prodotto 150 Exabyte (miliardi di Gigabyte) di dati. Nel 2010, i dati prodotti in formato digitale hanno raggiunto 1.200 Exabyte.”

Giusto per comodità, ricordo che 1 Exabyte è pari a 1000 Petabyte o a 1 milione di Terabyte, e che tale crescita è dovuta soprattutto a dati “non strutturati”, ovvero non espressi nella classica forma relazionale fatta di righe e colonne.

A questi dati si possono aggiungere alcuni valori “pubblici” riguardanti aziende note a tutti:

  1. Twitter gestisce oltre 90 milioni di tweet al giorno;
  2. I Grandi Magazzini Wal-Mart elaborano più di un milione di transazioni all'ora;
  3. Facebook ha un archivio contenente 30 miliardi di oggetti che vanno da contenuti testuali, a immagini, foto, blog, notizie, Link...
  4. Su Youtube vegono caricati ogni minuto 150 minuti di nuovi filmanti, molti dei quali non verranno visti da nessuno, a parte l'autore e la sua stretta cerchia di amici/conoscenti.

Si tratta di valori misurati seguendo vari criteri, ma che convergono su due punti:

  1. La crescita è indubbiamente dirompente e sembra inarrestabile.
  2. A favorire la crescita non sono solo i Social Media o la consumerizzazione dell'informatica, ma la multimedialità, che porta immagini, filmati, suoni che accrescono notevolmente la qualità dei servizi resi agli utenti, nonché i nuovi usi dell'IT nell'ambito della telefonia, della televisione via IP, della tele-formazione, delle tele-conferenze, della tele-diagnostica e chi più ne ha, ne metta.

Ora, senza pensare alle realtà più grandi, ma limitandoci ai dati medi di oggi, con Data Warehouse nell'ordine dei Terabyte, bisogna constatare che gli attuali strumenti di Business Intelligence, di Query e di archiviazione non sono stati concepiti per gestire tali volumi, per cui lavorano tendenzialmente al limite delle loro capacità. In buona sostanza, quindi, i Big Data non sono poi così lontani, sebbene neppure così vicini come certi titoli possono fare pensare. Diciamo che la soglia di attenzione, considerati gli attuali tassi di crescita, va collocata attorno ai 3 Terabyte di dati. Valore sempre più vicino a pressoché qualsiasi Medio-Grande impresa...

Ultima modifica ilMartedì, 19 Marzo 2013 22:10

Aggiungi commento


Codice di sicurezza
Aggiorna

Torna in alto