Menu

Le migliori piattaforme per Big Data Fabric

Forrester ha esaminato 15 fornitori di soluzioni complete per Big Data Fabric — Cambridge Semantics, Cloudera, Denodo Technologies, Hitachi Vantara, Hortonworks, IBM, Informatica, Oracle, Paxata, Podium Data, SAP, Syncsort, Talend, TIBCO Software, Trifacta — e sulla base di 26 parametri di confronto ha stabilito che i migliori sono...

Di Big Data Fabric abbiamo già visto gli obiettivi, le caratteristiche, le architetture, le componenti, per cui abbiamo ormai tutti gli elementi per cominciare a lavorarci, scegliendone le componenti e collegandole tra loro. Oppure, si può procedere affidandosi ad un fornitore che ha allestito delle suite complete, semplificando di molto il problema ma nel contempo rischiando di perdere parte della flessibilità e dell'autonomia che si avrebbero procedendo da soli. La scelta del fornitore diventa così critica, dovendone valutare anche le strategie e la consistenza sul mercato, al di là delle pure scelte tecnologiche e delle funzionalità offerte. Così, un consistente ausilio si può avere dal recente report di Forrester che, come al solito, dopo aver individuato i parametri sui quali sviluppare il confronto e selezionato i Vendor con una concreta offerta nell'area, ha stabilito una classifica che, come sempre, non è di tipo assoluto, ma va interpretata e calata nella realtà di partenza di ciascuna azienda.

Diciamo subito che tra le aziende che hanno dimostrato di avere una valida offerta di Big Data Fabric, a primeggiare sono state Talend, Denodo Technologies, Oracle, IBM e Paxata. Nella seconda fascia di preferenza si sono qualificate Hortonworks, Cambridge Semantics, SAP, Trifacta, Cloudera e Syncsort, mentre ad inseguire troviamo Podium Data, TIBCO Software, Informatica e Hitachi Vantara.

I criteri di valutazione dei Big Data Fabric

Senza entrare troppo nello specifico - per il quale rimandiamo al Report di Forrester acquistabile direttamente dal loro sito - la valutazione dell'attuale offerta sul mercato è stata sviluppata in due fasi. Nella prima sono state esaminate le caratteristiche tecniche ideali delle piattaforme per allestire Big Data Fabric di qualità, nella seconda è stata fatta una selezione preliminare dei Vendor da includere nel raffronto.

Nella prima fase, sono stati identificati 26 parametri di valutazione, raggruppabili idealmente in tre macro-famiglie:

  1. L'offerta attuale: le caratteristiche strutturali, funzionali e operative delle piattaforme sottoposte da ciascun Vendor per il raffronto, tenendo conto delle relative versioni e componenti.
  2. Le strategie di sviluppo: considerando che il settore è comunque in forte evoluzione, al di là delle caratteristiche attuali delle piattaforme sono state esaminate le linee sulle quali ciascun produttore intende sviluppare la propria piattaforma e, più in generale, l'offerta che vi è connessa. Il che non si limita alle componenti operative, ma anche alle formule di offerta, ai servizi, alle scelte attinenti il go-to-market.
  3. Presenza sul mercato: da ultimo, per valutare la solidità e le prospettive di ciascuna azienda, ne sono state esaminate le quote di mercato, la territorialità, le alleanze, la consistenza patrimoniale e la struttura societaria.

Nella seconda fase, al di là delle pure dichiarazioni di marketing o degli annunci prospettici, è stata esaminata l'effettiva consistenza dell'offerta degli operatori del settore: è stato distribuito loro un questionario e in seguito, dopo averne eliminati quelli che per incompletezza dell'offerta o scarsità di clienti non hanno superato la prima selezione, attraverso interviste e contatti diretti ne è stata approfondita la valutazione della piattaforma.A questo punto, pur potendo rientrare nel lotto degli esaminandi, alcuni Vendor hanno preferito rinunciare a partecipare al confronto. Questa fase è stata utile anche per mettere a punto gli stessi criteri di valutazione da utilizzare nel corso del raffronto e nelle determinzione dei loro pesi relativi. Da ultimo, sono state condotte varie interviste con i clienti dei vari fornitori così da utilizzarne le dirette impressioni come ulteriori elementi di valutazione.

Alla fine di questo processo, gli analisti di Forrester sono arrivati ad individuare 15 aziende con una offerta adeguata: Cambridge Semantics, Cloudera, Denodo Technologies, Hitachi Vantara, Hortonworks, IBM, Informatica, Oracle, Paxata, Podium Data, SAP, Syncsort, Talend, TIBCO Software e Trifacta, stabilendone i posizionamenti relativi rappresentati graficamente nella figura sottostante. Da notare che alcuni nomi sono stati "censurati" in quanto poco significativi per il mercato italiano e per mantenere una certa riservatezza sul lavoro di Forrester.

Tra le principali caratteristiche richieste per entrare nella selezione sottolineo le seguenti:

  • La disponibilità di una piattaforma completa per allestire Big Data Fabric e rilasciata ufficialmente in quanto tale prima del 31 marzo 2018. Tra le caratteristiche di base, considerate irrinunciabili, rientravano le funzioni di gestione di accesso ai dati, di data discovery, di data transformation, di integrazione e preparazione, di orchestrazione dei dati provenienti da fonti diverse. Tra le funzioni di controllo rientravano quelle per gestione della sicurezza dei dati e di data governance. Naturalmente, la piattaforma doveva risultare in grado di operare indifferentemente con grandi quantità di dati strutturati e non, gestendone anche i metadati, i cataloghi, i modelli dei dati e la loro conservazione nelle più diverse forme di Storage, utilizzando componenti quali Apache Hadoop, MPP EDW, NoSQL, Apache Spark, nonché le tecnologie in-memory.
  • La possibilità di essere installate presso l'azienda stessa (On Premise) o in ambienti Cloud, possibilmente passando da una configurazione all'altra in modo dinamico e trasparente per gli utenti. Per di più, trattandosi di una piattaforma, non ci doveva esser alcun legame rigido o dipendenza vincolante con componendi o applicazioni di tipo proprietario. L'offerta della piattaforma per Big Data Fabric doveva apparire in quanto tale e non come parte di altri ambienti applicativi o di analisi dei dati.
  • L'illustrazione di alcuni contesti operativi nei quali la piattaforma era già in esercizio presso alcuni clienti.
  • Minimo 10 clienti attivi, non in fase di valutazione dei progetti ma già titolari di contratti di esercizio, distribuiti su un'ampia base geografica, con l'accesso ad almeno tre di loro per svilupparne delle interviste e ricavarne le impressioni d'uso.

I principali elementi di differenziazione tra le varie offerte, che hanno portato all'individuazione di quelli considerati i migliori, sono stati la disponibilità di meccanismi di intelligenza artificiale e Machine Learning, la scalabilità, le prestazioni e il supporto nell'ambito degli specifici settori verticali di applicazione della piattaforma:

Forrester Wave™: Big Data Fabric, Q2 2018

Leader, forti e inseguitori

Tra le prime posizioni della classifica, Forrester ha collocato Talend, IBM e Oracle. Talend deve il proprio primato alla grande disponibilità di contesti già pronti all'uso nei quali la piattaforma può essere rapidamente collocata e resa operativa. Caratteristica che si abbina alla possibilità di operare tanto On Premise, quando in ambienti Cloud e all'ampia gamma di tecnologie offerte tipo la capacità di generare in automatico codice nativo Spark e MapReduce per trasformare e processare i dati sui cluster Hadoop o il gran numero di connettori per integrare la piattaforma negli ambienti e con i componenti più disparati compresi i sensori IoT.

Il pregio principale della soluzione di IBM, che continua ad avere una consistenza patrimoniale e capacità di investimento difficilmente raggiungibili dai suoi concorrenti, va attribuito ai progressi fatti nell'ambito dell'intelligenza artificiale e del Machine Learning guidati dal Cognitive Computing incentrato su Watson. Come facilmente immaginabile, un altro punto di forza della piattaforma di IBM sta nella sua capacità di supportare gli ambienti Legacy che tuttora imperano tra le grandi aziende di ogni parte del mondo, per non parlare della sua copertura geografica universale in fatto di strutture e servizi. Posizione simile a quella di Oracle che per le aziende che hanno già adottato i suoi database rappesenta una scelta molto valida.

Appena dietro troviamo Hortonworks, una azienda nata nel 2011 con l'obiettivo di supportare Apache Hadoop e Spark per la gestione dei Big Data e che ha sposato in pieno la filosofia Open Source utilizzandone numerose componenti (oltre a Apache Hadoop, la piattaforma si compone, tra gli altri, di MapReduce, Hive, HBase, Atlas, Ranger, Spark)  sui quali ha sviluppato soluzioni innovative tipo il suo DataPlane Service (DPS) per gestire la sicurezza e la governance dei Big Data Fabric.

Nella gestione dei dati, SAP è attiva con il proprio HANA che consente di operare direttamente In-Memory, assicurando così eccellenti prestazioni nella elaborazione dei big data. SAP ha affrontato le soluzioni per Data Fabric relativamente di recente, ma in modo molto aggressivo, contando sulla sua elevata penetrazione tra le grandi imprese e il potenziale offerto da HANA al quale sono stati affiancati SAP Data Hub, che include SAP Vora e lavora in abbinamento ad Apache Spark.

Per allestire Data Fabric, dopo esser stata tra le prime a rilasciare una piattaforma basata su Hadoop per la gestione dei big data, Cloudera ha sviluppato SDX (Shared Data Experience), piattaforma che fa largo uso di componenti Open Source (Apache Hive, Apache HBase, Apache HCatalog, Apache Avro) che eroga i servizi di gestione dei dati, di sicurezza, di governance, di integrazione, preparazione.

Ad inseguire troviamo TIBCO Software, che ha rafforzato la propria offerta nel settore attraverso l'acquisizione delle componenti di Data Virtualization di Cisco, Informatica e Hitachi Vantara, anch'essa protagonista di una recente acquisizione - Pentaho - che sta integrando nella propria piattaforma.

Ultima modifica ilMartedì, 07 Agosto 2018 11:41

Aggiungi commento


Codice di sicurezza
Aggiorna

Torna in alto

I cookie rendono più facile per noi fornirti i nostri servizi. Con l'utilizzo dei nostri servizi ci autorizzi a utilizzare i cookie.
Maggiori informazioni Ok