5 Strumenti open source per la Data Visualization
La Data visualization è la rappresentazione di dati attraverso grafici, diagrammi, infografiche, animazioni e dashboard anche interattive. Le informazioni visualizzate comunicano dati complessi e le relazioni tra di essi e sono accompagnate da insights, in modo che risultino facili da comprendere e che aiutino a prendere decisioni basate sui dati.
Le tecniche di Data visualization possono essere utilizzate per tantissimi scopi e non solo all’interno dei team di analisi. I team che gestiscono i sistemi di reporting tipicamente sfruttano alcuni template e viste per monitorare le performance. Ma sarebbe riduttivo affermare che la data visualization consista solo in dashboard che tracciano le prestazioni. Ad esempio, un data analyst potrebbe utilizzare una word cloud per catturare concetti chiave, trend e relazioni nascoste. Ci sono infiniti modi per rappresentare i diversi tipi di dato ed è importante ricordare che la data visualizaton è una competenza che dovrebbe essere estesa anche all’esterno del team analitico. Ad esempio, spesso i manager utilizzano le tecniche della data visualization per esporre i cambiamenti che avverranno nella gerarchia o nella struttura organizzativa. I data analyst, invece, la utilizzano per scoprire e spiegare pattern e trend.
Possiamo dire che la Data Visualization ha 4 scopi principali: la generazione di idee, l’illustrazione di idee, la scoperta visiva e la visualizzazione dei dati vera e propria. Vediamoli nel dettaglio.
Gli scopi della Data Visualization
Generazione di idee: la visualizzazione dei dati è spesso utilizzata per stimolare nuove idee all’interno di un gruppo di lavoro. Nonostante questo tipo di visualizzazioni siano grezze e incomplete, aiutano a porre le basi per assicurarsi che il team sia allineato sul problema che si sta cercando di risolvere.
Illustrazione di idee: questo scopo consiste nel veicolare un’idea, come ad esempio un processo o un framework particolare. Si usa solitamente nei contesti di apprendimento e certificazione, ma può anche essere usata per rappresentare processi e strutture aziendali. Ad esempio, i project manager utilizzano spesso i diagrammi di gantt e grafici a cascata per illustrare i flussi di lavoro. Anche la modellazione dei dati utilizza l’astrazione per rappresentare e comprendere meglio i flussi di dati all’interno di un’organizzazione.
Le ultime due casistiche sono più vicine ai professionisti che lavorano con i dati. Mentre la scoperta visiva aiuta a identificare pattern e trend in un dataset, come ad esempio la stagionalità, la visualizzazione vera e propria aiuta a raccontare la storia dei dati, ad esempio dopo la scoperta di un nuovo insight.
In altre parole, la visualizzazione dei dati è uno step critico nel processo di data science e aiuta persone e team a veicolare e comunicare dati e storie di dati in modo più efficiente. Oggi è molto facile accedere agli strumenti di data visualization, anche per i principianti.
> Scopri anche il corso di introduzione alla Data Visualization
5 strumenti open source per la visualizzazione dei dati
Gephi
Gephi è uno dei software di visualizzazione ed esplorazione dei dati open source e gratis più completi che ci siano sul mercato. È uno strumento potente e particolarmente indicato per chi desidera utilizzare i grafici per fare semplici operazioni di analisi e per chi ha necessità di creare visualizzazioni di dati provenienti dai social network. È possibile creare grafici interattivi che permettono di interagire con le rappresentazioni, manipolare strutture e colori per scoprire pattern nascosti.
Tableau Desktop/Tableau Public
Tableau è uno strumento di visualizzazione freemium, gratis fino a 10GB di archiviazione. Supporta sia la versione desktop, che quella browser e ha una community davvero attiva, che ha ribattezzato le visualizzazioni “viz” o “vizzes”. Gli utenti possono scegliere di utilizzare come template 3 milioni di vizzes create da un milione di utenti in tutto il mondo.
È possibile connettere dati da google sheet, excel, .txt, json., file spaziali, Odata, .rdata, .sav e altri file statistici. Permette la creazione di dashboard interattive, il controllo completo di colori ed etichette e alcune funzioni di Business Intelligence.
> Scopri anche il corso Tableau Desktop
RAWGraph
Il pubblico target di RAWGraphs sono gli utenti casuali, ma si rivela un eccellente strumento anche per i professionisti che lavorano con i dati. È possibile creare grafici di ogni tipo e costruire diagrammi e infografiche facilmente. Anche il processo è molto semplice: si tratta di incollare il link ai dati che si vogliono processare e RAWGRaphs crea diverse opzioni di visualizzazione. Lo strumento è gratuito e offre alcuni tutorial per gli utenti.
Plotly
Plotly è uno strumento di visualizzazione dei dati interattivo, open source e basato su browser, costruito sulle librerie di visualizzazione d3.js. Permette la creazione di visualizzazioni multi-grafico quando si confrontano set di dati. Plotly è un ottimo strumento per creare grafici complessi e interattivi, che possono essere visualizzati all’interno di dashboard o inseriti in un sito web. Il tool può essere installato in locale o distribuito nel cloud: è quindi possibile lavorare anche offline.
D3.js
D3.JS è uno degli strumenti di visualizzazione più efficaci per funzionalità, caratteristiche e creatività del design. Si tratta di una libreria JavaScript gratuita che aiuta a creare immagini utilizzando i dati. Lo strumento consente di connettere dati arbitrari a un Document Object Model (DOM) e quindi applicare trasformazioni basate sui dati al documento. Con l’API di programmazione DOM, i programmatori possono accedere ai documenti come oggetti.
È importante per un data analyst scegliere sempre il miglior strumento per la visualizzazione dei dati e ci sono alcuni accorgimenti da tenere in considerazione per fare questa scelta: ti consigliamo infatti di controllare la frequenza con cui il tool viene aggiornato, quali tipologie di visualizzazioni fornisce (2D, 3D, spaziali e finanziarie, semplici grafici di base), quali sono le opzioni di personalizzazione e design e qual è la licenza giusta.