16. Statistica descrittiva#
La statistica descrittiva si occupa di descrivere e riassumere le informazioni contenute nei dati disponibili, con lo scopo di:
comunicare il maggior numero di informazioni rilevanti
nella maniera più semplice e sintetica possibile
Questo, in accordo con la percezione umana todo, avviene tramite indicazioni di:
posizione, come la media, la mediana, la moda, o loro variazioni sul tema
dispersione, come la deviazione standard, la varianza, lo scarto interquartile,…
forma, come skewness o curtosi, o momenti di ordine superiore
correlazione o dipendenza todo correlazione non è dipendenza, fare un riferimento; è necessario dedurre una dipendenza? E” tra i compiti della statistica descrittiva?
Oggi sono disponibili librerie e strumenti informatici gratuiti e liberi per l’analisi e la rappresentazione dei dati. Ad esempio, native o compatibili con Python,
pandas, e geoapndas per dati geografici
plotly come libreria grafica (con dash come ambiente per lo sviluppo di semplici app interattive)
…
Per una galleria di esempi, si rimanda agli esempi e alle risorse messe a disposizione direttamente dagli sviluppatori, come ad esempio i grafici elementari, o i grafici frequentemente usati in statistica, e un”introduzione con le impostazioni di base. Per un livello di dettaglio maggiore, è spesso possibile consultare i file sorgenti con l’implementazione degli strumenti resi disponibili su repository pubblici: nel caso di plotly è possibile consultare questi file nel repository pubblico.
16.1. Dimensione dei dati#
variabili 1-dimensionali
variabili 2-dimensionali o di dimenione piccola
variabili di grandi dimensioni: possono essere necessarie tecniche di riduzione dei dati per far emergere le proprietà significative contenute nei dati raccolti
16.2. Rappresentazione grafica#
EDA: exploratory data analysis. Può essere utilizzata in applicazioni di statistica descrittiva o nelle prime fasi di applicazioni di statistica inferenziale, «per vedere che faccia hanno i dati raccolti» e per fare una prima selezione dei metodi da applicare nelle fasi successive dell’indagine.
Attualmente, sono disponibili i mezzi informatici e un gran numero di librerie per l’analisi dati, dall’elaborazione alla rappresentazione.