16. Statistica descrittiva#

La statistica descrittiva si occupa di descrivere e riassumere le informazioni contenute nei dati disponibili, con lo scopo di:

  • comunicare il maggior numero di informazioni rilevanti

  • nella maniera più semplice e sintetica possibile

Questo, in accordo con la percezione umana todo, avviene tramite indicazioni di:

  • posizione, come la media, la mediana, la moda, o loro variazioni sul tema

  • dispersione, come la deviazione standard, la varianza, lo scarto interquartile,…

  • forma, come skewness o curtosi, o momenti di ordine superiore

  • correlazione o dipendenza todo correlazione non è dipendenza, fare un riferimento; è necessario dedurre una dipendenza? E” tra i compiti della statistica descrittiva?

Oggi sono disponibili librerie e strumenti informatici gratuiti e liberi per l’analisi e la rappresentazione dei dati. Ad esempio, native o compatibili con Python,

  • pandas, e geoapndas per dati geografici

  • plotly come libreria grafica (con dash come ambiente per lo sviluppo di semplici app interattive)

Per una galleria di esempi, si rimanda agli esempi e alle risorse messe a disposizione direttamente dagli sviluppatori, come ad esempio i grafici elementari, o i grafici frequentemente usati in statistica, e un”introduzione con le impostazioni di base. Per un livello di dettaglio maggiore, è spesso possibile consultare i file sorgenti con l’implementazione degli strumenti resi disponibili su repository pubblici: nel caso di plotly è possibile consultare questi file nel repository pubblico.

16.1. Dimensione dei dati#

  • variabili 1-dimensionali

  • variabili 2-dimensionali o di dimenione piccola

  • variabili di grandi dimensioni: possono essere necessarie tecniche di riduzione dei dati per far emergere le proprietà significative contenute nei dati raccolti

16.2. Rappresentazione grafica#

EDA: exploratory data analysis. Può essere utilizzata in applicazioni di statistica descrittiva o nelle prime fasi di applicazioni di statistica inferenziale, «per vedere che faccia hanno i dati raccolti» e per fare una prima selezione dei metodi da applicare nelle fasi successive dell’indagine.

Attualmente, sono disponibili i mezzi informatici e un gran numero di librerie per l’analisi dati, dall’elaborazione alla rappresentazione.

16.3. Variabili 1-dimensionali#

16.4. Variabili 2-dimensionali#

16.5. Variabili di grandi dimensioni#