18. Statistica inferenziale#
La statistica inferenziale si occupa di stabilire le caratteristiche di una popolazione dall’osservazione di un suo campione, usando gli strumenti del calcolo delle probabilità.
Tra le applicazioni della statistica inferenziale si possono distinguere due applicazioni principali:
Stima
Stima di parametri di una popolazione, noto un campione di essa:
valori puntuali, come ad esempio la media o la varianza di una popolazione
intervalli, come ad esempio gli intervalli di confidenza
Verifica ipotesi
La verifica delle ipotesi è un’attività intimamente connessa al metodo sperimentale e alla formazione della conoscenza nella storia umana secondo criteri logici. Nonostante sia poco sensata una classificazione rigida delle attività che coinvolgono la verifica delle ipotesi (seguendo la documentazione di \(\texttt{scipy.stats}\)), si possono distinguere
test su campioni singoli o coppie di campioni: \(t\)-test, \(\chi^2\)-test, \(Z\)-test, Wilcoxon,…
test di correlazione: regressione lineare e generalizzata, Pearson \(r\)-test, Spearman \(r\)-test,…
test di indipendenza, verifica se i campioni provengono dalla stessa popolazione (e quindi dalla stessa distribuzione), o da popolazioni con distribuzioni con proprietà in comune: ANOVA, Tukey, Kruskal-Wallis H-test, Mann-Whitney U-test,…
ri-campionamento e metodi MC: per valutare \(p\)-value e intervalli di confidenza test di validità di ipotesi
ipotesi multiple
Esistono (almeno) due approcci alla statistica inferenziale:
l’apporccio classico frequentista: … todo dire due parole
l’approccio bayesiano: utilizza le osservazioni per trovare una stima migliore (a posteriori, dopo aver osservato il campione) di modello di partenza del sistema (a priori, da conoscenze precedenti, da stime sensate,…), grazie all’uso del teorema di Bayes.
Questo capitolo si concentra principalmente sull’approccio classico frequentista; dell’approccio bayesiano, ci si limita a dire che usa delle conoscenze pregresse sul fenomeno e che è stato reso praticabile dai recenti sviluppi nelle capacità di calcolo a disposizione. todo aggiungere sezione sull’approccio bayesiano? todo esempio con variabili discrete di dimensione limitata, senza introdurre i problemi sulle scelte di priori-posteriori
todo Scelta modello? Serve una discuterne? Rimandato a ML?