Statistica
E il
ramo della matematica che ha per oggetto i metodi per
raccogliere,
organizzare e analizzare un insieme di dati, talvolta influenzati
da svariate cause.
La statistica fornisce validi metodi per raccogliere, correlare e analizzare dati di natura economica, politica, sociale, psicologica, biologica e fisica.
L'attività dello statistico non si limita alla mera raccolta e tabulazione dei dati, ma consiste principalmente nella loro interpretazione.
Lo sviluppo della teoria delle probabilità ha ampliato il campo d'azione delle applicazioni della statistica.
La teoria delle probabilità interviene poi ancora per verificare la verosimiglianza delle conclusioni tratte con metodi statistici, e per indicare il tipo e il numero dinformazioni necessarie all'analisi di un particolare problema.
Metodi
statistici
Le "materie
prime" della statistica sono i dati numerici ottenuti dalla misurazione o dal conteggio degli oggetti in analisi.
Naturalmente esistono criteri e precauzioni da seguire nella fase di raccolta dei dati, in modo che sia garantita la completezza e l'accuratezza delle informazioni che se ne possono trarre. Il primo problema che si presenta allo statistico è quali e quanti dati raccogliere.
In realtà, il problema del censitore, che vuole ottenere una stima accurata e completa della popolazione, così come quello del fisico, che vuole contare il numero di collisioni al secondo tra le molecole di un gas, è quello di decidere la natura precisa di ciò che si deve contare.
In altre parole, è un problema complesso, in statistica, determinare un campione rappresentativo di tutta la "popolazione", cioè dell'insieme sul quale deve essere svolto lo studio statistico.
Presentazione
dei dati
I dati statistici raccolti
devono essere ordinati, tabulati e
presentati in modo da permetterne un'analisi interpretativa
immediata e significativa.
I dati di una tabella di distribuzione delle frequenze possono essere rappresentati graficamente in un istogramma delle frequenze, oppure con un tratto di curva continuo.
L'istogramma consiste in una serie di rettangoli con base uguale alla misura degli intervalli e altezza proporzionale alla frequenza del relativo intervallo.
Unendo i punti medi degli intervalli di un istogramma delle frequenze cumulative si ottiene una curva continua.
Valori medi
La misura
significativa usata più spesso è la semplice media aritmetica,
che viene simboleggiata con x,
ed è data dalla somma dei singoli dati divisa per il loro numero
n.
La mediana e la moda sono altre due misure dell'indice di posizione.
Per calcolare la mediana bisogna dapprima riordinare i valori x in ordine numerico; se n è dispari, essa è il valore centrale di x; se n è pari, è la media delle due x centrali. La moda invece è il valore di x che ricorre più frequentemente.
Variabilità
I dati raccolti possono
mostrare la tendenza
a raggrupparsi intorno a
un solo valore, che in genere coincide con il valore medio,
oppure possono essere "sparpagliati" su tutto
l'intervallo dei valori possibili.
L'indice di variabilità di una distribuzione fornisce allora una indicazione sul "grado di sparpagliamento", o sull'entità con la quale i dati, o una frazione di essi, si discostano dal valore medio.
Una misura della variabilità consiste nella valutazione della differenza tra due dati percentili, solitamente il 25° e il 75°.
La deviazione standard è una conveniente misura della variabilità delle differenze percentili. Se la deviazione standard è piccola, le misure sono tutte ben raggruppate intorno al valore medio; se invece è grande, significa che le misure sono tutte sparpagliate.
Correlazione
Quando due fenomeni di natura fisica, biologica o sociale subiscono delle variazioni proporzionali e simultanee
a causa di fattori
esterni identici, si dice
che i due fenomeni sono positivamente correlati; se uno dei due aumenta nella stessa
proporzione in cui l'altro diminuisce, i due fenomeni si dicono
negativamente correlati.
Il grado di correlazione si calcola applicando un coefficiente di correlazione ai dati dei due fenomeni. A una correlazione positiva perfetta tra le due variabili corrisponde un coefficiente +1; a una correlazione negativa perfetta corrisponde il coefficiente -1; mentre una totale assenza di correlazione è rappresentata dal coefficiente 0.
Modelli
matematici
Un modello matematico è un'idealizzazione matematica di un fenomeno fisico, biologico o sociale, che si
traduce in un sistema, una proposizione, una formula o
un'equazione matematica.
Così, un dado ideale, perfettamente equilibrato, che possa essere lanciato in modo assolutamente casuale, rappresenta un modello matematico per un dado fisico reale. La probabilità che in un numero n di lanci di un dado matematico il numero 6 esca k volte è data dal numero di combinazioni di n oggetti presi k alla volta.
Si può allora mettere alla prova la "bontà" di un dado reale lanciandolo più volte e confrontando i risultati sperimentali con quelli del modello di dado ideale.
Teoria delle
probabilità
Ramo della matematica che si occupa di misurare o determinare
quantitativamente la probabilità che un evento o un esperimento
abbia un certo risultato.
La teoria delle probabilità si basa sullo studio delle permutazioni e combinazioni, e costituisce il fondamento della statistica.
Nei problemi più semplici che si studiano nell'ambito di questa teoria si chiede di determinare la probabilità che si ottenga un certo risultato, in un evento che contempli un numero finito di altre possibili soluzioni.
Se il numero di risultati possibili è n, e f il numero di risultati favorevoli, la probabilità che si abbia un esito favorevole è data da f/n.
Problemi più complicati sono quelli in cui i singoli eventi possibili non hanno uguali probabilità.