Calcolatore di Statistica Descrittiva
Calcola media, varianza, deviazione standard (di popolazione e campionaria), minimo, massimo e campo di variazione per un insieme di fino a 8 valori numerici.
Dati di input
Risultati
Statistica descrittiva
La statistica descrittiva è l'insieme delle misure numeriche che sintetizzano le proprietà di un insieme di dati: dove si concentrano i valori (misure di tendenza centrale) e quanto si disperdono intorno a quel centro (misure di variabilità). Dati fino a 8 valori numerici, questo calcolatore restituisce media aritmetica, varianza e deviazione standard di popolazione e campionaria, minimo, massimo e campo di variazione — il punto di partenza di qualsiasi analisi quantitativa.
Le quattro misure e il loro significato
Media (media aritmetica): Si sommano tutti i valori e si divide per 8. La media è il punto di equilibrio del dataset. È sensibile ai valori anomali: un singolo valore estremo può spostarla in modo significativo.
Varianza: La distanza quadratica media rispetto alla media. Elevare al quadrato gli scarti garantisce valori positivi e amplifica l'effetto degli outlier. Esistono due versioni:
- Varianza di popolazione (σ²) — si divide per N
- Varianza campionaria (s²) — si divide per N − 1
Deviazione standard: La radice quadrata della varianza, espressa nella stessa unità di misura dei dati originali (metri, euro, secondi). È la misura di dispersione più riportata in letteratura.
Campo di variazione: massimo − minimo. La misura di dispersione più semplice — utile, ma molto sensibile agli outlier perché dipende da soli due valori.
Varianza di popolazione vs varianza campionaria: N o N−1
La scelta del denominatore — N o N−1 — dipende da cosa rappresentano gli 8 valori inseriti.
Varianza di popolazione (σ², si divide per N): Si usa quando gli 8 valori sono l'intera popolazione di riferimento — non esiste un gruppo più ampio dal quale siano stati estratti. Esempio: i voti finali degli esattamente 8 studenti di un corso universitario che si sta analizzando per intero.
Varianza campionaria (s², si divide per N − 1): Si usa quando gli 8 valori sono un campione casuale estratto da una popolazione più ampia, e si vuole stimare la vera varianza di popolazione. Il denominatore N − 1 è la correzione di Bessel, che rende s² uno stimatore non distorto. Senza di essa, la varianza campionaria sottostimerebbe sistematicamente la varianza vera.
Il motivo intuitivo: un campione tende a raggrupparsi più vicino alla propria media che alla vera media di popolazione, quindi SS ÷ N risulta in media troppo piccolo. Dividere per N − 1 corregge questa distorsione.
Regola empirica: Se si sono raccolti 8 dati da un gruppo molto più ampio (risposte a un questionario, misurazioni, punteggi a un test), si usi la deviazione standard campionaria. Se gli 8 valori definiscono l'intero universo di interesse, si usi la deviazione standard di popolazione.
Esempio guidato — voti a un esame
Voti: 12, 15, 11, 19, 14, 22, 9, 17
Media: (12 + 15 + 11 + 19 + 14 + 22 + 9 + 17) ÷ 8 = 119 ÷ 8 = 14,875
Somma degli scarti quadratici (SS):
- (12 − 14,875)² = 8,27
- (15 − 14,875)² = 0,02
- (11 − 14,875)² = 15,02
- (19 − 14,875)² = 17,02
- (14 − 14,875)² = 0,77
- (22 − 14,875)² = 50,77
- (9 − 14,875)² = 34,52
- (17 − 14,875)² = 4,52
SS = 130,875
Deviazione standard di popolazione: 4,04
Deviazione standard campionaria: 4,32
Il voto 22 è un lieve outlier — da solo rappresenta circa il 39% dell'SS totale.
Mediana: perché non è calcolata
La mediana richiede l'ordinamento — trovare il valore centrale dopo aver disposto i dati dal più piccolo al più grande. Per 8 valori (N pari), la mediana è (4° valore + 5° valore) ÷ 2 dopo l'ordinamento. Il motore del calcolatore valuta le formule algebricamente e non supporta operazioni di ordinamento su input arbitrari. Per la mediana si utilizzi un foglio di calcolo: MEDIANA() in Excel, MEDIAN() in Fogli Google.
Domande frequenti (FAQ)
Qual è la differenza tra deviazione standard di popolazione e campionaria?
La deviazione standard di popolazione (σ) divide per N; quella campionaria (s) divide per N − 1. Si usa σ quando i dati costituiscono l'intera popolazione di riferimento. Si usa s quando sono un campione estratto da una popolazione più ampia.
Il denominatore N − 1 è la correzione di Bessel, che rende s uno stimatore non distorto della vera deviazione standard di popolazione. Senza di essa, la deviazione campionaria tenderebbe a sottostimare sistematicamente la variabilità reale.
Come si calcola la mediana di un insieme di dati?
Si ordinano i valori in modo crescente. Se N è dispari, la mediana è il valore centrale. Se N è pari (come in questo caso con 8 valori), la mediana è la media dei due valori centrali: (4° valore + 5° valore) ÷ 2 dopo l'ordinamento. Questo calcolatore non calcola la mediana perché richiede un ordinamento non supportato dal motore di calcolo. Per la mediana, si utilizzi la funzione MEDIAN() in Excel o in Fogli Google.
Cosa indica la deviazione standard dei dati?
La deviazione standard misura quanto i valori si discostano dalla media. Un valore piccolo indica dati concentrati intorno alla media; un valore grande indica una distribuzione ampia. In una distribuzione normale, circa il 68% dei dati cade entro una deviazione standard dalla media e circa il 95% entro due.
Quando conviene usare la varianza invece della deviazione standard?
La deviazione standard, essendo nella stessa unità di misura dei dati, è più immediata per la comunicazione dei risultati. La varianza è preferita nelle derivazioni matematiche e nell'analisi della varianza (ANOVA) perché le varianze di set indipendenti si sommano direttamente, mentre le deviazioni standard non lo fanno.
Da provare dopo
Calcolatore di probabilità con i dadi
Calcola la probabilità esatta di ottenere una somma minima lanciando un numero qualsiasi di dadi. Risultato in frazione ridotta ai minimi termini e in decimale.