Calcolatore di Varianza e Deviazione Standard
Calcola varianza e deviazione standard di un insieme di dati numerici. Supporta sia la formula campionaria (÷ n−1) sia quella di popolazione (÷ n).
Dati di input
Risultati
Definizione
La varianza è una misura della dispersione di un insieme di valori numerici: quantifica quanto i singoli dati si discostino in media dalla loro media aritmetica. La deviazione standard è la radice quadrata della varianza e restituisce la dispersione nelle stesse unità dei dati originali.
Il calcolatore accetta un elenco di numeri separati da virgola e produce:
- Numerosità (n) — quanti valori sono stati inseriti
- Media (x̄) — la media aritmetica
- Somma degli scarti quadratici (SS) — il numeratore comune Σ(xᵢ − x̄)²
- Varianza — SS ÷ (n−1) per il campione, oppure SS ÷ n per la popolazione
- Deviazione standard — la radice quadrata della varianza
Il dataset predefinito — 4, 8, 15, 16, 23, 42 — corrisponde all'esempio risolto nel seguito.
Formule fondamentali
Media
Somma degli scarti quadratici
SS è il mattone comune a entrambe le formule della varianza. Misura la dispersione complessiva dei dati attorno alla media.
Varianza e deviazione standard di popolazione
Varianza e deviazione standard campionarie
Esempio risolto: 4, 8, 15, 16, 23, 42
Passo 1 — Calcolo della media.
Passo 2 — Calcolo degli scarti quadratici.
| xᵢ | xᵢ − x̄ | (xᵢ − x̄)² |
|---|---|---|
| 4 | −14 | 196 |
| 8 | −10 | 100 |
| 15 | −3 | 9 |
| 16 | −2 | 4 |
| 23 | +5 | 25 |
| 42 | +24 | 576 |
| SS | 910 |
Passo 3a — Statistiche campionarie (n = 6).
Passo 3b — Statistiche di popolazione (n = 6).
La correzione di Bessel: perché n−1?
Quando si calcola la varianza da un campione, la media x̄ viene stimata dagli stessi dati che si stanno misurando. I valori campionari tendono inevitabilmente ad addensarsi attorno a x̄ più di quanto non facciano attorno alla vera media di popolazione μ (ignota). Di conseguenza, dividere per n sottostima la dispersione reale della popolazione.
L'intuizione di Bessel: sostituire n con n−1 gonfia la stima quanto basta per renderla corretta — in media, su tutti i campioni possibili, s² risulta uguale a σ². Il grado di libertà sottratto rispecchia il fatto che, noti x̄ e n−1 valori, l'ultimo valore è già determinato e non aggiunge informazioni nuove sulla dispersione.
Un esempio intuitivo: estrai migliaia di campioni di dimensione 2 da una popolazione con σ² = 100. La media di tutte le stime SS/n sarà circa 50, mentre la media di tutte le stime SS/(n−1) sarà vicina a 100. La correzione è tanto più rilevante quanto più piccolo è n; al crescere di n, le due formule convergono.
Popolazione vs campione: quale scegliere?
| Scenario | Formula |
|---|---|
| Hai dati su tutti i membri del gruppo | Popolazione (÷ n) |
| I tuoi dati sono un sottoinsieme di un gruppo più ampio | Campione (÷ n−1) |
| n è molto grande (migliaia o più) | Entrambe — convergono |
Esempi di popolazione: tutti i voti di uno studente in un trimestre; i tempi esatti sul giro di un pilota in una gara specifica.
Esempi di campione: le altezze di 50 adulti selezionati a caso per stimare la varianza di un'intera regione; le misure di qualità su 30 pezzi estratti da un lotto di produzione di 10 000 unità.
In caso di dubbio, usa la varianza campionaria: è la scelta statisticamente prudente, perché riconosce l'incertezza sulla popolazione intera.
Cosa comunica la deviazione standard
La deviazione standard (σ o s) è la misura di dispersione più immediata perché è espressa nelle stesse unità dei dati originali. Se i voti di un'interrogazione hanno s = 6 punti, puoi affermare direttamente che la maggior parte dei voti si trova entro circa 6 punti dalla media.
Per una distribuzione normale valgono le seguenti regole empiriche:
| Intervallo | Contiene circa |
|---|---|
| μ ± 1σ | 68 % dei valori |
| μ ± 2σ | 95 % dei valori |
| μ ± 3σ | 99,7 % dei valori |
Queste regole sono approssimate per distribuzioni non normali, ma restano un utile punto di riferimento. Un valore che supera 2σ dalla media merita un'analisi più approfondita come possibile valore anomalo.
La varianza ha unità al quadrato
Un aspetto sottile ma importante: la varianza è espressa nel quadrato delle unità dei dati originali. Se i dati sono in centimetri, la varianza è in cm²; se sono in euro, è in euro². Questo rende la varianza difficile da interpretare direttamente — una varianza di 2 500 cm² è difficile da visualizzare.
La deviazione standard risolve il problema estraendo la radice quadrata e riportando la misura all'unità originale. È per questo che nella pratica (previsioni meteo, rendimenti finanziari, controllo qualità) si riporta la deviazione standard, mentre la varianza rimane per lo più un passaggio intermedio.
Domande frequenti (FAQ)
Quando si usa la varianza campionaria e quando quella di popolazione?
Usa la varianza campionaria (dividi per n−1) quando i tuoi dati sono un sottoinsieme estratto da un gruppo più ampio e vuoi stimare la varianza dell'intero gruppo. Per esempio, se hai misurato le altezze di 30 studenti in una scuola di 500, usa la formula campionaria.
Usa invece la varianza di popolazione (dividi per n) solo quando il dataset comprende ogni membro del gruppo — ad esempio i punteggi di tutti e cinque i giocatori di una squadra di pallacanestro.
Perché la varianza campionaria divide per n−1 anziché per n?
Dividere per n tende a sottostimare sistematicamente la vera varianza di popolazione: i valori di un campione si addensano attorno alla media campionaria più di quanto non facciano attorno alla media reale (ignota) della popolazione.
Dividere per n−1 — la correzione di Bessel — gonfia leggermente la stima rendendola corretta in media. Il grado di libertà sottratto rispecchia il fatto che la media campionaria è già stata calcolata dagli stessi dati: una volta nota x̄ e noti n−1 valori, l'ultimo valore è determinato e non apporta informazioni nuove sulla dispersione.
Che unità di misura ha la varianza?
La varianza è espressa nel quadrato delle unità originali. Se i dati sono in metri, la varianza è in m²; se sono in euro, è in euro². Questa unità al quadrato rende la varianza difficile da interpretare direttamente.
È per questo che la deviazione standard (radice quadrata della varianza) è preferita nella pratica: riporta la misura alle unità originali. Se, ad esempio, i voti di un esame hanno una deviazione standard di 4 punti, puoi dire direttamente che la maggior parte dei voti si trova entro 4 punti dalla media.
Come si collega la deviazione standard al punteggio z?
Il punteggio z misura di quante deviazioni standard un valore si discosta dalla media: z = (x − μ) / σ. La deviazione standard è il "righello" con cui si esprime quella distanza.
Un z = 1 significa che il valore è esattamente una deviazione standard sopra la media; un z = −2 significa che si trova due deviazioni standard al di sotto. In una distribuzione normale, circa il 68 % dei valori ricade entro una deviazione standard dalla media e circa il 95 % entro due.
Da provare dopo
Calcolatore di Statistica Descrittiva
Calcola media, varianza, deviazione standard (di popolazione e campionaria), minimo, massimo e campo di variazione per un insieme di fino a 8 valori numerici.