Calculadora de Varianza y Desviación Estándar
Calcula la varianza y la desviación estándar de una lista de números separados por comas. Alterna entre las fórmulas muestral y poblacional.
Datos de entrada
Resultados
Definición
La varianza es una medida estadística de dispersión que cuantifica cuánto se alejan los valores de un conjunto de datos respecto a su media aritmética. La desviación estándar es la raíz cuadrada de la varianza y expresa esa dispersión en las mismas unidades que los datos originales. Ambas miden la variabilidad de un conjunto de datos: un valor alto indica que los datos están muy dispersos; un valor bajo indica que están concentrados alrededor de la media.
Fórmulas principales
Media
Suma de desviaciones al cuadrado
La SC es el bloque de construcción de las dos fórmulas de varianza. Mide la dispersión total de los datos alrededor de la media.
Varianza y desviación estándar poblacionales
Varianza y desviación estándar muestrales
La corrección de Bessel: por qué se divide por n−1
Cuando se calcula la varianza a partir de una muestra, la media muestral x̄ se obtiene de los mismos datos que se analizan. Los valores de la muestra inevitablemente se agrupan más cerca de x̄ que de la media poblacional verdadera μ (desconocida). Por eso, dividir por n subestima sistemáticamente la dispersión real de la población.
La solución de Friedrich Bessel: sustituir n por n−1 infla el estimador justo lo suficiente para que sea insesgado — como promedio sobre todas las muestras posibles, s² es igual a σ². El grado de libertad que se resta refleja que, una vez calculadas x̄ y los n−1 primeros valores, el último queda completamente determinado y no aporta información nueva sobre la dispersión.
Un ejemplo intuitivo: si se extraen miles de muestras de tamaño 2 de una población con σ² = 100, el promedio de todos los estimadores SC/n rondará 50, pero el promedio de SC/(n−1) estará cercano a 100. La corrección importa sobre todo con n pequeño; a medida que n crece, n−1 ≈ n y las dos fórmulas convergen.
Ejemplo resuelto: 4, 8, 15, 16, 23, 42
Paso 1 — Calcular la media.
Paso 2 — Calcular las desviaciones al cuadrado.
| xᵢ | xᵢ − x̄ | (xᵢ − x̄)² |
|---|---|---|
| 4 | −14 | 196 |
| 8 | −10 | 100 |
| 15 | −3 | 9 |
| 16 | −2 | 4 |
| 23 | +5 | 25 |
| 42 | +24 | 576 |
| SC | 910 |
Paso 3a — Estadísticas muestrales (n = 6).
Paso 3b — Estadísticas poblacionales (n = 6).
Muestra frente a población
| Situación | Fórmula |
|---|---|
| Datos de todos los miembros del grupo | Población (÷ n) |
| Datos de un subconjunto de un grupo mayor | Muestra (÷ n−1) |
| n muy grande (miles o más) | Cualquiera — convergen |
Ejemplos poblacionales: las cinco notas de un estudiante concreto a lo largo de un trimestre; los tiempos exactos de vuelta de un piloto de Fórmula 1 en los últimos 10 Grandes Premios.
Ejemplos muestrales: las tallas de 50 adultos elegidos al azar para estimar la varianza de toda la población española; mediciones de calidad en 30 piezas de una producción de 10 000 unidades.
Cuando existan dudas, la varianza muestral es la opción estadísticamente conservadora: reconoce la incertidumbre sobre la población completa.
Interpretación de la desviación estándar
La desviación estándar (σ o s) está expresada en las mismas unidades que los datos originales. Si las notas de un examen tienen s = 8 puntos, la mayoría de las notas se encuentran a unos 8 puntos de la media.
Para una distribución normal, se cumplen estas reglas empíricas:
| Rango | Contiene aproximadamente |
|---|---|
| μ ± 1σ | el 68 % de los valores |
| μ ± 2σ | el 95 % de los valores |
| μ ± 3σ | el 99,7 % de los valores |
Estas reglas son aproximadas para datos no normales, pero siguen siendo una referencia útil. Un valor que se aleja más de 2σ de la media merece ser examinado como posible valor atípico.
Unidades de la varianza
La varianza se mide en las unidades al cuadrado de los datos originales. Si los datos están en centímetros, la varianza está en cm²; si están en euros, en euros². Esto hace que la varianza sea difícil de interpretar directamente — una varianza de 2 500 cm² resulta difícil de visualizar.
La desviación estándar resuelve esto tomando la raíz cuadrada y devolviendo la medida a la unidad original. Por eso la desviación estándar aparece en la mayoría de los contextos prácticos (previsiones meteorológicas, rendimientos de inversión, control de calidad), mientras que la varianza suele quedar como un paso intermedio.
Uso de la calculadora
Se introduce una lista de números separados por comas y se selecciona el modo Muestra o Población. La calculadora muestra:
- Cantidad (n) — cuántos valores se han introducido
- Media — el promedio aritmético
- Suma de desviaciones al cuadrado — el numerador común Σ(xᵢ − x̄)²
- Varianza — SC ÷ (n−1) para la muestra, o SC ÷ n para la población
- Desviación estándar — la raíz cuadrada de la varianza
El conjunto de datos predeterminado — 4, 8, 15, 16, 23, 42 — corresponde al ejemplo resuelto anterior.
Preguntas frecuentes (FAQ)
¿Cuándo se usa la varianza muestral y cuándo la poblacional?
Se usa la varianza muestral (divide por n−1) cuando los datos son un subconjunto de un grupo más amplio y se desea estimar la variabilidad de ese grupo. Por ejemplo, si se miden las alturas de 30 alumnos de un colegio de 500, corresponde la varianza muestral.
Se usa la varianza poblacional (divide por n) solo cuando el conjunto de datos contiene a todos los miembros del grupo; por ejemplo, las puntuaciones de los cinco jugadores de un equipo de baloncesto.
¿Por qué la varianza muestral divide por n−1 y no por n?
Dividir por n subestima sistemáticamente la varianza real de la población porque los valores de la muestra tienden a agruparse más cerca de la media muestral que de la media poblacional verdadera. Dividir por n−1 (corrección de Bessel) infla el estimador justo lo necesario para que sea insesgado en promedio.
El grado de libertad que se resta refleja que, una vez conocida la media muestral, el último valor del conjunto queda determinado y no aporta información nueva sobre la dispersión.
¿Qué unidades tiene la varianza?
La varianza se mide en el cuadrado de las unidades originales. Si los datos están en metros, la varianza está en m²; si están en euros, en euros².
Por eso la desviación estándar (raíz cuadrada de la varianza) suele ser más fácil de interpretar: mantiene las mismas unidades que los datos originales. Por ejemplo, si las notas de un examen tienen una desviación estándar de 8 puntos, la mayoría de las notas se encuentran a 8 puntos de la media.
¿Qué relación hay entre la desviación estándar y las puntuaciones z?
Una puntuación z mide a cuántas desviaciones estándar se encuentra un valor por encima o por debajo de la media: z = (x − μ) / σ. La desviación estándar es la regla que expresa esa distancia.
Una puntuación z de 1 significa que el valor está exactamente una desviación estándar por encima de la media; z = −2 indica que está dos desviaciones estándar por debajo. En una distribución normal, aproximadamente el 68 % de los valores cae dentro de una desviación estándar de la media, y alrededor del 95 % dentro de dos.
Recomendaciones
Calculadora de Estadística Descriptiva
Calcule media, desviación estándar, varianza, rango, mínimo y máximo para 8 datos. Muestra estadísticas de población y de muestra.