Calculadora de Variância e Desvio Padrão
Calcule variância e desvio padrão de uma lista de números separados por vírgula. Alterne entre as fórmulas de amostra e população com correção de Bessel.
Entradas
Resultados
Variância e desvio padrão
A variância é a média dos quadrados dos desvios de cada valor em relação à média do conjunto. O desvio padrão é a raiz quadrada da variância e retorna a medida à mesma unidade dos dados originais. Ambas quantificam a dispersão de um conjunto numérico: quanto maior o valor, mais espalhados estão os dados ao redor da média.
Mecanismo: por que elevar ao quadrado?
Os desvios brutos (xᵢ − x̄) somam sempre zero — os desvios positivos cancelam os negativos. Elevar cada desvio ao quadrado antes de somá-los elimina o cancelamento e amplifica valores extremos. A raiz quadrada final (o desvio padrão) desfaz o quadrado e devolve a escala original.
Fórmulas principais
Média
Soma dos Quadrados dos Desvios
SQ é o numerador compartilhado pelas duas fórmulas de variância e mede a dispersão total dos dados ao redor da média.
Variância e Desvio Padrão Populacionais
Variância e Desvio Padrão Amostrais
Correção de Bessel: por que n−1?
Ao calcular a variância de uma amostra, a média amostral x̄ é estimada com os mesmos dados que estão sendo analisados. Os valores amostrais tendem a se concentrar mais ao redor de x̄ do que ao redor da verdadeira média populacional μ (desconhecida). Por isso, dividir por n subestima a dispersão real da população.
Substituir n por n−1 infla a estimativa o suficiente para torná-la não viesada — em média, s² é igual a σ² independentemente da amostra sorteada. O grau de liberdade "perdido" reflete o fato de que, conhecendo x̄ e n−1 dos valores, o último valor fica determinado; ele não acrescenta nova informação sobre a dispersão.
Um exemplo simples: ao retirar milhares de amostras de tamanho 2 de uma população com σ² = 100, a média de todos os estimadores SQ/n fica próxima de 50, enquanto a média de todos os estimadores SQ/(n−1) fica próxima de 100. A correção é mais relevante para n pequeno; conforme n cresce, n−1 ≈ n e as duas fórmulas convergem.
Exemplo resolvido: 4, 8, 15, 16, 23, 42
Use o conjunto padrão da calculadora — 4, 8, 15, 16, 23, 42 — para acompanhar cada passo.
Passo 1 — Calcular a média.
Passo 2 — Calcular os desvios ao quadrado.
| xᵢ | xᵢ − x̄ | (xᵢ − x̄)² |
|---|---|---|
| 4 | −14 | 196 |
| 8 | −10 | 100 |
| 15 | −3 | 9 |
| 16 | −2 | 4 |
| 23 | +5 | 25 |
| 42 | +24 | 576 |
| SQ | 910 |
Passo 3a — Estatísticas amostrais (n = 6).
Passo 3b — Estatísticas populacionais (n = 6).
Amostra ou população: qual usar?
| Situação | Use |
|---|---|
| Dados de todos os elementos do grupo | População (÷ n) |
| Dados de um subconjunto de um grupo maior | Amostra (÷ n−1) |
| n muito grande (milhares ou mais) | Qualquer uma — elas convergem |
Exemplos populacionais: as cinco notas bimestrais de um aluno específico ao longo do ano; os tempos de volta de um piloto em cada etapa de uma corrida.
Exemplos amostrais: alturas de 50 adultos selecionados aleatoriamente para estimar a variância da população adulta; medições de qualidade em 30 peças de um lote de produção de 10.000 unidades.
Na dúvida, a variância amostral é a escolha estatisticamente conservadora: reconhece que os dados disponíveis não cobrem toda a população.
Interpretação do desvio padrão
O desvio padrão (σ ou s) é a medida de dispersão mais intuitiva porque permanece na mesma unidade dos dados originais. Se as notas de uma turma têm s = 8 pontos, é possível afirmar diretamente que a maioria dos alunos está a cerca de 8 pontos da média.
Para uma distribuição normal, as seguintes regras empíricas valem:
| Intervalo | Contém aproximadamente |
|---|---|
| μ ± 1σ | 68% dos valores |
| μ ± 2σ | 95% dos valores |
| μ ± 3σ | 99,7% dos valores |
Essas regras são aproximadas para dados não normais, mas servem como verificação rápida. Um valor a mais de 2σ da média é candidato a investigação como possível valor atípico.
Unidade da variância
A variância é medida no quadrado da unidade dos dados originais. Alturas em centímetros produzem variância em cm²; valores em reais produzem variância em R$². Isso torna a variância difícil de interpretar diretamente — uma variância de 2.500 cm² não tem apelo visual imediato.
O desvio padrão resolve esse problema ao extrair a raiz quadrada, devolvendo a medida à unidade original. Por isso o desvio padrão aparece em contextos práticos — previsão do tempo, retorno de investimentos, controle de qualidade industrial — enquanto a variância geralmente fica como etapa intermediária do cálculo.
Perguntas frequentes (FAQ)
Quando usar variância amostral ou populacional?
Use variância amostral (divide por n−1) quando seus dados são um subconjunto de um grupo maior e você quer estimar a variância desse grupo. Por exemplo, ao medir a altura de 30 alunos numa escola de 500, use variância amostral. Use variância populacional (divide por n) apenas quando seus dados contêm todos os elementos do grupo — por exemplo, as notas de todos os cinco jogadores de um time de basquete.
Por que a variância amostral divide por n−1 e não por n?
Dividir por n subestima sistematicamente a variância real da população, porque os valores amostrais tendem a se agrupar ao redor da média amostral, e não da média verdadeira da população. Dividir por n−1 (correção de Bessel) infla a estimativa o suficiente para torná-la não viesada em média. O grau de liberdade "perdido" reflete o fato de que a média amostral já foi estimada com os mesmos dados.
Qual é a unidade de medida da variância?
A variância é expressa no quadrado da unidade original dos dados. Se os dados estão em metros, a variância está em m²; se estão em reais, está em R$². Por isso o desvio padrão (raiz quadrada da variância) é mais fácil de interpretar — ele fica na mesma unidade dos dados originais. Por exemplo, se as notas de uma turma têm desvio padrão de 8 pontos, dá para dizer diretamente que a maioria dos alunos está a menos de 8 pontos da média.
Como o desvio padrão se relaciona com o escore Z?
O escore Z mede quantos desvios padrão um valor está acima ou abaixo da média: z = (x − μ) / σ. O desvio padrão é a régua usada para expressar essa distância. Um escore Z igual a 1 significa que o valor está exatamente um desvio padrão acima da média; um escore Z de −2 indica dois desvios padrão abaixo. Em uma distribuição normal, cerca de 68% dos valores ficam dentro de um desvio padrão da média, e aproximadamente 95% dentro de dois.
Próximas sugestões
Calculadora de Estatística Descritiva
Calcule média, desvio padrão, variância, amplitude, mínimo e máximo para 8 valores. Exibe estatísticas populacionais e amostrais com correção de Bessel.