Calculadora de Estatística Descritiva
Calcule média, desvio padrão, variância, amplitude, mínimo e máximo para 8 valores. Exibe estatísticas populacionais e amostrais com correção de Bessel.
Entradas
Resultados
Estatística descritiva
Estatística descritiva é o conjunto de medidas que resume um conjunto de dados em termos de tendência central e dispersão, sem estender as conclusões para além dos dados observados. As principais medidas calculadas aqui são: média aritmética, variância (populacional e amostral), desvio padrão (populacional e amostral), mínimo, máximo e amplitude — o suficiente para caracterizar onde os dados estão centrados e o quanto se afastam dessa tendência central.
As quatro medidas e o que elas significam
Média (média aritmética): Soma todos os valores e divide por 8. A média é o ponto de equilíbrio do conjunto. É sensível a valores atípicos — um único valor extremo pode deslocá-la significativamente.
Variância: A média dos quadrados das distâncias em relação à média. Elevar ao quadrado os desvios garante valores positivos e amplifica o efeito dos valores atípicos. Existem duas versões:
- Variância populacional (σ²) — divide por N
- Variância amostral (s²) — divide por N − 1
Desvio padrão: A raiz quadrada da variância, expressa na mesma unidade dos dados originais (metros, reais, segundos). É a medida de dispersão mais utilizada em relatórios e publicações científicas.
Amplitude: máximo − mínimo. A medida de dispersão mais simples — útil, mas muito sensível a valores atípicos porque depende de apenas dois valores.
Variância populacional vs. variância amostral
A distinção entre variância populacional e amostral determina qual denominador usar no cálculo — N ou N−1 — e depende inteiramente de como os dados foram obtidos.
Variância populacional (σ², divide por N): aplica-se quando os 8 valores são toda a população de interesse — não existe grupo maior do qual foram extraídos. Exemplo: as notas finais dos 8 alunos de uma turma fechada analisada em sua totalidade.
Variância amostral (s², divide por N − 1): aplica-se quando os 8 valores são uma amostra aleatória retirada de uma população maior e o objetivo é estimar a variância verdadeira dessa população. O denominador N − 1 é a correção de Bessel, que torna s² um estimador não viesado. Sem ela, a variância amostral subestimaria sistematicamente a variância verdadeira.
A razão intuitiva: uma amostra tende a se agrupar mais próximo da sua própria média do que da média verdadeira da população — portanto SS ÷ N é pequeno demais, em média. Dividir por N − 1 corrige esse viés.
Regra prática: Quando os dados forem coletados de um grupo muito maior (respostas de questionário, medições, notas de prova do ENEM ou vestibular), o desvio padrão amostral é o indicado. Quando os valores definem todo o universo analisado, usa-se o desvio padrão populacional.
Exemplo prático — notas de uma avaliação
Notas: 12, 15, 11, 19, 14, 22, 9, 17
Média: (12 + 15 + 11 + 19 + 14 + 22 + 9 + 17) ÷ 8 = 119 ÷ 8 = 14,875
Soma dos quadrados dos desvios (SS):
- (12 − 14,875)² = 8,27
- (15 − 14,875)² = 0,02
- (11 − 14,875)² = 15,02
- (19 − 14,875)² = 17,02
- (14 − 14,875)² = 0,77
- (22 − 14,875)² = 50,77
- (9 − 14,875)² = 34,52
- (17 − 14,875)² = 4,52
SS = 130,875
Desvio padrão populacional: 4,04
Desvio padrão amostral: 4,32
A nota 22 é um leve valor atípico — representa sozinha cerca de 39% do SS total.
Mediana: limitação de cálculo
O cálculo da mediana exige ordenação — encontrar o valor central após organizar os dados do menor para o maior. Para 8 valores (N par), a mediana é (4º valor + 5º valor) ÷ 2 após a ordenação. O motor desta calculadora avalia fórmulas algebricamente e não suporta operações de ordenação sobre entradas variáveis. Para calcular a mediana, use uma planilha: MEDIAN() no Excel ou MED() no Planilhas Google.
Perguntas frequentes (FAQ)
Qual a diferença entre desvio padrão populacional e amostral?
O desvio padrão populacional (σ) divide pela quantidade total N de valores; o amostral (s) divide por N − 1. Use σ quando seus dados formam a população completa — por exemplo, as notas de toda uma turma. Use s quando seus dados são uma amostra extraída de um grupo maior. O denominador N − 1 é a correção de Bessel, que torna s um estimador não viesado do desvio padrão verdadeiro.
Como calcular a mediana de um conjunto de dados?
Ordene os valores em ordem crescente. Se N for ímpar, a mediana é o valor central. Se N for par (como neste caso com 8 valores), a mediana é a média dos dois valores centrais: (4º valor + 5º valor) ÷ 2 após ordenação. A mediana não é calculada aqui porque exige ordenação, operação que o motor desta calculadora não suporta para entradas variáveis. Em planilhas, use MEDIAN() no Excel ou no Google Planilhas.
O que o desvio padrão diz sobre meus dados?
O desvio padrão mede o quanto os valores se afastam da média. Um valor pequeno indica dados concentrados; um valor grande indica alta dispersão. Em distribuições normais, aproximadamente 68% dos dados ficam a menos de um desvio padrão da média, e cerca de 95% a menos de dois desvios.
Quando devo usar a variância em vez do desvio padrão?
O desvio padrão é mais intuitivo para apresentação de resultados porque está na mesma unidade dos dados originais. Já a variância é preferida em derivações matemáticas e na Análise de Variância (ANOVA), pois variâncias de conjuntos independentes se somam — o que não ocorre com desvios padrão.
Próximas sugestões
Calculadora de probabilidade com dados
Calcula a probabilidade exata de obter uma soma mínima ao lançar qualquer número de dados. Resultado em fração irredutível e decimal.