Calculadora de Percentil e Quartil
Entradas
| Valores dos dados | 4, 8, 15, 16, 23, 42 |
|---|---|
| Percentil | 75 |
Resultados
| Valor no p-ésimo Percentil | 21,25 |
|---|---|
| Q1 (25º percentil) | 9,75 |
| Q2 (Mediana) | 15,5 |
| Q3 (75º percentil) | 21,25 |
| IIQ (Intervalo Interquartil) | 11,5 |
Calculadora de Percentil e Quartil
Calcule qualquer percentil, os quartis (Q1, Q2, Q3) e o IIQ a partir de dados separados por vírgula. Usa interpolação linear (Método 7 do R / PERCENTILE.INC do Excel).
Entradas
Resultados
Quartis
Um percentil indica o valor abaixo do qual se encontra determinada porcentagem das observações de um conjunto ordenado. O 75º percentil, por exemplo, é o valor abaixo do qual se encontram 75% dos dados. Os quartis são os três percentis — Q1 (25º), Q2 (50º) e Q3 (75º) — que dividem o conjunto em quatro partes iguais. Esta calculadora determina qualquer percentil e os três quartis a partir de uma lista de números separados por vírgula, além do intervalo interquartil (IIQ).
Método de interpolação linear
Existem várias convenções para o cálculo de percentis. Esta calculadora adota o método de interpolação linear inclusiva — Método 7 no R, idêntico à função PERCENTILE.INC do Excel e ao numpy.percentile do Python com a interpolação padrão linear.
O algoritmo segue três etapas:
- Ordenar os n valores em ordem crescente.
- Calcular o índice fracionário: posição = (n − 1) × p / 100.
- Definir lo = ⌊posição⌋ e hi = ⌈posição⌉, e frac = posição − lo. O percentil é igual a ordenado[lo] + frac × (ordenado[hi] − ordenado[lo]).
Quando a posição é um número inteiro, a fração de interpolação é zero e o resultado coincide exatamente com o valor em ordenado[posição]. Para p = 0, o resultado é o mínimo; para p = 100, é o máximo.
Exemplo resolvido
Considere o conjunto 4, 8, 15, 16, 23, 42 — seis valores já em ordem crescente.
Q1 (p = 25): posição = (6 − 1) × 0,25 = 1,25. O valor no índice 1 é 8; no índice 2 é 15. Q1 = 8 + 0,25 × (15 − 8) = 8 + 1,75 = 9,75.
Q2 / Mediana (p = 50): posição = 5 × 0,50 = 2,5. Os valores nos índices 2 e 3 são 15 e 16. Q2 = 15 + 0,5 × (16 − 15) = 15,5.
Q3 (p = 75): posição = 5 × 0,75 = 3,75. Os valores nos índices 3 e 4 são 16 e 23. Q3 = 16 + 0,75 × (23 − 16) = 16 + 5,25 = 21,25.
IIQ = Q3 − Q1 = 21,25 − 9,75 = 11,5. A metade central deste conjunto abrange uma amplitude de 11,5 unidades.
Para o 10º percentil: posição = 5 × 0,10 = 0,5. Os valores nos índices 0 e 1 são 4 e 8. P10 = 4 + 0,5 × (8 − 4) = 6,0.
Quartis e o diagrama de caixa
O resumo dos cinco números — mínimo, Q1, Q2, Q3 e máximo — é a base do diagrama de caixa (boxplot). Na representação padrão, a caixa se estende de Q1 a Q3, o traço interno indica a mediana (Q2), e as hastes (whiskers) alcançam os valores mais extremos ainda dentro de 1,5 × IIQ dos limites da caixa.
Valores além das hastes são marcados como valores atípicos (outliers). No conjunto do exemplo, o limite inferior é Q1 − 1,5 × IIQ = 9,75 − 17,25 = −7,5, e o limite superior é Q3 + 1,5 × IIQ = 21,25 + 17,25 = 38,5. O valor 42 ultrapassa o limite superior e seria classificado como valor atípico moderado.
IIQ como medida robusta de dispersão
O intervalo interquartil é a medida de dispersão estatística robusta mais utilizada na prática. Ao contrário do desvio padrão — que eleva ao quadrado e soma todos os desvios em relação à média —, o IIQ considera apenas os 50% centrais dos valores ordenados. Uma única observação extrema não altera Q1 nem Q3, de modo que o IIQ permanece insensível a valores atípicos.
Essa característica torna o IIQ a medida de dispersão preferida em distribuições assimétricas, como renda domiciliar, preços de imóveis e tempo de atendimento em serviços de saúde — contextos em que o desvio padrão pode ser dominado por poucas observações extremas e fornecer uma imagem distorcida da variabilidade típica.
Diferentes convenções de percentil
O R documenta nove métodos distintos para o cálculo de percentis, e diversas áreas científicas adotam suas próprias convenções. As principais diferenças residem no tratamento de índices fracionários e na posição atribuída ao mínimo.
- Método 7 (esta calculadora, padrão do R,
PERCENTILE.INCdo Excel, padrão do numpy): posição = (n − 1) × p/100. Atribui p = 0 ao mínimo e p = 100 ao máximo. - Método 6 (
PERCENTILE.EXCdo Excel, padrão do SPSS): posição = n × p/100. O mínimo e o máximo não são percentis alcançáveis; o intervalo válido vai de 1/(n+1) a n/(n+1). - Métodos 1 a 3: métodos de ranque mais próximo, que retornam um valor observado em vez de um valor interpolado. O Método 1 (ranque teto) é a convenção de alguns livros didáticos de estatística básica.
Em conjuntos com centenas de observações ou mais, todos os métodos convergem para resultados praticamente idênticos. As diferenças são mais evidentes em amostras pequenas. Ao comparar saídas de diferentes programas, convém verificar qual convenção cada um adota.
Relação com o escore z
O percentil é uma medida empírica de posição: descreve onde um valor se situa dentro do conjunto observado, sem pressupor nenhuma distribuição. O 90º percentil é simplesmente o valor abaixo do qual estão 90% dos dados.
O escore z, por sua vez, mede quantos desvios padrão um valor se afasta da média e é interpretável sobretudo quando os dados seguem uma distribuição aproximadamente normal. Sob normalidade perfeita, um escore z de 1,28 corresponde ao 90º percentil. Em distribuições fortemente assimétricas ou multimodais, o mesmo escore z pode corresponder a um percentil empírico muito diferente.
Os percentis são, portanto, mais adequados para dados com distribuição desconhecida ou não normal, enquanto os escores z são preferíveis quando a normalidade é uma hipótese razoável e se deseja comparar valores em escalas distintas.
Tamanho mínimo de amostra
O método de interpolação linear exige ao menos dois dados. Com exatamente dois valores, os quartis são calculados por interpolação sobre o único intervalo disponível, e todos os percentis entre o mínimo e o máximo são alcançáveis.
Na prática, estimativas confiáveis de percentis requerem amostras maiores. A incerteza de um percentil amostral é inversamente proporcional ao tamanho da amostra: o intervalo de confiança de 95% para o 90º percentil populacional é substancialmente mais amplo com n = 20 do que com n = 200.
Perguntas frequentes (FAQ)
Qual método de cálculo de percentil esta calculadora utiliza?
Esta calculadora usa o método de interpolação linear inclusiva, conhecido como Método 7 no R e equivalente à função PERCENTILE.INC do Excel (e também à PERCENTILE, que usa o mesmo algoritmo por padrão). O método posiciona o p-ésimo percentil na posição (n − 1) × p/100 e interpola entre os dois valores ordenados adjacentes.
Exemplo: para o conjunto [4, 8, 15, 16, 23, 42] com p = 25, a posição é 5 × 0,25 = 1,25. O resultado é o 2º valor (8) mais 0,25 × (3º valor − 2º valor) = 8 + 0,25 × 7 = 9,75.
Outros programas podem adotar convenções diferentes — o R documenta nove métodos distintos; o numpy do Python usa o Método 7 como padrão. Ao comparar resultados entre ferramentas, verifique qual convenção cada uma aplica.
Para que serve o intervalo interquartil (IIQ)?
O intervalo interquartil (IIQ) mede a dispersão dos 50% centrais de um conjunto de dados, calculado como Q3 menos Q1. Sua principal utilidade é dupla.
Primeiro, ele fundamenta a regra padrão para identificação de valores atípicos: qualquer observação abaixo de Q1 − 1,5 × IIQ ou acima de Q3 + 1,5 × IIQ é classificada como valor atípico moderado; valores além de 3 × IIQ dos limites são considerados extremos. Essa regra é usada por padrão no R, no matplotlib do Python e no Excel ao traçar diagramas de caixa.
Segundo, o IIQ é uma medida robusta de dispersão na presença de valores extremos. Ao contrário do desvio padrão — sensível a observações fora do padrão —, o IIQ ignora as caudas da distribuição, tornando-o adequado para variáveis com distribuições assimétricas, como renda domiciliar, preços de imóveis ou tempo de espera em serviços de saúde.
Como os quartis dividem um conjunto de dados?
Os quartis dividem um conjunto ordenado em quatro partes iguais, cada uma contendo 25% das observações. Q1 (25º percentil) separa o quarto inferior do restante. Q2 (50º percentil, ou mediana) divide os dados ao meio. Q3 (75º percentil) separa o quarto superior do restante.
Quando o número de elementos é múltiplo de quatro, os quartis recaem entre valores consecutivos. Nos demais casos, o método de interpolação linear produz valores fracionários que respeitam os limites proporcionais. O IIQ, correspondente a Q3 menos Q1, abrange os dois quartis centrais e é o resumo numérico de dispersão mais usado na análise exploratória de dados.
Qual é a diferença entre percentil e escore z?
O percentil é uma posição baseada em ranqueamento nos dados observados: indica qual fração das observações é igual ou inferior a determinado valor, sem pressupor nenhuma distribuição específica. O 75º percentil, por definição, é o valor abaixo do qual se encontram 75% dos dados.
O escore z mede quantos desvios padrão um valor se afasta da média e é significativo principalmente quando os dados seguem uma distribuição aproximadamente normal. Sob normalidade perfeita, um escore z de 1 corresponde ao 84º percentil; em distribuições assimétricas ou multimodais, essa correspondência não se mantém.
Os percentis são mais adequados quando a distribuição é desconhecida ou não normal — como em notas de exames com teto definido, renda domiciliar ou faixas de referência em saúde. Os escores z são preferíveis quando a normalidade é uma hipótese razoável e se deseja comparar medidas em escalas diferentes.
Próximas sugestões
Calculadora de Média, Mediana e Moda
Calcula média, mediana, moda e amplitude de qualquer conjunto de dados numéricos. Informe os valores separados por vírgula para obter as quatro medidas de tendência central.