8개 데이터의 평균, 표준편차, 분산, 범위, 최솟값, 최댓값을 계산합니다. 모집단 통계와 표본 통계를 함께 표시합니다.
입력
결과
값 112
값 215
값 311
값 419
값 514
값 622
값 79
값 817
기술 통계의 개요
기술 통계(記述統計, descriptive statistics)란 수집된 데이터의 중심 경향과 산포를 수치로 요약하는 통계 분야입니다. 추론 통계가 표본으로 모집단을 추정하는 데 초점을 두는 반면, 기술 통계는 주어진 데이터 자체를 기술합니다. 숫자 값을 최대 8개 입력하면 산술 평균, 모분산·표본분산, 모표준편차·표본표준편차, 최솟값, 최댓값, 범위를 산출합니다. 이 지표들은 수능 모의고사 성적 분석, 실험 측정값 검토, 통계학 학습 등 모든 정량적 분석의 출발점이 됩니다.
네 가지 지표와 의미
평균(산술 평균): 모든 값의 합을 8로 나눈 값입니다. 평균은 데이터의 무게중심에 해당하며, 극단적인 이상값 하나가 평균을 크게 끌어당길 수 있습니다.
분산: 각 값이 평균으로부터 얼마나 멀리 떨어져 있는지를 제곱하여 평균한 지표입니다. 편차를 제곱하면 양수·음수 편차가 서로 상쇄되지 않고, 이상값의 영향이 증폭됩니다. 분산에는 두 종류가 있습니다.
모분산 (σ²) — 편차 제곱합을 N으로 나눔
표본분산 (s²) — 편차 제곱합을 N − 1로 나눔
표준편차: 분산의 제곱근으로, 원래 데이터와 같은 단위(점수, 원, 초)로 표현된 산포 지표입니다. 학술 논문과 현장 보고서에서 가장 널리 쓰이는 산포도입니다.
범위: 최댓값 − 최솟값. 가장 단순한 산포 지표로 직관적이지만, 두 개의 극단값에만 의존하므로 이상값에 매우 취약합니다.
모분산 vs 표본분산: N으로 나눌까, N−1로 나눌까?
기술 통계에서 가장 자주 혼동되는 부분입니다.
모분산 (σ², N으로 나눔): 8개의 값이 조사 대상 전체인 경우에 사용합니다. 더 큰 모집단에서 추출된 것이 아니라, 그 자체가 완결된 전체인 경우입니다. 예: 반 전체 학생 8명의 최종 시험 점수를 분석할 때.
표본분산 (s², N − 1로 나눔): 8개의 값이 더 큰 모집단에서 무작위로 추출된 표본이고, 모분산을 추정하고자 할 때 사용합니다. N − 1 분모(베셀 보정)는 s²를 모분산의 불편 추정량으로 만들어 줍니다. 보정 없이 SS ÷ N을 사용하면 모분산을 체계적으로 과소 추정하게 됩니다.
직관적 이유: 표본은 모평균보다 표본 자신의 평균에 더 가깝게 모이는 경향이 있으므로, SS ÷ N은 평균적으로 너무 작습니다. N − 1로 나누면 이 편향이 교정됩니다.
판단 기준: 더 큰 모집단(전국 학생, 시험 응시자 전체 등)에서 수집한 8개의 데이터라면 표본 표준편차를 사용하십시오. 8개의 값이 관심 대상 전체라면 모 표준편차를 사용하십시오.
22점은 약간의 이상값으로, 전체 SS의 약 39%를 혼자 차지합니다. 수능 모의고사에서 평균 14.875점, 표본표준편차 약 4.3점이라면 8명의 성적이 상당히 고르게 분포되어 있지 않음을 의미합니다.
중앙값을 계산하지 않는 이유
중앙값을 구하려면 값을 정렬해야 합니다. 8개(짝수)의 경우, 오름차순으로 정렬한 뒤 4번째와 5번째 값의 평균이 중앙값입니다. 이 계산기의 엔진은 수식을 대수적으로 평가하며, 임의 입력값에 대한 정렬 연산을 지원하지 않습니다. 중앙값이 필요하다면 Excel의 MEDIAN() 또는 Google 스프레드시트를 사용하십시오.
자주 묻는 질문 (FAQ)
모표준편차와 표본표준편차의 차이는 무엇입니까?
모표준편차(σ)는 편차 제곱합을 N으로 나누고, 표본표준편차(s)는 N − 1로 나눕니다. 8개의 값이 조사 대상 전체라면 σ를 사용하십시오. 더 큰 모집단에서 추출한 표본이라면 s를 사용하십시오. N − 1로 나누는 베셀 보정(Bessel's correction) 덕분에 s는 모표준편차의 불편 추정량이 됩니다.
중앙값은 어떻게 구합니까?
값을 오름차순으로 정렬한 뒤, 데이터 수가 홀수이면 가운데 값이 중앙값입니다. 짝수(8개)이면 정렬 후 4번째와 5번째 값의 평균이 중앙값입니다. 이 계산기는 정렬 연산을 지원하지 않으므로 중앙값이 필요할 때는 Excel의 MEDIAN() 또는 Google 스프레드시트를 이용하십시오.
표준편차가 크면 어떤 의미입니까?
표준편차는 데이터가 평균 주변에 얼마나 퍼져 있는지를 나타냅니다. 값이 작으면 데이터가 평균 가까이 모여 있고, 크면 넓게 흩어져 있습니다. 정규분포에서는 전체 데이터의 약 68%가 평균 ±1σ 범위 안에, 약 95%가 평균 ±2σ 범위 안에 들어옵니다. 수능이나 모의고사 점수 분포를 분석할 때도 이 기준이 자주 활용됩니다.
분산과 표준편차 중 어떤 것을 써야 합니까?
표준편차는 원래 데이터와 같은 단위로 표현되어 결과를 해석하기 쉽습니다. 분산은 수학적 유도 과정과 분산 분석(ANOVA)에서 주로 사용됩니다. 독립적인 데이터셋의 분산은 서로 더할 수 있지만(가법성), 표준편차는 그렇지 않기 때문입니다.