حاسبة التباين والانحراف المعياري
احسب التباين والانحراف المعياري لمجموعة بيانات رقمية مع إمكانية الاختيار بين صيغة العينة والمجتمع الإحصائي.
المدخلات
النتائج
التباين والانحراف المعياري
التباين (variance) مقياس إحصائي يُعبّر عن متوسط مربعات انحرافات القيم عن وسطها الحسابي، وهو الأساس الكمي لقياس التشتت في مجموعة من البيانات. الانحراف المعياري (standard deviation) هو الجذر التربيعي للتباين، ويُعيد المقياس إلى وحدة البيانات الأصلية مما يُيسّر تفسيره مباشرةً.
تحسب الأداة المقادير التالية من قائمة أرقام مفصولة بفواصل:
- العدد الكلي (n) — عدد القيم المُدخلة
- المتوسط الحسابي (x̄) — متوسط جميع القيم
- مجموع مربعات الانحرافات (SS) — البسط المشترك Σ(xᵢ − x̄)²
- التباين — SS ÷ (n−1) للعينة، أو SS ÷ n للمجتمع
- الانحراف المعياري — الجذر التربيعي للتباين
يمكن استخدام المجموعة الافتراضية 4, 8, 15, 16, 23, 42 لمتابعة المثال المحلول أدناه.
الصيغ الأساسية
المتوسط الحسابي
مجموع مربعات الانحرافات
SS هو اللبنة الأساسية لصيغتَي التباين معاً، ويقيس إجمالي تشتت البيانات حول المتوسط.
تباين المجتمع وانحرافه المعياري
تباين العينة وانحرافها المعياري
مثال محلول: 4, 8, 15, 16, 23, 42
الخطوة 1 — حساب المتوسط.
الخطوة 2 — حساب مربعات الانحرافات.
| xᵢ | xᵢ − x̄ | (xᵢ − x̄)² |
|---|---|---|
| 4 | −14 | 196 |
| 8 | −10 | 100 |
| 15 | −3 | 9 |
| 16 | −2 | 4 |
| 23 | +5 | 25 |
| 42 | +24 | 576 |
| SS | 910 |
الخطوة 3أ — إحصاءات العينة (n = 6).
الخطوة 3ب — إحصاءات المجتمع (n = 6).
تصحيح بيسل والقسمة على (n−1)
حين تحسب التباين من عينة، فإن المتوسط x̄ يُحسب من البيانات ذاتها التي تقيسها. وبطبيعة الحال تتمركز قيم العينة حول x̄ أكثر مما تتمركز حول متوسط المجتمع الحقيقي μ المجهول. ونتيجةً لذلك، يؤدي القسمة على n إلى التقليل من تقدير مدى تشتت المجتمع الفعلي.
ما توصّل إليه بيسل: استبدال n بـ (n−1) يُضخّم التقدير بما يكفي بالضبط لجعله غير متحيز — أي أن متوسط جميع قيم s² عبر العينات الممكنة يساوي σ². درجة الحرية "المفقودة" تعكس أنه بمجرد معرفة x̄ وأيّة (n−1) قيمة، تكون القيمة الأخيرة محدّدة تلقائياً ولا تحمل معلومة جديدة عن التشتت.
تصوّر هذا: سحبت آلاف العينات الثنائية من مجتمع يبلغ تباينه σ² = 100. متوسط جميع تقديرات SS/n سيقترب من 50، بينما متوسط تقديرات SS/(n−1) سيقترب من 100. يكون التصحيح أكثر أهمية مع العينات الصغيرة؛ كلما كبر n اقتربت الصيغتان من بعضهما.
المجتمع أم العينة: معايير الاختيار
| الحالة | استخدم |
|---|---|
| البيانات تشمل جميع أفراد المجموعة | تباين المجتمع (÷ n) |
| البيانات جزء مسحوب من مجموعة أكبر | تباين العينة (÷ n−1) |
| n كبير جداً (آلاف أو أكثر) | أيٌّ منهما — النتائج تتقارب |
أمثلة على المجتمع: درجات طالب واحد في جميع اختبارات الفصل الدراسي؛ أزمنة دورات سيارة سباق واحدة في سباق بعينه.
أمثلة على العينة: أطوال 200 شخص تم اختيارهم عشوائياً لتقدير متوسط طول البالغين في منطقة ما؛ قياسات الجودة لـ 30 قطعة من دفعة إنتاجية مؤلفة من 10000 قطعة.
عند الشك، يُوصى باختيار تباين العينة، إذ يُقرّ بعدم اليقين حيال المجتمع الأشمل ويُمثّل الخيار الأكثر حذراً إحصائياً.
تفسير الانحراف المعياري
الانحراف المعياري (σ أو s) هو أكثر مقاييس التشتت بديهيةً لأنه يحمل وحدة البيانات الأصلية. إذا كان الانحراف المعياري لدرجات الاختبار يساوي 10 درجات، يمكن القول مباشرةً: "معظم الدرجات تقع في نطاق 10 درجات فوق المتوسط أو أسفله."
في التوزيع الطبيعي تسري هذه القواعد العملية:
| النطاق | يحتوي على |
|---|---|
| μ ± 1σ | حوالي 68% من القيم |
| μ ± 2σ | حوالي 95% من القيم |
| μ ± 3σ | حوالي 99.7% من القيم |
هذه القواعد تقريبية في البيانات غير الطبيعية التوزيع، لكنها تبقى مرجعاً مفيداً. إذا تجاوزت قيمة ما حاجز 2σ من المتوسط فهي تستحق المراجعة كقيمة شاذة محتملة.
وحدة قياس التباين مربّعة
نقطة دقيقة لكنها مهمة: التباين يُقاس بمربع وحدة البيانات الأصلية. إذا كانت البيانات بالسنتيمتر، فالتباين بالسنتيمتر²؛ وإذا كانت بالريال، فالتباين بالريال². يجعل ذلك تفسير التباين مباشرةً أمراً عسيراً — تباين يبلغ 2500 سم² يصعب استيعابه بصرياً.
يحل الانحراف المعياري هذه الإشكالية باستخراج الجذر التربيعي، فيعود إلى وحدة القياس الأصلية. لهذا يُذكر الانحراف المعياري في معظم السياقات التطبيقية — التقارير المناخية، عوائد الاستثمار، ضبط الجودة — بينما يظل التباين في الغالب خطوة وسيطة في الحساب.
الأسئلة الشائعة (FAQ)
متى أستخدم تباين العينة ومتى أستخدم تباين المجتمع؟
استخدم تباين العينة (القسمة على n−1) حين تكون بياناتك جزءاً مسحوباً من مجموعة أكبر وتريد تقدير تباينها. مثال: إذا قست أوزان 40 طالباً من جامعة تضم 5000 طالب فاستخدم صيغة العينة.
استخدم تباين المجتمع (القسمة على n) فقط حين تملك بيانات جميع أفراد المجموعة دون استثناء — كدرجات فريق مكوّن من خمسة لاعبين في مباراة واحدة.
لماذا نقسم على (n−1) في تباين العينة بدلاً من n؟
المتوسط الحسابي المحسوب من العينة يميل إلى تمركز قيم العينة حوله أكثر مما تتمركز حول متوسط المجتمع الحقيقي غير المعروف. القسمة على n تُعطي إذن تقديراً أقل من التباين الفعلي.
يُعالج تصحيح بيسل (القسمة على n−1) هذا التحيز بتضخيم التقدير بما يكفي لجعله غير متحيز في المتوسط. درجة الحرية "المفقودة" تعكس أننا استهلكنا معلومة واحدة — المتوسط — من البيانات ذاتها.
ما وحدة قياس التباين؟
التباين يُقاس بمربع وحدة البيانات الأصلية. إذا كانت بياناتك بالكيلوجرام فالتباين بالكيلوجرام². إذا كانت بالريال فالتباين بالريال².
لهذا السبب يكون الانحراف المعياري أسهل تفسيراً في الغالب — إذ يعود إلى وحدة البيانات الأصلية. فإذا كان الانحراف المعياري لدرجات الاختبار 10 درجات، يمكن القول: "معظم الدرجات تقع ضمن نطاق 10 درجات من المتوسط."
ما العلاقة بين الانحراف المعياري ودرجة Z؟
درجة Z تقيس عدد الانحرافات المعيارية التي تبعد بها قيمة ما عن المتوسط: z = (x − μ) / σ. الانحراف المعياري هو وحدة القياس، ودرجة Z هي القراءة.
درجة Z تساوي 1 تعني أن القيمة تبعد انحرافاً معيارياً واحداً فوق المتوسط؛ ودرجة Z تساوي −2 تعني أنها أسفل المتوسط بانحرافين. في التوزيع الطبيعي، تقع نحو 68% من القيم ضمن انحراف معياري واحد من المتوسط، ونحو 95% ضمن انحرافين.
التالي الموصى به
حاسبة الإحصاء الوصفي
احسب المتوسط الحسابي والانحراف المعياري والتباين والمدى والقيمة الصغرى والعظمى لثمانية بيانات. يعرض إحصاءات المجتمع والعينة مع تصحيح بيسل.