حاسبة المئينات والربيعيات
المدخلات
| القيم | 4, 8, 15, 16, 23, 42 |
|---|---|
| المئين | 75 |
النتائج
| قيمة المئين المحدد | 21.25 |
|---|---|
| Q1 — الربيع الأول | 9.75 |
| Q2 — الوسيط | 15.5 |
| Q3 — الربيع الثالث | 21.25 |
| المدى الربيعي | 11.5 |
حاسبة المئينات والربيعيات
احسب أي مئين والربيعيات الثلاثة (Q1 وQ2 وQ3) والمدى الربيعي من قائمة أرقام مفصولة بفواصل، باستخدام طريقة الاستيفاء الخطي (الطريقة 7 في NIST).
المدخلات
النتائج
الربيعيات
المئين هو قيمة في مجموعة بيانات يقع دونها نسبة محددة من القيم؛ فالمئين الخامس والسبعون يعني أن 75٪ من القيم المرتبة تصغره أو تساويه. الربيعيات الثلاثة — Q1 (المئين 25) وQ2 (المئين 50) وQ3 (المئين 75) — تُقسّم البيانات إلى أربعة أجزاء متساوية، وتُكمل الصورة مقياسُ المدى الربيعي (IQR) الذي يُعبّر عن تشتت النصف الأوسط من البيانات.
طريقة الاستيفاء الخطي
تعتمد الحاسبة طريقة الاستيفاء الخطي الشاملة، المعروفة بالطريقة 7 في R، وهي الطريقة الافتراضية في Excel (PERCENTILE.INC) وفي دالة numpy.percentile في Python. يجري الحساب على ثلاث خطوات:
- ترتيب القيم الـ n تصاعدياً.
- حساب الموضع الكسري: position = (n − 1) × p / 100.
- تحديد lo = ⌊position⌋ و hi = ⌈position⌉ ونسبة الكسر frac = position − lo، ثم: المئين = sorted[lo] + frac × (sorted[hi] − sorted[lo]).
حين يكون position عدداً صحيحاً، تصبح نسبة الكسر صفراً وتُعاد القيمة مباشرةً دون استيفاء. عند p = 0 يكون الناتج هو الحد الأدنى، وعند p = 100 هو الحد الأقصى.
مثال محلول
لتكن مجموعة البيانات: 4, 8, 15, 16, 23, 42 — ست قيم مرتبة تصاعدياً.
Q1 (p = 25): position = (6 − 1) × 0.25 = 1.25. القيمة عند الفهرس 1 هي 8، وعند الفهرس 2 هي 15. Q1 = 8 + 0.25 × (15 − 8) = 8 + 1.75 = 9.75.
Q2 / الوسيط (p = 50): position = 5 × 0.50 = 2.5. القيمتان عند الفهرسين 2 و3 هما 15 و16. Q2 = 15 + 0.5 × (16 − 15) = 15.5.
Q3 (p = 75): position = 5 × 0.75 = 3.75. القيمتان عند الفهرسين 3 و4 هما 16 و23. Q3 = 16 + 0.75 × (23 − 16) = 16 + 5.25 = 21.25.
المدى الربيعي = Q3 − Q1 = 21.25 − 9.75 = 11.5. يمتد النصف الأوسط من البيانات إذن على مسافة 11.5 وحدة.
للحصول على المئين العاشر: position = 5 × 0.10 = 0.5. القيمتان عند الفهرسين 0 و1 هما 4 و8. P10 = 4 + 0.5 × (8 − 4) = 6.0.
الربيعيات والمخطط الصندوقي
الملخص الخُماسي — الحد الأدنى وQ1 وQ2 وQ3 والحد الأقصى — هو أساس المخطط الصندوقي (box plot). يمتد الصندوق من Q1 إلى Q3، ويُرسم وسيطُ البيانات Q2 خطاً داخله، وتمتد الشوارب إلى أبعد القيم الواقعة ضمن حدَّي الشواذ:
- الحد الأدنى للشواذ: Q1 − 1.5 × IQR
- الحد الأعلى للشواذ: Q3 + 1.5 × IQR
في مجموعة البيانات السابقة: الحد الأدنى = 9.75 − 17.25 = −7.5، والحد الأعلى = 21.25 + 17.25 = 38.5. القيمة 42 تتجاوز هذا الحد، فتُصنَّف قيمةً شاذة خفيفة.
المدى الربيعي مقياساً قوياً للتشتت
يتميز المدى الربيعي بعدم تأثره بالقيم الشاذة، خلافاً للانحراف المعياري الذي يتضخم حين تُضاف قيمة متطرفة واحدة. هذه الخاصية تجعله المقياس الأنسب للتوزيعات غير المتماثلة كتوزيعات الدخل وأسعار العقارات وأوقات الانتظار، إذ قد يعكس الانحراف المعياري فيها تأثير نسبة ضيّقة من القيم المتطرفة بدلاً من التشتت الفعلي للبيانات.
اختلافات الطرق
توثّق لغة R تسع طرق متمايزة لحساب المئينات؛ وتتباين هذه الطرق أساساً في كيفية التعامل مع المواضع الكسرية ومع ترتيب الحد الأدنى في البيانات:
- الطريقة 7 (المستخدمة هنا، والافتراضية في R وExcel وNumPy): position = (n − 1) × p/100. يُعطي p = 0 عند الحد الأدنى وp = 100 عند الحد الأقصى.
- الطريقة 6 (الافتراضية في SPSS، ودالة PERCENTILE.EXC في Excel): position = n × p/100. الحد الأدنى والأقصى ليسا مئينات قابلة للحساب، والنطاق الصالح هو من 1/(n+1) إلى n/(n+1).
- الطرق 1–3 (طرق الرتبة الأقرب): تُعيد قيمة مرصودة فعلياً لا قيمة مستوفاة، وتُستخدم في بعض المناهج الجامعية الأساسية.
في مجموعات البيانات الكبيرة تتقارب جميع الطرق عملياً؛ أما في العيّنات الصغيرة فقد تتباين نتائجها، لذا ينبغي التحقق من الطريقة المعتمدة عند مقارنة مخرجات برامج مختلفة.
العلاقة بالدرجة المعيارية
المئين ترتيب تجريبي بحت: يصف موضع قيمة داخل البيانات المرصودة دون افتراض شكل محدد للتوزيع. المئين 90 يعني ببساطة أن 90٪ من القيم تقع دونه.
الدرجة المعيارية (درجة Z) في المقابل تقيس عدد الانحرافات المعيارية بين قيمة ما والوسط الحسابي، وتفترض ضمنياً أن البيانات تقترب من التوزيع الطبيعي. درجة Z = 1.28 تقابل المئين التسعين في التوزيع الطبيعي المثالي، غير أنها قد تقابل مئيناً مختلفاً كلياً في توزيع متحيّز أو متعدد الأنماط.
يُفضَّل استخدام المئينات حين يكون شكل التوزيع مجهولاً أو غير طبيعي — كدرجات الاختبارات والمعدلات المرجعية في الطب — وتُفضَّل الدرجات المعيارية حين يكون افتراض الطبيعية مقبولاً وتستلزم المقارنة بين مقاييس ذات وحدات مختلفة.
الحد الأدنى من البيانات
تستلزم طريقة الاستيفاء الخطي توفر قيمتين على الأقل. عند توفر قيمتين فقط، تُحسب الربيعيات باستيفاء على الفترة الوحيدة الممتدة بين القيمتين، وتكون جميع المئينات من 0 إلى 100 قابلة للحساب.
لتقديرات دقيقة في التطبيق العملي، تزيد الحاجة إلى بيانات أوفر. يتسع فارق الثقة في تقدير المئينات عند تقليص حجم العيّنة؛ فمتطلبات الدقة في المئين التسعين مثلاً أعلى بكثير في عيّنة مؤلفة من 20 قيمة منها في عيّنة مؤلفة من 200 قيمة.
الأسئلة الشائعة (FAQ)
ما طريقة الحساب المستخدمة في هذه الحاسبة؟
تعتمد الحاسبة طريقة الاستيفاء الخطي الشاملة، المعروفة بالطريقة 7 في لغة R، وهي مطابقة لدالة PERCENTILE.INC في Excel ولدالة numpy.percentile الافتراضية في Python. تُحدَّد رتبة المئين p عند الموضع (n − 1) × p/100 في البيانات المرتبة، ثم تُجرى عملية الاستيفاء بين القيمتين المجاورتين.
مثال: في مجموعة البيانات [4, 8, 15, 16, 23, 42] المكوّنة من 6 قيم، عند p = 25 يكون الموضع 5 × 0.25 = 1.25. الربيع الأول إذن = 8 + 0.25 × (15 − 8) = 9.75.
توجد طرق بديلة: الطريقة 6 المستخدمة في SPSS وفي دالة PERCENTILE.EXC بـ Excel، وطرق الرتبة الأقرب المستخدمة في بعض المناهج الأكاديمية. في مجموعات البيانات الكبيرة تتقارب جميع الطرق وتعطي نتائج متماثلة عملياً؛ لكنها تختلف في العيّنات الصغيرة، لذا ينبغي التحقق من الطريقة المستخدمة عند مقارنة النتائج بين برامج مختلفة.
ما استخدامات المدى الربيعي في التحليل الإحصائي؟
المدى الربيعي هو الفرق بين الربيع الثالث والربيع الأول، ويقيس تشتت النصف الأوسط من البيانات. يُوظَّف في سياقَين رئيسيَّين.
أولاً، يُستخدم لاكتشاف القيم الشاذة: كل قيمة تقل عن Q1 − 1.5 × IQR أو تزيد عن Q3 + 1.5 × IQR تُصنَّف قيمةً شاذة خفيفة، وما يتجاوز ثلاثة أمثال المدى الربيعي خارج هذين الحدَّين يُصنَّف شذوذاً متطرفاً. تعتمد هذا القاعدة أدوات الرسم البياني الصندوقي في R وPython وExcel.
ثانياً، يُعدّ المدى الربيعي مقياساً قوياً للتشتت في وجود القيم الشاذة؛ إذ لا يتأثر بالقيم المتطرفة على خلاف الانحراف المعياري. وهذا يجعله الأنسب للتوزيعات غير المتماثلة كتوزيعات الدخل وأسعار العقارات وأوقات الانتظار.
كيف تُقسّم الربيعيات مجموعة البيانات؟
تُقسّم الربيعيات الثلاثة (Q1 وQ2 وQ3) البيانات المرتبة إلى أربعة أجزاء متساوية، يحتوي كل منها على 25٪ من القيم. يفصل Q1 الربع الأدنى عن بقية البيانات، ويقسم Q2 البيانات إلى نصفين متساويين، ويفصل Q3 الربع الأعلى عن البقية.
عندما يكون عدد القيم مضاعفاً صحيحاً للأربعة، يقع كل ربيع بين قيمتين متتاليتين وتُجرى عملية الاستيفاء. وفي الحالات الأخرى تُنتج الطريقة الخطية قيماً كسرية تحترم الحدود النسبية.
المدى الربيعي — Q3 ناقص Q1 — يُغطي الربيعين الأوسطَين ويمثل أشيع ملخص إحصائي وحيد للتشتت في التحليل الاستكشافي للبيانات.
ما الفرق بين المئين والدرجة المعيارية (درجة Z)؟
المئين ترتيب تجريبي يعكس موضع قيمة داخل مجموعة البيانات الفعلية، ولا يفترض أي شكل للتوزيع. المئين 75 يعني ببساطة أن 75٪ من القيم المرصودة تقع دون هذه النقطة.
أما الدرجة المعيارية فتقيس عدد الانحرافات المعيارية التي تفصل قيمةً ما عن الوسط الحسابي، وتستلزم ضمنياً أن تكون البيانات مقاربةً للتوزيع الطبيعي؛ فدرجة Z = 1 تقابل المئين الرابع والثمانين في التوزيع الطبيعي، لكنها قد تقابل مئيناً مختلفاً تماماً في توزيع متحيّز أو متعدد الأنماط.
يُفضَّل استخدام المئينات حين يكون التوزيع مجهولاً أو غير طبيعي، كدرجات الاختبارات والدخول والمقاييس الطبية المرجعية. وتُفضَّل درجة Z حين يكون افتراض الطبيعية مقبولاً وتستلزم المقارنة بين مقاييس ذات وحدات مختلفة.
التالي الموصى به
حاسبة الوسط الحسابي والوسيط والمنوال
احسب الوسط الحسابي والوسيط والمنوال والمدى لأي مجموعة بيانات — أدخل الأرقام مفصولة بفواصل للحصول على مقاييس النزعة المركزية الأربعة.