أحد أكثر المفاهيم الأساسية في الإحصاء هو المتوسط ، أو المتوسط الحسابي، من مجموعة من الأرقام. المتوسط يعني قيمة مركزية لمجموعة البيانات. ال التباين من مجموعة البيانات يقيس مدى انتشار عناصر مجموعة البيانات هذه عن المتوسط. ستكون مجموعات البيانات التي تكون جميع الأرقام قريبة من المتوسط بها تباين منخفض. تلك المجموعات التي تكون فيها الأرقام أعلى أو أقل من المتوسط سيكون لها تباين عالي.
حساب متوسط مجموعة البيانات
حساب الاختلافات التربيعية
تتضمن الخطوة التالية حساب الفرق بين كل عنصر في مجموعة البيانات والمتوسط. بما أن بعض العناصر ستكون أعلى من المتوسط ، والبعض الآخر سيكون أقل ، فإن حساب التباين يستخدم مربع الاختلافات.
مبيعات اليوم الأول - متوسط المبيعات: 62،000 دولار - 65414.29 دولارًا أمريكيًا (- 3،414.29 دولارًا) (-3،414.29)2 = 11,657,346.94
مبيعات اليوم الثاني - متوسط المبيعات: $ 64،800 - $ 65414.29 = (- $ 614.29) ؛ (-614.29)2 = 377,346.94
مبيعات اليوم الثالث - متوسط المبيعات: 62،600 دولار - 65414.29 دولارًا أمريكيًا (- 2،814.29 دولارًا أمريكيًا) ؛ (-2،814.29)2 = 7,920,204.08
مبيعات اليوم الرابع - متوسط المبيعات: 69،200 دولار - 65414.29 دولار = (+ 3،785.71 دولار) ؛ (+3،785.71)2 = 14,331,632.65
مبيعات اليوم الخامس - متوسط المبيعات: 66،000 دولار - 65414.29 دولار = (+ 585.71 دولار) ؛ (+585.71)2 = 343,061.22
يوم 6 المبيعات - متوسط المبيعات: 63،900 - 65414،29 دولارًا أمريكيًا (- 1،514،29 دولارًا أمريكيًا) ؛ (-1،514.29)2 = 2,293,061.22
مبيعات اليوم السابع - متوسط المبيعات: 69،400 دولار - 65414.29 دولار = (+ 3،985.71 دولار أمريكي) (+3،985.71)2 = 15,885,918.37
ملحوظة: لا يتم قياس الاختلافات التربيعية بالدولار. يتم استخدام هذه الأرقام في الخطوة التالية لحساب التباين.
التباين والانحراف المعياري
يتم تعريف التباين كمتوسط الاختلافات المربعة.
11,657,346.94 + 377,346.94 + 7,920,204.08 + 14,331,632.65 + 343,061.22 + 2,293,061.22 + 15,885,918.37 = 52,808,571.43
52,808,571.43/7 = 7,544,081.63
بما أن التباين يستخدم مربع الاختلاف ، فإن الجذر التربيعي للتغير يعطي إشارة أوضح عن الانتشار الفعلي. في الإحصائيات ، يسمى الجذر التربيعي للتباين الانحراف المعياري.
SQRT (7،544،081.63) = $ 2،746.65
استخدامات التباين والانحراف المعياري
كل من التباين والانحراف المعياري مفيدان للغاية في التحليل الإحصائي. يقيس التباين الانتشار العام لمجموعة البيانات من المتوسط. يساعد الانحراف المعياري في الكشف القيم المتطرفة، أو عناصر من مجموعة البيانات التي تبتعد أكثر من المتوسط.
في مجموعة البيانات المذكورة أعلاه ، يكون التباين عاليًا جدًا ، حيث يصل مجمل مبيعات يومي فقط إلى 1000 دولار من المتوسط. تظهر مجموعة البيانات أيضًا أن اثنين من إجماليات المبيعات اليومية السبعة أكثر من انحراف معياري واحد فوق المتوسط ، في حين أن اثنين آخرين أكثر من انحراف معياري واحد أقل من المتوسط.