يشير مصطلح أخذ العينات في الإحصاء إلى اختيار جزء من البيانات الإحصائية المجمعة بغرض الحصول على المعلومات ذات الصلة حول الكل. يُطلق على المعلومات الإحصائية الإجمالية أو الكلية المتعلقة بسمة معينة لجميع الأعضاء الذين شملهم التحقيق اسم “السكان” أو “الكون”. (داس ، إن جي ، 2010). يُطلق على الجزء المختار من السكان الذي يتم استخدامه للحصول على خصائص السكان أو الكون اسم “عينة”. يتم أخذ السكان من وحدات فردية أو أعضاء ، ويتم تضمين بعض الوحدات في العينة. يُطلق على العدد الإجمالي لوحدات المجتمع اسم حجم السكان ، ويسمى عدد العينة حجم العينة. يمكن أن يكون عدد السكان والعينة محدودًا أو غير محدود وبالمثل يمكن أن يكونا موجودين أو افتراضيين.

فرق: التباين هو قيمة عددية توضح مدى اتساع توزيع الأرقام الفردية في مجموعة من البيانات حول المتوسط. هذا هو مدى بعد كل رقم عن المتوسط ​​، وبالتالي عن بعضها البعض. يعني التباين بقيمة صفر أن جميع البيانات متطابقة. كلما زاد التباين ، زادت القيم المنتشرة حول المتوسط ​​، وبالتالي من بعضها البعض. كلما قل التباين ، قلت القيم المنتشرة حول المتوسط ​​، وبالتالي من بعضها البعض ، ولا يمكن أن يكون التباين سالبًا.

الفرق بين التباين السكاني وتباين العينة

يرتبط الاختلاف الرئيسي بين تباين السكان وتباين العينة بحساب التباين. يتم حساب الفرق في خمس خطوات. يتم حساب المتوسط ​​الأول ، ثم نحسب الانحرافات عن المتوسط ​​، وثالثًا يتم تربيع الانحرافات ، ورابعًا يتم تلخيص الانحرافات التربيعية ، وفي النهاية يتم تقسيم هذا المجموع على عدد العناصر التي يتم حساب التباين من أجلها. وبالتالي فإن التباين = Σ (xi-x -) / n. حيث xi = ith. العدد ، x- = متوسط ​​و n = عدد العناصر ..

الآن ، عندما يتم حساب التباين من بيانات السكان ، فإن n تساوي عدد العناصر. وبالتالي ، إذا تم حساب التباين في ضغط الدم لكل 1000 شخص من بيانات ضغط الدم لكل 1000 شخص ، فعندئذٍ n = 1000. ومع ذلك ، عند حساب التباين من بيانات العينة 1 ، يجب خصمه من n قبل قسمة مجموع الانحرافات التربيعية. وهكذا في المثال أعلاه إذا كانت بيانات العينة تحتوي على 100 عنصر ، فسيكون المقام 100-1 = 99.

ونتيجة لذلك ، فإن قيمة التباين المحسوبة من بيانات العينة أعلى من القيمة التي كان يمكن اكتشافها باستخدام بيانات المجتمع. منطق القيام بذلك هو تعويض نقص المعلومات حول البيانات السكانية. من المستحيل معرفة تباين المرتفعات في البشر ، بسبب افتقارنا المطلق إلى المعلومات حول مرتفعات جميع الكائنات البشرية ، وليس الحديث عن المستقبل. حتى لو أخذنا مثالًا واحدًا معتدلًا ، مثل البيانات السكانية حول ارتفاعات جميع الرجال الأحياء في الولايات المتحدة ، فمن الممكن ماديًا ، لكن التكلفة والوقت اللذين ينطوي عليهما هذا سيحبطان الغرض من حسابه. هذا هو سبب أخذ بيانات العينة لمعظم الأغراض الإحصائية ، ويصاحب ذلك نقص في المعلومات حول غالبية البيانات. من أجل التعويض عن ذلك ، فإن قيمة التباين والانحراف المعياري ، وهو الجذر التربيعي للتباين ، أعلى في حالة بيانات العينة من التباين عن بيانات المجتمع.

يعمل هذا كدرع آلي للمحللين وصناع القرار. ينطبق المنطق على قرارات الميزانية الرأسمالية والتمويل الشخصي والتجاري والبناء وإدارة المرور والعديد من المجالات القابلة للتطبيق. هذا يساعد صاحب المصلحة على أن يكون في الجانب الآمن أثناء اتخاذ القرار أو لاستنتاجات أخرى.

ملخص: يشير تباين المحتوى إلى قيمة التباين المحسوبة من بيانات المحتوى ، وتباين العينة هو التباين المحسوب من بيانات العينة. نظرًا لقيمة المقام في معادلة التباين في حالة بيانات العينة ، تكون “n-1” ، وهي “n” لبيانات السكان. نتيجة لذلك ، يكون كل من التباين والانحراف المعياري المشتق من بيانات العينة أكثر من تلك الموجودة في بيانات السكان.

المصدر

المادة السابقةالفرق بين UMAMI و KOKUMI
المقالة القادمةهل أستخدام مرطب الجسم على وجهك جيد أم سيئ؟

ترك الرد

من فضلك ادخل تعليقك
من فضلك ادخل اسمك هنا