چگونه ارزش آزمون کای دو پیرسون را تفسیر کنیم؟ روش های کلاسیک آمار: آزمون کای اسکوئر

وزارت آموزش و پرورش و علوم فدراسیون روسیه

آژانس فدرال آموزش شهر ایرکوتسک

بایکال دانشگاه دولتیاقتصاد و حقوق

گروه انفورماتیک و سایبرنتیک

توزیع کای دو و کاربرد آن

کلمیکووا آنا آندریونا

دانشجوی سال دوم

گروه IS-09-1

ایرکوتسک 2010

معرفی

1. توزیع Chi-square

کاربرد

نتیجه

کتابشناسی - فهرست کتب

معرفی

رویکردها، ایده ها و نتایج نظریه احتمال چگونه در زندگی ما استفاده می شود؟

پایه یک مدل احتمالی از یک پدیده یا فرآیند واقعی است، به عنوان مثال. مدل ریاضی، که در آن روابط عینی بر حسب نظریه احتمال بیان می شود. احتمالات عمدتاً برای توصیف عدم قطعیت هایی استفاده می شوند که باید هنگام تصمیم گیری در نظر گرفته شوند. این هم به فرصت های نامطلوب (خطرات) و هم به فرصت های جذاب اشاره دارد (" مورد شانس") گاهی اوقات تصادفی بودن عمداً به وضعیت وارد می شود، به عنوان مثال، هنگام قرعه کشی، انتخاب تصادفی واحدها برای کنترل، انجام قرعه کشی یا نظرسنجی از مصرف کنندگان.

نظریه احتمال به فرد امکان می دهد تا احتمالات دیگری را که مورد علاقه محقق است محاسبه کند.

مدل احتمالی یک پدیده یا فرآیند، پایه و اساس آمار ریاضی است. از دو سری مفاهیم موازی استفاده می شود - مفاهیم مربوط به نظریه (یک مدل احتمالی) و مفاهیم مربوط به عمل (نمونه ای از نتایج مشاهده). به عنوان مثال، احتمال نظری با فرکانس یافت شده از نمونه مطابقت دارد. انتظارات ریاضی (سری نظری) با میانگین حسابی نمونه (سری عملی) مطابقت دارد. به عنوان یک قاعده، ویژگی های نمونه تخمین هایی از موارد نظری است. در عین حال، کمیت های مربوط به سلسله نظری «در اذهان محققین است»، به دنیای اندیشه ها (به گفته افلاطون فیلسوف یونان باستان) اشاره دارد و برای اندازه گیری مستقیم در دسترس نیست. محققان فقط داده های انتخابی دارند که با کمک آنها سعی می کنند ویژگی های یک مدل احتمالی نظری را که مورد علاقه آنها است ایجاد کنند.

چرا به یک مدل احتمالی نیاز داریم؟ واقعیت این است که فقط با کمک آن می توان خواص ایجاد شده توسط نتایج تجزیه و تحلیل یک نمونه خاص را به نمونه های دیگر و همچنین به کل به اصطلاح عمومی منتقل کرد. اصطلاح "جمعیت" برای اشاره به جمعیت بزرگ اما محدودی از واحدهای مورد مطالعه استفاده می شود. به عنوان مثال، در مورد کل همه ساکنان روسیه یا کل مصرف کنندگان قهوه فوری در مسکو. هدف از بازاریابی یا نظرسنجی های جامعه شناختی انتقال اظهارات دریافتی از نمونه ای متشکل از صدها یا هزاران نفر به جمعیت های عمومی چند میلیون نفری است. در کنترل کیفیت در نقش جمعیتدسته ای از محصولات ظاهر می شود.

برای انتقال استنباط از یک نمونه به یک جامعه بزرگتر، برخی از فرضیات در مورد رابطه ویژگی های نمونه با ویژگی های این جمعیت بزرگتر مورد نیاز است. این مفروضات بر اساس یک مدل احتمالی مناسب است.

البته پردازش داده های نمونه بدون استفاده از یک مدل احتمالی دیگر امکان پذیر است. به عنوان مثال، می توانید میانگین حسابی نمونه را محاسبه کنید، فراوانی تحقق شرایط خاص و غیره را محاسبه کنید. با این حال، نتایج محاسبات فقط برای یک نمونه خاص اعمال می شود؛ انتقال نتایج به دست آمده با کمک آنها به هر مجموعه دیگری نادرست است. این فعالیت گاهی اوقات به عنوان "تحلیل داده" نامیده می شود. در مقایسه با روش های احتمالی-آماری، تحلیل داده ها ارزش شناختی محدودی دارد.

بنابراین، استفاده از مدل‌های احتمالی مبتنی بر ارزیابی و آزمون فرضیه‌ها با کمک ویژگی‌های نمونه، جوهره احتمالات است. روش های آماریتصمیم گیری.

توزیع کای دو

با استفاده از توزیع نرمالسه توزیع تعریف شده است که در حال حاضر اغلب در پردازش داده های آماری استفاده می شود. اینها توزیع های پیرسون ("چی - مربع")، دانشجو و فیشر هستند.

ما بر توزیع تمرکز خواهیم کرد

("چی - مربع"). این توزیع اولین بار توسط ستاره شناس F. Helmert در سال 1876 مورد مطالعه قرار گرفت. در ارتباط با نظریه گاوسی خطاها، او مجموع مربعات n متغیر تصادفی استاندارد مستقل را مطالعه کرد. کارل پیرسون بعداً این تابع توزیع را "chi-square" نامید. و اکنون توزیع نام او را بر خود دارد.

به دلیل ارتباط نزدیک آن با توزیع نرمال، توزیع χ2 بازی می کند نقش مهمدر نظریه احتمالات و آمار ریاضی. توزیع χ2 و بسیاری از توزیع‌های دیگر که با توزیع χ2 تعریف می‌شوند (مثلاً توزیع دانش‌آموز)، توزیع‌های نمونه توابع مختلف را از مشاهدات توزیع شده عادی توصیف می‌کنند و برای ساخت فواصل اطمینان و آزمون‌های آماری استفاده می‌شوند.

توزیع پیرسون

(chi - مربع) توزیع یک متغیر تصادفی است، که در آن X1، X2،…، Xn متغیرهای تصادفی مستقل عادی هستند و ارزش مورد انتظارهر یک از آنها برابر با صفر و میانگین است انحراف معیار- واحد.

مجموع مربعات


توسط قانون تعیین شده است

("چی - مربع").

در این مورد، تعداد اصطلاحات، یعنی. n، "تعداد درجات آزادی" توزیع کای دو نامیده می شود.با افزایش تعداد درجات آزادی، توزیع به آرامی به حالت عادی نزدیک می شود.

چگالی این توزیع


بنابراین، توزیع χ2 به یک پارامتر n بستگی دارد - تعداد درجات آزادی.

تابع توزیع χ2 به شکل زیر است:


اگر χ2≥0. (2.7.)

شکل 1 نموداری از چگالی احتمال و تابع توزیع χ2 را برای درجات مختلف آزادی نشان می دهد.

تصویر 1وابستگی چگالی احتمال φ (x) در توزیع χ2 (چی یک مربع است) در عدد متفاوتدرجه آزادی.

لحظات توزیع "خی دو":

توزیع کای دو در تخمین واریانس استفاده می شود (با استفاده از فاصله اطمینان، هنگام آزمایش فرضیه های توافق، همگنی، استقلال، در درجه اول برای متغیرهای کیفی (دسته بندی شده) که تعداد محدودی از مقادیر را می گیرند، و در بسیاری از مسائل دیگر. تحلیل آماریداده ها.

2. "خی دو" در مسائل تجزیه و تحلیل داده های آماری

روش های آماری تجزیه و تحلیل داده ها تقریباً در تمام زمینه های فعالیت انسانی استفاده می شود. هر زمان که لازم باشد هر گونه قضاوت در مورد یک گروه (اشیاء یا موضوعات) با مقداری ناهمگونی درونی به دست آید، از آنها استفاده می شود.

مرحله مدرن توسعه روش های آماری را می توان از سال 1900 شمارش کرد، زمانی که K. Pearson انگلیسی مجله "Biometrika" را تأسیس کرد. ثلث اول قرن بیستم تحت علامت آمار پارامتریک تصویب شد. روش‌های مبتنی بر تجزیه و تحلیل داده‌ها از خانواده‌های پارامتری توزیع‌ها که توسط منحنی‌های خانواده پیرسون توصیف شده‌اند مورد مطالعه قرار گرفتند. محبوب ترین توزیع نرمال بود. برای آزمون فرضیه ها از معیارهای پیرسون، دانشجو و فیشر استفاده شد. روش حداکثر درستنمایی پیشنهاد شده است. تحلیل واریانس، ایده های اصلی برنامه ریزی آزمایش فرموله شده است.

توزیع کای دو یکی از پرکاربردترین توزیع‌ها در آمار برای آزمون فرضیه‌های آماری است. بر اساس توزیع «خی دو»، یکی از قوی‌ترین آزمون‌های برازش، آزمون «خی‌دو» پیرسون ساخته شد.

آزمون خوب بودن برازش معیاری برای آزمون فرضیه در مورد قانون پیشنهادی توزیع مجهول است.

آزمون χ2 ("chi-square") برای آزمون فرضیه توزیع های مختلف استفاده می شود. این شایستگی اوست.

فرمول محاسبه معیار برابر است با

که در آن m و m به ترتیب فرکانس های تجربی و نظری هستند

توزیع در حال بررسی؛

n تعداد درجات آزادی است.

برای راستی‌آزمایی، باید فرکانس‌های تجربی (مشاهده‌شده) و نظری (محاسبه‌شده با فرض توزیع نرمال) را با هم مقایسه کنیم.

اگر فرکانس های تجربی کاملاً با فرکانس های محاسبه شده یا مورد انتظار منطبق باشند، S (E - T) = 0 و معیار χ2 نیز برابر با صفر خواهد بود. اگر S (E - T) برابر با صفر نباشد، این نشان دهنده اختلاف بین فرکانس های محاسبه شده و فرکانس های تجربی سری است. در چنین مواردی، ارزیابی اهمیت معیار χ2 ضروری است که از نظر تئوری می تواند از صفر تا بی نهایت متغیر باشد. این با مقایسه مقدار واقعی χ2ph با مقدار بحرانی آن (χ2st) انجام می‌شود.فرضیه صفر، یعنی این فرض که اختلاف بین فرکانس‌های تجربی و نظری یا مورد انتظار تصادفی است، اگر χ2ph بزرگتر یا مساوی باشد، رد می‌شود. به χ2 برای سطح معناداری پذیرفته شده (a) و تعداد درجات آزادی (n).

آزمون Chi-Square - روش عمومیبررسی تطابق بین نتایج آزمایش و مدل آماری مورد استفاده.

فاصله پیرسون X 2

پیاتنیتسکی A.M.

دولت روسیه دانشگاه پزشکی

در سال 1900، کارل پیرسون یک طرح ساده، جهانی و روش موثرتأیید توافق بین پیش‌بینی‌های مدل و داده‌های تجربی. آزمون کای اسکوئر او مهمترین و پرکاربردترین آزمون آماری است. بسیاری از مشکلات مربوط به تخمین پارامترهای ناشناخته مدل و بررسی تطابق بین مدل و داده های تجربی را می توان با کمک آن حل کرد.

بگذارید یک مدل پیشینی ("پیش آزمایشی") از شی یا فرآیند مورد مطالعه وجود داشته باشد (در آمار آنها از "فرضیه صفر" H 0 صحبت می کنند) و نتایج آزمایش با این شی. باید تصمیم گرفت که آیا مدل کافی است (آیا با واقعیت مطابقت دارد)؟ آیا نتایج آزمایش با ایده های ما در مورد چگونگی کارکرد واقعیت در تضاد نیست، یا به عبارت دیگر، H 0 باید رد شود؟ اغلب این کار را می توان به مقایسه مشاهده شده (O i = مشاهده شده) تقلیل داد و با توجه به مدل (E i = انتظار می رود) متوسط ​​فراوانی های وقوع رویدادهای خاص را انتظار داشت. اعتقاد بر این است که فرکانس های مشاهده شده در یک سری از N مشاهدات مستقل (!) در شرایط ثابت (!) به دست آمده اند. در نتیجه هر مشاهده، یکی از M رویدادها ثبت می شود. این رویدادها نمی توانند به طور همزمان رخ دهند (آنها به صورت جفتی ناسازگار هستند) و یکی از آنها لزوما رخ می دهد (ترکیب آنها یک رویداد قابل اعتماد را تشکیل می دهد). مجموع همه مشاهدات به یک جدول (بردار) فرکانس (O i )=(O 1 ,… O M ) کاهش می یابد که به طور کامل نتایج آزمایش را توصیف می کند. مقدار O 2 = 4 به این معنی است که رویداد شماره 2 4 بار اتفاق افتاده است. مجموع فرکانس های O 1 +… O M =N. تمایز بین دو مورد مهم است: N - ثابت، غیر تصادفی، N - مقدار تصادفی. در یک ثابت تعداد کلآزمایش های فرکانس N توزیع چند جمله ای دارند. اجازه دهید این را توضیح دهیم طرح کلی مثال ساده.

استفاده از آزمون کای اسکوئر برای آزمون فرضیه های ساده.

اجازه دهید مدل (فرضیه صفر H 0) این باشد که تاس منظم است - همه وجوه به طور مساوی با احتمال p i = 1/6، i =، M = 6 می افتند. آزمایشی انجام شد که شامل این واقعیت بود که استخوان 60 بار پرتاب شد (60 = N انجام شد تست های مستقل). با توجه به مدل، انتظار داریم که تمام فرکانس های مشاهده شده O i وقوع 1،2،... 6 نقطه باید به مقادیر میانگین آنها نزدیک باشد E i =Np i =60∙(1/6)=10. با توجه به H 0 بردار فرکانس میانی (E i)=(Np i)=(10، 10، 10، 10، 10، 10). (فرضیه هایی که در آنها متوسط ​​فرکانس ها قبل از شروع آزمایش کاملاً مشخص باشد، ساده نامیده می شوند.) اگر بردار مشاهده شده (O i ) برابر با (34,0,0,0,0,26) بود آنگاه فوراً مشخص می شود. واضح است که مدل نادرست است - استخوان نمی تواند درست باشد، زیرا فقط 1 و 6 60 بار سقوط کردند. احتمال چنین رویدادی برای یک صحیح تاسناچیز: P \u003d (2/6) 60 \u003d 2.4 * 10 -29. با این حال، ظهور چنین اختلافات آشکار بین مدل و تجربه یک استثنا است. بگذارید بردار فرکانس های مشاهده شده (O i ) برابر با (5، 15، 6، 14، 4، 16) باشد. آیا این با H 0 موافق است؟ بنابراین، باید دو بردار فرکانس (E i) و (O i) را با هم مقایسه کنیم. در عین حال، بردار فرکانس های مورد انتظار (E i) تصادفی نیست، اما بردار فرکانس های مشاهده شده (O i) تصادفی است - در آزمایش بعدی (در یک سری جدید 60 پرتابی) معلوم می شود که ناهمسان. معرفی یک تفسیر هندسی از مسئله و فرض اینکه در فضای فرکانس ها (در این مورد 6 بعدی) دو نقطه با مختصات (5، 15، 6، 14، 4، 16) و (10، 10، 10، 10، 10، 10) آورده شده است. آیا آنقدر از هم فاصله دارند که آن را با H 0 ناسازگار بدانیم؟ به عبارت دیگر، ما نیاز داریم:

  1. یاد بگیرید چگونه فاصله بین فرکانس ها را اندازه گیری کنید (نقاط در فضای فرکانس)،
  2. معیاری داشته باشید که چه فاصله ای باید خیلی زیاد ("غیر محتمل") در نظر گرفته شود، یعنی با H 0 ناسازگار باشد.

مجذور فاصله معمول اقلیدسی خواهد بود:

X 2 اقلیدس = اس(O i -E i) 2 = (5-10) 2 + (15-10) 2 + (6-10) 2 + (14-10) 2 + (4-10) 2 + (16-10) 2

علاوه بر این، اگر مقادیر E i را ثابت کنیم و O i را تغییر دهیم، سطوح X 2 Euclid = const همیشه کروی هستند. کارل پیرسون اشاره کرد که نباید از فاصله اقلیدسی در فضای فرکانسی استفاده کرد. بنابراین، اشتباه است که فرض کنیم نقاط (O = 1030 و E = 1000) و (O = 40 و E = 10) روی هستند. مسافت مساویاز یکدیگر، اگرچه در هر دو مورد تفاوت O -E = 30 است. به هر حال، هر چه فرکانس مورد انتظار بیشتر باشد، انحرافات بیشتری از آن را باید ممکن در نظر گرفت. بنابراین، نقاط (O = 1030 و E = 1000) باید "نزدیک" و نقاط (O = 40 و E = 10) "دور" از یکدیگر در نظر گرفته شوند. می توان نشان داد که اگر فرضیه H 0 صحیح باشد، نوسانات فرکانس O i نسبت به E i دارای قدر مرتبه است. ریشه دوم(!) از E i. بنابراین، پیرسون پیشنهاد کرد که هنگام محاسبه فاصله، تفاوت ها را مربع نکنید (O i -E i)، بلکه تفاوت های نرمال شده (O i -E i)/E i 1/2 را مربع کنید. بنابراین، فرمول محاسبه فاصله پیرسون (در واقع مجذور فاصله است):

X 2 پیرسون = اس((O i -E i )/E i 1/2) 2 = اس(O i -E i ) 2 /E i

در مثال ما:

X 2 پیرسون = (5-10) 2 /10+(15-10) 2 /10 +(6-10) 2 /10+ (14-10) 2 /10+ (4-10) 2 /10+( 16-10) 2 /10=15.4

برای یک تاس معمولی، همه فرکانس‌های مورد انتظار E i یکسان هستند، اما معمولاً متفاوت هستند، بنابراین سطوحی که فاصله پیرسون روی آن‌ها ثابت است (X 2 Pearson =const) از قبل بیضی هستند، نه کره.

حال، پس از انتخاب فرمول محاسبه فواصل، باید دریابیم که کدام فاصله‌ها را باید «نه خیلی بزرگ» در نظر گرفت (مطابق با H 0).بنابراین، برای مثال، در مورد مسافتی که ما 15.4 محاسبه کردیم چه می‌توان گفت. ? در چند درصد موارد (یا با چه احتمالی) اگر با یک تاس معمولی آزمایش کنیم، فاصله ای بیشتر از 15.4 بدست می آید؟ اگر این درصد کم باشد<0.05), то H 0 надо отвергнуть. Иными словами требуется найти распределение длярасстояния Пирсона. Если все ожидаемые частоты E i не слишком малы (≥5), и верна H 0 , то нормированные разности (O i - E i )/E i 1/2 приближенно эквивалентны стандартным гауссовским случайным величинам: (O i - E i )/E i 1/2 ≈N (0,1). Это, например, означает, что в 95% случаев| (O i - E i )/E i 1/2 | < 1.96 ≈ 2 (правило “двух сигм”).

توضیح. تعداد اندازه‌گیری‌هایی که O i در سلول جدول با عدد i قرار می‌گیرد، دارای توزیع دوجمله‌ای با پارامترها است: m =Np i =E i ,σ =(Np i (1-pi )) 1/2، که N برابر است تعداد اندازه‌گیری‌ها (N "1)، p i احتمال افتادن یک اندازه‌گیری در این سلول است (به یاد بیاورید که اندازه‌گیری‌ها مستقل هستند و در شرایط ثابت). اگر p i کوچک باشد، آنگاه: σ≈(Np i) 1/2 =E i و توزیع دوجمله ای نزدیک به پواسون است که در آن میانگین تعداد مشاهدات E i =λ و انحراف معیار σ=λ 1/2 است. = E i 1/2. برای λ≥5، توزیع پواسون نزدیک به N نرمال است (m =E i =λ، σ=E i 1/2 =λ 1/2)، و مقدار نرمال شده (O i - E i )/E i 1 /2 ≈ N (0،1).

پیرسون متغیر تصادفی χ 2 n - "خی دو با n درجه آزادی" را به عنوان مجموع مربعات n r.v استاندارد استاندارد مستقل تعریف کرد:

χ 2 n = T 1 2 + T 2 2 + … + T n 2 ،همه چیز کجاست T i = N(0,1) - n O. آر. با. V.

بیایید سعی کنیم معنای این مهم ترین متغیر تصادفی در آمار را به صورت بصری درک کنیم. برای انجام این کار، در یک صفحه (برای n = 2) یا در فضا (برای n = 3) ابری از نقاط را نشان می دهیم که مختصات آنها مستقل هستند و دارای توزیع نرمال استاندارد هستندf T (x) ~exp (-x 2 /2) ). در یک صفحه، طبق قانون "دو سیگما"، که به طور مستقل برای هر دو مختصات اعمال می شود، 90٪ (0.95*0.95≈0.90) از نقاط در داخل یک مربع (-2) محصور شده اند.

f χ 2 2 (a) = Сexp(-a/2) = 0.5exp(-a/2).

با تعداد درجات آزادی کافی n (n>30)، توزیع کای دو به حالت عادی نزدیک می شود: N (m = n؛ σ = (2n) ½). این نتیجه "قضیه حد مرکزی" است: مجموع کمیت های توزیع شده یکسان با واریانس محدود با افزایش تعداد عبارت ها به قانون عادی نزدیک می شود.

در عمل، باید به خاطر داشت که میانگین مربع فاصله برابر با m (χ 2 n )=n و پراکندگی آن σ 2 (χ 2 n ) = 2n است. از اینجا به راحتی می توان نتیجه گرفت که کدام مقادیر مربع کای باید خیلی کوچک و خیلی بزرگ در نظر گرفته شوند: بیشتر توزیع در محدوده n -2 ∙ (2n) ½ تا n + 2 ∙ (2n) ½ قرار دارد.

بنابراین، فواصل پیرسون به طور قابل توجهی بیش از n +2∙ (2n) ½ باید به طور غیرقابل قبولی بزرگ در نظر گرفته شود (با H 0 سازگار نیست). اگر نتیجه نزدیک به n +2∙(2n) ½ باشد، باید از جداولی استفاده کنید که در آن دقیقاً می توانید دریابید که در چه نسبتی از موارد چنین مقادیر مربع خی و بزرگ ممکن است ظاهر شوند.

مهم است که بدانید چگونه مقدار مناسبی را برای تعداد درجات آزادی انتخاب کنید (تعداد درجه آزادی، به اختصار n .d .f .). طبیعی به نظر می رسید که فکر کنیم n به سادگی با تعداد بیت ها برابر است: n = M . پیرسون در مقاله خود چنین پیشنهاد کرد. در مثال تاس، این به این معنی است که n = 6. با این حال، چند سال بعد نشان داده شد که پیرسون اشتباه می کند. اگر بین متغیرهای تصادفی O i ارتباط وجود داشته باشد، تعداد درجات آزادی همیشه کمتر از تعداد ارقام است. برای مثال تاس، مجموع O i 60 است و تنها 5 فرکانس را می توان به طور مستقل تغییر داد، بنابراین مقدار صحیح n=6-1=5 است. برای این مقدار n، n +2∙(2n) ½ =5+2∙(10) ½ =11.3 را دریافت می کنیم. از آنجایی که 15.4>11.3، پس فرضیه H 0 - تاس صحیح است، باید رد شود.

پس از روشن شدن خطا، جداول χ 2 موجود باید تکمیل می شد، زیرا در ابتدا موردی n = 1 در آنها وجود نداشت، زیرا کمترین تعداد ارقام = 2 بود. اکنون مشخص شد که ممکن است مواردی وجود داشته باشد که فاصله پیرسون دارای توزیع χ 2 n = 1 باشد.

مثال. با 100 پرتاب سکه، تعداد نشان ها O 1 = 65 و دم O 2 = 35 است. تعداد ارقام M = 2. اگر سکه متقارن باشد، فرکانس های مورد انتظار E 1 = 50، E 2 = 50 است.

X 2 پیرسون = اس(O i -E i) 2 / E i \u003d (65-50) 2 / 50 + (35-50) 2 / 50 \u003d 2 * 225/50 \u003d 9.

مقدار به دست آمده باید با مقادیری که متغیر تصادفی χ 2 n = 1 می تواند بگیرد، مقایسه شود، که به عنوان مربع مقدار نرمال استاندارد χ 2 n = 1 = T 1 2 ≥ 9 تعریف می شود. ó T 1 ≥3 یا T 1 ≤-3. احتمال چنین رویدادی بسیار کوچک است P (χ 2 n = 1 ≥9) = 0.006. بنابراین، سکه را نمی توان متقارن در نظر گرفت: H 0 را باید رد کرد. این واقعیت که تعداد درجات آزادی نمی تواند با تعداد بیت ها برابر باشد، از این واقعیت قابل دریافت است که مجموع فرکانس های مشاهده شده همیشه با مجموع فرکانس های مورد انتظار برابر است، برای مثال O 1 + O 2 = 65 +35 = E 1 + E 2 =50+50=100. بنابراین، نقاط تصادفی با مختصات O 1 و O 2 در یک خط مستقیم قرار دارند: O 1 + O 2 \u003d E 1 + E 2 \u003d 100 و فاصله تا مرکز کمتر از زمانی است که این محدودیت وجود نداشته باشد. آنجا، و آنها در کل هواپیما قرار داشتند. در واقع، برای دو متغیر تصادفی مستقل با انتظارات ریاضی E 1 = 50، E 2 = 50، مجموع تحقق آنها نباید همیشه برابر با 100 باشد - برای مثال، مقادیر O 1 = 60، O 2 = 55 خواهد بود. قابل قبول باشد

توضیح. بیایید نتیجه معیار پیرسون را با M = 2 با آنچه که فرمول Moivre-Laplace هنگام تخمین نوسانات تصادفی در فراوانی وقوع یک رویداد ν =K /N با احتمال p در یک سری N آزمایش مستقل برنولی می دهد، مقایسه کنیم. K تعداد موفقیت ها است):

χ 2 n = 1 = اس(O i -E i) 2 / E i \u003d (O 1 -E 1) 2 / E 1 + (O 2 -E 2) 2 / E 2 \u003d (Nν -Np) 2 / (Np) + ( N ( 1-ν )-N (1-p )) 2 /(N (1-p ))=

=(Nν-Np) 2 (1/p + 1/(1-p))/N=(Nν-Np) 2 /(Np(1-p))=((K-Np)/(Npq) ½ ) 2 = T 2

مقدار T \u003d (K -Np) / (Npq) ½ \u003d (K -m (K)) / σ (K) ≈ N (0.1) با σ (K) \u003d (Npq) ½ ≥3. می بینیم که در این مورد، نتیجه پیرسون دقیقاً همان نتیجه ای است که با اعمال تقریب نرمال در توزیع دو جمله ای به دست می آید.

تا کنون، فرضیه های ساده ای را در نظر گرفته ایم که میانگین فرکانس های مورد انتظار E i از قبل کاملاً شناخته شده است. نحوه انتخاب درجه آزادی مناسب برای فرضیه های پیچیده را در زیر ببینید.

استفاده از آزمون کای دو برای آزمون فرضیه های پیچیده

در مثال هایی با تاس و سکه صحیح، فرکانس های مورد انتظار را می توان قبل از (!) آزمایش تعیین کرد. به چنین فرضیه هایی «ساده» می گویند. در عمل، "فرضیه های پیچیده" رایج تر هستند. در عین حال، برای یافتن فرکانس های مورد انتظار E i، ابتدا باید یک یا چند کمیت (پارامترهای مدل) تخمین زده شود و این کار فقط با استفاده از داده های تجربی قابل انجام است. در نتیجه، برای «فرضیه‌های پیچیده»، فرکانس‌های مورد انتظار E i وابسته به فرکانس‌های مشاهده‌شده O i هستند و بنابراین خود به متغیرهای تصادفی تبدیل می‌شوند و بسته به نتایج آزمایش تغییر می‌کنند. در فرآیند برازش پارامترها، فاصله پیرسون کاهش می یابد - پارامترها به گونه ای انتخاب می شوند که توافق بین مدل و آزمایش را بهبود بخشد. بنابراین، تعداد درجات آزادی باید کاهش یابد.

چگونه پارامترهای مدل را ارزیابی کنیم؟ روش های مختلفی برای تخمین وجود دارد - "روش حداکثر احتمال"، "روش لحظه ها"، "روش جایگزینی". با این حال، ممکن است با به حداقل رساندن فاصله پیرسون، هیچ بودجه اضافی در نظر گرفته نشود و تخمین پارامترها را بیابید. در دوران پیش از کامپیوتر، این رویکرد به ندرت مورد استفاده قرار می گرفت: برای محاسبات دستی ناخوشایند است و، به عنوان یک قاعده، خود را به یک راه حل تحلیلی نمی دهد. هنگام محاسبه در رایانه، مینیمم سازی عددی معمولاً به راحتی انجام می شود و مزیت این روش جهانی بودن آن است. بنابراین، با توجه به "روش کمینه سازی کای اسکوئر"، مقادیر پارامترهای مجهول را انتخاب می کنیم تا فاصله پیرسون کوچکترین شود. (به هر حال، با مطالعه تغییرات این فاصله با جابجایی های کوچک نسبت به حداقل یافت شده، می توان میزان دقت برآورد را تخمین زد: فواصل اطمینان ایجاد کنید.) پس از اینکه پارامترها و خود این حداقل فاصله پیدا شد، باز هم لازم است به این سوال پاسخ دهیم که آیا به اندازه کافی کوچک است یا خیر.

توالی کلی اقدامات به شرح زیر است:

  1. انتخاب مدل (فرضیه H 0).
  2. انتخاب ارقام و تعیین بردار فرکانس های مشاهده شده O i.
  3. تخمین پارامترهای مجهول مدل و ساخت فواصل اطمینان برای آنها (مثلاً با جستجوی حداقل فاصله پیرسون).
  4. محاسبه فرکانس های مورد انتظار E i.
  5. مقایسه مقدار یافت شده فاصله پیرسون X 2 با مقدار بحرانی کریت chi-square χ 2 - بزرگترین که هنوز هم قابل قبول است و با H 0 سازگار است. مقدار χ 2 کریت را از جداول پیدا می کنیم و معادله را حل می کنیم

P (χ2 n > χ 2 کریت) = 1-α،

جایی که α «سطح اهمیت» یا «اندازه آزمون» یا «مقدار خطای نوع I» است (مقدار معمولی α=0.05).

معمولاً تعداد درجات آزادی n با فرمول محاسبه می شود

n = (تعداد ارقام) – 1 – (تعداد پارامترهای تخمینی)

اگر کریت X 2 > χ 2 باشد، فرضیه H 0 رد می شود، در غیر این صورت پذیرفته می شود. در α∙100٪ موارد (یعنی کاملاً به ندرت)، این روش بررسی H 0 منجر به "خطای نوع اول" می شود: فرضیه H 0 به اشتباه رد می شود.

مثال.در مطالعه 10 سری 100 بذری، تعداد آلودگی مگس چشم سبز شمارش شد. داده های دریافتی: O i =(16، 18، 11، 18، 21، 10، 20، 18، 17، 21);

در اینجا، بردار فرکانس های مورد انتظار از قبل ناشناخته است. اگر داده ها همگن باشند و برای توزیع دو جمله ای به دست آمده باشند، یک پارامتر ناشناخته است - نسبت p دانه های آلوده. توجه داشته باشید که در جدول اصلی در واقع نه 10 بلکه 20 فرکانس وجود دارد که 10 لینک را برآورده می کند: 16+84=100، ... 21+79=100.

X 2 \u003d (16-100p) 2 / 100p + (84-100 (1-p)) 2 / (100 (1-p)) + ... +

(21-100p) 2 /100p +(79-100(1-p)) 2 /(100(1-p))

با ترکیب عبارات به صورت جفت (مانند مثال با یک سکه)، شکل نوشتن معیار پیرسون را دریافت می کنیم که معمولاً بلافاصله نوشته می شود:

X 2 \u003d (16-100p) 2 / (100p (1-p)) + ... + (21-100p) 2 / (100p (1-p)).

حال، اگر از حداقل فاصله پیرسون به عنوان روشی برای تخمین p استفاده کنیم، باید p را پیدا کنیم که X 2 =min برای آن باشد. (این مدل سعی می کند، در صورت امکان، با داده های تجربی "تطبیق" کند.)

معیار پیرسون جهانی ترین معیار مورد استفاده در آمار است. می توان آن را برای داده های تک بعدی و چند بعدی، ویژگی های کمی و کیفی اعمال کرد. با این حال، دقیقاً به دلیل جهانی بودن است که باید مراقب بود که اشتباه نکند.

نکات مهم

1. انتخاب رتبه.

  • اگر توزیع گسسته باشد، معمولاً در انتخاب ارقام دلبخواهی وجود ندارد.
  • اگر توزیع پیوسته باشد، خودسری اجتناب ناپذیر است. شما می توانید از بلوک های معادل آماری استفاده کنید (همه O یکسان هستند، برای مثال = 10). در این مورد، طول فواصل متفاوت است. در محاسبات دستی سعی می کردند فواصل یکسان باشد. آیا فواصل در مطالعه توزیع یک ویژگی یک بعدی باید برابر باشد؟ خیر
  • لازم است بیت ها را ترکیب کنید تا فرکانس های مورد انتظار (رعایت نشده!) خیلی کوچک نباشند (≥5). به یاد بیاورید که آنها (E i ) هستند که هنگام محاسبه X 2 در مخرج هستند! هنگام تجزیه و تحلیل ویژگی های یک بعدی، مجاز به نقض این قانون در دو بیت شدید E 1 =E max =1 است. اگر تعداد بیت‌ها زیاد باشد و فرکانس‌های مورد انتظار نزدیک باشد، آنگاه X 2 تقریباً χ 2 را حتی برای E i = 2 تقریب می‌کند.

تخمین پارامتر. استفاده از روش های تخمین "خودساخته" ناکارآمد می تواند به مقادیر بیش از حد فاصله پیرسون منجر شود.

انتخاب تعداد مناسب درجه آزادی. اگر تخمین پارامترها نه از فرکانس ها، بلکه مستقیماً از داده ها انجام شود (به عنوان مثال، میانگین حسابی به عنوان تخمین میانگین در نظر گرفته می شود)، تعداد دقیق درجات آزادی n ناشناخته است. ما فقط می دانیم که نابرابری را برآورده می کند:

(تعداد ارقام - 1 - تعداد پارامترهای تخمینی)< n < (число разрядов – 1)

بنابراین، مقایسه X 2 با مقادیر بحرانی χ 2 کریت محاسبه شده در کل این محدوده n ضروری است.

چگونه مقادیر غیرقابل قبول chi-square را تفسیر کنیم؟اگر یک سکه بعد از 10000 پرتاب، 5000 نشان داشته باشد، آیا باید متقارن در نظر گرفته شود؟ پیش از این، بسیاری از آماردانان معتقد بودند که H 0 را نیز باید در این مورد رد کرد. اکنون رویکرد دیگری پیشنهاد می‌شود: پذیرش H 0، اما داده‌ها و روش تجزیه و تحلیل آنها را به تأیید اضافی سوق دهید. دو احتمال وجود دارد: یا فاصله بسیار کوچک پیرسون به این معنی است که افزایش تعداد پارامترهای مدل با کاهش مناسب در تعداد درجات آزادی همراه نبوده است، یا خود داده ها جعل شده اند (شاید ناخواسته با نتیجه مورد انتظار تنظیم شده است. ).

مثال.دو محقق A و B نسبت هموزیگوت‌های مغلوب aa را در نسل دوم در یک تلاقی تک هیبریدی AA * aa محاسبه کردند. طبق قوانین مندل، این نسبت 0.25 است. هر محقق 5 آزمایش انجام داد و در هر آزمایش 100 موجود زنده مورد مطالعه قرار گرفت.

نتایج الف: 25، 24، 26، 25، 24. نتیجه گیری محقق: قانون مندل معتبر است (؟).

نتایج ب: 29، 21، 23، 30، 19. نتیجه گیری محقق: قانون مندل معتبر نیست (؟).

با این حال، قانون مندل ماهیت آماری دارد و تجزیه و تحلیل کمی نتایج، نتیجه گیری را معکوس می کند! با ترکیب پنج آزمایش در یک آزمایش، به توزیع خی دو با 5 درجه آزادی می رسیم (فرضیه ساده ای در حال آزمایش است):

X 2 A = ((25-25) 2 +(24-25) 2 +(26-25) 2 +(25-25) 2 +(24-25) 2)/(100∙0.25∙0.75)=0.16

X 2 B = ((29-25) 2 +(21-25) 2 +(23-25) 2 +(30-25) 2 +(19-25) 2)/(100∙0.25∙0.75)=5.17

مقدار میانگین m [χ 2 n = 5 ] = 5، انحراف معیار σ[χ 2 n = 5 ] = (2∙5) 1/2 = 3.2.

بنابراین، بدون مراجعه به جداول، واضح است که مقدار X 2 B معمولی است و مقدار X 2 A به طور غیرقابل قبولی کوچک است. طبق جداول P (χ 2 n = 5<0.16)<0.0001.

این مثال یک نسخه اقتباس شده از یک مورد واقعی است که در دهه 1930 رخ داد (به کار کولموگروف "درباره اثبات دیگری از قوانین مندل" مراجعه کنید). جالب اینجاست که محقق A طرفدار ژنتیک بود، در حالی که محقق B مخالف آن بود.

سردرگمی نشانه گذاریلازم است فاصله پیرسون را که به توافقات اضافی در محاسبه آن نیاز دارد، از مفهوم ریاضی متغیر تصادفی کای دو متمایز کرد. فاصله پیرسون در شرایط خاص توزیعی نزدیک به مجذور کای با n درجه آزادی دارد. بنابراین، مطلوب است که فاصله پیرسون را با χ 2 n نشان ندهیم، بلکه از نماد مشابه اما متفاوت برای X 2 استفاده کنیم.

معیار پیرسون همه کاره نیست.تعداد نامتناهی گزینه برای H 0 وجود دارد که او قادر به در نظر گرفتن آنها نیست. اجازه دهید این فرضیه را آزمایش کنید که این ویژگی دارای توزیع یکنواخت است، شما 10 بیت دارید و بردار فرکانس های مشاهده شده است (130,125,121,118,116,115,114,113,111,110). معیار پیرسون نمی تواند متوجه شود که فرکانس ها به طور یکنواخت کاهش می یابد و H 0 رد نمی شود. اگر با معیار سریال تکمیل می شد، بله!

وزارت آموزش و پرورش و علوم فدراسیون روسیه

آژانس فدرال آموزش شهر ایرکوتسک

دانشگاه دولتی اقتصاد و حقوق بایکال

گروه انفورماتیک و سایبرنتیک

توزیع کای دو و کاربرد آن

کلمیکووا آنا آندریونا

دانشجوی سال دوم

گروه IS-09-1

برای پردازش داده های به دست آمده از آزمون کای اسکوئر استفاده می کنیم.

برای انجام این کار، جدولی از توزیع فرکانس های تجربی می سازیم، یعنی. فرکانس هایی که مشاهده می کنیم:

از نظر تئوری، ما انتظار داریم که فرکانس ها به طور مساوی توزیع شوند، یعنی. فرکانس به طور متناسب بین پسران و دختران توزیع خواهد شد. بیایید جدولی از فرکانس های نظری بسازیم. برای انجام این کار، مجموع ردیف را در مجموع ستون ضرب کنید و عدد حاصل را بر مجموع کل (s) تقسیم کنید.


جدول حاصل برای محاسبات به صورت زیر خواهد بود:

χ2 \u003d ∑ (E - T)² / T

n = (R - 1)، که در آن R تعداد ردیف های جدول است.

در مورد ما، خی دو = 4.21; n = 2.

با توجه به جدول مقادیر بحرانی معیار، در n = 2 و سطح خطای 0.05، مقدار بحرانی χ2 = 5.99 در می یابیم.

مقدار حاصل کمتر از مقدار بحرانی است، به این معنی که فرضیه صفر پذیرفته می شود.

نتیجه گیری: معلمان هنگام نوشتن ویژگی های کودک به جنسیت او اهمیت نمی دهند.

کاربرد

نقاط توزیع بحرانی χ2

میز 1

نتیجه

دانش آموزان تقریباً همه تخصص ها بخش "تئوری احتمالات و آمار ریاضی" را در پایان دوره ریاضیات عالی مطالعه می کنند ، در واقع آنها فقط با برخی از مفاهیم و نتایج اساسی آشنا می شوند که مشخصاً برای کار عملی کافی نیست. دانش‌آموزان با برخی از روش‌های ریاضی تحقیق در دروس ویژه آشنا می‌شوند (به عنوان مثال، مانند «پیش‌بینی و برنامه‌ریزی فنی و اقتصادی»، «تحلیل فنی و اقتصادی»، «کنترل کیفیت محصول»، «بازاریابی»، «کنترل»، «روش‌های ریاضی» پیش بینی "، "آمار"، و غیره - در مورد دانشجویان رشته های اقتصادی)، با این حال، ارائه در بیشتر موارد بسیار مختصر و تجویزی است. در نتیجه، دانش آماردانان کاربردی ناکافی است.

بنابراین، درس "آمار کاربردی" در دانشگاه های فنی از اهمیت بالایی برخوردار است و در دانشگاه های اقتصادی - درس "اقتصاد سنجی"، زیرا همانطور که می دانید اقتصاد سنجی تجزیه و تحلیل آماری داده های اقتصادی خاص است.

تئوری احتمال و آمار ریاضی دانش بنیادی را برای آمار کاربردی و اقتصاد سنجی فراهم می کند.

آنها برای کار عملی برای متخصصان ضروری هستند.

من یک مدل احتمالی پیوسته را در نظر گرفتم و سعی کردم قابلیت استفاده آن را با مثال هایی نشان دهم.

کتابشناسی - فهرست کتب

1. Orlov A.I. آمار کاربردی م.: انتشارات "امتحان"، 2004.

2. Gmurman V.E. نظریه احتمالات و آمار ریاضی. M.: دبیرستان، 1999. - 479p.

3. آیووزیان س.ا. نظریه احتمالات و آمار کاربردی، ج.1. M.: وحدت، 2001. - 656s.

4. Khamitov G.P., Vedernikova T.I. احتمالات و آمار. ایرکوتسک: BSUEP، 2006 - 272p.

5. ژووا ال.ن. اقتصاد سنجی. ایرکوتسک: BSUEP، 2002. - 314p.

6. Mosteller F. پنجاه مسئله احتمالی سرگرم کننده با راه حل. M.: Nauka، 1975. - 111p.

7. Mosteller F. احتمال. م.: میر، 1969. - 428s.

8. Yaglom A.M. احتمال و اطلاعات M.: Nauka، 1973. - 511p.

9. چیستیاکوف وی.پی. دوره احتمال. M.: Nauka، 1982. - 256 ص.

10. کرمر ن.ش. نظریه احتمالات و آمار ریاضی. M.: UNITI, 2000. - 543 p.

11. دایره المعارف ریاضی، ج1. م.: دایره المعارف شوروی، 1976. - 655 ص.

12. http://psystat.at.ua/ - آمار در روانشناسی و آموزش. آزمون مجذور کای مقاله.

آزمون کای اسکوئر پیرسون یک روش ناپارامتریک است که به شما امکان می دهد تا اهمیت تفاوت بین تعداد واقعی (که در نتیجه مطالعه آشکار شد) یا ویژگی های کیفی نمونه که در هر دسته قرار می گیرند و تعداد نظری را ارزیابی کنید. در صورت صحت فرضیه صفر می توان در گروه های مورد مطالعه انتظار داشت. به عبارت ساده تر، این روش به شما امکان می دهد تا اهمیت آماری تفاوت بین دو یا چند شاخص نسبی (فرکانس ها، سهم ها) را ارزیابی کنید.

1. تاریخچه توسعه معیار χ 2

آزمون کای اسکوئر برای تجزیه و تحلیل جداول احتمالی در سال 1900 توسط یک ریاضیدان، آماردان، زیست شناس و فیلسوف انگلیسی، بنیانگذار آمار ریاضی و یکی از بنیانگذاران بیومتریک ایجاد و پیشنهاد شد. کارل پیرسون(1857-1936).

2. معیار χ 2 پیرسون برای چیست؟

آزمون کای اسکوئر را می توان در تجزیه و تحلیل به کار برد جداول احتمالیحاوی اطلاعاتی در مورد فراوانی پیامدها بسته به وجود یک عامل خطر. مثلا، جدول اضطراری چهار میدانیبه شرح زیر است:

خروج است (1) بدون خروج (0) جمع
یک عامل خطر وجود دارد (1) آ ب A+B
بدون عامل خطر (0) سی D C+D
جمع A+C B+D A+B+C+D

چگونه می توان چنین جدول احتمالی را پر کرد؟ بیایید یک مثال کوچک را در نظر بگیریم.

مطالعه ای در مورد تأثیر سیگار بر خطر ابتلا به فشار خون شریانی در حال انجام است. برای این، دو گروه از افراد انتخاب شدند - گروه اول شامل 70 نفر بود که حداقل 1 پاکت سیگار در روز مصرف می کردند، گروه دوم - 80 غیر سیگاری در همان سن. در گروه اول 40 نفر فشار خون بالا داشتند. در دوم - فشار خون شریانی در 32 نفر مشاهده شد. بر این اساس، فشار خون طبیعی در گروه سیگاری ها در 30 نفر (70 - 40 = 30) و در گروه غیر سیگاری - در 48 نفر (80 - 32 = 48) بود.

جدول احتمالی چهار میدانی را با داده های اولیه پر می کنیم:

در جدول احتمالی حاصل، هر خط مربوط به گروه خاصی از موضوعات است. ستون ها - تعداد افراد مبتلا به فشار خون شریانی یا با فشار خون طبیعی را نشان می دهد.

چالش پیش روی محقق این است: آیا از نظر آماری تفاوت معناداری بین فراوانی افراد مبتلا به فشار خون در بین افراد سیگاری و غیر سیگاری وجود دارد؟ شما می توانید با محاسبه آزمون کای دو پیرسون و مقایسه مقدار به دست آمده با مقدار بحرانی به این سوال پاسخ دهید.

3. شرایط و محدودیت های استفاده از آزمون کای اسکوئر پیرسون

  1. شاخص های قابل مقایسه باید در اندازه گیری شوند مقیاس اسمی(به عنوان مثال، جنسیت بیمار - مرد یا زن) یا در ترتیبی(به عنوان مثال، درجه فشار خون شریانی، گرفتن مقادیر از 0 تا 3).
  2. این روش امکان تجزیه و تحلیل نه تنها جداول چهار میدانی را فراهم می کند، زمانی که عامل و نتیجه هر دو متغیر باینری هستند، یعنی فقط دو مقدار ممکن دارند (به عنوان مثال، مرد یا زن، وجود یا عدم وجود یک بیماری خاص. در تاریخ ...). آزمون کای دو پیرسون همچنین می تواند در مورد تجزیه و تحلیل جداول چند میدانی استفاده شود، زمانی که عامل و (یا) نتیجه سه مقدار یا بیشتر داشته باشند.
  3. گروه‌های همسان باید مستقل باشند، به‌عنوان مثال، هنگام مقایسه مشاهدات قبل و بعد از آزمایش کای دو استفاده نشود. تست مک نمار(هنگام مقایسه دو جمعیت مرتبط) یا محاسبه می شود آزمون کیو کوکران(در صورت مقایسه سه گروه یا بیشتر).
  4. هنگام تجزیه و تحلیل جداول چهار میدانی ارزش های مورد انتظاردر هر یک از سلول ها باید حداقل 10 باشد. در صورتی که حداقل در یک سلول، پدیده مورد انتظار از 5 تا 9 به دست آید، آزمون کای اسکوئر باید محاسبه شود. با تصحیح یتس. اگر حداقل در یک سلول پدیده مورد انتظار کمتر از 5 باشد، باید از تجزیه و تحلیل استفاده کرد تست دقیق فیشر.
  5. در مورد تجزیه و تحلیل جداول چند میدانی، تعداد مشاهدات مورد انتظار در بیش از 20 درصد سلول ها نباید مقادیر کمتر از 5 را داشته باشد.

4. چگونه آزمون کای دو پیرسون را محاسبه کنیم؟

برای محاسبه آزمون کای اسکوئر باید:

این الگوریتم برای جداول چهار میدانی و چند میدانی قابل استفاده است.

5. چگونه می توان مقدار آزمون کای دو پیرسون را تفسیر کرد؟

در صورتی که مقدار به دست آمده از معیار χ2 بیشتر از مقدار بحرانی باشد، نتیجه می گیریم که یک رابطه آماری بین عامل خطر مورد مطالعه و نتیجه در سطح معنی داری مناسب وجود دارد.

6. نمونه ای از محاسبه آزمون کای اسکوئر پیرسون

اجازه دهید با توجه به جدول بالا، اهمیت آماری تأثیر عامل سیگار بر روی بروز فشار خون شریانی را تعیین کنیم:

  1. ما مقادیر مورد انتظار را برای هر سلول محاسبه می کنیم:
  2. مقدار آزمون کای دو پیرسون را پیدا کنید:

    χ 2 \u003d (40-33.6) 2 / 33.6 + (30-36.4) 2 / 36.4 + (32-38.4) 2 / 38.4 + (48-41.6) 2 / 41.6 \u003d 4.396.

  3. تعداد درجات آزادی f = (2-1)*(2-1) = 1. مقدار بحرانی آزمون کای دو پیرسون را از جدول می یابیم که در سطح معنی داری 05/0p= و تعداد درجه آزادی 1، 3.841 است.
  4. ما مقدار به دست آمده از آزمون کای دو را با مقدار بحرانی مقایسه می کنیم: 4.396 > 3.841، بنابراین، وابستگی بروز فشار خون شریانی به حضور سیگار از نظر آماری معنی دار است. سطح معنی داری این رابطه با p مطابقت دارد<0.05.

تا پایان قرن نوزدهم، توزیع نرمال قانون جهانی تنوع داده ها در نظر گرفته می شد. با این حال، K. Pearson متوجه شد که فرکانس های تجربی می توانند تا حد زیادی با توزیع نرمال متفاوت باشند. سوال این بود که چگونه می توان آن را ثابت کرد. این نه تنها به یک مقایسه گرافیکی نیاز داشت، که ذهنی است، بلکه به یک توجیه کمی دقیق نیز نیاز داشت.

بدین ترتیب معیار اختراع شد χ 2(chi-square)، که اهمیت اختلاف بین فرکانس های تجربی (مشاهده شده) و نظری (مورد انتظار) را آزمایش می کند. این در سال 1900 اتفاق افتاد، اما این معیار هنوز در حال استفاده است. علاوه بر این، برای حل طیف گسترده ای از وظایف سازگار شده است. اول از همه، این تجزیه و تحلیل داده های اسمی است، یعنی. آنهایی که نه با کمیت، بلکه با تعلق به یک دسته بیان می شوند. به عنوان مثال، کلاس ماشین، جنسیت شرکت کننده در آزمایش، نوع گیاه و غیره. عملیات ریاضی مانند جمع و ضرب را نمی توان برای چنین داده هایی اعمال کرد، فقط می توان فرکانس ها را برای آنها محاسبه کرد.

فرکانس های مشاهده شده را نشان می دهیم اوه (مشاهده شده)، انتظار می رود - E (مورد انتظار). به عنوان مثال، نتیجه پرتاب یک قالب را 60 بار در نظر می گیریم. اگر متقارن و یکنواخت باشد، احتمال بالا آمدن هر ضلع 1/6 است و بنابراین تعداد مورد انتظار بالا آمدن هر ضلع 10 (1/6∙60) است. فرکانس های مشاهده شده و مورد انتظار را در جدول می نویسیم و هیستوگرام رسم می کنیم.

فرضیه صفر این است که فرکانس‌ها سازگار هستند، یعنی داده‌های واقعی با انتظارات مغایرتی ندارند. یک فرضیه جایگزین این است که انحرافات در فرکانس ها فراتر از نوسانات تصادفی است، یعنی اختلافات از نظر آماری معنی دار هستند. برای نتیجه گیری دقیق، ما نیاز داریم.

  1. اندازه گیری تعمیم یافته اختلاف بین فرکانس های مشاهده شده و مورد انتظار.
  2. توزیع این معیار بر اساس اعتبار فرضیه عدم وجود تفاوت است.

بیایید با فاصله بین فرکانس ها شروع کنیم. اگر فقط تفاوت را در نظر بگیریم O - E، پس چنین اندازه گیری به مقیاس داده ها (فرکانس ها) بستگی دارد. به عنوان مثال، 20 - 5 = 15 و 1020 - 1005 = 15. در هر دو مورد، تفاوت 15 است. اما در حالت اول، فرکانس های مورد انتظار 3 برابر کمتر از موارد مشاهده شده و در حالت دوم، تنها 1.5 است. ٪. ما به یک معیار نسبی نیاز داریم که به مقیاس بستگی نداشته باشد.

بیایید به حقایق زیر توجه کنیم. به طور کلی، تعداد درجه‌بندی‌هایی که در آن فرکانس‌ها اندازه‌گیری می‌شوند، می‌تواند بسیار بیشتر باشد، بنابراین احتمال اینکه یک مشاهده منفرد در یک دسته یا دسته دیگر قرار گیرد، بسیار کم است. اگر چنین است، پس توزیع چنین متغیر تصادفی از قانون رویدادهای نادر، معروف به قانون پواسون. در قانون پواسون، همانطور که مشخص است، مقدار انتظار ریاضی و واریانس یکسان است (پارامتر λ ). از این رو، فراوانی مورد انتظار برای دسته ای از متغیرهای اسمی ایهمزمان و پراکندگی آن خواهد بود. علاوه بر این، قانون پواسون با تعداد زیادی مشاهدات به حالت عادی گرایش دارد. با ترکیب این دو واقعیت، به این نتیجه می رسیم که اگر فرضیه توافق بین فرکانس های مشاهده شده و مورد انتظار درست باشد، پس با تعداد زیادی مشاهدات، اصطلاح

خواهد داشت .

مهم است که به یاد داشته باشید که نرمال بودن فقط در فرکانس های به اندازه کافی بالا ظاهر می شود. به طور کلی در آمار پذیرفته شده است که تعداد کل مشاهدات (مجموع فرکانس ها) باید حداقل 50 باشد و فرکانس مورد انتظار در هر درجه بندی باید حداقل 5 باشد. فقط در این حالت، مقدار نشان داده شده در بالا یک نرمال استاندارد خواهد داشت. توزیع فرض کنیم این شرط برقرار است.

توزیع نرمال استاندارد تقریباً همه مقادیر را در 3± (قانون سه سیگما) دارد. بنابراین، ما یک تفاوت نسبی در فرکانس ها برای یک درجه بندی دریافت کرده ایم. ما به یک معیار کلی نیاز داریم. شما نمی توانید فقط تمام انحرافات را جمع کنید - ما 0 را دریافت می کنیم (حدس بزنید چرا). پیرسون پیشنهاد کرد مربع های این انحرافات را اضافه کنید.

این نشانه هاست معیار χ 2پیرسون. اگر فرکانس ها واقعاً با فرکانس های مورد انتظار مطابقت داشته باشند، ارزش معیار نسبتاً کوچک خواهد بود (زیرا بیشتر انحراف ها نزدیک به صفر هستند). اما اگر معیار بزرگ باشد، این به نفع تفاوت های قابل توجه بین فرکانس ها است.

یک معیار زمانی "بزرگ" می شود که وقوع چنین ارزشی یا حتی بیشتر از آن بعید باشد. و برای محاسبه چنین احتمالی، لازم است که توزیع معیار را زمانی که آزمایش بارها تکرار می شود، زمانی که فرضیه توافق فرکانس صحیح است، دانست.

همانطور که می بینید، مقدار chi-square به تعداد عبارت ها نیز بستگی دارد. هر چه تعداد آنها بیشتر باشد، ارزش معیار باید بیشتر باشد، زیرا هر عبارت به مبلغ کل کمک می کند. بنابراین، برای هر مقدار مستقلشرایط، توزیع خاص خود را خواهد داشت. معلوم می شود که χ 2یک خانواده کامل از توزیع ها است.

و در اینجا به یک لحظه حساس می رسیم. عدد چیست مستقلمقررات؟ به نظر می رسد هر اصطلاحی (یعنی انحراف) مستقل است. K. Pearson نیز چنین فکر می کرد، اما معلوم شد که اشتباه می کند. در واقع تعداد عبارت های مستقل یک کمتر از تعداد درجه بندی های متغیر اسمی خواهد بود n. چرا؟ زیرا اگر نمونه ای داشته باشیم که مجموع فرکانس ها قبلاً برای آن محاسبه شده است، در آن صورت همیشه می توان یکی از فرکانس ها را به عنوان تفاوت بین تعداد کل و مجموع همه فرکانس ها تعریف کرد. از این رو، تنوع تا حدودی کمتر خواهد بود. رونالد فیشر 20 سال پس از آنکه پیرسون معیار خود را توسعه داد متوجه این واقعیت شد. حتی میزها باید دوباره درست می شدند.

به همین مناسبت، فیشر مفهوم جدیدی را وارد آمار کرد - میزان آزادی(درجات آزادی)، که تعداد اصطلاحات مستقل در مجموع است. مفهوم درجات آزادی توضیحی ریاضی دارد و فقط در توزیع های مرتبط با نرمال ظاهر می شود (Student، Fisher-Snedekor و خود مجذور کای).

برای درک بهتر معنای درجات آزادی، اجازه دهید به آنالوگ فیزیکی بپردازیم. نقطه ای را تصور کنید که آزادانه در فضا حرکت می کند. 3 درجه آزادی دارد، زیرا می تواند در هر جهتی از فضای سه بعدی حرکت کند. اگر نقطه ای در امتداد هر سطحی حرکت کند، آنگاه از قبل دارای دو درجه آزادی (به جلو-عقب، راست-چپ) است، اگرچه همچنان در فضای سه بعدی قرار دارد. نقطه ای که در امتداد چشمه حرکت می کند دوباره در فضای سه بعدی است، اما تنها یک درجه آزادی دارد، زیرا می تواند به جلو یا عقب حرکت کند. همانطور که می بینید، فضایی که جسم در آن قرار دارد همیشه با آزادی حرکت واقعی مطابقت ندارد.

همچنین توزیع یک معیار آماری ممکن است به تعداد کمتری از عناصر نسبت به شرایط لازم برای محاسبه آن بستگی داشته باشد. در حالت کلی، تعداد درجات آزادی کمتر از تعداد مشاهدات با تعداد وابستگی های موجود است. این ریاضی محض است، جادو ندارد.

بنابراین توزیع χ 2خانواده ای از توزیع ها است که هر کدام به پارامتری از درجات آزادی بستگی دارد. و تعریف رسمی آزمون کای اسکوئر به شرح زیر است. توزیع χ 2(خی دو) با کدرجه آزادی توزیع مجموع مربعات است کمتغیرهای تصادفی عادی استاندارد مستقل

در مرحله بعد، می‌توانیم به خود فرمول برویم، که براساس آن تابع توزیع کای دو محاسبه می‌شود، اما خوشبختانه، همه چیز برای ما مدت‌هاست محاسبه شده است. برای بدست آوردن احتمال علاقه می توانید از جدول آماری مربوطه یا تابع آماده در نرم افزارهای تخصصی که حتی در اکسل نیز موجود است استفاده کنید.

جالب است ببینید که چگونه شکل توزیع کای دو بسته به تعداد درجات آزادی تغییر می کند.

با افزایش درجات آزادی، توزیع کای اسکوئر نرمال است. این با عمل قضیه حد مرکزی توضیح داده می شود که بر اساس آن مجموع تعداد زیادی از متغیرهای تصادفی مستقل دارای توزیع نرمال است. در مورد مربع چیزی نمی گوید.

آزمون فرضیه کای دو

بنابراین به آزمون فرضیه ها با استفاده از روش کای اسکوئر می رسیم. به طور کلی، تکنیک باقی می ماند. یک فرضیه صفر مطرح می شود که فرکانس های مشاهده شده با فرکانس های مورد انتظار مطابقت دارند (یعنی هیچ تفاوتی بین آنها وجود ندارد، زیرا آنها از یک جمعیت عمومی گرفته شده اند). اگر اینطور باشد، اسپرد نسبتاً کوچک و در محدوده نوسانات تصادفی خواهد بود. اندازه گیری گسترش با آزمون کای دو تعیین می شود. در مرحله بعد، یا خود معیار با مقدار بحرانی مقایسه می شود (برای سطح اهمیت و درجات آزادی متناظر)، یا به طور صحیح تر، سطح p مشاهده شده محاسبه می شود، یعنی. احتمال به دست آوردن چنین یا حتی بیشتر از معیار تحت اعتبار فرضیه صفر.

زیرا از آنجایی که ما به توافق فرکانس ها علاقه مندیم، پس زمانی که معیار بزرگتر از سطح بحرانی باشد، این فرضیه رد می شود. آن ها معیار یک طرفه است با این حال، گاهی اوقات (گاهی) لازم است فرضیه چپ دستی آزمایش شود. به عنوان مثال، زمانی که داده های تجربی بسیار شبیه به داده های نظری هستند. سپس این معیار می تواند در یک منطقه بعید، اما در سمت چپ قرار گیرد. واقعیت این است که در شرایط طبیعی، بعید به نظر می رسد که فرکانس هایی که عملاً با فرکانس های نظری منطبق باشد به دست آید. همیشه یک مقدار تصادفی وجود دارد که خطا می دهد. اما اگر چنین خطایی وجود نداشته باشد، احتمالاً داده ها جعل شده اند. اما با این حال، فرضیه راست دست معمولاً آزمایش می شود.

بیایید به مسئله تاس برگردیم. مقدار آزمون کای اسکوئر را با توجه به داده های موجود محاسبه کنید.

حالا بیایید مقدار جدولی معیار را در 5 درجه آزادی پیدا کنیم ( ک) و سطح معنی داری 05/0 ( α ).

به این معنا که χ2 0.05; 5 = 11,1.

بیایید مقدار واقعی و جدولی را با هم مقایسه کنیم. 3.4( χ 2) < 11,1 (χ2 0.05; 5). معیار محاسبه شده کوچکتر است، به این معنی که فرضیه برابری (رضایت) فرکانس ها رد نمی شود. در شکل، وضعیت به این صورت است.

اگر مقدار محاسبه شده در ناحیه بحرانی قرار گیرد، فرضیه صفر رد می شود.

محاسبه p-level نیز صحیح تر است. برای انجام این کار، باید نزدیکترین مقدار را در جدول برای تعداد معینی از درجه آزادی پیدا کنید و سطح اهمیت مربوطه را ببینید. اما این قرن گذشته است. ما از رایانه شخصی، به ویژه MS Excel استفاده می کنیم. اکسل چندین توابع مرتبط با مربع کای دارد.

در زیر شرح مختصری از آنها آورده شده است.

XI2.OBR- مقدار بحرانی معیار برای یک احتمال معین در سمت چپ (مانند جداول آماری)

chi2.ex.phمقدار بحرانی معیار برای یک احتمال معین در سمت راست است. تابع اساساً تابع قبلی را کپی می کند. اما در اینجا می توانید بلافاصله سطح را نشان دهید α ، به جای کم کردن آن از 1. این راحت تر است، زیرا در بیشتر موارد، این دم سمت راست توزیع است که مورد نیاز است.

CH2.DIST– p-level در سمت چپ (تراکم قابل محاسبه است).

HI2.DIST.PH- سطح p در سمت راست.

HI2.TEST- آزمایش کای اسکوئر را در دو محدوده فرکانس داده شده به طور همزمان انجام می دهد. تعداد درجات آزادی یک کمتر از تعداد فرکانس های موجود در ستون (همانطور که باید باشد) گرفته می شود و مقدار سطح p را برمی گرداند.

در حال حاضر، بیایید برای آزمایش خود مقدار بحرانی (جدولی) را برای 5 درجه آزادی و آلفا 0.05 محاسبه کنیم. فرمول اکسل به شکل زیر خواهد بود:

CH2.OBR(0.95;5)

chi2.inv.rx(0.05;5)

نتیجه یکسان خواهد بود - 11.0705. این مقداری است که در جدول می بینیم (گرد تا 1 رقم اعشار).

در نهایت سطح p را برای 5 درجه آزادی معیار محاسبه می کنیم χ 2= 3.4. ما به احتمال سمت راست نیاز داریم، بنابراین تابع را با اضافه کردن RH (دم سمت راست) می گیریم.

CH2.DIST.RH(3.4;5) = 0.63857

بنابراین، با 5 درجه آزادی، احتمال به دست آوردن مقدار معیار است χ 2= 3.4 و بیشتر برابر با تقریباً 64٪ است. به طور طبیعی، فرضیه رد نمی شود (سطح p بیشتر از 5٪ است، فرکانس ها مطابقت بسیار خوبی دارند.

و حالا بیایید فرضیه توافق فرکانس را با استفاده از تابع CH2.TEST بررسی کنیم.

بدون جدول، بدون محاسبات دست و پا گیر. با تعیین ستون هایی با فرکانس های مشاهده شده و مورد انتظار به عنوان آرگومان های تابع، بلافاصله سطح p را دریافت می کنیم. زیبایی

حالا تصور کنید که با یک نوع مشکوک تاس بازی می کنید. توزیع امتیازات از 1 تا 5 ثابت می ماند، اما او 26 عدد شش می اندازد (تعداد همه رول ها 78 می شود).

سطح P در این مورد 0.003 است که بسیار کمتر از 0.05 است. دلایل جدی برای شک در صحت تاس وجود دارد. در اینجا این احتمال در نمودار توزیع خی دو به نظر می رسد.

خود معیار کای اسکوئر در اینجا 17.8 است که طبیعتاً بیشتر از جدولی (11.1) است.

امیدوارم تونسته باشم توضیح بدم که معیار خوب بودن چیه. χ 2(خی دو) پیرسون و چگونگی آزمون فرضیه های آماری با آن.

در نهایت یک بار دیگر در مورد یک شرط مهم! تست کای اسکوئر فقط زمانی درست کار می کند که تعداد همه فرکانس ها از 50 بیشتر شود و حداقل مقدار مورد انتظار برای هر درجه بندی کمتر از 5 نباشد. اگر در هر دسته ای فرکانس مورد انتظار کمتر از 5 باشد، اما مجموع همه فرکانس ها بیشتر از آن باشد. 50، سپس این دسته با نزدیکترین آنها ترکیب می شود تا فرکانس کل آنها از 5 بیشتر شود. اگر این امکان وجود ندارد یا مجموع فرکانس ها کمتر از 50 است، باید از روش های دقیق تری برای آزمون فرضیه ها استفاده کرد. در مورد آنها یک بار دیگر صحبت خواهیم کرد.

در زیر یک کلیپ ویدیویی در مورد نحوه آزمایش یک فرضیه با استفاده از آزمون مجذور کای در اکسل آورده شده است.

مقالات مشابه

2023 parki48.ru. ما در حال ساخت یک خانه قاب هستیم. محوطه سازی. ساخت و ساز. پایه.