توزیع کای دو

آزمون کای دو یک آزمون ناپارامتریک است كه توسط فیشر ارائه شده و كار اصلی آن، بررسی معناداری تفاوت بین فراوانی­ های مشاهده شده و مورد انتظار است. فرمول كلی كای­ دو به شكل زیر می­ باشد.

 

http://modir3-3.ir/images/formul123.png

توزیع كای ­دو از توزیع نرمال بدست می ­آید. اگر متغیر x متعلق به جامعه نرمال با میانگین  و انحراف معیار Q باشد و از این جامعه نمونه تصادفی به حجم n انتخاب شود، سپس هر یک از اعضای نمونه با استفاده از فرمول http://modir3-3.ir/images/fk2.PNG استاندارد شوند، متغیر تصادفی زیر از توزیع کای­ دو با n درجه آزادی پیروی می­ كند.

http://modir3-3.ir/images/fk2-2.PNG

 

توزیع كای دو دارای رابطه ای به شكل زیر می باشد كه در آن k در جه آزادی را نشان می­ دهد و میانگین و وایانس آن به ترتیب k و2k  می ­باشد.

http://modir3-3.ir/images/fk2-4.PNG

 

 

نحوه عملكرد آزمون كای دو

جمع ­آوری اطلاعات، مقداری را برای فراوانی در سلول­ ها نشان می ­دهد. به این فراوانی­ ها، فراوانی مشاهده شده گویند. از طرفی در صورتی كه طبق فرض صفر استقلال بین دو متغیر وجود داشته باشد، انتظار داریم فراوانی­ ها به شكل دیگری باشد. طبیعی است كه بین این دو نوع فراوانی اختلاف وجود داشته باشد. در صورتی كه اختلاف قابل توجه نباشد،  می­ توانیم فرض مورد نظر را بپذیریم.

در غیر این صورت فرض صفر رد می شود. علت تقسیم كسر http://modir3-3.ir/images/fk2-3.PNG نرمالایز كردن یا بی­ مقیاس كردن داده­ ها است.

شرایط استفاده از آزمون كای دو

1- تصادفی بودن داده ها
2- مستقل بودن نمونه ها
3- بزرگ بودن نمونه به اندازه كافی
گفته می شود فراوانی سلول ها نباید كمتر از 10 (به عقیده بعضی ها 5) باشد. در صورتی كه این اتفاق بیافتد باید طبقات ادغام شود. به همین دلیل بعضی از محققین اعتقاد دارند برای انجام آزمون كای دو تعداد نمونه ای بزرگتر از 50 مورد نیاز است. در نرم افزار  spss در صورت وجود سلول هایی با فراوانی كمتر از 5 به مقدار بیش از 20% سلول ها هشدار داده می شود، این بدین معنی ست كه تست كای دو، قدرت لازم را جهت انجام آزمون ندارد.
4- آزمون كای دو  برای متغیرهای رتبه ای و اسمی استفاده می شود.

مراحل آزمون كای دو

1- فراوانی های مورد انتظار را با استفاده از توزیع مورد آزمون تعیین كنید.
2- آماره ϰ2 را تعیین كنید.
3- مقدار بحرانی را از جدول كای دو با سطح خطای مورد نظر و درجه آزادی N-K-1  محاسبه نمایید. که در آن N تعداد طبقات و K تعداد متغیرهای برآورد شده می باشد.
4- تصمیم گیری كنید.
آزمون نیکویی برازش، میزان تناسب و ارزش یكسری از داده‌ها را با یک توزیع خاص مثل توزیع نرمال یا پواسون بررسی می كند. در صورتی‌كه داده‌ها از شكل توزیع فاصله زیادی نداشته باشند برازش داده‌ها با آن توزیع تعیین و در غیر این صورت رد می‌شود. روش آزمون در این جا نیز مانند 2 كاربرد دیگر آزمون کای‌دو است بدین معنا كه با محاسبه مقادیر فراوانی مورد انتظار این مقادیر در قالب رابطه توزیع  با فراوانی‌های واقعی یا مشاهده شده مقایسه می‌شود و در نهایت با مقایسه آماره حاصل با حدود بحرانی برازش داده‌ها مشخص می‌شود.

http://modir123.com/photo%20site/D-modir123.com%20_2_.png دانلود آموزش کامل آزمون

 

http://modir3-3.ir/images/tahlil-modir123.com.gif