آزمون هاي معني داري

دوشنبه، 8 دی 1393

تخمین زمان مطالعه: 11 دقیقه

نويسنده: دکتر سيدحسن صانعي

نمره دو دانش آموز در درس هاي رياضي و فارسي را در نظر بگيريد که دانش آموز اولي هم در امتحان رياضي و هم در امتحان فارسي نمره پاييني را کسب نموده، ولي دانش آموز دومي هم در امتحان رياضي و هم در امتحان فارسي نمره بالايي را گرفته است. با نگاهي اجمالي به نمره اين دانش آموزان به نظر مي رسد که تغييرات اين دو درس همراه و هم جهت با هم مي باشد و با يکديگر ارتباط تنگاتنگي دارند. اما آيا يک محقق مي تواند براي استنباط چنين نظريه اي فقط با يک نمونه ي دوتايي قانع شود؟ يقيناً اين چنين نيست چون تعداد افرادي که نمرات آنها بررسي مي شود بسيار مهم است. حال گر تعداد بسيار زيادي دانش آموز ( مثلاً بيش از 100 نفر ) داراي چنين نمراتي بودند يقيناً محقق دلايل قانع کننده تري براي پذيرش استنباط فوق داشت و آنرا کمتر مرهون شانس و تغييرات تصادفي مي دانست. حال اين سؤال مطرح مي شود که چگونه با تعداد مشخصي از افراد مي توان نتايج حاصل از يک تحقيق را دليل قانع کننده اي دانست که اين تغييرات ناشي از نوسانات تصادفي يا تغييرات نمونه اي نباشد.
تمام هدف آزمون هاي آماري پاسخگويي به اين سؤال محققين است و بر اساس آن مي توان تصميم به رد کردن يا رد نکردن (1) فرضيه اي گرفت. بنابراين فرآيندي که به منظور تصميم گيري در زمينه رد کردن يا رد نکردن يک فرضيه بکار مي رود « آزمون آماري معني داري » ناميده مي شود. از آنجايي که اين آزمون ها به آزمون کردن فرضيه ها مي پردازند بعضاً « آزمون فرضيه » نيز ناميده مي شوند.
اساس اين گونه آزمون ها بر اين اصل استوار است که اگر يک آزمون آماري احتمال شانسي بودن اندازه هاي مشاهده شده در تحقيق را پايين تشخيص دهد آنگاه فرضيه صفر ( که تغييرات مشاهده شده را منسوب به شانس و تصادف مي داند ) را رد مي کند. اين بدان معنا است که شما فرضيه مخالفي را که نتايج آن تحقيق را فاحش و معني دار مي داند ( يعني به دليل ماهيت داده ها است نه به دليل تصادف و نوسانات شانسي ) مي پذيريد.
چنانچه فرضيه صفر رد شود بدان معنا است که اختلافات مشاهده شده مربوط و منسوب به نوسانات تصادفي متغير نمي باشد. بنابراين آنچه يک آزمون آماري بيان مي کند آن است که چه مقدار از کل تغييرات اندازه صفتي از افراد مربوط به شانس، تصادف و نوسانات نمونه اي و چه مقدار مربوط به ارتباط بين متغيرها است.
نکته مهمي که بايد حتماً بر آن تأکيد شود آن است که حتي وقتي نتايج تحقيق معني دار است باز هم يک احتمال مشخصي وجود دارد که هر نتيجه اي بتواند متأثر از شانس و تصادف باشد.
براي درک بهتر اين مفهوم، فرض کنيد سکه اي را صدبار پرتاب نموده و هر صد بار شير آمده است. در چنين حالتي يقيناً شما حکم به ناقص و معيوب بودن سکه خواهيد کرد. اما در عين حال يک احتمال کوچکي هم وجود دارد که حتي با فرض کاملاً سالم بودن سکه باز هم چنين نتيجه اي را بتوان مشاهده کرد. با اين وجود به دليل اينکه احتمال وقوع صدبار شير، بيش از اندازه کوچک است لذا مي توان با احتمال بسيار بسيار زيادي سکه را معيوب قلمداد کرد. براي کسب اطلاعات بيشتري در زمينه آزمون هاي آماري بهتر است به کتب آماري در اين زمينه مراجعه نمود.

سطح معني داري

اکنون ممکن است اين سؤال برايتان مطرح گردد که احتمال وجود نوسانات تصادفي و مشاهده ي تغييرات نمونه گيري بايد تا چه اندازه کوچک باشد تا بتوان براي رد کردن يا رد نکردن فرضيه صفر تصميم گرفت؟ اين بدين معناست که شما خود را براي پذيرش چه ميزان خطر يا خطا آماده کرده ايد يا نتايج حاصل از تحقيق شما آنگونه که در فرضيه صفر بيان شده، به طور تصادفي و شانسي اتفاق افتاده باشد و فرضيه صفر اصلاً رد نشود. البته اکثراً مايليم که به وجود اختلافات فاحش و معني دار پي برده و اطمينان حاصل کنيم. ليکن به دليل اينکه هميشه يک احتمال کوچکي وجود دارد که مشاهدات تصادفي باشند، موضوع معني داري همواره روشن و واضح نمي باشد.
اينک فرض کنيد مي خواهيد بررسي کنيد که آيا شيوه جديد تدريس مي تواند تأثيري بر سطح يادگيري دانش آموزان داشته باشد و بدين منظور تجربه اي را به بوته آزمايش مي گذاريد. يعني پيشرفت گروهي دانش آموزان که با شيوه جديد تدريس آموزش ديده اند در برابر گروه ديگري که با شيوه هاي سنتي آموزش ديده اند را مقايسه مي کنيد. مشاهدات شما حکايت از اختلاف در سطح يادگيري دانش آموزان، به نفع گروهي که با شيوه جديد تدريس آموزش ديده اند دارد. اينک اگر احتمال شانسي بودن اختلاف مشاهده شده برابر 5% در نظر گرفته شود آيا مي توان پذيرفت که اختلاف اين دو شيوه ي تدريس معني دار است و در نتيجه شيوه جديد تدريس را توصيه نمود؟
مورد ديگري را در نظر بگيريد که شما مشغول تجربه و آزمايش يک داروي قوي جهت پايين آوردن فشار خون هستيد. ليکن اين دارو بعضاً عوارض جانبي بسيار شديدي را ايجاد مي کند. اينک فرض کنيد کارخانه توليد کننده پيش بيني کرده است که چنين وضعيتي از هر 100 بار مي تواند فقط 5 بار به وقوع پيوندد يعني اين عوارض شديد فقط بين 5 نفر از هر 100 بيمار به وقوع مي پيوندد. آيا شما مي توانيد معني دار بودن همبستگي و ارتباط بين داروي فشار خون و عوارض جانبي را بپذيريد و از دادن دارو به بيماراني که فشار خون بالا دارند خودداري کنيد؟ حال اگر بدانيد که در صورت عدم دريافت اين دارو، اکثر بيماران خواهند مرد. آيا اين خطر را مي پذيريد؟
اگر با هواپيمايي که قرار است پرواز کنيد 5% احتمال نقص فني الکتريکي و در نتيجه سقوط آنرا به همراه داشته باشد، چه احساسي به شما دست خواهد داد؟ اگر بدانيد در جاده اي که در آن رانندگي مي کنيد 5% احتمال ناامني و راهزني وجود دارد آنگاه براي مسافرت خود چه مي کنيد؟اگر احتمال اينکه والدين شما با احتمال 20% تا 30% به خواسته هاي شما پاسخ مثبت ندهند، آيا نياز و خواسته خود را با آنها مطرح مي کنيد يا از آن صرف نظر مي کنيد؟
مثال هاي فوق اين حقيقت را براي ما روشن مي سازند که انتخاب يک سطح معني داري همواره به عنوان جزئي از روند تصميم گيري به حساب مي آيد و بدان مفهوم است که آمادگي پذيرش چه مقدار خطري را داريد تا بپذيريد که تغييرات داده هاي شما تصادفي است. انتخاب اين سطح در موضوعات گوناگون، متفاوت خواهد بود. اما در مورد پاسخ به سؤالات فوق:
تا وقتي که شيوه جديد تدريس خيلي گران نباشد و دانش آموزان متحمل هزينه زياد نشوند، احتمالاً آنرا ادامه خواهيد داد و شيوه جديد تدريس را معرفي و توصيه مي کنيد. در مثال ديگر، درباره پذيرش داروي قوي براي پايين آوردن فشار خون با عوارض جانبي بسيار شديد، بايد احساس شک و ترديد بيشتري کرد. اگر 5 در 100 احتمال وجود داشت که اين دارو اصلاً مفيد نمي باشد ( موجب بروز عوارض جانبي ناهنجار در بيماران مبتلا به فشار خون مي گردد ) اما چون اين دارو تنها وسيله حفظ جان بيماران فشار خوني مي باشد، شما نيز شايد اين خطر را بپذيريد و دارو را به بيمار خود بدهيد. ولي هرگز تصور نمي رود که هيچ يک از ما با هواپيمايي پرواز کنيم که 5% احتمال نقص فني الکتريکي و سقوط داشته باشد. يا در جاده اي به مسافرت خود ادامه دهيم که 5% احتمال ناامني و راهزني در آن وجود داشته باشد. اما قطعاً همگي ما خواسته ها و نيازهاي خود را با پدر و مادري که با احتمال 20% تا 30% به خواسته هاي فرزندشان جامه ي عمل نمي پوشانند در ميان خواهيم گذاشت.
در تحقيقات عملي معمولاً ميزان خطر يا خطاي 1% ( يک درصد ) يا 5% ( 5 درصد ) به عنوان دامنه اي براي رد فرضيه صفر و پذيرفتن فرضيه تحقيق استفاده مي شود. انتخاب اين سطوح به صورت يک قرارداد و توافق است که به هنگام طراحي و برنامه ريزي تحقيق مشخص مي شود. تعيين و بيان اين سطح بدان جهت آورده مي شود تا بر تصادفي بودن نتايج کمتر از 1% تا 5% تأکيد شود. به همين دليل در مجلات و ژورنال هاي علمي عباراتي را مي يابيد که يافته هاي آن در سطوح 1%> p يا 5%> p معني دارند و بدان مفهوم است که احتمال وقوع تصادفي نتايج، کمتر از مقدار بيان شده 1% يا 5% مي باشد. بنابراين 1%> p بدان معنا است که احتمال وقوع شانسي و تصادفي نتايج کمتر از 1% است. بالاخره اين عبارت نشان دهنده احتمال رد کردن فرضيه ي صفر ِ صحيح است، يعني احتمال به دست آوردن نتايج صرفاً تصادفي و شانسي است. بديهي است که اين احتمال نبايد بزرگ باشد و معمولاً بيشتر از 10% نمي باشد و آن را با α نشان مي دهند و به آن خطاي نوع اول هم گفته مي شود.
از طرفي ديگر « سطح اطمينان » واژه مکمل « سطح معني داري » است و بدان مفهوم است که مثلاً 99% يا 95% احتمال مي رود که نتايج به دست آمده متأثر از شانس و تصادف نباشد و به دليل ماهيت واقعي خود آنها مي باشد. چون سطح معني داري با α نشان داده مي شود سطح اطمينان با ( 100- α )% نشان داده خواهد شد و عبارت است از احتمال رد نکردن فرضيه سفر وقتي که آن فرضيه واقعاً درست باشد. بنابراين به طور خالصه مي توان گفت که: سطح معني داري و سطح اطمينان به وقتي که فرضيه صفر واقعاً درست باشد ( به ترتيب براي احتمال رد کردن و احتمال رد نکردن ) مربوط مي شود.

فرضیه صفر رد نمی شود	فرضیه صفر رد می شود	فضاوت و تصمیم گیری →
α-1	α	فرضیه صفر واقعاً درست است

به طريق مشابه با همين تعريف، مؤلفه متناظر ديگري را مي توان براي زماني که فرضيه صفر واقعاً نادرست باشد بيان نمود. بدين معني که احتمال رد نکردن فرضيه صفر وقتي که اين فرضيه واقعاً نادرست باشد را با β نشان داده و آن را خطاي نوع دوم مي نامند. مکمل آن يعني احتمال رد کردن فرضيه صفر وقتي که اين فرضيه واقعاً نادرست باشد را با ( 100- Β )% نشان داده که توان آزمون ناميده مي شود. توان آزمون يکي از عواملي است که در تحقيقات همواره بايد مدنظر پژوهشگر باشد و به آن توجه کافي مبذول دارد.

فرضیه صفر رد نمی شود	فرضیه صفر رد می شود	فضاوت و تصمیم گیری →
β	1-β	فرضیه صفر واقعاً نادرست است

معمولاً هم مقدار β و هم مقدار α بايد کوچک باشد، اما اغلب مقدار β از مقدار α بزرگتر و بين 10% تا 30% است.

پي‌نوشت‌:

1- از آنجايي که آزمون هاي معني داري براي رد کردن فرضيه ها درست شده اند، پس از انجام آزمون فرضيه، يا مي بايد آن فرضيه رد شود يا در صورتي که آزمون منجر به رد فرضيه ي صفر نشود مجاز به استفاده از عبارات « فرضيه ي صفر قبول مي شود » يا « فرضيه ي صفر پذيرفته مي شود » نبوده و بايد به جاي آن از عبارات « دليلي بر رد فرضيه ي صفر وجود ندارد » يا « فرضيه ي صفر را رد نمي کنيم » استفاده نمود.

مقالات مرتبط

تازه های مقالات

بیشترین بازدید هفته