قبل از بيان مفهوم برآورد، جامعه اي را در نظر بگيريد که از نمره 5 دانش آموز مختلف در درس آمار ( 16، 15، 17، 18 و 19 ) تشکيل شده باشد. واضح است که ميانگين اين جامعه فرضي برابر با 17 مي باشد. اينک با سبک قرعه کشي ( که بعدها آن را تصادفي ساده مي ناميم ) سه نمره را به گونه اي انتخاب کنيد که در بين آنها اعداد تکراري وجود نداشته باشد. اگر اين انتخاب شامل اعداد 15، 18 و 19 باشد ميانگين آن برابر 17/33مي شود. به همين طريق از ديگر هم کلاسي هاي خود بخواهيد که هر کدام يک نمونه سه تايي ديگر را با همان روش تصادفي برگزينند و اين کار مثلاً تا ده بار ادامه يابد. يعني بتوانند 10 نمونه ي سه تايي غيرتکراري از بين اين 5 نمره برگزينند. نتايج حاصل از انتخاب اين نمونه سه تايي و ميانگين هاي آنان در جدول شماره 1 آورده شده است.
جدول شماره 1- نمونه هاي استخراج شده از يک جامعه فرضي با نمره 5 دانش آموز
میانگین |
نمونه های سه تایی |
میانگین |
نمونه های سه تایی |
67/16 |
15-16-19 |
33/17 |
19-18-15 |
67/17 |
19-18-16 |
67/17 |
18-17-15 |
33/16 |
18-15-16 |
33/17 |
17-16-19 |
0/18 |
19-17-18 |
0/16 |
16-15-17 |
0/17 |
17-15-19 |
0/17 |
16-17-18 |
ملاحظه مي شود که در اين 10 نمونه 3 تايي انتخاب شده، 7 ميانگين مختلف وجود دارد. هر کدام از افرادي که نمونه انتخاب کرده اند بر اين باورند که نمونه انتخابي آنان کاملاً بي طرفانه، شانسي، به سبک تصادفي و با قرعه کشي انجام شده و در نتيجه ميانگيني که به وسيله نمونه آنها به دست آمده بايد به عنوان تصويري واقعي و تخميني از ميانگين جامه اصلي در نظر گرفته شود. به نظر شما اينک با وجود تغييراتي که در ميانگين اين نمونه ها وجود دارد و بين 16 تا 18 در نوسان است، ادعاي کدام يک از اين ده نفر مي تواند درست باشد؟ آيا مي توان ادعاي همه آنها را صحيح پنداشت؟ آيا مي توان گفت چون جواب هاي متفاوتي به دست آمده است، هيچکدام قابل قبول نبوده و بايد همه آنها را دور ريخت؟ آيا بايد ميانگين هايي که از بقيه بيشتر تکرار شده اند پذيرفت؟ در اين صورت سه ميانگين وجود دارد که هر کدام 2 بار تکرار شده است. کدام يک از اين سه ميانگين مقبول تر است؟ آيا ميانگين هايي که به ميانگين جامعه اصلي ( يعني 17 ) نزديک تر يا منطبق بر آن مي باشد، پذيرفته خواهد شد؟ يا بايد ميانگين را به صورت فاصله اي بيان کنيم، يعني بگوييم ميانگين نمونه اي بين 16 تا 18 مي باشد؟ از اين قبيل سؤالات همچنان مي تواند مطرح گردد. مخصوصاً اگر همه نمونه هاي ممکن سه تايي را که تعداد آنها به 60 ( 3×4×5 ) مي رسد (1) را استخراج کرد، شک و شبهه شما بيشتر مي شود يا کمتر؟ ( لازم به يادآوري است که در عمل و در جوامع بزرگ ميانگين واقعي جامعه نامعلوم است و محقق بدون اطلاع از آن قصد برآورد و تخمين زدن آن را دارد. در اين مثال نيز با توجه به همين اصل، اقدام به برآورد ميانگين از نمونه هاي مختلف کرده ايم ).
در پاسخ بايد گفت که ميانگين هاي به دست آمده از نمونه هاي مختلف فوق، چگونگي نوسانات نمونه اي که قبلاً با عنوان تغييرات تصادفي و شانسي خوانده شد را نشان مي دهد. اين نوسانات در نمونه هايي با تعداد کوچکتر، بيشتر و در نمونه هايي با تعداد بزرگتر، کمتر مي باشند. همانطور که از جدول فوق پيدا است، اين ميانگين ها از نمونه اي به نمونه ي ديگر تغيير خواهند کرد. حال اگر همه نمونه هاي ممکن از اين جامعه را استخراج و ميانگين همه ي آنها را محاسبه کنيم، ميانگين همه اين ميانگين ها دقيقاً برابر با 17 که همان ميانگين جامعه ي اصلي است خواهد شد. به همين دليل گفته مي شود که « ميانگين هر نمونه تصادفي برآورد خوبي از ميانگين واقعي جامعه اصلي است ». هرچند اين برآورد نمونه اي، به مقدار جامعه اصلي نزديک يا از آن دور باشد.
بايد توجه نمود که در هر مطالعه ي تحقيقاتي، محقق از مقدار ميانگين جامعه ي اصلي اطلاعي ندارد و فقط يکي از اين ميانگين ها را به عنوان برآورد ميانگين واقعي جامعه خواهد داشت.
به منظور ملموس تر کردن اين برآورد و بر اساس هر نمونه تصادف مي توان با اطمينان مشخصي، فاصله اي از مقادير را به عنوان برآورد فاصله اي ميانگين معرفي نمود. مثلاً گفت: با اطمينان 95 درصد برآورد فاصله اي ميانگين واقعي جامعه از 16/4 تا 17/6 مي باشد. اين کار سبب مي شود تا اين برآورد با احتمال بيشتري ميانگين هاي به دست آمده از نمونه هاي مختلف را بپوشاند. محاسبه برآورد فاصله اي که گاهي به آن فاصله اطمينان هم گفته مي شود به سه عامل مهم بستگي دارد.
* نخست حجم نمونه اي که از جامعه اصلي استخراج مي شود. هر چقدر تعداد اين نمونه بيشتر باشد برآورد فاصله اي بسته تر خواهد شد و بالعکس هرچقدر تعداد نمونه کمتر باشد اين فاصله بازتر خواهد شد. اين تأثير به صورت معکوس جذر تعداد نمونه در فرمول مربوطه نمايان مي شود.
* عامل دوم که در محاسبه فاصله اطمينان تأثير دارد، پراکندگي صفت مورد بررسي است. هر قدر پراکندگي و گستردگي صفت مورد مطالعه کمتر باشد اين فاصله بسته تر و تنگ تر و هرچقدر اين پراکندگي بيشتر باشد فاصله اطمينان بازتر خواهد شد. از آنجايي که انحراف معيار يکي از شاخص هاي نشان دهنده پراکندگي يک صفت است اين تأثير با انحراف معيار ارتباط مستقيم دارد.
* عامل سوم سطح اطميناني است که در محاسبه برآورد استفاده مي شود هرچقدر بخواهيم اطمينان بيشتري به برآورد خود داشته باشيم بايد فاصله ي برآورد شدن پهن تر و بازتر باشد و بالعکس اطمينان کمتر فاصله بسته تري در پي خواهد داشت. بنابراين سطح اطمينان با فاصله اطمينان رابطه مستقيم دارد و به صورت پارامتر Z در فرمول آن ظاهر خواهد شد.
معمولاً همه افراد در جنبه هاي مختلف زندگي و حتي به صورت ناخودآگاه از استنباط و برآورد آماري بهره مي جويند. هرچند ممکن است با واژگان « استنباط آماري » و « برآورد » آشنايي نداشته باشند. براي مثال در زير به ذکر داستاني از لقمان حکيم در گذشته هاي دور مي پردازيم.
مسافري در بين راه به يکي از اهالي محل که لقمان حکيم نام داشت رسيد و از او پرسيد: « چقدر تا شهر مانده است؟ »
لقمان که نمي دانست اين مرد چگونه و با چه سرعتي راه مي رود تا زمان رسيدنش به شهر را پاسخ دهد، گفت: « راه برو ».
مسافر دوباره گفت: « پرسيدم چقدر تا شهر راه مانده است؟ »
لقمان که مي خواست جواب دقيق تري به او بدهد، مجدداً گفت: « راه برو ». مسافر نوميد از شنيدن پاسخ لقمان، به راه خود ادامه داد و لقمان در راه رفتن مسافر بدون اينکه خودش متوجه شود، با دقت مي نگريست.
پس از اينکه مسافر چند قدمي پيمود، لقمان او را صدا زد و گفت: « دو ساعت ديگر تا شهر مانده است ».
مرد مسافر پس از تشکر، به لقمان اعتراض کرد که شما مي خواستيد جواب بدهيد، چرا همان ابتدا پاسخم را نداديد؟
لقمان گفت: مي خواستم راه رفتنت را ببينم که با چه سرعتي راه مي روي. تند مي روي يا آهسته. اگر هم منظور خود را مي گفتم، آنگاه نحوه راه رفتن شما ناخودآگاه تغيير مي کرد.
ملاحظه مي شود که در اين داستان کوچک و ساده، اغلب اصول آماري رعايت شده است. چون افراد زيادي از محل زندگي لقمان گذشته و به شهر مي روند. لذا ممکن است اين سؤال براي بسياري از آنان مطرح گردد پس همه رهگذراني که از اين محل عبور مي کنند جامعه آماري او را تشکيل مي دهند. متغير مورد بررسي نيز مدت زماني است که يک فرد فاصله اين نقطه تا شهر را طي مي کنند. در اين فاصله کوتاه گفتگوي خود با مسافر به فکر نمونه برداري و نمونه گيري مي افتد و از مرد مي خواهد چند قدمي راه برود. پس نمونه لقمان همان چند قدمي است که مسافر در مقابل چشمان او به راه خود ادامه مي دهد. منتهي لقمان از دادن هرگونه توضيح بيشتري به مرد مسافر خودداري مي ورزد تا تأثيري در راه رفتن آن مسافر نداشته باشد و نمونه او از متغير مورد علاقه اش که همان سرعت قدم هاي مسافر مي باشد کم و زياد نشود و در نتيجه يک نمونه واقعي داشته باشد تا او بتواند زمان رسيدن به شهر توسط اين مسافر را به درستي تخمين زند.
فرآيند نمونه گيري از جامعه مرجع، برآورد پارامترهاي آن بر اساس نمونه و در نهايت تعميم نتايج به دست آمده به جامعه مرجع در شکل زير به صورت شماتيک نشان داده شده است.
نماي شماتيک برآورد و استنباط آماري
پينوشتها:
1- تکرار اعداد در هر نمونه، نمونه ي متفاوتي را به وجود مي آورد.
2- برخي دقت برآورد را خطاي برآورد مي خوانند و چنين تفسير مي کنند: هرچه فاصله ي برآورد شده، بسته تر باشد خطاي برآورد کمتر مي گردد. بالعکس هرچه فاصله ي مذکور بازتر و پهن تر باشد، خطاي برآورد بيشتر خواهد شد.
سيدحسن، صانعي؛ (1391)، الفباي تحقيق، تهران: نشر انديشمند، چاپ دوم