روش هاي چند متغيري پيوسته
منبع : راسخون
مؤلفه های اصلی
این تفکر از آنجا ناشی می گردد که در مراحل اولیه تحقیق، توجه به سوی متغیرهایی متمرکز است که از یک مشاهده به مشاهده دیگر بیشترین تغییرات را نشان می دهند. متغیرهایی که از یک مشاهده به مشاهده دیگر زیاد عوض نمی شوند را می توان به عنوان ثابت ها در نظرگرفت، با کنار گذاشتن متغیرهایی با واریانس پائین و توجه به متغیرهایی با واریانس بالا، می توانیم به راحتی مساله خود را در یک زیر فضایی با بُعد کمتر مورد مطالعه قرار دهیم.
روش مؤلفه های اصلی را ابتدا کارل پیرسن(1971) برای متغیرهای غیرآماری پیشنهاد کرد. در اکثر موارد یک تحلیل از مؤلفه های اصلی، ارتباط هایی که قبلاً حدس زده شده را آشکـــار می سازد. تحلیل مؤلفه های اصلی در بیان های دیگر در مباحث رگرسیون چند متغیره، آنـالیز گروه بندی و تجزیه عاملی نیز به کار گرفته می شود.
تحلیل مؤلفه های اصلی به ساختمان ماتریس کوواریانس به وسیله چند ترکیب خطی از متغیرهای اولیه، مربوط است. دو هدف عمده دراینجا پیگیری می شود.
1- فشرده کردن داده 2- تفسیر اطلاعات.
با اینکه p مولفه ی اولیه در تغییرپذیری کل سیستم لازم است، اکثر اوقات این تغییرپذیری می تواند به وسیله تعداد کمتر k از مولفه های اصلی بیان شود.
تحلیل مؤلفه های اصلی وسیله ای برای رسیدن به هدف هستند تا اینکه خودشان هدف باشند، زیرا اغلب آنها به عنوان مراحل میانی در وضعیت های بزرگتر به کار می آیند.
تحلیل عاملی
این شیوه آماری به یافتن راهی جهت تلخیص اطلاعات موجود در تعدادی متغیرهای اصلی می پردازد و آنها را به یک سری عامل های کوچکتر با کمترین میزان ریزش اطلاعات تبدیل می کند.
تجزیه عاملی بر مبنای همبستگی در توزیع، یک بردار تصادفی X=[x1,x2,x3,…,xp]را بر حسب کمترین تعداد متغیرهای تصادفی غیرقابل مشاهده به نام عامل ها توجیه می کند. در این روش هر مؤلفه Xi مورد بررسی قرار می گیرد تا معلوم شود آیا می توان آن را بوسیله یک تابع خطی شامل مینیمم تعداد متغیرهای تصادفی غیرقابل مشاهده (که ساختار کوواریانس ظاهر می شوند) و یک متغیر دیگر ( که واریانس مؤلفه Xi را توجیه می کند) تولید کرد یا خیر؟
مراحل اجرای تحلیل عاملی عبارتند از :
1- جمع آوری داده ها و ایجاد ماتریس همبستگی
2- استخراج راه حل عاملی اولیه
3- چرخش دورانی و تفسیر
4- ساخت مقیاس ها با امتیازات عاملی برای استفاده در تحلیل های بعدی
طریقه طبقه بندی صفت کمی پیوسته
و چنان چه قید شود داده ها روند شده اند آن گاه دامنه تغییرات عبارت است از Xmax-Xmin +1 R= .
عامل بعدی تعداد طبقات است که با K نمايش ىاىه مي شوى و همواره بين 5 تا 20 ءبقه مي باشد که رابطه آن عبارت است از K=1+3.32*logn .
عامل سوم فاصله طبقاتC است که عبارت است ازمرزپایین هر طبقه- مرز بالای هر طبقه.
بین سه عامل فوق رابطه زیر برقرار است: C=R/K
دقت شود که همواره مرز پایین طبقه اول کوچکترین مشاهده می باشد و برای به دست آوردن مرز بالای طبقه اول کافی است به مرز پایین فاصله طبقات اضافه شودبدین ترتیب حدود طبقات محاسبه میشود.
داده های زیر مربوط به نمرات 40دانش آموز در یک آزمون ریاضی است جدول توزیع فراوانی را برای این داده ها به طور کامل تشکیل دهید. 7, 20, 13 , 18, 17.5, 10, 15, 8, 4, 16 ,19.5 ,13.5 ,11.5
16.5, 7.5, 3, 4, 11, 12.5, 13.5, 20, 9, 3, 8, 9, 12, 18.5
17.5, 16.5, 13.5, 12.5, 14.5, 15.5, 18.5, 19.5, 12, 4.5 , 14 ,16.5,
R=Xmax-Xmin=20-3=17 k=1+3.32*log40=6.31=6
C= R/K C=17/6=2.8=2.9
فراوانی نسبی تجمعیG | فراوانی تجمعیG | فراوانی نسبیN | تعداد فراوانی مطلقF | حدود واقعی طبقات | صفات طبقات |
6/40 | 6 | 6/40 | 6 | 2.95 -5.85 | 3-5.8 |
11/40 | 11 | 5/40 | 5 | 5.85-8.75 | 5.9-8.7 |
16/40 | 16 | 5/40 | 5 | 8.75-11.65 | 8.8-11.6 |
26/40 | 26 | 10/40 | 10 | 11.65-14.55 | 11.7-14.5 |
31/40 | 31 | 5/40 | 5 | 14.55-17.45 | 14.6-17.4 |
1 | 40 | 9/40 | 9 | 17.45-20.35 | 17.5-20.3 |
1 | n=40 |
|
|
ستون دیگری که می توان به جدول فوق اضافه کرد حدود واقعی طبقات است که زمانی مورد استفاده قرار می گیرد که می خواهیم نمودارهای آماری رسم کنیم. برای این کار چون داده ها یک رقم اعشار دارند 0.05
از مرز پایین هر طبقه کم کرده و 0.05 به مرز بالای آن اضافه می کنیم بدین ترتیب حدود واقعی طبقات محاسبه می شود.
مثال: داده های زیر مربوط به یک نمونه های 50 تایی از نوعی نخ کتان است جدول توزیع فراوانی را رسم کنید.
21.2, 27.3, 20.6, 25.4, 36.9, 28.3, 33.7, 29.5, 34.1, 24.6, 27.1, 29.4, 21.8, 27.5, 28.9, 24, 25, 21.9, 37.5, 29.6, 24.8, 32.7, 29.3, 33.5, 22.2, 28.1, 29.5, 17.3, 29.6, 22.7, 25.4 , 30.2, 29, 26.8, 31.3, 34.5, 23.9, 36.8, 28.7, 33.2, 23.6, 23, 29.2, 34.8, 37, 38.4, 26.4, 23.5, 18.6, 28.3
R=38.4-17.3=21.1 K=1+3.32*log50=6.64=7
C=21.1/7=3.01
فراوانی نسبی تجمعیG | فراوانی تجمعیG | فراوانی نسبیN | تعداد فراوانی مطلقF | صفات طبقات |
2/50 | 2 | 2/50 | 2 | 17.3-20.3 |
9/50 | 9 | 7/50 | 7 | 20.4-23.4 |
19/50 | 19 | 10/50 | 10 | 23.5-26.5 |
36/50 | 36 | 17/50 | 17 | 26.6-29.6 |
39/50 | 39 | 3/50 | 3 | 29.7-32.7 |
45/50 | 45 | 6/50 | 6 | 32.8-35.8 |
1 | 50 | 5/50 | n=5 | 35.9-39 |
پس از تهيه جدول توزيع فراواني مي توانيم نمودارهای آماری ار بااستفاده از آن رسم کنیم با استفاده از نمودارهای آماری می نوان اطلاعات نهفته شده در جدول فراوانی را با سهولت بیشتر به مخاطب عرضه نمود.
منابع :
1- تحلیل آماری چند متغیری کاربردی/جانسون، ویچرن؛ ترجمه : حسینعلی نیرومند. دانشگاه فردوسی
2-http://statisticslu.blogfa.com
3-http://learn-m-p-l.persianblog.i
4-http://daneshnameh.roshd.ir