انتقادهايي بر ارزيابي شخصيت


 

نويسنده:آی . لانیون،ریچارد و دی فلئونارد
ترجمه:نقشبندی،سیامک



 

کاربرد ابزارهاي ارزيابي شخصيت
 

تالیف:ریچارد آی . لانیون و فلئونارد دی ، ترجمه:سیامک نقشبندی، و ....
آزمونهاي روان شناختي، از جمله آن دسته از آزمونهايي که به منظور ارزيابي شخصيت مورد استفاده قرار مي گيرند، از همان ابتدا همواره مورد انتقاد قرار گرفته اند. بدون شک، بخشي از اين انتقادها ناشي از اين موضوع است که ما دوست نداريم تحت هر گونه آزمايش يا ارزيابي اي قرار بگيريم (آرين، 1965، ص 859). ساير انتقادها نيز بر اساس سوءتفاهمات شکل گرفته اند. براي مثال دالستروم (1969) نشان داد که در بعضي از فرمهاي تقاضاي استخدام دولتي از متقاضيان خواسته شده است به عبارتهايي پاسخ دهند که پاسخ آنها تعيين کننده صحت معلومات آنهاست. ليکن پرسشنامه هاي شخصيت خودسنجي واکنشهايي را ايجاب مي کنند که پاسخهاي آن صحيح يا غلط نيستند؛ در اين گونه پرسشها، پاسخ دهندگان يا بايد عقيده شخصي خودشان و يا بايد مناسبترين پاسخ را ارايه دهند. اکثر ابزارهاي فرافکن حتي مبهم تر از اين هستند: آنها پاسخهايي را طلب مي کنند که نشانگر عقيده کاملاً بنيادي و شخصي آزمودنيهاست. همه اين گونه پاسخها به عنوان رفتار مورد بحث و بررسي قرار مي گيرند و نه لزوماً به عنوان اطلاعات "حقيقي" يا واقعي. با چنين ابزارها و مجموعه نگرشهاي متناقضي، به سادگي مي توان درک کرد که چرا ممکن است پاسخ دهندگان درباره صحت پاسخهايشان گيج شوند، و در مورد پاسخهاي خود با احتياط عمل کنند. در ضمن، چنين تناقضهايي نشان دهنده اهميت نياز به مديريت يا حداقل نظارت بر آزمونهاي شخصيتي به وسيله متخصصان با کفايت است تا اطمينان حاصل کنند که پاسخها ماهيت اصلي خودشان را مي رسانند.
اکثر انتقادهاي رسمي بسيار جدي تر از مواردي هستند که در بالا ذکر شده اند. در سال 1965، در واکنش به شکل گيري تدريجي عواطف عمومي عليه آزمون گيري روان شناختي، دو دوره کنگره دادرسي(950) برگزار شد. کميسيون فرعي ويژه اي در مورد تجاوزکاريهاي پنهان دولت "به علت شواهد بسياري زيادي که دال بر فعاليتها و اعمال معين آژانسهاي ايالتي بود که در جهت تعيين اين موضوع صورت گرفته بود که کدام سؤالهاي مهم را مي توان مطرح کرد"، شکل گرفت.
در مورد ارزيابي شخصيتي يا روان شناختي در استخدام دولتي و درخواست شغلي از مرکز استخدامي يک مسئله وجود دارد. بسياري از کارکنان دولتي به طور گسترده اي از نظر زندگي جنسي، موقعيتهاي خانوادگي، مذهب، عادتهاي شخصي، دوره کودکي و بسياري موضوعهاي ديگر مورد آزمون قرار مي گيرند (گلاگر(951)، 1965، ص 955). کميته فرعي مجلس سنا نيز با استدلالهاي مشابهي، پژوهشي را درباره حقوق تعيين شده براي کميته قضايي در قانون اساسي انجام داد (اروين(952)، 1965). به تأييد اين پژوهشها، موضوعهاي بسيار متنوع تر و وسيعتر از آن چيزي که در اهداف پذيرفته شده در کنگره دادرسي بيان گرديد، مورد پرسش قرار گرفت، و دامنه گسترده اي از نارضايتيها و انتقادها نيز توسط افراد مختلفي نظير روان شناسان بيان شد. همچنين ممکن است پيشنهاد دالستروم (1969) تا حدودي حقيقت داشته باشد؛ يعني، آزمونهاي روان شناختي به عنوان يک سپر بلا براي نگراني و اضطراب عمومي درباره رشد فزاينده نوعي تکنولوژي رواني دقيق به کار گرفته مي شدند.
با افزايش آشکار موارد استخدام مربوط به گروههاي اقليت در دهه هاي 1960 و 1970، علاقه عمومي هم بر جداسازي کاربرد آزمونهاي توانايي مربوط به موقعيتهاي شغلي متمرکز شد. اين روند منجر به تشکيل هيئت فرصتهاي شغلي برابر (EEDC)(953) شد، که به منظور انتخاب منصفانه کارکنان دولت دستورالعملهايي منتشر کرد (هيئت فرصتهاي شغلي برابر، هيئت خدمات شهري، اداره کار و سازمان قضايي، 1978). اين دستورالعملها که تجديدنظر شده و مطابق با اطلاعات روز درآمده است، در رابطه با استفاده مناسب از آزمونهاي توانايي و آزمونهاي شخصيت قيد و بندهاي بيشتري را ايجاد کردند.
اين گونه اعمال در سطح دولت مرکزي، روان شناسان را وادار به مقابله با انتقادهاي فراواني کرد که از آزمونهاي روان شناختي و فعاليتهاي آزمون گيري به عمل آمده بود که پيش از آن يا به حداقل رسيده و يا به کلي از بين رفته بود (نويک(954)، 1981). گزارشهاي حاصل، اين تأثير را هم داشت که روان شناسان را وادار به ايجاد اصلاحاتي کرد که اينک بخشي از انتظارات مسلم مربوط به ارزيابي روان شناختي است. نتيجه مثبت ديگر اين مذاکرات طولاني و روح تحقيق ايجاد شده به وسيله اين فعاليتها، اين بود که به طور کلي، بعضي از پيچيدگيهاي مربوط به موضوعهاي اخلاقي و قومي را درباره آزمونهاي روان شناختي روشن کردند. در اين فصل به مباحثي خواهيم پرداخت که به ارزيابي شخصيت اختصاص دارند.
انتقادهايي را که به موضوع ارزيابي شخصيت شده است مي توان، به طور کلي، به دو گروه تقسيم کرد: (الف) اين ارزيابيها دقيق نيستند، (ب) اين گونه ارزيابيها غيراخلاقي هستند (گروس، 1965). در گذشته، گرچه در بعضي موارد استفاده از آزمونهاي شخصيتي غيردقيق و غيراخلاقي بوده است، اما ساير کاربردهاي اين آزمونها هم دقيق و هم اخلاقي بوده، و فوايد آشکاري براي افراد و اجتماع در بر داشته اند (دالستروم، 1993). هنوز هم ضرورت جداسازي کاربردهاي دقيق از کاربردهاي غيردقيق و کاربردهاي اخلاقي از کاربردهاي غيراخلاقي اين آزمونها احساس مي شود و اين کار بايد صورت گيرد. ما درباره اين دو زمينه تحت عناوين مختلف کاربردي(955) و موضوعهاي اخلاقي(956) به بحث خواهيم پرداخت.

کاربرد ابزارهاي ارزيابي شخصيت
 

مشکلات استفاده از آزمونهاي شخصيت بر دو نوع هستند: اول، مشکلاتي که در رابطه با استفاده هاي نادرست از يک آزمون معتبر وجود دارد؛ مثلاً، آزموني که براي هدف خاصي اعتبار دارد، ولي براي هدفي ديگر به کار مي رود. دوم، مشکلات مربوط به استفاده از آزموني که براي هيچ هدف خاصي اعتبار روشني ندارد. ما ابتدا به مشکلاتي خواهيم پرداخت که مربوط به استفاده از آزمونهايي است که اعتبار کاربرد آنها مسلم شده است. در چنين مواردي به نظر مي رسد انتقادها بيشتر بر استفاده کنندگان آزمون وارد است تا خود آزمونها.

به کارگيري نامناسب آزمون
 

در ميان شديدترين شکل استفاده نامناسب از تکنولوژي ارزيابي شخصيت، کاربرد نادرست آزمونهايي که براي هدف ديگري اعتبار دارند، احتمالاً وجود دارد، و بدون شک ادامه خواهد داشت. به يک معني، همه اين گونه سوءاستفاده ها بايد به حساب به کاربرندگان آزمون، درک ناکافي از ماهيت آزمون و انتقادهايي را که به آزمونها وارد است، گذاشته شود. از اين رو، انتقادهاي متداول به آزمون گيري شامل استفاده از آزمونهاي خاص در موقعيتهايي است که براي آن ساخته نشده اند، و به دست آوردن ارزيابيهاي نامطلوب بر اساس اطلاعات کاملاً ناکافي يا نسبتاً ناکافي بوده اند (مثل گوردون و تِرِل(957)، 1981).
کاربرد آزمون در گزينش کارکنان. يکي از استفاده هاي آشکار و غلط آزمونهاي شخصيتي، به کارگيري آنها به وسيله افراد ناآزموده در شرايط نامناسب، براي شاغلان در کارخانجات و صنايع بوده است. اين اتهام به ويژه به استفاده از آزمونهايي مربوط مي شود که انتظار مي رود در موقعيتهاي روان پزشکي کاربرد داشته باشند، از قبيل رورشاخ و MMPI. بعضي از دلايل احتمالي چنين اقداماتي عبارت اند از: گردانندگان نيروي انساني(958) (RH) بايد قادر باشند ناراحتيهاي عاطفي اشخاص را تعيين کنند. همچنين در آموزش رسمي آکادميک اين افراد احتمالاً بر توانايي تشخيص آسيب شناختي اين گونه ابزارها و اعتبار آنها در سنجش شخصيت تأکيد شده است، در حالي که در عمل اين آزمونها بر ارزيابي جنبه هاي عملکرد عادي شخصيت، به ويژه جنبه هاي مربوط به موفقيت شغلي و توانايي مديريت، تأکيد دارند. به علاوه، ممکن است بعضي از متخصصان نيروي انساني به طور غيرمستقيم تمايل به کسب بعضي موقعيتهاي روان شناسان حرفه اي پيدا کنند يا درگير کنجکاوي روان شناختي شوند که خاص همان حرفه است. قابل ذکر است که يک دليل اصلي گفت و شنود(959) کنگره 1965 کاربرد آزمون MMPI به وسيله بخش ايالتي(960) به روش محدود، اما روزمره بود.
در پاسخ به اين انتقاد، بايد پذيرفت که مطمئناً واقعيت دارد که سوءاستفاده هايي از آزمونهاي شخصيت اتفاق مي افتد. يک شيوه براي خنثي کردن اين گونه سوءاستفاده ها اين است که روان شناسان حرفه اي کاربرد اين قبيل آزمونها را به افراد با کفايتي واگذار کنند که آنها را به طور صحيحي به کار مي برند. چنين سياستي رسماً به وسيله انجمن روان شناسي آمريکا (1970) اتخاذ شد؛ در يک ماده گفته مي شود که: "تصميم گيري درباره به کارگيري روشهاي ارزيابي و چگونگي اجراي آن بايد بر اساس شايستگي افراد سازنده آنها صورت گيرد" (ص 266). به همين سياق، بر اساس استانداردهاي رسمي آزمون روان شناختي و آموزشي، که به وسيله انجمن روان شناسي آمريکا انتشار يافته و اکنون براي پنجمين بار مورد تجديد نظر قرار گرفته (انجمن تحقيقات آموزشي آمريکا، انجمن روان شناسي آمريکا، شوراي ملي اندازه گيري در آموزش، 1985) آمده است:
يک استفاده کننده از آزمون به منظور انتخاب يا تعبير و تفسير يک آزمون، بايد اهداف اجراي آزمون و نتايج احتمالي آن را بداند. بايد از روشهاي لازم براي کمک به مفيد بودن و کاهش سوگيري در استفاده از آزمون آگاه باشد. گرچه سازنده و انتشار دهنده آزمون بايد درباره نقاط قوّت و ضعف آزمون اطلاعاتي در اختيار استفاده کنندگان قرار دهد، اما مسئوليت نهايي استفاده مناسب از آزمون به عهده به کاربرنده آزمون است. استفاده کننده آزمون بايد درباره آزمون و کاربردهاي مناسب آن آگاهي کافي داشته باشد و همچنين اين اطلاعات را به گونه مناسبي به ديگران انتقال دهد (ص 41).
در اين نشريه، 51 استاندارد ويژه براي استفاده از آزمون در 6 زمينه کلي آمده است، که هم شامل آزمون گيري به منظور گزينش و هم بسياري از کاربردهاي ديگر است. استفاده مسئولانه و اخلاقي آزمونها توسط روان شناسان نيازمند آشنايي با اين استانداردهاست، به همان ميزان که آنها بايد با اصول کلي تر اخلاقي روان شناسان و نظام نامه رفتاري آشنا باشند (انجمن روان شناسان آمريکا، 1987).
دولت مرکزي نيز قوانين و مقرراتي را براي استفاده صحيح از آزمونها وضع کرده است. گرچه اکثر اين قوانين مربوط به آزمونهاي توانايي در زمينه مدارس و استخدام هستند (کاپلان و ساکوزو(961)، 1993)، بعضي از اين مقررات هم در رابطه با ابزارهاي ارزيابي شخصيت به کار مي روند. براي مثال، 1990 نفر از کارفرمايان آمريکايي فاقد صلاحيت از پرسيدن سؤالهاي پيش از استخدام درباره تواناييهاي احتمالي متقاضيان شغل منع شدند (دي انجليس(962)، 1995). اين قانون شامل جلوگيري از اجراي آزمونهايي است که جنبه آسيب شناسي رواني دارند، از قبيل کاربرد MMPI براي جداسازي اشخاص پيش از استخدام، در حالي که اين آزمون مجاز به ارزيابي ويژگيهاي شخصيتي "نرمال" است.
مشکل وانمود کردن(963) آزمونهاي شخصيتي يکي ديگر از محورهاي انتقادي است، موضوعي که به ويژه در صورت استفاده اين آزمونها در محل کار اهميت پيدا مي کند. سؤال کاربردي اين است که آيا از پاسخ دهندگاني که مايل به آشکارسازي ويژگيهاي خود نيستند مي توان اطلاعات معتبري استخراج کرد. از بحث درباره اين مشکل در فصل 7، اين پاسخ موقتي به دست مي آيد که: نمي توان فرض کرد که اطلاعات به دست آمده تحت چنين شرايطي، براي همه موقعيتهاي خاص ديگر پژوهشي اعتبار دارد. لوول(964) (1967) اين ديدگاه افراطي را اتخاذ کرد که آزمونهاي شخصيتي به هيچ عنوان نبايد به منظور گزينش افراد به کار گرفته شوند؛ دالستروم (1969) معتقد بود اين آزمونها از لحاظ اخلاقي قابل استفاده هستند، زيرا پاسخ دهندگان اين فرصت را دارند که در صورت تمايل مسايل شخصي خود را پنهان نگاه دارند (با وانمودسازي يا از طريق جعل کردن اطلاعات). بر اساس نتيجه گيري شخصي، اصول اعتبارسازي و استفاده روشهاي گزينش کارکنان، که به وسيله بخش روان شناسي صنعتي- سازماني انجمن روان شناسي آمريکا (1980) انتشار يافت، سؤال وانمودسازي در خلال يک بحث مفصل و گسترده اعتبار کلي قرار مي گيرد. بنابراين، به طور ضمني اين نکته استنباط مي شود که اگر موضوع اعتبار، يعني "ميزان و اندازه اي که به استناد نمره هاي آزمونها يا ارزشيابيها با مدرک کافي حمايت و توجيه شده باشد" (ص2)، و نيز به طور مناسبي پي گيري شده باشد، لازم نيست که سؤال مربوط به وانمودسازي به طور جداگانه مورد ملاحظه قرار گيرد. بايد توجه کرد که ارزش اجتماعي زيربنايي کاربرد سنتي آزمونهاي شخصيت در محيط کار با توانايي آنها جهت شناسايي و حذف افراد غيرسنتي و مشکل دار ارتباط دارد و اعتبار آزمونهايي از اين دست نيز شاخصي از سوگيري آنها عليه چنين افرادي است. با وجود اين، ناتواني "در کنار آمدن" با همکاران يک علت مهم براي تشکيلاتي است که در محيط کار پيش مي آيد و اکثر کارفرمايان قوياً ترجيح مي دهند کارمند "مشکل دار" نداشته باشند. حل اين مشکل پيچيده به جاي حمله به آزمونهاي شخصيت، مستلزم تجديدنظر اساسي در ارزش هاي اجتماعي است. به طور کلي، موضوعهاي مربوط به آزمونهاي شخصيتي (و ديگر آزمونها) و امر جداسازي مشکل و پيچيده است و بهترين ضمانت در برابر عملکردهاي غيرمنصفانه جاري، درک جامع اصول اساسي اجتماعي، سنجش رواني و اخلاقي به وسيله استفاده کنندگان آزمون است.
سالنامه هاي اندازه گيريهاي ذهني (مانند کرامر و کونولي، 1992)، از جمله مجموعه کتابهاي راهنمايي هستند که از سال 1938 انتشار يافته و نقش غيرمدوني در کمک به منتقدان آزمون داشته اند، سزاوار توجه هستند. بررسي اين کتابها تعداد بي شماري از ابزارهاي شخصيت را که براي استفاده قابل دسترس هستند روشن خواهد کرد؛ بسياري از آنها بيشتر از يک روش ارزيابي ابتدايي اعتبار ندارند. خوشبختانه اکثر اين آزمونها کاربرد اندکي در فرصتهاي شغلي دارند. آزمونهاي اندکي هم که مورد استفاده قرار مي گيرند، وضعيت اعتبارشان، گرچه به آن اندازه که همواره از آنها انتظار مي رود نيست، اما تا حدودي بهتر از بقيه هستند. با اين حال، اين سالنامه ها ناخواسته براي آن دسته از کساني که آزمونها را مورد حمله قرار مي دهند بهانه هاي فراواني به دست مي دهند، زيرا تقريباً براي همه آزمونهاي منتشر شده تلويحاً تا حدودي اعتبار صحيح اما گمراه کننده قايل شده است. يک ويژگي تعيين کننده دقيقتر مي تواند اين باشد که اعتبار بعضي از آزمونهايي که کاربرد گسترده اي دارند، اگر به وسيله افراد باکفايت و کارآزموده و در شرايط مناسب استفاده شوند، رضايت بخش تر و به ويژه در محيط شغلي مناسب تر خواهند بود.
نقص بنيادي درجه بنديها. يک موضوع جدي نگراني که به نظر مي رسد توسط منتقدان غيرمتخصص آزمونهاي شخصيتي ناديده گرفته شده است، مشکل موجود در مبناي درجه بندي است، موضوعي که در فصل هفت مورد بحث قرار گرفت. جاي تعجب نيست که منتقدان غيرمتخصص در تشخيص و درک اين مشکل پيچيده فني دچار اشتباه شوند؛ زيرا بسياري از روان شناسان حرفه اي هم به اهميت اين موضوع واقف نيستند.
گرچه ممکن است براي خواننده کسالت آور باشد، ولي ما دوباره مطرح خواهيم کرد که چگونه وجود نقص بنيادي درجه بندي ممکن است منجر به سوءاستفاده از آزمودني شود که از ساير جهات اعتبار ندارد. يک مثال روشن در اين زمينه به وسيله سي من(965) (1969) ارايه شده است. وي نتايج هال(966) و لادراير(967) (1969) را مجداً مورد تجزيه و تحليل قرار داد. آنها گزارش داده بودند که برخي از پاسخهاي نامناسب مفهومي در خرده آزمونهاي شباهت وکسلر براي کودکان، در تشخيص آسيبهاي مغزي آنان مفيد بوده است. سي من چنين اظهار عقيده کرد که اگر فرض شود تقريباً روي 25 درصد از کودکان مراجعه کننده به کلينيکهاي راهنمايي کودک تشخيص آسيب مغزي واقعي گذاشته شده باشد (البته يک تخمين اغراق آميز) و در اين تشخيص نمره هاي معيار پيشنهاد شده توسط هال و لادراير به کار گرفته شده باشند، در 37 درصد موارد تشخيص مي توانست دقيق و در 63 درصد موارد تشخيص مي توانست غيردقيق باشد. گرچه در اعتبار "نقص ادراکي" به عنوان يک نشانه براي آسيب مغزي جاي هيچ ترديدي نيست. بنابراين، در نظر نگرفتن تکرار وقوع (فراواني) در چنين سنجشي براي پيش بيني کردن مي تواند موجب کاربرد نابجاي آزموني شود که براي منظور ديگري اعتبار دارد. باز هم تکرار مي کنم که تصميم نهايي درباره اينکه از يک نشانه استفاده شود يا نه، بستگي به هزينه نسبي و ارزشهاي مطرح شده دارد.
حساسيت منفي آزمون در قِبال گروههاي خاص. سالهاست که موضوع استفاده از آزمونها براي گروههاي خاص مورد بحث بوده است و البته اين بحث و جدل باز هم ادامه خواهد داشت. گرچه نگراني عمده درباره کاربرد آزمونهاي توانايي است، ولي اساساً شبيه همين موضوع درباره آزمونهاي شخصيتي و آسيب شناسي رواني هم صادق است: آيا نمره هاي بعضي آزمونها به درمان نامناسب گروههاي اقليت، زنان و ساير گروهها مي انجامد؟ اين موضوع را با در نظر گرفتن کاربرد فرضي مقياس تسلط براي ارزيابي توانايي رهبري مي توان نشان داد. بررسي هنجارهاي مقياسهاي مربوط به تسلط در آزمونهاي شخصيتي رايج نشان مي دهند که به طور متوسط در اين مقياسها مردها نمره بيشتري از زنها مي آورند. براي اين تفاوتها دلايل گوناگوني وجود دارد. شايد يکي از آنها اين باشد که به طور کلي مردها بيش از زنها داراي تسلط هستند. حتي اگر چنين چيزي صحت داشته باشد، باز هم نمي تواند پاسخي براي اين سؤال باشد که آيا تسلط براي رهبري زنها (يا مردها) يک پيش بيني کننده معتبر تلقي مي شود يا نه. يک احتمال ديگر اين است که شايد ميزان تسلط لازم براي رهبري موفق به طور متوسط در زنها کمتر از مردهاست.
اينها موضوعهاي پيچيده اي هستند و اگرچه درباره آزمونهاي استعداد و توانايي مطالعات گسترده اي انجام گرفته است، ولي در رابطه با آزمونهاي شخصيت و آسيب شناسي رواني تحقيقات اندکي وجود دارد (ساکت و ويلک، 1994). به عنوان مثال، بر اساس بررسيهاي به عمل آمده مي توان نتيجه گرفت که آزمون MMPI به يک ميزان هم براي سفيدپوستان و هم براي سياهپوستان شاخصي از آسيب شناسي رواني است، اما چنين تحقيقي هنوز درباره آمريکاييهاي بومي صورت نگرفته است (دالستروم، لاکار و دالستروم، a1986). تا زماني که تحقيقات کافي انجام نگرفته باشد، استفاده کنندگان از آزمون، علاوه بر احتياط در نتيجه گيريهاي خود، بايد از موضوعهاي نظري نيز اطلاع کافي داشته باشند.
اخيراً مزيک (1995) تحليل دقيقي از اين مشکل را بر اساس ديدگاه روان سنجي انجام داده است. مزيک در ارايه يک مفهوم کلي تر از اعتبار سازه، بر اهميت ارزشيابي "نتايج مربوط به تفسير و کاربرد نمره ها" هم از لحاظ شواهد تجربي و هم از لحاظ موارد واقعي ( و نيز بالقوه) تأکيد کرد (ص 742). اگرچه طرح اين سؤال که درباره آن دسته از آزمونهايي که به طور بالقوه پيامدهاي اجتماعي معکوس دارند چه اقدامي بايد صورت گيرد، يک موضوع سياسي اجتماعي است و نه روانسنجي. اين يک امر ضروري است که يک آزمون بايد ساختار ويژه اي را که براي آن ساخته شده است، ارزيابي کند. در سطح تهيه آزمون دو تهديد براي اين دستاور وجود دارد: مشکل اول اينکه ساختي ناقص(968) داشته باشد، يعني آزمون بسيار ضعيف باشد. به عبارت ديگر، آزمون ابعاد يا ويژگيهاي مهم سازه مورد نظر را شامل نشود. مشکل دوم، واريانس نامربوط سازه(969) است که در آن آزمون بيش از حد گسترده و وسيع است؛ يعني آزمون ويژگيهايي را شامل مي شود که به تعبير و تفسير آزمون هيچ ربطي ندارند. هر دوي اين نواقص باعث مي شوند که آزمون قادر به اندازه گيري آن چيزي نباشد که برايش ساخته شده است. مزيک در اين خصوص چنين نتيجه گيري مي کند که آزمون سازي به ويژه در مرحله جمع آوري ماده هاي آزمون و بعد انتخاب ماده هاي مناسب، به دقت زيادي نياز دارد. اين امر براي اين منظور صورت مي گيرد که آزمون مورد نظر به طور کامل و تا حد زيادي سازه مورد نظر را اندازه گيري کند و سازه هاي ديگر را در بر نگيرد. تنها در صورتي که اين رسالت انجام شود، تفاوتهاي بين نمره هاي آزمون را مي توان با اطمينان بيشتري بر اساس ساخت سؤالات آزمون تعبير و تفسير کرد و لذا اين تفاوتها به ساخت ديگري نسبت داده نمي شوند، زيرا ممکن است به يک گروه از جمعيت کل نسبت به گروه ديگر امتياز غيرمنصفانه ( يا نامربوط) داده شود.
بحث تجربه. اين جنبه از کاربرد آزمونهاي شخصيتي به وسيله افرادي که مهارت فني کافي ندارند بحث انگيزتر از جنبه هايي است که در بالا به آنها اشاره شد. در زمينه تشخيص باليني، ادعا بر اين است که مهارت با ابزارهايي مثل آزمون رورشاخ، به چيزي بيش از آموختن صرف اين ابزارها نياز دارد، و ترجيحاً تجربه زياد همراه با يک درک نظري جامع از نظريه هاي شخصيت و منطق خاص استفاده از آزمون مورد نياز است. به خاطر همين وضعيت است که مطالعات بسياري که موفق به نشان دادن اعتبار اين ابزارها نشده اند، به عنوان ملاک پذيرفته نمي شوند، زيرا در اين گونه مطالعات درمانگران بي تجربه به کار گرفته شده اند. در اين مورد موضوع آموزشهاي ضمني در برابر آموزش متعارف مطرح نيست (مانند بحثي که درباره استفاده آزمونها در گزينش افراد مطرح بود و در فصل هشتم گزارش آن آورده شده است)، بلکه بحث از آموزش متوسطه در برابر آموزش تخصصي و تجربه است.
درباره مسئله ضرورت آموزش متمرکز درازمدت شواهد تحقيقي اندکي وجود دارند و شواهد موجود هم چندان پايدار نيستند. در تأثير اين مطلب گلدبرگ (1959) نشان داد، آن دسته متخصصاني که در اجراي آزمون بندر گشتالت تجربه فراواني داشتند، در تشخيص آسيبهاي مغزي عملکرد خيلي بهتري را نشان دادند تا ساير قضاوت کنندگان. با اين حال، در يک مطالعه گسترده از تشخيصهاي روان پزشکي که به وسيله ليتل و اشنايدمن (1959) انجام شد و در آن انتخاب اجراکنندگان آزمون در کشور با دقت صورت گرفته بود، نتايج چندان جالبي به دست نيامد. شايد به اين دليل که گلدبرگ براي نتيجه گيري خود حدود 20 ساعت روي 30 پيش نويس آزمون بندر گشتالت آموزش تخصصي ديد، و اين مي تواند با نتيجه گيري به عمل آمده در فصل 8 مبني بر اينکه انگيزه قضاوت کنندگان درباره آزمون، نقش مهمي در دقت باليني آنها ايفا مي کند، در تناقض باشد. اما حتي اگر اين يافته ها حکايت از آن داشته باشند که متخصصان باليني آموزش ديده در سطح بالا نسبت به آنهايي که تخصص اندکي دارند از اولويت برخوردارند، سؤالي که باقي مي ماند اين است که آيا اولويت آنها تلاش و صرف هزينه براي آموزش بيشتر را توجيه مي کند.
کاربرد نابجاي(970) آزمونها. آزمونهاي شخصيت در سطح گسترده اي هم براي هدفهاي مناسب و هم براي هدفهاي نامناسب مورد استفاده قرار مي گيرند. براي مثال، اين امر غيرعادي نيست که روان شناسان از آزمونهاي اندريافت موضوع و پيش نويس(971) رورشاخ به منظور برآورد هوش استفاده کنند. همچنين تلاشهاي گسترده اي را که جهت گسترش کاربرد آزمون MMPI صورت گرفته است مي توان در کار لانيون (1968) که در مطالعه دقيق خود به جمع آوري ميانگين نيمرخهاي MMPI از يک گروه بزرگ آزمودنيهاي مختلف پرداخته بود، مشاهده کرد. در اين گردآوري به وضوح مي توان ديد که هرچه آسيبهاي روان شناختي آزمودنيها بيشتر باشند، بهتر مي توان بين نيمرخهاي آنان تفاوتها را مشاهده کرد. براي مثال، آزمون MMPI در جداسازي رانندگان ناشي و متبحر اتومبيل تقريباً بي فايده بوده است.
از سوي ديگر بين اختلالهاي شخصيتي و اختلالهاي اضطرابي تفاوتهاي گسترده و آشکاري وجود دارد. همچنانکه قبلاً ذکر شد اين موضوع عجيبي نيست، زيرا آزمون MMPI با هدف خاص تمايز نوع دوم ساخته شده است و نه تمايز نوع اول. همين اظهار نظر براي آزمون TAT هم صدق مي کند، زيرا اين آزمون براي توصيف نيازها و صفات شخصيت طراحي شده است و نه آسيب شناسي رواني. علي رغم ادعاهاي مکرر مبني بر مفيد بودن آزمون TAT در زمينه آسيب رواني (شارکي و ريتسلر، 1985)، تاکنون اطلاعات قابل توجهي بر خلاف يافته هاي ارون (1948) مبني بر وجود تفاوتهاي نسبتاً اندک بين پاسخهاي دانشجويان کالج و بيماران اسکيزوفرني به آزمون TAT، به دست نيامده است.
کاربرد نابجاي ديگر آزمونهاي شخصيت در رشد روزافزون فرمولبنديهاي(972) دقيق روان پويايي بيماران در موقعيتهاي باليني يافت مي شود. چنين فرمولبنديهايي ممکن است در نتيجه استفاده از درمانهاي روان تحليلي دراز مدت به دست آمده باشد - گرچه حتي اين موضوع هم مورد ترديد قرار گرفته است (ميل(973)، 1960) – اما ارزش چنين روشي در اکثر موقعيتهايي که در آنها درمان کوتاه مدت به کار مي رود، مبهم است. اين نکته از نظر بعضي از مؤلفان به عنوان "افول آزمونهاي رواني" تلقي شده است (کلولند(974)، 1976؛ لواندوسکي(975) و ساکوزو(976)، 1976). شايد ديدگاه دقيقتر اين باشد که ماهيت امر خطير ارزيابي تغيير يافته است – به نحوي که با فاصله گرفتن از شکل مجموعه ارزشيابيهاي طولاني آزمونهاي متعدد فرافکن به سوي ابزارهاي عيني تر و کوتاهتر و کاربردهاي مبتني بر تفسيرهاي کامپيوتري، تغيير جهت داده است. با اين همه، زمينه يابيهاي کاربرد آزمونها که در فصل گذشته شرح آن رفت، نشان دهنده تداوم کاربرد وسيع روشهاي فرافکن است.
انتقادهاي نابجا. گهگاه در نشريه هاي عمومي انتقادهايي از ارزيابيهاي شخصيت به عمل مي آيد. بعضي از اين انتقادها را مي توان به سادگي منتقداني نسبت داد که ظاهراً اصول مربوط به اندازه گيريهاي رواني را درک نکرده اند (مانند گروس(977)، 1962). بسياري از انتقادهايي که به وسيله گروس در رابطه با آزمون MMPI انجام شده است، در اين طبقه قرار مي گيرند؛ مثلاً، براي وي غيرقابل هضم بود که نمره دفاعي بودن در مقياس (K(978 مي تواند موجب افزايش اعتبار نمره آزمون شود، يا نمره بالا در مقياس (Sc(979 (اسکيزوفرني) را نبايد حتماً نشاني از اسکيزوفرني دانست. انتقاد ديگر او درباره موادي است که با دقت ماهرانه در آزمون به کار رفته است [ و از پاسخ آنها مي توان نشانه اي را استنباط کرد]. گروس اين موضوع را تا اندازه اي غيرمنصفانه مي دانست: يعني، فردي که اعتقاد به بازگشت مجدد مسيح را انکار کند، بايد با قرار گرفتن در مقياس افسردگي تعبير شود؛ او نمي دانست اين استدلال را درک کند که بيماراني که در گروه ملاکهاي اصلي افسردگي قرار مي گيرند، در واقع، پاسخهايشان در اين مواد نسبت به پاسخهاي افراد عادي، متفاوت است. دالستروم (1993) و ديگران زحمات بسياري را متحمل شدند تا بعضي نکات روان سنجي را که براي افراد ناآزموده مبهم بود، توضيح دهند و به تصوير درآورند.
يک رويکرد جديد. در سال 1984 کميته اي شامل چندين سازمان به منظور استفاده صحيح آزمونهاي روان شناختي و آزمونهاي مربوط به آن، براي تهيه يک رويکرد عملي به منظور ارزيابي صلاحيت اجراکنندگان آزمون تشکيل شد (فرمر(980)، دياموند(981) و کامرا(982)، 1989). روشهاي قبلي تعيين صلاحيت افراد براي استفاده از يک آزمون خاص متکي بر ارزش گواهينامه اي بود که از طرف منتشرکنندگان آزمون انتشار مي يافت. در مقابل، رويکرد جديد بر تعيين صلاحيتهاي رفتاري که براي به کاربرنده آزمون لازم است، تأکيد دارد (مورلند(983)، ايد(984)، روبرتسون(985)، پريموف(986) و موست(987)، 1995). مرحله اصلي اين مطالعه با استفاده از روش اجراي متداول آزمون، 86 ويژگي صلاحيت اجراي آزمون را که حداقل براي اجراي بيش از يک آزمون قابل استفاده بود، به فهرست درآورد. به کمک يک رشته تجزيه و تحليل، اين فهرست به 12 ويژگي لازم براي احراز حداقل شايستگي اجراي آزمون تقليل يافت (مورلند و همکاران، 1995، ص 16). اين 12 ويژگي در شکل 1-9 آمده است. در سطح کلي تر مي توان همه 12 ويژگي را در دو عنصر تعيين کننده صلاحيت خلاصه کرد: دانش آزمون و محدوديتهاي آزمون، و پذيرش مسئوليت براي استفاده صحيح از آزمون. همچنين هدف اين مطالعه چگونگي کاربرد عملي موضوعهاي نظري اين طرح به وسيله ناشران آزمون بود.

بي اعتباري کل آزمون
 

اکنون به انتقادهايي مي پردازيم که بيشتر به خود آزمونها (يا سازندگان آنها) وارد است تا به اجراکنندگان آنها. بايد به آن دسته از مشکلات اعتبار آزمونها بپردازيم که ناشي از روشهاي تهيه آزمونهايي هستند که در آنها توجه کافي به کاربرد آزمون در بعضي جنبه ها نشده است. بهترين مباحث تحت اين عنوان را مي توان در "اصول اعتبار و کاربرد روشهاي گزينش افراد" چاپ دوم (انجمن روان شناسي آمريکا بخش روان شناسي صنعتي - سازماني، 1980) و "استانداردهايي براي آزمونهاي آموزشگاهي و روان شناختي" (انجمن پژوهشي آموزشي آمريکا- انجمن روان شناسي آمريکا- انجمن ملي اندازه گيري در آموزش، 1985) پيدا کرد.
مشکل معيار. ابتدا به بحث درباره مشکلاتي مي پردازيم که در صورتي اتفاق مي افتند که ابزار ارزيابي شخصيت بدون داشتن هيچ معيار روشني تهيه شده باشد. در بحث قبلي درباره رويکرد تجربي به کار رفته در ساخت آزمون گفته شد که تهيه کنندگان آزمون، بسته به اينکه قصد ارزيابي کدام ابعاد شخصيتي
شکل 1-9: دوازده ويژگي استفاده صحيح از آزمونها را تعيين مي کند (اقتباس از مورلند و همکاران، 1995، صف 16، تجديد چاپ، 1995 به وسيله انجمن روان شناسي آمريکا، با کسب اجازه). (توضيح شکل)

شماره ماده ويژگي صلاحيت
 

1. اجتناب کردن از خطاي نمره گذاري و ثبت.
2. خودداري کردن از برچسب زني بر اشخاص، با اصطلاحات شخصيتي نامناسب، مانند "غيرقابل اعتماد" بر اساس آزموني که نمره آن اعتبار کامل ندارد.
3. نگهداري کردن از کليدها و مواد آزمون به طور کاملاً سري و در يک جاي امن.
4. توجه داشتن به اين نکته که هر آزمودني از دستورالعملهاي خاصي پيروي مي کند، به طوري که نمره هاي آزمون دقيق باشد.
5. استفاده از محلهايي براي اجراي آزمون که موجب عملکرد مطلوب آزمودني شود (مثل اتاق مناسب).
6. خودداري کردن از راهنمايي يا آموزش افراد يک گروه درباره مواد آزمون، که موجب نادرست جلوه دادن تواناييها و شايستگيهاي شخص شود.
7. تمايل داشتن به ارايه تعبير و تفسير و راهنمايي به آزمودني در موقعيتهاي مشاوره.
8. کپي نگرفتن از آزمونهاي کپي شده (تکثير نکردن آزمون).
9. خودداري کردن از به کارگيري پاسخنامه هاي خودساخته که به طور مناسبي با کليدهاي نمره گذاري آزمون هماهنگ نيستند.
10. برقراري رابطه با آزمودنيها به منظور به دست آوردن نمره هاي دقيق.
11. خودداري کردن از پاسخدهي به سؤالات آزمودنيها با جزئيات بيشتر از اطلاعاتي که خود آزمون اجازه مي دهد.
12. در نظر داشتن اينکه هنجار موجود در يک شغل براي شغل ديگر کاربرد ندارد (و دانستن اين نکته که هنجارهاي يک گروه به خودي خود در مورد گروه ديگر به کار نمي آيند.)
را داشته باشند؛ سعي مي کنند با تعيين گروههاي معيار يا شيوه هاي ديگري که به وضوح توصيف شده باشند، اين کار را عملي سازند. رويکردهاي منطقي و نظري به ساخت آزمون نيز، اگر به طور صحيح به کار رفته باشند، علاوه بر روشهاي با ثباتي که اين ابعاد را تعريف مي کنند، ايده روشني از اينکه کدام ابعاد يا ويژگيهاي شخصيتي را بايد اندازه گيري کنند، در بر مي گيرند (خواه با اصطلاحات منطقي بيان شوند و خواه با اصطلاحات نظري). در همه اين موارد تعاريف نسبتاً روشن به معياري مي انجامد که آزمون را مي توان بر اساس آن ارزشيابي کرد. مشکلات هنگامي در حوزه ارزيابي شخصيت پديد مي آيند که تعريف واضح و روشني از ملاک خاصي که در صدد ارزيابي آن هستيم، وجود نداشته باشد.
مشکل معيار به ويژه با وجود بعضي از ابزارهاي فرافکن و پرسشنامه هايي که بر مبناي استدلال منطقي ساخته شده اند، شکل حاد به خود گرفته است، اما اين بدان معني نيست که حتي در مورد ابزارهايي که معيار معيني دارند اين مشکل وجود نداشته باشد. يک نمونه از اين دست، مقياسهاي MMPI هستند که به منظور پيش بيني جايگاه بيماران در طبقه بندي تشخيصي روان پزشکي ساخته شده اند. در اصل معيارهاي استفاده شده، طبقات تشخيصي خاصي بودند که از قبل، بيماران بر اساس آن طبقه بندي مي شدند. هاتاوي (1959) و ميل (b1959) هر دو به اين نکته اشاره کرده اند که چون (در آن زمان) تشخيصهاي روان پزشکي تقريباً بي ثبات و تا حدودي قراردادي بودند، امکان داشت براي فرد اين سؤال به طور جدي پيش بيايد که چرا بايد اين همه به اين طبقه بنديهاي مبهم توجه شود؛ يعني، چرا بايد سعي بر ساخت ابزاري شود که از همان ابتدا واقعه اي را پيش بيني کند که بي ثبات و قراردادي است؟ حد و مرز دقت پيش بيني اين قبيل مقياسها به وسيله ميزان پايايي تشخيص معيار مشخص مي شود، به طوري که فراتر از اين سطح دقت، هيچ پيشرفت بيشتري در اين گونه ابزارها وجود ندارد.
وقتي در آزمون براي آنچه مورد ارزيابي قرار مي دهد مرجع يا معياري که به اندازه کافي روشن و صريح باشد وجود نداشته باشد، حداقل دو روش براي حل اين مشکل وجود دارد. يک راه حل که به وسيله هاتاوي (1959) پيشنهاد شده عبارت است از همتراز کردن يا مقايسه نتيجه ارزيابي با معيار. از اين زاويه، با توجه به تشخيص روان پزشکي مي توان با استفاده از نتايج به دست آمده از آزمون رورشاخ و MMPI به اندازه معاينه روان پزشکي يک بيمار را اسکيزوفرنيک تلقي کرد. از اين طريق، عدم تجانس بين منابع اطلاعاتي مختلف را مي توان با قضاوت باليني حل کرد. روش ديگر حل اين مشکل مي تواند به کارگيري روش تحليل عاملي، و بعد پذيرفتن عامل مقياسها به عنوان "پايه" متغيرهاي روان شناختي باشد، تا از اين طريق بتوان احتمال اشتباه بودن ساختار اصلي بر اساس داده هاي غلط را تشخيص داد. قابليت اين روش در فصل سوم مورد بررسي قرار گرفته است.
به طور کلي، اشخاصي که کارشان در رابطه با گسترش فنون ارزيابي شخصيت است، به اهداف خاص روشهاي ارزيابي و تدوين معيار کافي براي آنچه مورد ارزيابي قرار مي دهند، توجه اندکي نشان داده اند. هولت(989) (1958) درباره ارزيابي رفتارهاي خاص چنين مي نويسد:
ابتدا، اگر قصد داشته باشيم که بعضي از انواع رفتار را پيش بيني کنيم، اين موضوع متضمن اين است که نسبت به آنچه مي خواهيم پيش بيني کنيم اطلاع کافي داشته باشيم. اين کار مي تواند تحليل کار يا مطالعه معيار ناميده شود. وقتي اين موضوعها از نظر عقل سليم بسيار آشکار به نظر مي رسند، ظاهراً شايد کمي به خيالپردازي نزديک باشند. با اين همه، جالب اينجاست که مردم غالباً وقت و تلاش بسيار زيادي صرف مي کنند تا کوشش نمايند رفتاري را پيش بيني کنند که درباره آن اطلاعات خيلي کمي دارند، حتي بدون اينکه به فکرشان خطور کند که اگر در اين زمينه کنکاش بيشتري نمايند، اين امر مي تواند برايشان مفيد باشد (ص2).
اين کمبود در اصل سالها پيش به وسيله توپز(989) (1944) مطرح شد که اظهار داشت بايد مدت زمان برابري به تهيه معيار و ارتقاي کيفيت ابزارهاي ارزيابي اختصاص داده شود. انتقاد و هشدار مشابهي به وسيله تافت (990) (1959)، استرن(991)، استين(992) و بلوم(993) (1956) ارايه شد. اين يادداشتها به ترتيب با دو مقياس بزرگ ارزيابي شخصيت ارتباط داشتند؛ يعني، مطالعه OSS (ارزيابي کارکنان OSS، 1948) و ارزيابي VA مربوط به آموزش در روان شناسي باليني (کلي و فيسک(994)، 1951؛ کلي و گلدبرگ، 1959). تقريباً هيچ يک از اين بررسيها به دليل ناتواني در تشخيص صريح ماهيت رفتار معيار در دستيابي به اهداف خود موفق نبوده اند. يک رويکرد نظري به مشکل پيچيده ارزيابي به وسيله لارنت (1962) به کار گرفته شد که در صدد بود تا اطلاعات شخصيتي و ساير اطلاعات را به منظور گزينش افرادي که تحت آموزش مديريت بودند با حداکثر احتمال موفقيت به کار گيرد. وي براي غلبه بر مشکل معيار، ابتدا از طريق به کارگيري روش تحليل عاملي متغيرهاي مؤثر در "موفقيت"، از قبيل موقعيت و ميزان درآمد، يک معيار مرکب براي "موفقيت" تهيه کرد. نتيجه عامل اوليه که مي توانست معيار کلي موفقيت باشد به عنوان پيش بيني کننده هدف به کار برده شد.
مطالعاتي که تاکنون ذکر شد با اهداف ارزيابي چندگانه يا پيچيده سرو کار داشت، اما مکشلات معياري مشابهي در ساخت ابزارهاي ارزيابي و ويژگيهاي شخصيت افراد وجود دارد. بسياري از پژوهشگران از ارايه اعتبار پيش بيني براي ابزارهاي فرافکن غافل مي شوند، زيرا اين آزمونها بدون توجه به يک معيار پايا و قابل تعريف ساخته شده اند، به نحوي که هر محققي براي انتخاب هر يک از ابعاد شخصيتي در تحقيق مورد علاقه اش آزاد است. در نتيجه، ترکيبي از پژوهشهاي مختلف، نتايج منفي چندي را به دست داده اند؛ اما در صورتي که يک معيار مشخص وجود نداشته باشد، هرگز يک مطالعه معين نمي تواند صورت گيرد.
شايد اين مبحث را بتوان با اشاره به ديدگاه ابل (b1964) به بهترين نحو خلاصه کرد؛ از نظر وي آزمونهايي را که براي پرهيز از به کارگيري روشهاي ارزيابي رفتاري پيچيده، به شکل کوتاه ساخته شده اند، مي توان از ساير آزمونها تشخيص داد. در آزمونهاي کوتاه معيار ساخت آزمون بايد روشهاي ارزيابي مفصلتري را در بر بگيرد و اعتبار آن بايد به وسيله مقايسه بين دو اندازه گيري سنجيده شود. در چنين مواردي اين نمره هاي معيار را مي توان به وسيله روش اندازه گيري خاصي به دست آورد که به چندين دليل برتر است (مانند جامعيت و پايايي بيشتر)، به طوري که آزمون مورد نظر يک شاخص ضعيفتر و در عين حال، ساده تر از اين روش جامع است. در ارزيابي شخصيت معمولاً مشکل اصلي اين است که يک شيوه مبسوط تر براي ارزيابي عملکرد شخصيت وجود ندارد يا نمي توان آن را به گونه موجه و مناسبي به کار برد. هرچند اين واقعيت هم هست که معيار مناسب را گاهي مي توان به روش لارنت (1962) تهيه کرد. نمونه اي از اين دست را مي توان در کار بي. لانيون (1972) ديد که آن را به عنوان مبنايي براي جنبه هاي تجربي تدوين آزمون تکميل جمله سه مقياسي تهيه کرد (فصل 4).
همبستگي ظاهري. يک دسته از مشکلات ديگري که در اعتبار شيوه هاي خاص ارزيابي وجود دارد، زماني اتفاق مي افتند که آزمونها بر اساس عقل سليم يا اطلاعات باليني موجود در پرونده تعبير و تفسير شوند؛ همچنانکه در مورد بسياري از تعبير و تفسيرهاي آزمونهاي فرافکن و تا حدي آزمون رورشاخ و ابزارهاي مشابه آن اتفاق مي افتد. اين مشکل به وسيله چپمن (1967) شناسايي شد و "همبستگي ظاهري" نام گرفت (چپمن و چپمن، 1967). آيا دليل ادامه کاربرد آزمونهاي خاص با اعتبار تجربي نامطمئن و حمايت آنها به وسيله متخصصان تشخيصي وجود همين همبستگي ظاهري است؟
وقتي چپمن و چپمن يکسري کلمات زوجي را با فراواني يکسان به دانشجويان کالج ارايه دادند، به طور منظم و نادرست گزارش کردند که کلمات معيني بيش از آن چيزي که عملاً وجود داشت با يکديگر همراه مي شدند. مسلماً اين تصور ايجاد شده بود که کلماتي که همخواني قويتري داشتند بيشتر از کلماتي که همخواني ضعيفتري داشتند با يکديگر تکرار مي شدند (مثل ميز- صندلي و گرسنه – غذا). چپمن ها اين تأثير را با خطاي ادراکي مولر- لاير قابل مقايسه دانستند که در آن خطاي مشاهده به طور منظم و گسترده اي وجود دارد به نحوي که ارتباطي با تجربيات شخصي يا آموزشي ويژه قبل مشاهده کننده ندارد (چپمن و چپمن، 1967، ص 194).
با توجه به اين استدلال که اين همبستگي ظاهري ممکن است در تعبير و تفسير آزمونهاي باليني اتفاق بيفتد، چپمن ها به تعدادي از دانشجويان دوره ليسانس يکسري شکلهاي چهره انسان را نشان دادند. روي هر نقاشي به طور تصادفي دو جمله که شخصيت فرد مورد نظر را نشان مي داد، نوشته شده بود و به آزمودنيها گفته شد که اين جملات توصيف کننده فردي است که نقاشي را کشيده است. 6 جمله نشانه وجود داشت و هر يک به تعدادي از نقاشيهاي مختلف چسبانيده شده بودند. در اين آزمايش مشاهده اي به آزمودنيها اين گونه تفهيم شد که اين آزمايش به منظور "آموزش" رابطه بين نقاشيها و نشانه ها طرح شده است. پس از آموزشهاي لازم به آزمودنيها، فهرستي از 6 جمله نشانه شخصيتي به آنها داده و از آنها خواسته شد هر يک از اين جمله ها را زير يک نقاشي که فکر مي کنند طبق مشاهده قبلي خود به آن مربوط است، بنويسند. البته پاسخ صحيح اين بود که هيچ رابطه "نظامداري" بين جمله هاي نشانه و ويژگيهاي نقاشيها وجود ندارد.
همان گونه که انتظار مي رفت آزمودنيها گرايش داشتند نقاشيها و جملات را به گونه اي با يکديگر همراه کنند، که هر نشانه شخصيتي با ويژگي خاصي از نقاشي همخواني قويتري داشته باشد. براي مثال، در اکثر موارد رابطه بين نشانه شخصيتي "سوءظن" و ويژگي نقاشي "چشمان غيرعادي" با هم گزارش شدند؛ اگرچه در آموزش قبلي آزمودنيها هرگز چنين رابطه اي آموزش داده نشده بود. تحقيقات بعدي يافته هاي مهم زير را به دست داد: بين "تعبير و تفسير شخصيت" انجام شده و به وسيله دانشجويان دوره ليسانس آموزش نديده و تعبير و تفسيرهاي شخصيت انجام شده به وسيله متخصصان باليني ورزيده ارتباط خيلي نزديکي وجود داشت! بنابراين، شواهدي در دست است که بخشي از "اطلاعات باليني" که به منظور تعبير و تفسير آزمونهاي فرافکن وجود دارد نادرست است، و احتمالاً علت اين امر ناشي از دلايل مشابهي است که هميشه به طور عيني اتفاق مي افتند؛ چون چنين تعبير و تفسيرهايي يا "معني دار" به نظر مي رسند و يا به نظر مي رسد "ذاتاً" صحيح هستند، علي رغم اينکه شواهد تجربي براي اين گونه روابط به طور واقعي وجود ندارد.
شدت تأثير همبستگي ظاهري چقدر است؟ چپمن و چپمن (1969) توانستند تأثير همبستگي ظاهري را در ارزيابي همجنس بازي از طريق آزمون رورشاخ نشان دهند و استار(995) و کاتکين(996) اين تأثير را در سياهه جملات ناتمام پيدا کردند. در مطالعه اي که توسط داولينگ(997) و گراهام (1976) انجام گرفت پديده مشابهي در استفاده از آزمون MMPI گزارش شد، گرچه در خصوص نتايج آنها تعبير و تفسيرهاي ديگري نيز وجود داشت. در دو مطالعه ديگر معلوم شد حتي زماني که درباره تأثيرات همبستگي ظاهري به آزمودنيها هشدارهاي خاصي داده شد، علي رغم آموزش کافي آزمودنيها، باز هم تأثير آن بدون کم و کاست وجود داشت (کارتز(998) و گارفيلد(999)، 1987؛ والر(1000) و کيلي(1001)، 1978). در مطالعه اي که به منظور درک بيشتر اين پديده طراحي شده بود، ليوگر(1002) و پتزل(1003) (1979) نشان دادند که هرچه مقدار اطلاعات براي پردازش توسط قضاوت کنندگان بيشتر باشد، تأثير همبستگي ظاهري بيشتر خواهد بود.
نمي توان نتيجه گرفت که علت همه تفاوتهاي بين ادعاهاي قطعي متخصصان باليني در روشهاي معتبر ترسيم نقاشي و ساير آزمونهاي مشابه، و شواهد تجربي ضعيفي که در دسترس و مورد حمايت هستند فقط همبستگي ظاهري است. علي رغم قوّت و پايداري يافته هاي تحقيقي که گذشته از ميزان اطمينان فرد در تعبير و تفسير آزمون، بر محکوميت "تجربه" تأکيد دارند، داوس(1004) (1989) درباره تأثير همبستگي ظاهري در دقت تجزيه و تحليل و قضاوت باليني چنين مي گويد: به طور کلي، همبستگي ظاهري در سطح بسيار وسيعتري از تعبير و تفسير آزمون اتفاق مي افتد، و تقريباً با اطمينان مي توان گفت که عامل مهمي در محدودسازي مهارتهاي تخصصي و مشکلي براي دخالت تجربه در قضاوتهاي باليني به حساب مي آيد.

پي نوشت:
 

950- congressional hearings
951- Gallagher
952- Ervin
953- Equal Employment Opportunity Commisson
954- Novik
955- usage
956- moral
957- Gordon & Terrell
958- human resources
959- hearings
960- State Department
961- Kaplan & Saccuzzo
962- De Angelis
963- faking
964- Lovell
965- Seeman
966- Hall
967- LaDriere
968- construct underrepresentation
969- construct irrelevant variance
970- unwarranted
971- protocol
972- formulation
973- Meehl
974- Cleveland
975- Lewandowski
976- Saccuzzo
977- Gross
978- correction
979- Schizopherenia
980- Fremer
981- Diamond
982- Camera
983- Moreland
984- Eyde
985- Robertson
986- Primoff
987- Most
988- Holt
989- Toops
990- Taft
991- Stern
992- Stein
993- Bloom
994- Fiske
995- Starr
996- Katkin
997- Dowling
998- Kurtz
999- Garfield
1000- Waller
1001- Keely
1002- Lueger
1003- Petzel
1004- Dawes
 

منبع:تالیف:آی . لانیون،ریچارد و دی فلئونارد ، ترجمه:نقشبندی،سیامک و .... «ارزيابي شخصيت» ، نشر روان ،1385