وقتی مردم کارهای وحشتناکی انجام میدهند، به نظر منطقی میرسد که ما باید از قبل برای شناسایی آنها قدمهایی برداشته باشیم. اگر ما بتوانیم این کار را انجام دهیم، مطمئناً میتوانیم از آسیب رساندن آنها جلوگیری کنیم.
سقوط پرواز 9525 ایر باس، که به نظر میرسد یک اقدام عمدی بوده است، نمونهای از آن است. هنگامی که یک متخصص قابل اعتماد به کسانی که جان خود را به او سپردهاند صدمه میزند، ما را شوکه میکند (و این قابل درک است).
بنابراین چرا خلبانان دارای چنین ریسکهایی را شناسایی نمیکنیم و برای جلوگیری از وقوع دوباره حوادث مشابه، اقدامات لازم را انجام نمیدهیم؟
زیرا احتمالاً غیرممکن است و شاید حتی ضد تولیدی نیز باشد.
و این فقط نظر من نیست. محدودیتهایی که میتوان در پیش بینی یک رویداد به دست آورد، بیانگر معضلی است که ما در تمام مدت در آزمایشات زیست پزشکی با آن روبرو هستیم.
بگذارید چنین تحلیلی را برای شما انجام دهم و به شما نشان دهم که چقدر چنین برنامههای بیهودهای میتوانند در جلوگیری از وقایعی نظیر سقوط هوایی در اروپا مؤثر باشند.
تصویر: حساس یا ویژه؟ لولههای خونی از طریق shutterstock
آزمایش پزشکی میتواند حساس یا ویژه باشد، اما به ندرت هر دو است
هر مصاحبه یا ابزار بررسی کتبی که برای شناسایی افراد در معرض خطر ارتکاب اقدامات نادر و وحشتناک انجام شود، اساساً یک آزمایش پزشکی است. و عملکرد چنین آزمایشاتی با حساسیت و ویژگی آن توصیف میشود. به عبارت سادهتر، حساسیت توانایی آزمایش در تشخیص بیماری است و ویژگی آن دقت در نتیجه آن است.برای اکثر تستها، شما بین این یا موارد دیگر معامله میکنید: حساسیت در مقابل ویژگی. به عنوان مثال، تستهای بسیار حساس معمولاً دارای بسیاری از موارد مثبت کاذب است - آنها ممکن است بیمار را بیمار بنامند که بیمار آن بیماری را نداشته باشد. و آزمایشات بسیار ویژه اغلب منفیهای کاذب زیادی دارند - بسیاری از بیماران مبتلا به بیماری را از دست میدهند.
به طور کلی، شما میتوانید یک تست حساس یا یک تست ویژه داشته باشید، اما نمیتوانید یک تست حساس و ویژه داشته باشید. با استفاده از یک استعاره ساده، می توان آن را "عدم وجود قانون ناهار رایگان" در آزمایش پزشکی نامید.
این محدودیت زمانی زیاد میشود که از آزمایشهای پزشکی در جمعیتهایی که شیوع بیماری بسیار کمی برای آنها وجود دارد استفاده شود.
یک مثال مهمل میتواند به درک این موضوع کمک کند. آزمایشهای بارداری مدرن بسیار دقیق و بیش از 99٪ قابل اعتماد است. با این حال، بگذارید فرض کنیم که شما آزمایش بارداری را در جمعیتی با ده هزار مرد انجام میدهید. شما تعداد انگشت شماری از تستهای مثبت را دریافت خواهید کرد که 100٪ از آنها مثبت کاذب خواهد بود.
به همین دلیل، آزمایش خون معمولی نمیتواند بطور کلی برای غربالگری بیماریهای بسیار نادر استفاده شود بدون اینکه با یک آزمایش تأییدیه دوم جفت شود.
با برگرداندن توجهمان به پرواز 9525 ایر باس، باید گفت بروز چنین رویدادی به قدری غیر معمولی است که در یک خطای گرد شده در تشخیص بارداری یک مرد وجود دارد.
از سال 1959 تاکنون 660 میلیون مسافرت هواپیمایی تجاری صورت گرفته است که تنها در تعداد انگشت شماری از تصادفات آنها گمان می رود علت، اقدامات عمدی توسط خلبان بوده باشد. حتی اگر فرض کنیم احتمالاً تصادفات به صورت عمدی توسط خلبانان ایجاد شده اما به آنها نسبت داده نشده است، این هنوز یک اتفاق بسیار نادر است. شاید نادرترین حادثه نباشد (مثل این که حداقل یک نفر در میان تقریبا 100 میلیارد نفر تا به حال ادعا کردهاند که هم توسط رعد و برق زده شدهاند و هم توسط یک کوسه گزیده شدهاند)، اما به هر حال برای اهداف ما بسیار غیر معمول است.
بنابراین، حتی اگر ما بتوانیم یک تست یا یک روند غربالگری را برای پیدا کردن یک خلبان که عمدا هواپیما را ساقط میکند ایجاد کنیم و آن سیستم بسیار، بسیار خوب - ویژه و حساس – باشد آنگاه تقریباً همه مثبتها مثبت کاذب خواهد بود.
تصویر: جراحی باز بیمار میتواند عملکرد بهتری نسبت به تستهای تصویربرداری داشته باشد. جراحی از طریق shutterstock
تستهای پزشکی روانشناختی کاملاً دقیق نیستند
و یک سلسله مراتب برای عملکرد آزمون وجود دارد که همه اینها را پیچیدهتر میکند. آزمایشاتی که در آن شما برشی از بیمار بر میدارید و بافت را زیر میکروسکوپ معاینه میکنید دارای بهترین عملکرد هستند، با حساسیت و ویژگی تقریباً کامل. تستهای تصویربرداری مانند اسکنهای CAT و MRI میلیونها نقطه داده تصویری را ارائه میدهند و همچنین عملکرد بسیار خوبی دارند. برخی از کارشناسان ادعا کردهاند که به محض حذف جانبداری انتشار (تمایل به انتشار فقط نتایج مثبت)، بیشتر، اگر نه همهی، چنین وسایلی فاقد هرگونه عملکرد پیش بینی کنندهای میشوند. اما با رسیدن به اندازه گیری غلظت مولکولها در خون، مشکلاتی ایجاد میشود. اینگونه آزمایشات بدون درک کامل از بروز بیماری نباید استفاده شود.در انتهای سلسله مراتب عملکرد، ابزارهای بررسی روانشناختی قرار دارند – تستهایی که در آن مجموعهای از سؤالات با هدف ایجاد تشخیص روانشناختی مطرح میشوند. برخی از کارشناسان ادعا کردهاند که به محض حذف جانبداری انتشار (تمایل به انتشار فقط نتایج مثبت)، بیشتر، اگر نه همهی، چنین وسایلی فاقد هرگونه عملکرد پیش بینی کنندهای میشوند.
یک بررسی بزرگ سیستماتیک که در ژورنال پزشکی انگلیس منتشر شده است، عملکرد ابزارهای ارزیابی پیش بینی خشونت در افراد در معرض خطر را مورد بررسی قرار داده و دریافته است که برای جلوگیری از یک عمل خشونت آمیز، نیاز به بازداشت دو نفر یا به طریقی دیگر جلوگیری از عمل آنها است. آنها نتیجه گرفتند "حتی پس از 30 سال پیشرفت، این دیدگاه که خشونت، خطر جنسی یا جنایی، در اکثر موارد قابل پیش بینی است، مبتنی بر شواهد نیست."
پیش بینی میتواند منجر به نتایج مثبت کاذب شود. حتی تشخیص دقیق یک بیماری دشوارتر از آن است که اکثر مردم تصور میکنند. در مورد تشخیص بیماری، سلسله مراتب نیز وجود دارد. بیماریهای شناخته شده و فوراً تهدید کننده زندگی مانند سرطان پیشرفته یا بیماری های قلبی اغلب به راحتی قابل تشخیص هستند. در انتهای دیگر طیف، دردها و امراض غیر اختصاصی یا بیماریهایی هستند که در مراحل اولیه خود هستند، و حتی بهترین پزشکان را نیز به چالش میکشند.
نادر بودن خلبانی که عمداً هواپیما را ساقط میکند و عملکرد ضعیف تستهای روانشناختی، نتیجه گیری را آسان میکند که چنین آزمایشهایی بی فایده است. ممکن است از وقایع نادری مانند این یکی - درهای کابین خلبان "هوشمند" یا برخی از راه حلهای فناوری جلوگیری کند. اما پیش بینی وقوع آنها با نگاه دقیقتر افراد درگیر محکوم به شکست است. این یک نسخه افراطی از مشکلی است که همه ما روزانه با آن روبرو میشویم، عمدتاً بدون درک آن.
منبع: نورمن اِی پارادیس - Dartmouth College