تصویر: محدودیت‌هایی در مورد آنچه آزمایشات می‌توانند پیش بینی کنند وجود دارد. تصویر هواپیما از طریق  shutterstock
 
وقتی مردم کارهای وحشتناکی انجام می‌دهند، به نظر منطقی می‌رسد که ما باید از قبل برای شناسایی آنها قدم‌هایی برداشته باشیم. اگر ما بتوانیم این کار را انجام دهیم، مطمئناً می‌توانیم از آسیب رساندن آنها جلوگیری کنیم.
 
سقوط پرواز 9525 ایر باس، که به نظر می‌رسد یک اقدام عمدی بوده است، نمونه‌ای از آن است. هنگامی که یک متخصص قابل اعتماد به کسانی که جان خود را به او سپرده‌اند صدمه می‌زند، ما را شوکه می‌کند (و این قابل درک است).
 
بنابراین چرا خلبانان دارای چنین ریسک‌هایی را شناسایی نمی‌کنیم و برای جلوگیری از وقوع دوباره حوادث مشابه، اقدامات لازم را انجام نمی‌دهیم؟
 
زیرا احتمالاً غیرممکن است و شاید حتی ضد تولیدی نیز باشد.
 
و این فقط نظر من نیست. محدودیت‌هایی که می‌توان در پیش بینی یک رویداد به دست آورد، بیانگر معضلی است که ما در تمام مدت در آزمایشات زیست پزشکی با آن روبرو هستیم.
 
بگذارید چنین تحلیلی را برای شما انجام دهم و به شما نشان دهم که چقدر چنین برنامه‌های بیهوده‌ای می‌توانند در جلوگیری از وقایعی نظیر سقوط هوایی در اروپا مؤثر باشند.
 
 
تصویر: حساس یا ویژه؟ لوله‌های خونی از طریق  shutterstock
 

آزمایش پزشکی می‌تواند حساس یا ویژه باشد، اما به ندرت هر دو است

هر مصاحبه یا ابزار بررسی کتبی که برای شناسایی افراد در معرض خطر ارتکاب اقدامات نادر و وحشتناک انجام شود، اساساً یک آزمایش پزشکی است. و عملکرد چنین آزمایشاتی با حساسیت و ویژگی آن توصیف می‌شود. به عبارت ساده‌تر، حساسیت توانایی آزمایش در تشخیص بیماری است و ویژگی آن دقت در نتیجه آن است.
 
برای اکثر تست‌ها، شما بین این یا موارد دیگر معامله می‌کنید: حساسیت در مقابل ویژگی. به عنوان مثال، تست‌های بسیار حساس معمولاً دارای بسیاری از موارد مثبت کاذب است - آنها ممکن است بیمار را بیمار بنامند که بیمار آن بیماری را نداشته باشد. و آزمایشات بسیار ویژه اغلب منفی‌های کاذب زیادی دارند - بسیاری از بیماران مبتلا به بیماری را از دست می‌دهند.
 
به طور کلی، شما می‌توانید یک تست حساس یا یک تست ویژه داشته باشید، اما نمی‌توانید یک تست حساس و ویژه داشته باشید. با استفاده از یک استعاره ساده، می توان آن را "عدم وجود قانون ناهار رایگان" در آزمایش پزشکی نامید.
 
این محدودیت زمانی زیاد می‌شود که از آزمایش‌های پزشکی در جمعیت‌هایی که شیوع بیماری بسیار کمی برای آنها وجود دارد استفاده شود.
 
یک مثال مهمل می‌تواند به درک این موضوع کمک کند. آزمایش‌های بارداری مدرن بسیار دقیق و بیش از 99٪ قابل اعتماد است. با این حال، بگذارید فرض کنیم که شما آزمایش بارداری را در جمعیتی با ده هزار مرد انجام می‌دهید. شما تعداد انگشت شماری از تست‌های مثبت را دریافت خواهید کرد که 100٪ از آنها مثبت کاذب خواهد بود.
 
به همین دلیل، آزمایش خون معمولی نمی‌تواند بطور کلی برای غربالگری بیماریهای بسیار نادر استفاده شود بدون اینکه با یک آزمایش تأییدیه دوم جفت شود.
 
با برگرداندن توجه‌مان به  پرواز 9525 ایر باس، باید گفت بروز چنین رویدادی به قدری غیر معمولی است که در یک خطای گرد شده در تشخیص بارداری یک مرد وجود دارد.
 
از سال 1959 تاکنون 660 میلیون مسافرت هواپیمایی تجاری صورت گرفته است که تنها در تعداد انگشت شماری از تصادفات آنها گمان می رود علت، اقدامات عمدی توسط خلبان بوده باشد. حتی اگر فرض کنیم احتمالاً تصادفات به صورت عمدی توسط خلبانان ایجاد شده اما به آنها نسبت داده نشده است، این هنوز یک اتفاق بسیار نادر است. شاید نادرترین حادثه نباشد (مثل این که حداقل یک نفر در میان تقریبا 100 میلیارد نفر تا به حال ادعا کرده‌اند که هم توسط رعد و برق زده شده‌اند و هم توسط یک کوسه گزیده شده‌اند)، اما به هر حال برای اهداف ما بسیار غیر معمول است.
 
بنابراین، حتی اگر ما بتوانیم یک تست یا یک روند غربالگری را برای پیدا کردن یک خلبان که عمدا هواپیما را ساقط می‌کند ایجاد کنیم و آن سیستم بسیار، بسیار خوب - ویژه و حساس – باشد آنگاه تقریباً همه مثبت‌ها مثبت کاذب خواهد بود.
 

تصویر: جراحی باز بیمار می‌تواند عملکرد بهتری نسبت به تست‌های تصویربرداری داشته باشد. جراحی از طریق shutterstock
 

تست‌های پزشکی روانشناختی کاملاً دقیق نیستند

و یک سلسله مراتب برای عملکرد آزمون وجود دارد که همه اینها را پیچیده‌تر می‌کند. آزمایشاتی که در آن شما برشی از بیمار بر می‌دارید و بافت را زیر میکروسکوپ معاینه می‌کنید دارای بهترین عملکرد هستند، با حساسیت و ویژگی تقریباً کامل. تست‌های تصویربرداری مانند اسکن‌های CAT و MRI میلیون‌ها نقطه داده تصویری را ارائه می‌دهند و همچنین عملکرد بسیار خوبی دارند. برخی از کارشناسان ادعا کرده‌اند که به محض حذف جانبداری انتشار (تمایل به انتشار فقط نتایج مثبت)، بیشتر، اگر نه همه‌ی،  چنین وسایلی فاقد هرگونه عملکرد پیش بینی کننده‌ای می‌شوند. اما با رسیدن به اندازه گیری غلظت مولکولها در خون، مشکلاتی ایجاد می‌شود. اینگونه آزمایشات بدون درک کامل از بروز بیماری نباید استفاده شود.
 
در انتهای سلسله مراتب عملکرد، ابزارهای بررسی روانشناختی قرار دارند – تست‌هایی که در آن مجموعه‌ای از سؤالات با هدف ایجاد تشخیص روانشناختی مطرح می‌شوند. برخی از کارشناسان ادعا کرده‌اند که به محض حذف جانبداری انتشار (تمایل به انتشار فقط نتایج مثبت)، بیشتر، اگر نه همه‌ی،  چنین وسایلی فاقد هرگونه عملکرد پیش بینی کننده‌ای می‌شوند.
 
یک بررسی بزرگ سیستماتیک که در ژورنال پزشکی انگلیس منتشر شده است، عملکرد ابزارهای ارزیابی پیش بینی خشونت در افراد در معرض خطر را مورد بررسی قرار داده و دریافته است که برای جلوگیری از یک عمل خشونت آمیز، نیاز به بازداشت دو نفر یا به طریقی دیگر جلوگیری از عمل آنها است. آنها نتیجه گرفتند "حتی پس از 30 سال پیشرفت، این دیدگاه که خشونت، خطر جنسی یا جنایی، در اکثر موارد قابل پیش بینی است، مبتنی بر شواهد نیست."
 
پیش بینی می‌تواند منجر به نتایج مثبت کاذب شود. حتی تشخیص دقیق یک بیماری دشوارتر از آن است که اکثر مردم تصور می‌کنند. در مورد تشخیص بیماری، سلسله مراتب نیز وجود دارد. بیماریهای شناخته شده و فوراً تهدید کننده زندگی مانند سرطان پیشرفته یا بیماری های قلبی اغلب به راحتی قابل تشخیص هستند. در انتهای دیگر طیف، دردها و امراض غیر اختصاصی یا بیماریهایی هستند که در مراحل اولیه خود هستند، و حتی بهترین پزشکان را نیز به چالش می‌کشند.
 
نادر بودن خلبانی که عمداً هواپیما را ساقط می‌کند و عملکرد ضعیف تست‌های روانشناختی، نتیجه گیری را آسان می‌کند که چنین آزمایش‌هایی بی فایده است. ممکن است از وقایع نادری مانند این یکی - درهای کابین خلبان "هوشمند" یا برخی از راه حلهای فناوری جلوگیری کند. اما پیش بینی وقوع آنها با نگاه دقیق‌تر افراد درگیر محکوم به شکست است. این یک نسخه افراطی از مشکلی است که همه ما روزانه با آن روبرو می‌شویم، عمدتاً بدون درک آن.
 

منبع: نورمن اِی پارادیس - Dartmouth College