تصویر: اتصال نقاط  majcot / Shutterstock
 
شرکت هوش مصنوعی کانادایی BlueDot در هفته‌های اخیر در اخطارهای مربوط به روزهای جدید کرونا ویروس پیش از هشدارهای رسمی مرکز کنترل و پیش گیری از بیماری‌ها و سازمان بهداشت جهانی هشدار داده است. این شرکت با بهره برداری از منابع مختلف اطلاعات فراتر از آمارهای رسمی در باره تعداد موارد گزارش شده، توانست این کار را انجام دهد.
 
الگوریتم هوش مصنوعیBlueDot ، که نوعی برنامه رایانه‌ای است که هر چه پردازش بیشتری روی داده‌ها صورت دهد بیشتر بهبود می‌یابد، روایت‌های خبری را به ده‌ها زبان، و گزارش‌ها را از شبکه‌های رد یابی بیماری‌های گیاهی و حیوانی، و داده‌های بلیطهای هواپیمایی را جمع آوری می‌کند. نتیجه، الگوریتمی است که در شبیه سازی شیوع بیماری بهتر از الگوریتم‌هایی است که به داده‌های بهداشت عمومی متکی هستند – لااقل به اندازه کافی بهتر است برای پیش بینی شیوع بیماری. این شرکت برای پیش بینی و رد یابی بیماری‌های عفونی برای مشتریان دولتی و بخش خصوصی از این فناوری استفاده می‌کند.
 
اپیدمیولوژی سنتی رد یابی می‌کند که کجا و چه زمانی افراد یک بیماری را می‌گیرند تا منبع شیوع بیماری را تشخیص دهد و این که چه جمعیتی بیشتر در معرض خطر هستند. سیستم‌های هوش مصنوعی مانند مدل BlueDot نحوه شیوع بیماری‌ها در جمعیت را نشان می‌دهند و این امکان را فراهم می‌کنند تا پیش بینی کنیم که در چه موارد شیوع رخ می‌دهد و پیش بینی می‌کنند که بیماری‌ها تا چه حد و چقدر سریع گسترش خواهند یافت. به این لحاظ، در حالی که CDC و آزمایشگاه‌های سراسر جهان برای یافتن علاج بیماری کرونا ویروس جدید در حال رقابت هستند، محققان با استفاده از هوش مصنوعی سعی می‌کنند پیش بینی کنند که این بیماری به کجا خواهد رسید و تأثیرات آن چه میزان می‌تواند باشد. هر دو نقش مهمی در مواجهه با این بیماری دارند.
 
با این حال، هوش مصنوعی یک گلوله نقره‌ای جادویی در این مبارزه نیست. دقت سیستم‌های هوش مصنوعی به میزان و کیفیت داده‌هایی که از آنها یاد می‌گیرند وابسته است، و این که چگونه سیستم‌های هوش مصنوعی طراحی و آموزش داده می‌شوند. آنها می توانند مسائل اخلاقی را مطرح کنند که این امر می‌تواند به ویژه وقتی فناوری‌ها روی بخش بزرگی از جمعیت، پیرامونِ چیزی مثل سلامت عمومی تأثیر می‌گذارند مشکل ساز باشد.
 

همه چیز در مورد داده‌هاست

تجزیه و تحلیل سنتی شیوع بیماری‌های، برای پیش بینی احتمال گسترش بیماری در مدت زمانی کوتاه، به موقعیت شیوع بیماری، تعداد موارد بیماری و دوره زمانی بیماری - مکان بیماری، حامل بیماری و زمان ابتلا - نگاه می‌کند.
 
 
 
تصویر: سیستم‌های هوش مصنوعی به منظور پیش بینی شیوع بیماری، انواع مختلفی از داده‌ها، مانند پروازهای داخلی و خارجی از فرودگاه ووهان تیانهه را بررسی می‌کنند. Painjet / ویکی مدیا Commons، CC BY-SA
 
تلاش‌های اخیر با استفاده از هوش مصنوعی و علوم داده باعث شده است تا منابع داده‌های مختلف زیادی را شامل شود و این امر باعث می‌شود پیش بینی‌هایی در مورد چگونگی شیوع آن صورت گیرد. با ظهور فیس بوک، توییتر و دیگر سایتهای رسانه‌ای اجتماعی و چند رسانه‌ای میکرو، اطلاعات بیشتر و بیشتری می‌توانند با یک مکان ارتباط داده شوند و برای آگاهی در مورد رویدادی مانند شیوع ، داده کاوی شوند. هر مدل از هوش مصنوعی فقط به اندازه داده‌هایی که برای آموزش آن استفاده می‌شود خوب است. این داده‌ها می‌توانند شامل بحث در مورد کارمندان پزشکی و در مورد موارد غیر معمول تنفسی و پست‌های رسانه‌های اجتماعی در مورد بیماری باشد.
 
بخش اعظم این داده‌ها کاملاً ساختاری نیستند، به این معنی که کامپیوترها نمی‌توانند به راحتی آن را درک کنند. داده‌های بدون ساختار می‌توانند در قالب اخبار، نقشه پرواز، پیام در رسانه‌های اجتماعی، بررسی مواردی از افراد، فیلم و تصاویر باشند. از طرف دیگر، داده‌های ساختاری مانند تعداد موارد گزارش شده بر اساس موقعیت مکانی، جدول بندی شده‌تر هستند و به طور کلی نیازی به پردازش آن چنانی لازم برای برخی موارد پیچیده ندارند تا رایانه‌ها بتوانند آن را تفسیر کنند.
 
تکنیکهای جدیدتر مانند یاد گیری عمیق می‌توانند به ایجاد داده‌های بدون ساختار کمک کنند. این الگوریتم‌ها در شبکه‌های عصبی مصنوعی اجرا می‌شوند، که از هزاران پردازنده کوچک بهم پیوسته تشکیل شده‌اند، دقیقاً مانند نورون‌های مغز. پردازنده‌ها در لایه‌ها مرتب شده‌اند و داده‌ها در هر لایه ارزیابی می‌شوند و یا حذف می‌شوند یا به لایه بعدی منتقل می‌شوند. با چرخ زنی داده‌ها از میان لایه‌ها در یک حلقه بازخورد، یک الگوریتم یاد گیری عمیق می‌آموزد که چگونه، به عنوان مثال، گربه‌ها را در فیلم‌های YouTube شناسایی کند.
 
محققان، الگوریتم‌های یاد گیری عمیق را برای درک داده‌های بدون ساختار با آموزش دادن به آنها برای شناخت مؤلفه‌های انواع خاصی از موارد، آموزش می‌دهند. به عنوان مثال، محققان می‌توانند با آموزش آنها با استفاده از تصاویری از چندین نوع دستگیره و لبه، الگوریتمی را برای تشخیص یک فنجان آموزش دهند. و از این طریق می‌تواند انواع مختلفی از فنجان‌ها را تشخیص دهد، و نه فقط فنجان‌هایی که دارای ویژگی خاصی هستند.
 
هر مدل از هوش مصنوعی فقط به اندازه داده‌هایی که برای آموزش آن استفاده می‌شود خوب است. داده‌های بسیار اندک و نتایج حاصل از این مدل‌های رد یابی بیماری می‌تواند کم رنگ باشد. به طور مشابه، کیفیت داده‌ها بسیار مهم است. برای کنترل کیفیت داده‌های بدون ساختار، عواملی از جمله داده‌های منبع جمعیت می‌تواند به ویژه چالش بر انگیز باشد. این امر به محققانی نیاز دارد تا قبل از تغذیه داده‌ها به مدل‌های خود، آنها را با دقت فیلتر کنند. این شاید یکی از دلایلی باشد که برخی محققان، از جمله کسانی که در BlueDot هستند، از داده‌های رسانه‌های اجتماعی استفاده نمی‌کنند.
 
یکی از راه‌های ارزیابی کیفیت داده‌ها، بررسی نتایج مدلهای هوش مصنوعی است. محققان نیاز دارند بازده مدل‌های خود را در برابر آنچه در دنیای واقعی رخ می‌دهد، بررسی کنند، که فرایندی است به نام راستی آزمایی زمینی. پیش بینی‌های نادرست در بهداشت عمومی، به ویژه با مثبت‌های کاذب، می تواند منجر به بروز هیستری گسترده‌ای در گسترش بیماری شود.
 
هوش مصنوعی نوید بزرگی را برای شناسایی مکانها و چگونگی سرایت بیماری‌ها دارد. دانشمندانِ داده به طور فزاینده‌ای از این تکنیک‌ها برای پیش بینی شیوع بیماری‌ها استفاده می‌کنند. به طور مشابه، محققان با استفاده از این تکنیک‌ها به نحوه حرکت مردم در داخل شهرها و این که چگونه به طور بالقوه پاتوژن‌ها را با حرکت خود پخش می‌کنند می‌پردازند.
 

تصویر: به احتمال زیاد هوش مصنوعی به این زودی‌ها جایگزین اپیدمیولوژیست‌ها و ویروس شناسان نخواهد شد. گورودنکوف / Shutterstock.com
 
منبع: واندانا جانِجا - University of Maryland, Baltimore County