تشخیص چهره: انسان يا کامپیوتر (قسمت دوم)
آیا کامپیوترها بهتر از انسانها هستند؟
در یک ویدیو با کیفیت پایین، انسانها به طور ذاتي الگوهای زمانی و بدنی را با هم ترکیب میکنند. کاری که محققان پیشرو فعلی تازه متوجه آن شدهاند. یکی از کارهای اخیر نشان داده که ترکیب انسان و کامپیوتر میتواند به تولید یک سیستم تشخیص چهره تقریباً کامل منجر شود (مقاله «ترکیب انسان و الگوریتمهای مقایسه چهره»، نوشته اِي. جي. اُتول و ديگران، مجله IEEE Trans ويژهنامه سيستمها، انسان و سايبرنتيك سال 2007.
شكل 3 - حالتهاي متنوع چهره يك شخص واحد
بررسی جديدترين فناوريها
کشف صورت
یکی از پرکاربردترین و قویترین الگوریتمهای تشخیص چهره توسط بلویولا و مایکل جونز6 طراحی شده است. آنها برای تشخیص اشیا، شیوهای مبتنی بر یادگیری ماشینی را معرفیکردند که در آن از طریق ترکیب تعداد زیادی یادگیرنده ضعیف، یک سیستم طبقهبندیکننده قوی آموزش داده میشود. برای مسئلهای که تنها نیازمند دو دسته است و با نمونههای تمرینی برچسبدار، یک الگوریتم یادگیری آدابوست (Adaboost يا Adaptive Boosting)، میتواند تعداد اندکی از مشخصههای بصری را انتخاب كند تا بیشترین دقت طبقهبندی فراهم شود.شكل 4 نمونهای از عملکرد الگوریتم معمول کشف چهره و خصوصیت را نشان میدهد.
شكل 4- نمونهای از سیستم کشف چهره و استخراج خصوصیات (شكل از هانکیو مون و همکاران؛ مقاله پردازش شكل، مجله IEEE Trans.، ويژهنامه پردازش تصوير شماره نوامبر 2002).
سالهای نخست
ژست، نورپردازی و حالت چهره
به این ترتیب، شیوه مبتنی بر مدل سهبعدی قابل تغییر توانست در تشخیص تصاویر چهرهای که از روبهرو گرفته نشده بودند، نرخ تشخیص بالایی را از خود نشان دهد. حالتهای فرعی زیادی از این شیوه با درجههای گوناگون موفقیت عرضه شدهاند. اغلب این شیوههای مبتنی بر مدل سهبعدی، به محاسبات سنگین نیاز دارند و به طور معمول باید تعداد کمی از مشخصات و الگوها به صورت دستی انتخاب شوند. در کنار توسعه شیوههای مبتنی بر مدل سهبعدی قابل تغییر، روشهایی برای نرمالسازی نورپردازی باعث جلب توجه محققان عرصه بینایی کامپیوتری شد. تلاشهای اولیه برای کاهش اثر نورپردازی شامل حذف تعداد کمی از نخستين مقادیر آیگن مربوط به بسط اجزاي اصلی صورت ميشده که این کار با استفاده ازسمت و جهت تغییر طیف رنگی به عنوان یک مشخصه یا ساخت یک زیر فضای نمونه با نام مخروط نورپردازی (Illumination Cone) برای ثبت تصویر شیء لامبرتی محدب انجام میشد. مدلهای همسازهای کروی ابعاد پایین(Low-Dimensional Spherical Harmonics Representations) نیز برای تشخیص چهره در شرایط نوری متفاوت مؤثر شناخته شدهاند. همچنین از طریق توسعه روش مبتنی بر مدل سهبعدی قابل تغییر، روشهايي پیشنهاد شدهاند که میتوانند الگویی از چهره را تولید کنند که نسبت به تغییرات نور ثابت باشد. پیشنهاد دیگر عبارت است از استفاده از محاسبه و ساخت یک تصویر خود تقسیمی که از طریق تقسیم تصویر اصلی بر کپی ملایم شده آن (کپی که در آن شدت تیره و روشنها کاهش یافته است) به دست میآید و در نتیجه نسبت به تغییرات نورپردازی حساس نخواهد بود. این روش نوعی الگوریتم استریو فتومتریک عمومی است که امکان تغییر شکلهای درون گروهی را فراهم میآورد. در تحقیقات جدیدتر، محققان الگوریتم فیلتر اتفاقی (Stochatic) و غیرایستایی را توسعه دادهاند که برای تخمین نقشههای بازتابی (Albedo) تشخیص چهره غیر حساس به نورپردازی استفاده ميشود. شكل 5 نمونه تخمین این نقشهها و مدلهای سهبعدی را از یک تصویر واحد نشان میدهد. اما بيشتر محققان بر این نکته توافق دارند که این روشها نسبت به روشهای زیر فضای آیگن و... در تشخیص چهره با نورپردازیهای متفاوت، موفقتر عمل میکنند، اما همه آنها روی مجموعه دادههای کنترل شده نظیر مجموعه B در دانشگاه ییل یا مجموعه PIE جمعآوری شده در دانشگاه کارنگی ملون آزمایش شدهاند. طراحی روشهایی که در برابر تغییرات نورپردازی در محیطهای کنترل نشده مقاوم و قدرتمند باشند، هنوز مسئلهای حل نشده به شمار میرود. تحلیل و تشخیص حالتهای چهره در تحقیقات مربوط به تعامل انسان و کامپیوتر بسیار مورد مطالعه قرار گرفته است9. هویت و حالت چهره ممکن است با سیستمهای جداگانهای پردازش شوند. برای تشخیص خودكار حالتهای چهره روشهای بسیاری موجود است كه اغلب آنها برای حالتهای کلی و مقیاس بالای چهره مانند شادی، عصبانیت، تعجب و ترس مؤثر هستند3. یکی از زمینههایی که فعالیت تحقیقاتی در آن دنبال میشود و توسط برنامه تلویزیونی «به من دروغ بگو» (Lie to Me) به فرهنگ عامه مردم هم نفوذ کرده، تحلیل و تشخیص حالتهای مقیاس کوچک چهره است.
شكل 5- نمونههای استخراج نقشههای بازتابی غیر حساس به نورپردازی و مدلهای سه بعدی از روی تصاویری که از اینترنت دانلود شدهاند. در هر ردیف، تصویر سمت چپ از اینترنت دانلود شده است. دو تصویر بعدی مدل سه بعدی بازسازی شده را از دو زاویه دید مختلف نشان میدهند. آخرین مجموعه تصاویر از طریق ترکیب تصاویر جدید حاصل از مدل سه بعدی بر اساس ژستهای مختلف به دست آمدهاند (از مجموعه تصاویر سوما بیسواز و سایرین (Soma Biswas et al) – مقاله هوش ماشینی و تحلیل الگو - مجله IEEE Trans. می2009)
پينوشتها:
1- مقاله «نتایج مقیاس بالای FVRT 2006 و ICE 2006» نوشته پی. جی. فیلیپس و دیگران مجله
IEEE Trans ويژهنامه تحليل الگو و هوش ماشيني شماره مارس 2010
منبع:http://www.shabakeh-mag.com
ارسال توسط کاربر محترم سایت : hasantaleb
/ج