تشخیص چهره: انسان يا کامپیوتر (قسمت چهارم)


 





 
تحقیق در زمینه تشخیص چهره فرصت‌های مطالعاتی را فراهم می‌آورد که دانشمندان و مهندسان را برای چند سال آینده به چالش خواهد کشید. به عنوان نمونه، ایجاد یک سیستم تشخیص چهره قدرتمند می‌تواند در پروژه‌های مرتبط با امنیت ملی، تعامل انسان و کامپیوتر و بسیاری از موارد دیگر به کار برده شود. اين مطلب يكي از مقالات بخش ويژه نشريه ماهنامه شبكه در شماره 116 با عنوان امنيت بيومتريك مي‌باشد. جهت دريافت اين بخش ويژه به بخش پرونده‌هاي ويژه سايت مراجعه نمائيد.

مدل‌سازی خصوصیات چهره
 

مدل‌سازی مؤثر خصوصیات چهره هر سوژه از روی داده‌های ویدیویی، تنها زمانی امكان‌پذير می‌شود که تغییرات ظاهر چهره در طول مدت ویدیو را بتوان به درستی بر‌اساس فاکتورهای مختلف نظیر ژست، نور و حالت چهره دسته‌بندی كرد. برخلاف سناریوهای مبتنی بر تصویر ثابت، این تغییرات به طور ذاتی در سیستم‌های VFR وجود دارند و برای بهره‌برداری از اطلاعات افزوده موجود در داده‌های ویدیویی باید آن‌ها را نیز مدنظر قرار داد.
همچنين، با در نظر گرفتن طبیعت داده‌های ورودی، VFR معمولاً با مسئله «ردگیری» مواجه است که خود چالش بزرگی به شمار می‌آید. در بيشتر مواقع دقت ردگیری سیستم به در اختیار داشتن مدل قابل اعتمادی از قیافه و ظاهر بستگی دارد، اما نتایج تشخیص سیستم معمولاً به دقت تعیین محل چهره در ویدیوی ورودی بستگی دارد. محققان، سیستم‌های VFR موجود را بر‌اساس متد ترکیبی ردگیری و تشخیص طراحی کرده‌اند. این متد عبارت است از ترکیب یک الگوریتم تطابق گراف خصوصیات چهره در طول محور زمان با یک روش مبتنی بر مدل سه بعدی یا مدل‌های پنهان ماکاروف یا نمودار احتمالات تنوع ظاهری. جدول 2 خلاصه‌ای از روش‌های موجود را نشان می‌دهد.

جهت دهی تحقیقات آینده
 

اگرچه حجم عظیمی از سابقه‌هاي آزمایش و پژوهش در زمینه درک چهره توسط انسان وجود دارد، اما بسیاری از موارد اساسی هنوز حل نشده باقی مانده‌اند.

اطلاعات مربوط به پیکربندی
 

نخست ما باید دقیقاً تعیین کنیم که چه اطلاعاتی در رابطه با پیکره (شکل کلی) چهره برای تشخیص آن مهم است. در بيشتر تحقیقات سعی شده با تمرکز بر تفاوت بین روش‌های تشخیص چهره مبتنی بر خصوصیات چهره و روش‌های مبتنی بر پیکره چهره از این مسئله صرف نظر شود. به طور مشخص در این میان چیزی از کلیت چهره (Face Gestalt) اهمیت فوق‌العاده‌ای دارد، اما ما هنوز دقیقاً نمی‌دانیم که چگونه این مفهوم کلی را جمع‌بندی و مشخص کنیم. کدام یک از ابعاد و خصوصیات چهره می‌تواند در این سیستم نشانه‌گذاری به ما کمک کند؟

نقش آشنا بودن چهره
 

در وحله بعدي ما باید به این نتیجه برسیم که چگونه آشنا بودن چهره بر نحوه درک و تصور ما از چهره تأثیر می‌گذارد. فرآیند تشخیص چهره در انسان، می‌تواند با کاهش دقت تصویر افراد آشنا، بسیار بهتر از افرادی که فقط با آن‌ها آشنایی مختصری داریم، کنار بیاید. این امر ما را به این نتیجه می‌رساند که تصور درونی (ذهنی) ما از چهره افراد با افزایش میزان آشنایی، تغییرات زیادی را متحمل خواهد شد و در نتیجه سؤالات متعددی را پیش روی ما قرار خواهد داد. ماهیت این تغییرات چیست؟ آیا تغییر فرآیند کدگذاری از حالت مبتنی بر جزئیات به حالت کل گرا نتایج بهتری را فراهم خواهد آورد؟ چگونه می‌توان از این تغییرات برای افزایش قدرت و قابلیت سیستم در برابر تغییر شکل‌ها بهره برد؟

انتظارات از بالا به پایین
 

[در روش طراحی یا پردازش بالا به پایین، ابتدا شمای کلی طرح یا محصول ایجاد یا شناخته می‌شود، سپس مراحل بعدی بدون جزئیات توصیف شده و هرکدام جداگانه پردازش می‌شود. این روند تا رسیدن به جزئیات لازم ادامه می‌یابد. در روش پایین به بالا، از ابتدا تمام زیرسیستم‌های اولیه با جزئیات کافی طراحی و ساخته شده و از اتصال آن‌ها به یکدیگر سیستم سطح بالاتر ساخته می شود و این روند تا رسیدن به سیستم پیچیده نهایی ادامه می‌یابد].
سوم ما باید تصمیم بگیریم که انتظارات مدل بالا به پایین چه نقشی در سیستم تشخیص بازی خواهد کرد. به خاطر داشته باشید که زمان تأخیر نورون‌های انتخابی در تشخیص چهره انسانی، در ناحیه اینفروتمپورال کورتکس (Infero-Temporal Cortex) بیش از صد میلی ثانیه بود. با درنظر گرفتن ایده‌های معمول کدگذاری تناوبی [Rate Codingکه فرآیندی مربوط به واکنش نورون‌ها در برابر محرک‌های تکراری است] این تأخیر پایین ما را به این فکر می‌اندازد که شايد، فرآیند پردازش چهره ذاتاً باید به شدت مبتنی بر سیستم بازخورد به جلو (Feed Forward) باشد. در چنین صورتی، انتظارات و توقعات قبلی چگونه می‌تواند بر محاسبه هویت تأثیر بگذارد؟ همچنين، تحت چه شرایطی تأثیرات روش بالا به پایین می‌تواند به سیستم‌های تشخیص چهره معمول کمک کند؟ پاسخ به این سؤالات نه تنها نوید آشکار‌کردن فرآیند تشخیص چهره در مغز را با خود به همراه دارد، بلکه نشانه‌ها و راهنمایی‌هایی را برای توسعه راهبردهاي مؤثرتر و ارائه‌هایی مناسب کاربرد در سیستم‌های مبتنی بر بینایی کامپیوتری را نیز فراهم خواهد کرد.

تشخیص چهره از راه دور
 

اغلب سیستم‌ها و الگوریتم‌های تشخیص چهره موجود، تنها زمانی کارا هستند که سوژه در فاصله چندین ده متری دوربین قرار گرفته باشد. افزایش فاصله مؤثر در سیستم‌های تشخیص چهره، دغدغه و نیروی محرکه جدیدی در کاربردهای نظارتی است. در سناریوهای تشخیص چهره از دور، تصاویر چهره اغلب مات و محو خواهند بود، ممکن است تعداد پیکسل‌های کافی در محدوده چهره موجود نباشد و همچنین ممکن است تنوع نورپردازی و ژست‌های فراوانی داشته باشند یا در برابر این تصاویر موانعی وجود داشته باشد. در سناریوهای تشخیص چهره از دور، ثبت نشانه‌های صورت با کیفیت مناسب و کافی جهت انتقال به موتور تشخیص چهره خود چالشی بزرگ‌محسوب‌می‌شود. این مشکل به خصوص زمانی که حسگر و سوژه متحرک باشند، شدیدتر خودنمایی می‌کند. در چنین حالتی ابتدا باید ویدیو را تثبیت و استوار کرد تا بتوان چهره را پیش از تشخیص ردگیری کرد.

تشخیص چهره مبتنی بر ویدیو
 

بخش امنیت نیروی دریایی و سایر کاربردهای امنیتی، به راهکارهای قابل اعتمادی نیاز دارند که بتوانند توالی‌های ویدیویی را استخراج کنند. تشخیص چهره مبتنی بر ویدیو، در طی نه سال اخیر توجه زیادی را به خود جلب کرده است. در مراحل اولیه توسعه، تحقیقات در زمینه VFR باید با کمبود داده‌های ویدیویی دست و پنجه نرم می‌کرد. در برنامه مسابقات بزرگ بیومتریک چندگانه که توسط مؤسسه استاندارد و فناوري امریکا (NIST) برگزار شد(http://face.nist.gov/mbgc)، نزديك به 4489 سکانس ویدیویی برای توسعه و ارزیابی و امتیازبندی روش‌های تطابق ویدیو به ویدیو در اختیار شرکت کنندگان قرار گرفت. برای هرچه مؤثرتر‌شدن چنین اقداماتی، اين مشکلات باید حل شوند: ردگیری و نرمال‌سازی ژست چهره‌های متحرک به صورت بي‌درنگ، نرمال‌سازی نورپردازی، جبران کیفیت پایین تصاویر چهره با تکیه بر تکنیک‌های افزایش کیفیت و ردگیری و تشخیص همزمان. همچنین الگوریتم‌های دارای قابلیت سازگاری با تصاویر چندین گالری و سکانس‌های کاوش ویدیویی باید توسعه داده شوند.

تشخیص چهره در شبکه دوربین‌ها
 

شبکه‌های چنددوربینی به راه‌حل‌هایی بسیار معمول برای کاربردهای نظارتی مقیاس وسیع تبدیل شده‌اند. در اختیار داشتن شبکه‌ای از دوربین‌ها که بتواند تصاویر متعددی از چهره افراد تهیه کند، به توسعه‌دهندگان کمک خواهد کرد تا با روش‌های قدرتمندتری به توصیف چهره بپردازند. چنین وضعیتی اين احتمال را كه تصویر فردي با ژستی از رو‌به‌رو یا تقریباً از رو‌به‌رو ثبت شود، نیز افزایش خواهد داد. اما برای استفاده از اطلاعات این دیدهای مختلف، باید بتوانیم وضعیت سر فرد را برآورد کنیم. این کار می‌تواند به صورت صریح و از طریق محاسبه و تبدیل ژست واقعی فرد به یک حالت تخمینی قابل قبول انجام شود یا به صورت ضمنی و از طریق یک الگوریتم انتخاب دید انجام پذیرد. اما تعیین وضعیت دقیق سر سوژه به خصوص زمانی که کیفیت تصاویر پایین باشد یا کالیبراسیون هر دو دوربین داخلی و خارجی از دقت کافی جهت ترکیب مناسب چند دید مختلف برخوردار نباشد، بسیار مشکل خواهد بود. این مشکل زمانی که سوژه در فاصله دوری از دوربین‌ها قرار دارد نیز وجود خواهد داشت. همچنين مشکلات دیگری نظیر ردگیری در چند دید مختلف، ارائه و تفسیر مناسب از تصاویر چهره چند دیدی و تشخیص چهره چند دیدی هم در انتظار راه حل به سر می‌برند. و در نهايت اين موضوع ‌كه آيا الگوریتم‌های مورد نیاز باید متمرکز یا توزیع‌شده باشند، خود مسئله حیاتی دیگری است.
منبع:http://www.shabakeh-mag.com
ارسال توسط کاربر محترم سایت : hasantaleb