انتظار می‌رود تا سال 2022 بازار سخت افزار و دید کامپیوتری به 6ر48 میلیارد دلار برسد. دید کامپیوتری به جزئی از زندگی روزمره تبدیل شده است و احتمالاً حتی در صورت عدم تشخیص زمان و محل استقرار آن، مرتباً  این فناوری را تجربه می‌کنید. در این بخش دید کامپیوتری را معرفی کرده و نحوه عملکرد آن و به هفت نمونه عملی شگفت انگیز از این فناوری اشاره می‌کنیم.
دنیای ما حاوی تصاویر و فیلم‌های بی شماری از دوربین‌های موجود در دستگاه‌های تلفن همراه‌ استدید کامپیوتری که تحت عناوین بینایی کامپیوتری و کامپیوتر ویژن نیز شناخته می‌شود فرمی از هوش مصنوعی است که در آن کامپیوترها می‌توانند جهان را «ببینند»، داده‌های بصری را تجزیه و تحلیل نموده و سپس با توجه به نتیجه حاصل از این تجزیه و تحلیل تصمیم گیری کنند و یا محیط و موقعیت را درک نمایند. امروزه یکی از عوامل محرک در رشد و توسعه دید کامپیوتری میزان داده‌هایی است که تولید کرده و سپس به منظور آموزش و بهبود دید کامپیوتری مورد استفاده قرار می‌دهیم. دنیای ما حاوی تصاویر و فیلم‌های بی شماری از دوربین‌های موجود در دستگاه‌های تلفن همراه‌ است. اما در حالی که تصاویر می‌توانند عکس و فیلم را شامل شوند، به معنای داده‌های حسگرهای حرارتی یا مادون قرمز و منابع دیگر نیز می‌توانند باشند. در کنار حجم عظیمی از داده‌های بصری (بیش از سه میلیارد تصویر هر روزه به صورت آنلاین به اشتراک گذاشته می‌شود)، اکنون توان محاسباتی مورد نیاز جهت تجزیه و تحلیل این داده‌ها در دسترس بوده و مقرون به صرفه‌تر می‌باشد. همانطور که حوزه دید کامپیوتری با الگوریتم‌ها و سخت افزارهای جدید رشد کرده است، میزان دقت در تشخیص شئ نیز رو به رشد بوده است. ظرف کمتر از یک دهه، سیستم‌های امروزی از 50 درصد دقت به 99 درصد رسیده‌اند که این امر باعث شده است این سیستم‌ها نسبت به انسان در واکنش سریع به ورودی‌های بصری دقیق‌تر عمل کنند.
 

نحوه عملکرد دید کامپیوتری

یکی از مؤلفه‌های مهم جهت تحقق تمام قابلیتهای هوش مصنوعی، برخوردار ساختن ماشین آلات از قدرت بینایی است. ماشین‌ها برای تقلید از بینایی انسان، باید تصاویر را دریافت کرده، آنها را پردازش، تجزیه و تحلیل و درک کنند. رشد شگرف در رسیدن به این نقطه عطف به لطف فرآیند یادگیری مکرر بوده که به وسیله شبکه‌های عصبی مصنوعی امکان پذیر شده است. فرض کنیم هدف شناسایی تصاویر مربوط به گربه در فیلم‌های گرفته شده باشد، مجموعه داده مورد استفاده توسط شبکه‌های عصبی باید هم حاوی تصاویر و فیلم‌های گربه و هم نمونه‌هایی بدون گربه باشد. به هنگام اجرای یک شبکه عصبی از طریق داده و سیگنال، تصویری از یک گربه شناسایی می‌شود. شبکه‌های عصبی برای تشخیص قسمتهای مختلف تصویر از الگوهایی استفاده می‌کنند. به جای آن که یک برنامه نویس ویژگیهایی از جمله سبیل و دم را تعریف کند که تداعی کننده گربه هستند، ماشین‌ها از میلیونها تصویر بارگذاری شده نحوه تشخیص آن را می‌آموزند.
 

هفت نمونه شگفت انگیز از دید کامپیوتری

در این بخش برخی از جالب‌ترین نمونه‌های عملی دید کامپیوتری را معرفی می‌کنیم.
 

1- وسایل نقلیه خودکار

وجود دید کامپیوتری برای به کار انداختن خودروهای خودران ضروری است. خودروسازانی همچون تسلا، بی‌ام‌دبلیو (بی‌ام‌و)، ولوو و آئودی از دوربین‌های چندگانه، لیدار، رادار و سنسور اولتراسونیک برای دریافت تصاویر از محیط استفاده می‌کنند تا خودروهای خودران آنها بتوانند به منظور رانندگی ایمن، اشیاء، خط کشی‌های موجود در خیابان، علائم و سیگنالهای راهنمایی و رانندگی را تشخیص دهند.
 

2- اپلیکیشن گوگل ترنسلیت

تنها کاری که باید برای خواندن علائم در یک زبان خارجی انجام دهید این است که دوربین گوشی خود را بر روی این کلمات گرفته و اجازه دهید اپلیکیشن گوگل ترنسلیت تقریباً بلافاصله معنای آن را به زبان مورد نظر شما ترجمه کند. این برنامه با استفاده از تشخیص کاراکتر نوری برای دیدن تصویر و واقعیت افزوده برای پوشش دقیق ترجمه، ابزاری مناسب به حساب آمده که از دید کامپیوتری استفاده می‌کند.
 

3- تشخیص چهره

چین به طور قطع پیشرو در استفاده از فناوری تشخیص چهره است و آن را برای کار در مراکز پلیس، پرتال‌های پرداخت، محل‌های بازرسی امنیتی در فرودگاه و حتی توزیع دستمال توالت و جلوگیری از سرقت آن در پارک تیانتان در پکن و بسیاری موارد دیگر مورد استفاده قرار می‌دهد.
 

4- بهداشت و درمان

از آنجا که 90 درصد از کل داده‌های پزشکی مبتنی بر تصویر است، دید کامپیوتری مصارف زیادی در پزشکی خواهد داشت. از امکان استفاده از روشهای جدید تشخیصی برای تحلیل سی تی اسکن، ماموگرافی و سایر اسکن‌ها گرفته تا نظارت بر بیماران به منظور تشخیص زودتر عوارض و کمک به جراحی، انتظار می‌رود که مراکز درمانی و متخصصان و بیماران ما از دید کامپیوتری نه تنها اکنون بلکه در آینده نیز بهره‌مند شوند.
 

5- ردیابی بی درنگ در ورزش

تعیین مسیر و ردیابی توپ و گوی در ورزشهای تلویزیونی مدتی است که رواج یافته است، اما دید کامپیوتری به تجزیه و تحلیل استراتژی، عملکرد بازیکن و رتبه بندی و از آن جمله کمک می‌کند.
 

6- کشاورزی

در نمایشگاه سی ایی اس (CES) 2019 جان دیر از یک ماشین کومباین نیمه خودکار رونمایی کرد که از هوش مصنوعی و دید کامپیوتری برای تجزیه و تحلیل کیفیت غلات به هنگام برداشت استفاده می‌کند.
انتظار می‌رود با این کار میزان علف کش‌های مورد نیاز به 90 درصد کاهش یابدپتانسیل بسیار خوبی برای دید کامپیوتری جهت تشخیص علفهای هرز به منظور استفاده مستقیم از علف کش بر روی آنها به جای استفاده بر روی محصول وجود دارد. انتظار می‌رود با این کار میزان علف کش‌های مورد نیاز به 90 درصد کاهش یابد.
 

7- تولیدات صنعتی

دید کامپیوتری به تولید کنندگان کمک می‌کند تا به روشهای مختلف با ایمنی بیشتر، هوشمندانه‌تر و کارآمدتر عمل کنند. نگهداری و تعمیرات پیشگویانه تنها یک نمونه از تجهیزاتی است که به وسیله دید کامپیوتری تحت نظارت قرار داشته تا قبل از آنکه یک خرابی موجب تعطیلی پرهزینه برای دستگاه شود بتواند به موقع آن را تشخیص دهد. بسته بندی و کیفیت محصول مورد بررسی قرار گرفته و محصولات معیوب همچنین به وسیله دید کامپیوتری شناسایی شده و میزان این محصولات کاهش می‌یابد.

در حال حاضر تعداد زیادی از برنامه‌های کاربردی دنیای حقیقی برای دید کامپیوتری وجود دارد، با این وجود این فناوری هنوز در ابتدای راه خود قرار دارد. با ادامه همکاری انسان و ماشین، نیروی کار انسان قادر خواهد بود تا بر روی کارهای با ارزش‌تر تمرکز کند، زیرا ماشین آلات فرایندهایی که به تشخیص تصویری متکی هستند را به صورت خودکار انجام خواهند داد.


منبع: linkedin