انتظار میرود تا سال 2022 بازار سخت افزار و دید کامپیوتری به 6ر48 میلیارد دلار برسد. دید کامپیوتری به جزئی از زندگی روزمره تبدیل شده است و احتمالاً حتی در صورت عدم تشخیص زمان و محل استقرار آن، مرتباً این فناوری را تجربه میکنید. در این بخش دید کامپیوتری را معرفی کرده و نحوه عملکرد آن و به هفت نمونه عملی شگفت انگیز از این فناوری اشاره میکنیم.
دنیای ما حاوی تصاویر و فیلمهای بی شماری از دوربینهای موجود در دستگاههای تلفن همراه استدید کامپیوتری که تحت عناوین بینایی کامپیوتری و کامپیوتر ویژن نیز شناخته میشود فرمی از هوش مصنوعی است که در آن کامپیوترها میتوانند جهان را «ببینند»، دادههای بصری را تجزیه و تحلیل نموده و سپس با توجه به نتیجه حاصل از این تجزیه و تحلیل تصمیم گیری کنند و یا محیط و موقعیت را درک نمایند. امروزه یکی از عوامل محرک در رشد و توسعه دید کامپیوتری میزان دادههایی است که تولید کرده و سپس به منظور آموزش و بهبود دید کامپیوتری مورد استفاده قرار میدهیم. دنیای ما حاوی تصاویر و فیلمهای بی شماری از دوربینهای موجود در دستگاههای تلفن همراه است. اما در حالی که تصاویر میتوانند عکس و فیلم را شامل شوند، به معنای دادههای حسگرهای حرارتی یا مادون قرمز و منابع دیگر نیز میتوانند باشند. در کنار حجم عظیمی از دادههای بصری (بیش از سه میلیارد تصویر هر روزه به صورت آنلاین به اشتراک گذاشته میشود)، اکنون توان محاسباتی مورد نیاز جهت تجزیه و تحلیل این دادهها در دسترس بوده و مقرون به صرفهتر میباشد. همانطور که حوزه دید کامپیوتری با الگوریتمها و سخت افزارهای جدید رشد کرده است، میزان دقت در تشخیص شئ نیز رو به رشد بوده است. ظرف کمتر از یک دهه، سیستمهای امروزی از 50 درصد دقت به 99 درصد رسیدهاند که این امر باعث شده است این سیستمها نسبت به انسان در واکنش سریع به ورودیهای بصری دقیقتر عمل کنند.
دنیای ما حاوی تصاویر و فیلمهای بی شماری از دوربینهای موجود در دستگاههای تلفن همراه استدید کامپیوتری که تحت عناوین بینایی کامپیوتری و کامپیوتر ویژن نیز شناخته میشود فرمی از هوش مصنوعی است که در آن کامپیوترها میتوانند جهان را «ببینند»، دادههای بصری را تجزیه و تحلیل نموده و سپس با توجه به نتیجه حاصل از این تجزیه و تحلیل تصمیم گیری کنند و یا محیط و موقعیت را درک نمایند. امروزه یکی از عوامل محرک در رشد و توسعه دید کامپیوتری میزان دادههایی است که تولید کرده و سپس به منظور آموزش و بهبود دید کامپیوتری مورد استفاده قرار میدهیم. دنیای ما حاوی تصاویر و فیلمهای بی شماری از دوربینهای موجود در دستگاههای تلفن همراه است. اما در حالی که تصاویر میتوانند عکس و فیلم را شامل شوند، به معنای دادههای حسگرهای حرارتی یا مادون قرمز و منابع دیگر نیز میتوانند باشند. در کنار حجم عظیمی از دادههای بصری (بیش از سه میلیارد تصویر هر روزه به صورت آنلاین به اشتراک گذاشته میشود)، اکنون توان محاسباتی مورد نیاز جهت تجزیه و تحلیل این دادهها در دسترس بوده و مقرون به صرفهتر میباشد. همانطور که حوزه دید کامپیوتری با الگوریتمها و سخت افزارهای جدید رشد کرده است، میزان دقت در تشخیص شئ نیز رو به رشد بوده است. ظرف کمتر از یک دهه، سیستمهای امروزی از 50 درصد دقت به 99 درصد رسیدهاند که این امر باعث شده است این سیستمها نسبت به انسان در واکنش سریع به ورودیهای بصری دقیقتر عمل کنند.
نحوه عملکرد دید کامپیوتری
یکی از مؤلفههای مهم جهت تحقق تمام قابلیتهای هوش مصنوعی، برخوردار ساختن ماشین آلات از قدرت بینایی است. ماشینها برای تقلید از بینایی انسان، باید تصاویر را دریافت کرده، آنها را پردازش، تجزیه و تحلیل و درک کنند. رشد شگرف در رسیدن به این نقطه عطف به لطف فرآیند یادگیری مکرر بوده که به وسیله شبکههای عصبی مصنوعی امکان پذیر شده است. فرض کنیم هدف شناسایی تصاویر مربوط به گربه در فیلمهای گرفته شده باشد، مجموعه داده مورد استفاده توسط شبکههای عصبی باید هم حاوی تصاویر و فیلمهای گربه و هم نمونههایی بدون گربه باشد. به هنگام اجرای یک شبکه عصبی از طریق داده و سیگنال، تصویری از یک گربه شناسایی میشود. شبکههای عصبی برای تشخیص قسمتهای مختلف تصویر از الگوهایی استفاده میکنند. به جای آن که یک برنامه نویس ویژگیهایی از جمله سبیل و دم را تعریف کند که تداعی کننده گربه هستند، ماشینها از میلیونها تصویر بارگذاری شده نحوه تشخیص آن را میآموزند.
هفت نمونه شگفت انگیز از دید کامپیوتری
در این بخش برخی از جالبترین نمونههای عملی دید کامپیوتری را معرفی میکنیم.
1- وسایل نقلیه خودکار
وجود دید کامپیوتری برای به کار انداختن خودروهای خودران ضروری است. خودروسازانی همچون تسلا، بیامدبلیو (بیامو)، ولوو و آئودی از دوربینهای چندگانه، لیدار، رادار و سنسور اولتراسونیک برای دریافت تصاویر از محیط استفاده میکنند تا خودروهای خودران آنها بتوانند به منظور رانندگی ایمن، اشیاء، خط کشیهای موجود در خیابان، علائم و سیگنالهای راهنمایی و رانندگی را تشخیص دهند.
2- اپلیکیشن گوگل ترنسلیت
تنها کاری که باید برای خواندن علائم در یک زبان خارجی انجام دهید این است که دوربین گوشی خود را بر روی این کلمات گرفته و اجازه دهید اپلیکیشن گوگل ترنسلیت تقریباً بلافاصله معنای آن را به زبان مورد نظر شما ترجمه کند. این برنامه با استفاده از تشخیص کاراکتر نوری برای دیدن تصویر و واقعیت افزوده برای پوشش دقیق ترجمه، ابزاری مناسب به حساب آمده که از دید کامپیوتری استفاده میکند.
3- تشخیص چهره
چین به طور قطع پیشرو در استفاده از فناوری تشخیص چهره است و آن را برای کار در مراکز پلیس، پرتالهای پرداخت، محلهای بازرسی امنیتی در فرودگاه و حتی توزیع دستمال توالت و جلوگیری از سرقت آن در پارک تیانتان در پکن و بسیاری موارد دیگر مورد استفاده قرار میدهد.
4- بهداشت و درمان
از آنجا که 90 درصد از کل دادههای پزشکی مبتنی بر تصویر است، دید کامپیوتری مصارف زیادی در پزشکی خواهد داشت. از امکان استفاده از روشهای جدید تشخیصی برای تحلیل سی تی اسکن، ماموگرافی و سایر اسکنها گرفته تا نظارت بر بیماران به منظور تشخیص زودتر عوارض و کمک به جراحی، انتظار میرود که مراکز درمانی و متخصصان و بیماران ما از دید کامپیوتری نه تنها اکنون بلکه در آینده نیز بهرهمند شوند.
5- ردیابی بی درنگ در ورزش
تعیین مسیر و ردیابی توپ و گوی در ورزشهای تلویزیونی مدتی است که رواج یافته است، اما دید کامپیوتری به تجزیه و تحلیل استراتژی، عملکرد بازیکن و رتبه بندی و از آن جمله کمک میکند.
6- کشاورزی
در نمایشگاه سی ایی اس (CES) 2019 جان دیر از یک ماشین کومباین نیمه خودکار رونمایی کرد که از هوش مصنوعی و دید کامپیوتری برای تجزیه و تحلیل کیفیت غلات به هنگام برداشت استفاده میکند.
انتظار میرود با این کار میزان علف کشهای مورد نیاز به 90 درصد کاهش یابدپتانسیل بسیار خوبی برای دید کامپیوتری جهت تشخیص علفهای هرز به منظور استفاده مستقیم از علف کش بر روی آنها به جای استفاده بر روی محصول وجود دارد. انتظار میرود با این کار میزان علف کشهای مورد نیاز به 90 درصد کاهش یابد.
انتظار میرود با این کار میزان علف کشهای مورد نیاز به 90 درصد کاهش یابدپتانسیل بسیار خوبی برای دید کامپیوتری جهت تشخیص علفهای هرز به منظور استفاده مستقیم از علف کش بر روی آنها به جای استفاده بر روی محصول وجود دارد. انتظار میرود با این کار میزان علف کشهای مورد نیاز به 90 درصد کاهش یابد.
7- تولیدات صنعتی
دید کامپیوتری به تولید کنندگان کمک میکند تا به روشهای مختلف با ایمنی بیشتر، هوشمندانهتر و کارآمدتر عمل کنند. نگهداری و تعمیرات پیشگویانه تنها یک نمونه از تجهیزاتی است که به وسیله دید کامپیوتری تحت نظارت قرار داشته تا قبل از آنکه یک خرابی موجب تعطیلی پرهزینه برای دستگاه شود بتواند به موقع آن را تشخیص دهد. بسته بندی و کیفیت محصول مورد بررسی قرار گرفته و محصولات معیوب همچنین به وسیله دید کامپیوتری شناسایی شده و میزان این محصولات کاهش مییابد.
در حال حاضر تعداد زیادی از برنامههای کاربردی دنیای حقیقی برای دید کامپیوتری وجود دارد، با این وجود این فناوری هنوز در ابتدای راه خود قرار دارد. با ادامه همکاری انسان و ماشین، نیروی کار انسان قادر خواهد بود تا بر روی کارهای با ارزشتر تمرکز کند، زیرا ماشین آلات فرایندهایی که به تشخیص تصویری متکی هستند را به صورت خودکار انجام خواهند داد.
منبع: linkedin
در حال حاضر تعداد زیادی از برنامههای کاربردی دنیای حقیقی برای دید کامپیوتری وجود دارد، با این وجود این فناوری هنوز در ابتدای راه خود قرار دارد. با ادامه همکاری انسان و ماشین، نیروی کار انسان قادر خواهد بود تا بر روی کارهای با ارزشتر تمرکز کند، زیرا ماشین آلات فرایندهایی که به تشخیص تصویری متکی هستند را به صورت خودکار انجام خواهند داد.
منبع: linkedin