روباتیک هدایت شده با بینایی و هوش مصنوعی

آن چه در این مقاله می آید توضیحی حتی الامکان ساده از نظر تکنیکی درباره روباتیک های با هدایتِ دید و الگوریتم های یادگیری عمیق است.

سه‌شنبه، 9 شهريور 1400

تخمین زمان مطالعه:

مترجم : شیما قائم مقامی

هوش مصنوعی کامپیوتر و فناوری اطلاعات

موارد بیشتر برای شما

صنعت اتوماسیون در حال تجربه انفجار رشد و قابلیت های فناوری است. برای توضیح این فناوری پیچیده، ما از اصطلاحاتی مانند "هوش مصنوعی" برای انتقال این ایده استفاده می کنیم که راه حل ها از قبل تواناتر و پیشرفته تر هستند. اگر شما یک سرمایه گذار، رهبر تجاری یا کاربر فناوری هستید و به دنبال درک فناوری هایی هستید که در آن سرمایه گذاری می کنید، این مقاله برای شما مناسب است. آن چه در ادامه می آید توضیحی درباره روباتیک های با هدایتِ دید و الگوریتم های یادگیری عمیق است.

درست است. عنوان مقاله "هوش مصنوعی" است و با این حال تا پایان پاراگراف اول، ما به الگوریتم های یادگیری عمیق روی آورده ایم! تبلیغات صنعتی به سختی کار می کند که شما را متقاعد می کند که "هوش مصنوعی = پیشرفته و ارزشمند" در حالی که "یادگیری عمیق = بی روح و تکنیکی". اگر شما مهندس بینایی هستید که راه حل خود را طراحی می کند، این مقاله برایتان سرگرم کننده خواهد بود. اگر شما یک رهبر تجاری هستید که می خواهید اصول اولیه را درک کنید، بدانید این فقط برای شما نوشته شده است.
سه عنصر مورد نیاز برای روباتیک با هدایت بینایی بهینه شده است: توان پردازشی که با یک الگوریتم کارآمد بهینه شده است. مجموعه داده های منحصر به فردی از داده های با کیفیت بالا ، که در طول سال ها ساخته شده است. الگوریتم های هوشمند یادگیری عمیق که با تجربه های مختلف در برنامه های تجاری آموزش دیده اند.

انواع سیستم های بینایی مورد استفاده در انبارها و محیط های توزیع

سه نوع یا کاربرد اصلی سیستم های بینایی وجود دارد که در محیط های انبارداری و توزیع استفاده می شود. آنها عبارتند از بازرسی و نقشه برداری، انتخاب و جا دادن بدون یادگیری عمیق، و انتخاب و جا دادن با یادگیری عمیق. همه انواع سیستم های بینایی شامل سه عنصر اصلی هستند: ورودی (دوربین) ، پردازنده (کامپیوتر و برنامه)، و خروجی (روبات). همه انواع ممکن است از دوربین ها و روبات های مشابه استفاده کنند. برنامه متفاوت است.

تصویر: ورودی ، پردازنده و خروجی

بازرسی و نقشه برداری

سیستم های بینایی برای بازرسی در انواع برنامه های کاربردی روبات صنعتی مورد استفاده قرار می گیرند و خروجی های "قبولی / ردی"، "ارائه / عدم ارائه" یا یک مقدار اندازه گیری را ارائه می دهند. نتیجه، گام بعدی در یک فرایند را تعیین می کند. یک مثال، استفاده از یک سیستم بینایی در یک سلول تولیدی برای بررسی کمیت موجود، رنگ یا سایر ویژگی های از پیش تعریف شده (به عنوان مثال، 3 قرمز، 1 زرد، 2 آبی) است. نتایج به یک سیستم پردازش خارجی ارسال می شود که مجموعه ای از اقدامات از پیش تعیین شده را انجام می دهد.

سیستم های نقشه برداری کمتر مورد استفاده قرار می گیرند اما شبیه سیستم های بازرسی هستند، از این نظر که نقشه های بینایی مستقیماً به عملکرد ماشین تبدیل نمی شوند. یک مثال، روبات های متحرک مبتنی بر ناوبری بینایی (به عنوان مثال، Seegrid ) است. نقشه ایجاد شده و در پایگاه داده ذخیره می شود. مسیرهای مورد نظر از قبل محاسبه شده است.
الگوریتم های یادگیری عمیق آستانه ای ندارند که در آن داده های بیشتر (داده های بهتر و متنوع تر) دیگر منجر به بهبود عملکرد نشوند. هنگامی که روبات از طریق سیستم در مسیرهای از پیش برنامه ریزی شده حرکت می کند، سیستم بینایی توانایی تعیین موقعیت X-Y روبات را بر روی یک نقشه شناخته شده فراهم می کند. یک الگوریتم مسیریابی خارجی با استفاده از نقشه شناخته شده و خوراک دوربین زنده دستور العمل هایی را به روبات ارائه می دهد (به جلو ادامه دهید، به چپ بپیچید و غیره).

سیستم های بازرسی و نقشه برداری می توانند بسیار پیچیده باشند، که از جمله آنهاست الگوریتم های مسیریابی که روبات های متحرک را هدایت می کنند، اما نیازی به یادگیری عمیق یا هوش مصنوعی ندارند.

انتخاب و جا دادن، بدون یادگیری

سیستم های بیناییِ انتخاب و جا دادن بر روی بیشتر سلول های روباتیک نصب شده امروزه مستقر می شوند. یک کاربرد معمول، انتخاب و جا دادن در محیط های تولید با متغیرهای محدود است. به عنوان مثال، قسمتA ، B یا C را از یک منطقه مشخص بردارید و آنها را در یک منطقه مشخص قرار دهید. این سیستم ها می توانند بین اجسام و پس زمینه بر اساس ویژگی های ساده مانند: شکل، اندازه و رنگ تمایز قائل شوند. دوربین ها حرکت روبات را از طریق بازخورد حلقه بسته هدایت می کنند و به روبات ها این امکان را می دهند تا با پارامترهای تعیین شده خود بسیار سریع و دقیق عمل کنند.

تصویر: برداشت و قرار دادن خودکار بسته ها

این سیستم ها دارای "حلقه یادگیری" نیستند که سیستم را قادر می سازد امروز هوشمندتر از روزی باشد که برنامه ریزی شده است. آنها برای مجموعه ای از اشیاء و دستور العمل ها از قبل برنامه ریزی شده اند. در حالی که این سیستم ها "هوشمند" هستند، اما به مرور هوش یا یادگیری خود را اضافه نمی کنند.

در مقام مقایسه، این امر مانند داشتن یک خودروی خودران است که فقط می تواند در جاده های شناخته شده و در شرایط آب و هوایی و ترافیکی که از قبل برنامه ریزی شده است حرکت کند. اتومبیل می تواند سرعت بگیرد و سرعت خود را کاهش دهد، مسیر را تغییر دهد، در سر چراغ ها توقف کند ... اما اگر جاده جدیدی ساخته شود، ماشین نمی تواند از آن عبور کند. آیا این فناوری فوق العاده ای خواهد بود؟ مطمئناً. آیا محدودیت هایی دارد؟ بله.
سه راه حل برای یادگیری عمیق وجود دارد: قدرت پردازش رایانه، داده های با کیفیت و متنوع، و الگوریتم های یادگیری عمیق. هر نیاز بستگی به دیگری دارد.

یادگیری عمیق (موسوم به هوش مصنوعی)

پیچیده ترین سیستم های بینایی از "یادگیری عمیق" استفاده می کنند. این سیستم ها اغلب با اصطلاحات پر شوری مانند "هوش مصنوعی" توصیف می شوند. با پیچیده تر شدن مسائل، بسیاری از سیستم های غیر یادگیرنده به گونه ای به بازار عرضه می شوند که گویی دارای قابلیت (یادگیری) هوشمند هستند و باعث سردرگمی می شوند. سیستم های یادگیری عمیق نوعی یا زیر مجموعه ای از "هوش مصنوعی" هستند.

مهندسان، با یادگیری عمیق از مجموعه ای کوچک از اشیاء به عنوان پایگاه یادگیری استفاده می کنند و برنامه رایانه ای (الگوریتم) را برای تشخیص مجموعه وسیعی از اشیاء بر اساس ویژگی های یک نمونه کوچک آموزش می دهند. به عنوان مثال، اگر می توانید چند نوع علائم توقف را تشخیص دهید، می توانید از این دانش برای تشخیص بسیاری از انواع علائم توقف استفاده کنید.

برنامه یادگیری عمیق ویژگی های مستقل از اشیاء را می آموزد، به طوری که می تواند آنها را به طیف وسیعی از اشیاء تعمیم دهد. به عنوان مثال، از طریق چنین برنامه ای، روبات ها می توانند لبه یک شیء را بدون توجه به نوردهی دوربین یا شرایط نوری تشخیص دهند.

سیستم های یادگیری عمیق به یک متغیر واحد مانند رنگ متکی نیستند، زیرا چیزی به سادگی تغییر نوردهی یا روشنایی می تواند نتیجه را خراب کند. رنگ ممکن است یکی از متغیرها باشد، اما از متغیرهای انتزاعی بیشتری برای تشخیص شیء در برنامه آموزش عمیق استفاده می شود.

در مقام مقایسه، این سیستم های یادگیری عمیق که برای برنامه های انتخاب روباتیک استفاده می شوند، مانند رانندگی با تسلا در حالت خودکار کامل هستند. با استفاده از بهترین مسیر سفر در (بیشتر) هر شرایط آب و هوایی، و در همه انواع جاده ها، در هر مکانی پارک کنید و از A تا B حرکت کنید.

بلوک های اساسی برای سیستم های یادگیری عمیق

اصول یادگیری عمیق که توسط روبات های صنعتی و خودروهای خودران تسلا استفاده می شود مشابه است. اتومبیل های خودران شکل ها، اندازه ها ، رنگ ها و مکان های مختلف را برای علائم توقف تشخیص می دهند. این الگوریتم پس از مشخص شدن به عنوان علامت توقف، پاسخ را بر اساس متغیرهای خارجی مانند موقعیت و جهت حرکت سایر خودروها، عابران پیاده، ویژگی های جاده و غیره محاسبه می کند و این محاسبات باید سریع باشند.

تصویر: برداشت و قرار دادن خودکار بسته ها
پیچیده ترین سیستم های بینایی از "یادگیری عمیق" استفاده می کنند. روبات های هدایت شده با دید با برنامه های یادگیری عمیق برای کاربردهای صنعتی، انواع مختلف بسته بندی، مکان دهی و سایر متغیرها (به عنوان مثال، تا حدی پنهان شدگی زیر بسته بندی های دیگر) را تشخیص می دهند و عملکرد مستقیم ماشین را بر اساس آن متغیرها جهت می دهند. در مقایسه با اتومبیل های خودران، برخی از متغیرها برای روبات های صنعتی چندان پیچیده نیستند، اما رویکرد اساسی برای یادگیری و واکنش سریع یکسان است.

سه راه حل برای یادگیری عمیق وجود دارد: قدرت پردازش رایانه، داده های با کیفیت و متنوع، و الگوریتم های یادگیری عمیق. هر نیاز بستگی به دیگری دارد.

قدرت پردازش کامپیوتر

بیست سال پیش، بزرگ ترین ابر رایانه جهان قادر به انجام 12 ترافلاپس (12 تریلیون محاسبه در ثانیه) بود. این ابر رایانه 850،000 وات توان مصرف می کرد که برای تأمین انرژی ده ها خانه کافی است. امروزه تسلا مدل S مجهز به 10 ترافلاپس قدرت محاسباتی است!

در حالی که توانایی انجام بازی های ویدئویی با گرافیک فشرده در تسلای شما، نظر مطبوعات را به خود جلب می کند، دلیل واقعی نیاز ما به تمام قدرت محاسباتی، اجرای الگوریتم های یادگیری عمیق است که رانندگی خودگردان را امکان پذیر می کند. این تنها 5 یا 10 سال پیش بود که قدرت پردازشی مورد نیاز برای توسعه تجاری و استقرار الگوریتم های یادگیری عمیق برای استفاده خرده فروشان و تولیدکنندگان روزمره وجود نداشت.

داده ها ... نه تنها مقدار بیشتری از آنها، بلکه متغیرهای پیچیده بیشتر

الگوریتم های یادگیری عمیق با مواجه شدن با داده های پیچیده تر و متنوع تر بهتر می شوند. بهبود الگوریتم به کیفیت داده ها بستگی دارد، و نه فقط بیشتر شدن آنها. تغییرات جدید داده ها (اشیاء) که مشابه اشیاء شناخته شده موجود نیستند، بهبود الگوریتم را امکان پذیر می کند. الگوریتم برای طبقه بندی اشیاء جدید بر اساس متغیرهای سطح عمیق تر آموزش داده می شود.

در موردFizyr ، هنگامی که الگوریتم نتواند اشیاء را در سیستم فعلی به درستی تقسیم بندی کند، از مثال های منفی برای آموزش مجدد مدل استفاده می شود. منظور از یادگیری مداوم این است. البته هدف کاهش تعداد نمونه های منفی است.

الگوریتم های یادگیری عمیق آستانه ای ندارند که در آن داده های بیشتر (داده های بهتر و متنوع تر) دیگر منجر به بهبود عملکرد نشوند. به همین دلیل است که شرکت هایی که چندین سال الگوریتم های یادگیری عمیق خود را در برنامه های تجاری به کار گرفته اند، برتری قابل توجهی نسبت به تأمین کنندگان جدیدتر دارند. تجربه بیشتر منجر به الگوریتم های بهتر می شود که به نوبه خود منجر به عملکرد بهتر سیستم می شود.

الگوریتم های یادگیری عمیق

الگوریتم باید کارآمد باشد تا ترکیب داده های موجود و قدرت پردازش را به حداکثر برساند. خروجی های الگوریتم دستور العمل هایی هستند که می توانند توسط دستگاه (روبات یا ماشین) اجرا شوند.

الگوریتم های یادگیری عمیق داده ها را در سطوح یا دسته بندی های زیادی طبقه بندی می کنند. سطح های تشخیص هویت چیزهایی هستند که آن را یادگیری "عمیق" می سازند. با استفاده از یک قیاس ورزشی: چه ورزشی، نوع توپ، شرایط زمین، جهت بازی، محل و جهت حرکت بازیکنان دیگر، حرکت توپ، عمل مورد نظر شما - گل بزنید! هنگامی که در حالت یادگیری هستید، الگوریتم یادگیری عمیق تمام ورودی ها و متغیرها را محاسبه می کند (یک تریلیون محاسبه در ثانیه) و به شما دستور می دهد توپ را با پای چپ پایین و محکم بزنید و باعث حرکت توپ به گوشه سمت راست بالای دروازه شوید. گل!

تصویر: برداشت و قرار دادن خودکار بسته ها

قدرت پردازش در هماهنگی با الگوریتم های هوشمند سرعت را فعال می کند. یک عکس بگیرید، داده ها را منتقل کنید، طبقه بندی کنید، نتایج دلخواه را تعیین کنید، و دستور العمل های اجرایی را در یک ثانیه یا کمتر صادر کنید. الگوریتم ها بیش از 100 حالت درک در هر ثانیه را ارائه می دهند، با طبقه بندی برای مدیریت متفاوت اجسام، از جمله کنترل کیفیت برای تشخیص نقص. این ها عملکردهای شگفت انگیزی است که تنها با الگوریتم های هوشمند و رایانه های سریع امکان پذیر می شوند. داده های بهتر الگوریتم های هوشمندتری را فعال می کند. این یک چرخه برتری است.

سه عنصر مورد نیاز برای روباتیک با هدایت بینایی بهینه شده است: توان پردازشی که با یک الگوریتم کارآمد بهینه شده است. مجموعه داده های منحصر به فردی از داده های با کیفیت بالا ، که در طول سال ها ساخته شده است. الگوریتم های هوشمند یادگیری عمیق که با تجربه های مختلف در برنامه های تجاری آموزش دیده اند.
سه نوع یا کاربرد اصلی سیستم های بینایی وجود دارد که در محیط های انبارداری و توزیع استفاده می شود. آنها عبارتند از بازرسی و نقشه برداری، انتخاب و جا دادن بدون یادگیری عمیق، و انتخاب و جا دادن با یادگیری عمیق.

سیستم های بینایی یادگیری عمیق برای روبات های صنعتی هدایت شده با بینایی

برنامه های تجاری با استفاده از روبات ها برای انتخاب، قرار دادن، پالت کردن یا حذف پالت در محیط انبار به سه بلوک اساسی نیاز دارند: دوربین، نرم افزار و روبات ها. دوربین ها و روبات ها چشم و بازو هستند. نرم افزار مغز است.

الگوریتم یادگیری عمیق جریان داده ها را از دوربین ها گرفته و دستور العمل هایی را به روبات ها ارائه می دهد. دوربین ها و روبات ها باید برای برنامه مناسب باشند، اما هوش را ارائه نمی دهند. هر سه جزء باید با هم کار کنند تا عملکرد سیستم بهینه شود.

فناوری دوربین

فناوری دوربین جریان داده های با کیفیت بالا را امکان پذیر می کند. دوربین ها و پردازش تصویر بعدی، یک جریان داده را برای ارزیابی الگوریتم یادگیری عمیق فراهم می کند. در حالی که فناوری دوربین مهم است، از جهات مختلف با کامپیوتر یا روبات قابل مقایسه است. برخی از دوربین ها تصاویر با کیفیت بهتر ارائه می دهند یا برای برنامه های کاربردی مناسب ترند، اما خود دوربین آن چیزی نیست که یک روبات با بینایی را قادر به یادگیری عمیق کند. دوربین داده ها را ارائه می دهد اما داده ها را به دستورات قابل اجرا تبدیل نمی کند.

نرم افزار

این نرم افزار است که الگوریتم یادگیری عمیق است – که درگیر داده های ورودی از دوربین ها، فرآیند، و نتایج به دست آمده از روبات هاست.

روبات و تأثیر گذار نهایی

روبات و تأثیر گذار نهایی (معروف به gripper) همچنین نقش مهمی در عملکرد سیستم دارند. آنها باید سطح دسترسی، قدرت گرفتن، و مهارت و سرعت مورد نیاز برای اجرای برنامه را ارائه دهند. روبات و تأثیر گذار نهایی به دستورات الگوریتم یادگیری عمیق پاسخ می دهند. بدون الگوریتم یادگیری عمیق، روبات به دستورات از پیش برنامه ریزی شده و از پیش تنظیم شده پاسخ می دهد.

به طور خلاصه، هنگام مطالعه در مورد هوش مصنوعی و سیستم های روباتیک با بینایی، سه نکته را باید به خاطر بسپارید:

* الگوریتم های یادگیری عمیق، داده ها را در چند سطح یا دسته طبقه بندی می کنند.
* الگوریتم های یادگیری عمیق به داده های با کیفیت بالا و متنوع نیاز دارند.
* الگوریتم ها همان طور که مورد استفاده قرار می گیرند قدرتمندتر می شوند. تجربه مهم است.

پیشرفت های اخیر در فناوری دوربین و پردازش رایانه، بلوک های سازنده ای را فراهم می آورند که بر اساس آنها نرم افزار پیشرفته یادگیری عمیق، عملکرد روبات را قادر می سازد که به هوش مصنوعی نزدیک شود. آینده فرا رسیده است!

منبع:
جان ریپل، Esoteric Staffing