بینایی رایانهای (Computer vision) یا بینایی ماشین، یکی از شاخههای علوم کامپیوتر است که در آن، سیستم تصاویر تولیدشده در دنیای واقعی را پردازش میکند و دادههای عددی یا نمادین را بهعنوان خروجی ارائه میدهد. بینایی کامپیوتر در اصل روشهایی برای دستیابی به تصاویر، پردازش و آنالیز آنها و درک محتوای تصاویر است.
بینایی رایانهای قصد دارد، توانایی بینایی ماشینها را هر چه بیشتر به توانایی بینایی انسان نزدیکتر کند تا رایانهها نیز بتوانند توانایی مشاهده و درک اشیاء را همانند انسان داشته باشند. ماشینها با کمک بینایی کامپیوتری میتوانند اشیاء یا تصاویر را ببینند و نکاتی را در مورد آن درک کنند. فناوریهای مربوط به بینایی کامپیوتری به کاربر کمک میکند تا به گوشی آیفون خود نگاه کند و قفل گوشی باز شود. با کمک بینایی ماشین، تنها با نگاه کردن به اشیاء و اجسام، میتوان در مورد آنها اطلاعاتی کسب کرد.
تیم تحقیقاتی MIT، نام سیستم خود را DON یا Dense Object Nets نامگذاری کردهاند. دان میتواند اشیاء و اجسام مختلفی را که تاکنون ندیده است، بهراحتی ببینید. دان، اشیاء را در قالب مجموعهای از نقاط میبیند. ربات با پردازش نقاط و اتصال آنها به یکدیگر، تصویری سهبعدی از شیء مربوطه میسازد و با کمک همین تصویر میتواند شیء مورد نظر را ببیند. چنین تحولی در بینایی کامپیوتری بدین مفهوم است که لازم نیست دانشمندان برای شناساندن اشیاء به ربات، دادههای بسیاری را به سیستم وارد کنند. سیستم بهخوبی میتواند اشیایی را که پیش از این ندیده است، شناسایی کند.
هنگامی که DON، با جسمی روبهرو میشود که آشنا بهنظر میرسد، میتواند بخشهای مختلف جسم جدید را سریعتر شناسایی کند؛ بهعنوان مثال، محققان به دان، یک کفش را نشان دادند و به سیستم آموزش دادند که کفش را از روی زمین بلند کند. جالب است بدانید که وقتی کفشهای دیگری به سیستم نشان داده شد، خیلی سریع کفشها را شناسایی کرد و تشخیص داد که باید آنها را از روی زمین بلند کند. حتی اگر سیستم برای اولین بار با کفش مواجه میشد، بهراحتی میتوانست آن را تشخیص دهد. یکی از محققان تیم تحقیقاتی MIT به نام لوکاس مانولی در کنفرانس مطبوعاتی معرفی ربات دان اعلام کرد:
دان ممکن است نتواند همهی قسمتهای یک شیء را با دقت شناسایی کند. خصوصا وقتی اشیاء شکلهای متقارنی ندارند، ممکن است دان هنوز کاربرد برخی قسمتها را نداند. برای روشن شدن مطلب، مثالی برای شما طرح میکنم. مثلا اگر از دان خواسته شود، لیوانی را از روی زمین بلند کند، دان خیلی خوب لیوان را شناسایی میکند، ولی ممکن است لیوان را از دستهی آن نگیرد. در واقع دان اصلا نمیداند که قسمت دستهی لیوان چه کاربردی دارد و در شناسایی ماگ یا لیوان ممکن است فقط شکل کلی آن را در نظر بگیرد و حتی توجهی به اینکه لیوان باید در چه جهتی از روی زمین برداشته شود، ندارد.
البته با تمام کاستیهای احتمالی که بینایی ماشین میتواند داشته باشد، نباید نادیده بگیریم که رشد سریع و خوبی داشته است و کارهای بسیاری را میتواند بهانجام برساند. در آیندهی نزدیک شاهد رباتهایی با بینایی ماشین خواهیم بود که میتوانند کارهایی گوناگونی انجام دهند که پیشتر قادر به انجام آن نبودند.
روزی فراخواهد رسید که رباتها بهراحتی بتوانند اجناس مختلف را در خط تولید بستهبندی کنند یا بتوانند در مراکز بازیافت، نقش مهمی را بازی کنند. رباتها میتوانند در فرآیندهایی که امکان حضور نیروی انسانی وجود ندارد، نقش مهمی داشته باشند. آیا روزی میرسد که رباتها پشت میز بنشینند و ادارهی امور مختلف را در دست بگیرند؟ با روند روبهرشد و توسعهی رباتها، شاهد تواناییهای بیشتری در آنها هستیم. آیا روزی فراخواهد رسید که رباتها بتوانند تواناییهایی را از خود نشان بدهند که بیش از پیش، آنها را به انسانها شبیه سازد؟ باید ببینیم با این روند روبهرشد، آیندهی رباتها به چه سمتی حرکت خواهد کرد.