هوش مصنوعی هوشمندتر: یادگیری ماشین بدون داده‌های منفی

یک تیم تحقیقاتی یک روش جدید برای یادگیری ماشین را به طور موفقیت آمیز توسعه داده است که به هوش مصنوعی اجازه می دهد طبقه بندی ها را بدون آنچه که «داده های منفی» نامیده می شود، پیدا کند که می تواند به برنامه هایی گسترده تر برای انجام وظایف طبقه بندی منجر شود.

چهارشنبه، 14 فروردين 1398

تخمین زمان مطالعه:

پدیدآورنده: علی رضایی میر قائد

موارد بیشتر برای شما

توضیح تصویر: نمایش شماتیک داده های مثبت (سیب) و عدم وجود داده های منفی (موز) با تصویری از اطمینان از داده های سیب.
اعتبار: RIKEN

گزارش کامل

یک تیم تحقیقاتی از مرکز ریکِن برای پروژه هوش پیشرفته روش جدیدی برای یادگیری ماشین را به وجود آورده است که اجازه می دهد تا هوش مصنوعی طبقه بندی ها را بدون آنچه که «داده های منفی» نامیده می شود، پیدا کند که می تواند منجر شود به کاربردهای گسترده تر در انواع وظایف طبقه بندی

طبقه بندی چیزها برای زندگی روزمره ما حیاتی است. به عنوان مثال، ما باید ایمیل های اسپم، اخبار سیاسی جعلی، و همچنین چیزهای عادی بیشتری مانند اشیا یا چهره‌ها را شناسایی کنیم. هنگام استفاده از هوش مصنوعی، چنین وظایفی براساس "تکنولوژی طبقه بندی" در یادگیری ماشین است – با واداشتن کامپیوتر به یادگیری با استفاده از مرز جداسازی داده های مثبت و منفی. به عنوان مثال، داده های "مثبت" عکس هایی شامل یک چهره‌ی خوشحال و داه های "منفی" عکس هایی شامل یک چهره‌ی غمگین هستند. هنگامی که یک مرز طبقه بندی آموخته می شود، کامپیوتر می تواند تعیین کند که آیا داده ای خاص مثبت یا منفی است. مشکل این تکنولوژی این است که برای هر فرایند یادگیری داده های مثبت و منفی نیاز به اطلاعات دارد و داده های منفی در بسیاری از موارد موجود نیست (برای مثال، پیدا کردن عکس هایی با برچسب «این عکس در زمره‌ی چهره‌های غمگین است» بسیار دشوار است، زیرا اکثر مردم در مقابل دوربین لبخند می زنند). با استفاده از روش جدید ما، می توانیم اجازه دهیم کامپیوترها یک طبقه بندی را تنها از اطلاعات مثبت مجهز به اعتماد به نفس یاد بگیرند

از لحاظ برنامه های زندگی واقعی، هنگامی که یک خرده فروش در تلاش است پیش بینی کند که چه کسی خرید را انجام می دهد، می تواند به راحتی اطلاعاتی را در مورد مشتریانی که از او خرید کرده اند (داده های مثبت) پیدا کند، اما اساسا غیرممکن است که اطلاعاتی را در مورد مشتریانی که از او خرید نکرده‌اند (داده های منفی) به دست آورد، زیرا دسترسی به اطلاعات رقبای خود ندارد. مثال دیگر یک وظیفه مشترک برای توسعه دهندگان برنامه است: آنها باید پیش بینی کنند که کاربران با استفاده از برنامه (مثبت) یا توقف استفاده از برنامه (منفی) ادامه خواهند داد. با این حال، هنگامی که کاربر لغو اشتراک می کند، توسعه دهندگان داده های کاربر را از دست می دهند، زیرا آنها باید به طور کامل، با توجه به سیاست حفظ حریم خصوصی برای محافظت از اطلاعات شخصی، اطلاعات مربوط به کاربر لغو کننده اشتراک را حذف کنند.

طبق نظر Takashi Ishida، مؤلف راهبر، از RIKEN AIP، "روشهای طبقه بندی قبلی نمی توانند با وضعیتی که اطلاعات منفی در دسترس نیستند، کنار بیایند، اما ما این را برای رایانه ها ممکن ساخته ایم که تنها با اطلاعات مثبت، تا زمانی که یک نمره اعتماد به نفس برای داده های مثبت داشته باشیم، یاد بگیرند که، از اطلاعاتی از قبیل قصد خرید و یا نرخ فعال کاربران برنامه، ساخته شوند. با استفاده از روش جدید ما، می توانیم اجازه دهیم کامپیوترها یک طبقه بندی را تنها از اطلاعات مثبت مجهز به اعتماد به نفس یاد بگیرند."

Ishida همراه با پژوهشگر Niu Gang از گروهش و ماساشی سوگیاما ، رهبر تیم، پیشنهاد کرد که آنها به راحتی با اضافه کردن امتیاز اعتماد به نفس، که به لحاظ ریاضی مربوط است به احتمال اینکه داده ها متعلق به یک کلاس مثبت است یا نه، اجازه دهند کامپیوترها به خوبی یاد بگیرند. آنها موفق به توسعه یک روش شدند که می تواند اجازه دهد کامپیوترها مرز بندی طبقه بندی را فقط از اطلاعات مثبت و اطلاعاتی روی اعتماد به نفس آنها (قابلیت اعتماد مثبت)، در برابر مشکلات طبقه بندی یادگیری ماشین که اطلاعات را به مثبت و منفی تقسیم می کند، به دست آورند.

برای دیدن این که این سیستم عملکرد خوبی دارد، آنها از مجموعه ای از عکس ها حاوی برچسب های مختلفی از موارد مد استفاده می کنند. به عنوان مثال، آنها "تی شرت" را به عنوان کلاس مثبت و یک مورد دیگر، مانند "صندل"، را به عنوان کلاس منفی انتخاب کردند. سپس آنها اعتماد به نفس را به عکس های "تی شرت" اضافه کردند. آنها متوجه شدند بدون دسترسی به داده های منفی (به عنوان مثال، عکس های "صندل")، در بعضی موارد، بازده روش آنها به همان اندازه‌ی یک روش است که شامل استفاده از هر دوی اطلاعات مثبت و منفی است. تکنولوژی طبقه بندی ما می تواند در موقعیت های جدیدی مورد استفاده قرار گیرد که با توجه به اطلاعات، مقررات و یا محدودیت های کسب و کار تنها داده های مثبت را می توان جمع آوی کرد.

طبق گفته ایشیا، "این کشف می تواند طیف وسیعی از برنامه هایی که در آن از تکنولوژی طبقه بندی می توان استفاده کرد را گسترش دهد. حتی در زمینه هایی که یادگیری ماشین به طور فعالانه‌ای مورد استفاده قرار گرفته است، تکنولوژی طبقه بندی ما می تواند در موقعیت های جدیدی مورد استفاده قرار گیرد که با توجه به اطلاعات، مقررات و یا محدودیت های کسب و کار تنها داده های مثبت را می توان جمع آوی کرد. در آینده ای نزدیک، ما امیدواریم از تکنولوژی ما در زمینه های مختلف تحقیقاتی مانند پردازش زبان طبیعی، دید رایانه، روباتیک و بیوانفورماتیک استفاده شود."

محققان نشان داده اند که چگونه رویکردهای هوش مصنوعی می توانند به شناسایی رابطه های علت - اثر در بین داده ها کمک کنند الگوریتم های یادگیری ماشین در جستجوی الگوهای پیچیده در داده های بزرگ هستند، بنابراین محققان اغلب از آنها برای پیش بینی استفاده می کنند. محققان این فن آوری را به فراتر از پیدا کردن صرفاً همبستگی‌ها پیش می‌برند تا کمک کنند به کشف روابط علتِ پنهان و هدایت کنند به تحقق کشفیات علمی. محققان با مطالعه پروتئین ها در حال یکی کردن تکنیک های یادگیری ماشین با کارشان هستند. یکی از چالش های آنها فقدان روش هایی برای شناسایی رابطه های علت - اثر در داده های حاصل از شبیه سازی های پویایی مولکولی بوده است.

برگرفته از سایت ساینس دیلی

گزارش کامل

مقالات مرتبط

تازه های مقالات

بیشترین بازدید هفته