یک تکنیک برای بهبود یادگیری ماشین از رفتار نوزادان انسان الهام گرفته است

رفتار نوزاد، الهامبخش بهبود یادگیری ماشین شد

محققان موسسه علوم و تکنولوژی پیشرفته کره (KAIST) اخیراً یک روش عادی سازی پاداش ذاتی را ایجاد کرده اند که به عاملان هوش مصنوعی اجازه می دهد اقداماتی را انتخاب کنند که به الگوهای شهودی آنها بیشترین بهبود را می بخشد.
سه‌شنبه، 1 مرداد 1398
تخمین زمان مطالعه:
پدیدآورنده: حمید وثیق زاده انصاری
موارد بیشتر برای شما
رفتار نوزاد، الهامبخش بهبود یادگیری ماشین شد
یک نمودار مفصل از رویکرد توسعه یافته توسط محققان. (راست پایین) برای هر جفت اشیاء، محققان ویژگی های آنها را به یک رمزگذار ارتباطی می خورانند تا رابطه ی rjj و sobji حالت i شیء را به دست آورند. (چپ بالا) با استفاده از روش حریصانه، برای هر شیء، آنها ماکزیمم مقدار Q را برای به دست آوردن شیء کانون، شیء ارتباط، و عمل پیدا می کنند. (بالا سمت راست) هنگامی که شیء کانونشان و شیء ارتباطشان را جمع کردند، آنها حالت ها و تمامی ارتباط های خود را به رمزگشاهایشان خوراندند تا تغییر در موقعیت و تغییر در سرعت را پیش بینی کنند. اعتبار: چوی و یون
 
از اولین سالهای زندگی، انسانها این توانایی ذاتی را دارند که به طور مداوم یاد بگیرند و مدل های ذهنی جهان را، به سادگی با مشاهده و تعامل با چیزها یا افراد در محیط اطراف خود، بسازند. مطالعات روانشناسی شناختی نشان می دهد که انسان ها از این دانش قبلا به دست آمده به طور گسترده استفاده می کنند، مخصوصا زمانی که با موقعیت های جدید رو به رو می شوند یا هنگامی که باید تصمیم گیری کنند.
 
علیرغم پیشرفت های اخیر مهم در زمینه هوش مصنوعی (AI)، اکثر عوامل مجازی هنوز هم نیاز به صدها ساعت آموزش برای دستیابی به عملکرد سطح انسان در وظیفه های متعددی را دارند، در حالی که انسان ها می توانند یاد بگیرد که چگونه این کارها را در چند ساعت یا کمتر انجام دهند. مطالعات اخیر دو مشارکت کننده کلیدی در توانایی انسان ها برای به دست آوردن دانشی اینچنین سریع را برجسته کرده اند، که عبارتند از فیزیک شهودی و روانشناسی شهودی.
 
این مدل های شهودی که در مراحل اولیه توسعه در انسان دیده می شود، ممکن است تسهیل کننده های اصلی یادگیری آینده باشند. بر اساس این ایده، محققان موسسه علوم و تکنولوژی پیشرفته کره (KAIST) اخیراً یک روش عادی سازی پاداش ذاتی را ایجاد کرده اند که به عاملان هوش مصنوعی اجازه می دهد اقداماتی را انتخاب کنند که به الگوهای شهودی آنها بیشترین بهبود را می بخشد. در مقاله شان که در arXiv پیش انتشار یافت، محققان به ویژه  یک شبکه فیزیکی گرافیکی یکی شده با یادگیری تقویتی عمیق الهام گرفته شده توسط رفتار یادگیری مشاهده شده در نوزادان انسان را پیشنهاد کردند.
 
محققان در مقاله خود توضیح می دهند: "نوزادان انسانی را در یک اتاق با اسباب بازی هایی قرار گرفته در اطراف، در فاصله ای قابل دسترس، تصور کنید." "آنها به طور مداوم در حال چنگ زدن، پرت کردن، و انجام عملیاتی بر روی اشیاء هستند؛ گاهی اوقات آنها عواقب بعدی اقدامات خود را مشاهده می کنند، اما گاهی اوقات، علاقه شان را از دست می دهند و به سمت شیء دیگری حرکت می کنند. دیدگاه "کودک به عنوان یک دانشمند" اشاره بر این دارد که نوزادان انسانی ذاتاً برانگیخته می شوند که آزمایشات خود را هدایت کنند، اطلاعات بیشتری را کشف کنند، و در نهایت یاد می گیرند که بین اشیاء مختلف تمیز قائل شوند و ارائه های داخلی غنی تری از آنها خلق کنند."
 
مطالعات روانشناسی نشان می دهد که در اولین سال های زندگی شان انسان ها به طور مداوم در حال آزمایش با محیط اطراف خود هستند و این امر به آنها امکان می دهد تا یک درک کلیدی از جهان را شکل دهند. علاوه بر این، هنگامی که کودکان نتایجی را مشاهده می کنند که انتظارات قبلی آنها را برآورده نمی کند، که به عنوان نقض انتظار شناخته می شود، آنها اغلب تشویق می شوند تا آزمایش بیشتری برای دستیابی به درک بهتر وضعیتی که در آن هستند، انجام دهند.
 
تیم محققان در KAIST تلاش کرد تا این رفتارها را در عوامل هوش مصنوعی با استفاده از یک رویکرد تقویت یادگیری بازتولید کند. در مطالعه خود، آنها برای اولین بار یک شبکه فیزیکی گرافیکی را معرفی کردند که می تواند روابط فیزیکی بین اشیاء را استخراج کند و رفتارهای بعدی آنها را در یک محیط سه بعدی پیش بینی کند. نوزادان انسانی ذاتاً برانگیخته می شوند که آزمایشات خود را هدایت کنند، اطلاعات بیشتری را کشف کنند، و در نهایت یاد می گیرند که بین اشیاء مختلف تمیز قائل شوند. سپس، آنها این شبکه را یکی کردند با یک مدل یادگیری تقویت عمیق، که یک تکنیک هنجار سازی پاداش ذاتی را معرفی می کند که یک عامل هوش مصنوعی را تشویق به کاوش و تشخیص فعالیت هایی می کند که به طور مداوم مدل شهودیش را بهبود خواهند داد.
 
محققان با استفاده از یک موتور فیزیک سه بعدی نشان دادند که شبکه فیزیک گرافیکی آنها می تواند به نحو مؤثری موقعیت ها و سرعت های اشیاء مختلف را استنتاج کند. آنها همچنین دریافتند که رویکرد آنها به شبکه یادگیری تقویت عمیق اجازه می داد تا به طور مداوم مدل شهودیش را بهبود بخشد، و آن را تشویق کند به تعامل با اشیاء صرفا بر مبنای تحریک های ذاتی.
 
در یک سری از ارزیابی ها، تکنیک جدیدی که توسط این تیم از محققان تدبیر شده، دقت قابل توجهی را به دست آورد، با عامل هوش مصنوعی اجرا کننده‌ی تعداد بیشتری از اقدامات اکتشافی مختلف. در آینده، این می تواند توسعه ابزارهای یادگیری ماشین را اطلاع دهد که می تواند از تجربیات گذشته خود سریع تر و موثرتر یاد بگیرد.
 
محققان در مقاله خود توضیح می دهند: "ما شبکه مان را در هر دو حالت ثابت و غیر ثابت در صحنه های مختلف با اشیاء کروی با جرم ها و شعاع های مختلف آزمایش کرده ایم." "امید ما این است که این مدل های شهودی پیش پرورده بعداً به عنوان یک دانش قبلی برای دیگر وظایف هدفدار مثل بازی های آتاری یا پیش بینی های ویدئویی مورد استفاده قرار گیرد."
 

اشاره ای به یک رویکرد الهام گرفته از زیست شناسی برای افزایش یادگیری در ANNها

مغز انسان به طور مداوم با گذشت زمان تغییر می کند، و ارتباطات جدید سیناپسی را براساس تجارب و اطلاعاتی که طی یک عمر فرا گرفته است، شکل می دهد. در طی چند سال گذشته، محققان هوش مصنوعی (AI) تلاش کرده اند تا این قابلیت جذاب، شناخته شده به عنوان قالب پذیری را در شبکه‌های عصبی مصنوعی (ANNs) بازتولید کنند.
 
مترجم: حمید وثیق زاده انصاری
منبع: اینگرید فَدِلی، Tech Xplore


مقالات مرتبط
ارسال نظر
با تشکر، نظر شما پس از بررسی و تایید در سایت قرار خواهد گرفت.
متاسفانه در برقراری ارتباط خطایی رخ داده. لطفاً دوباره تلاش کنید.
مقالات مرتبط
موارد بیشتر برای شما
بررسی مرقع و قطاع در خوشنویسی
بررسی مرقع و قطاع در خوشنویسی
خیابانی: آقای بیرانوند! من بخواهم از نام بردن تو معروف بشوم؟ خاک بر سر من!
play_arrow
خیابانی: آقای بیرانوند! من بخواهم از نام بردن تو معروف بشوم؟ خاک بر سر من!
توضیحات وزیر رفاه در خصوص عدم پرداخت یارانه
play_arrow
توضیحات وزیر رفاه در خصوص عدم پرداخت یارانه
حمله پهپادی حزب‌ الله به ساختمانی در نهاریا
play_arrow
حمله پهپادی حزب‌ الله به ساختمانی در نهاریا
مراسم تشییع شهید امنیت وحید اکبریان در گرگان
play_arrow
مراسم تشییع شهید امنیت وحید اکبریان در گرگان
به رگبار بستن اتوبوس توسط اشرار در محور زاهدان به چابهار
play_arrow
به رگبار بستن اتوبوس توسط اشرار در محور زاهدان به چابهار
دبیرکل حزب‌الله: هزینۀ حمله به بیروت هدف قراردادن تل‌آویو است
play_arrow
دبیرکل حزب‌الله: هزینۀ حمله به بیروت هدف قراردادن تل‌آویو است
گروسی: فردو جای خطرناکی نیست
play_arrow
گروسی: فردو جای خطرناکی نیست
گروسی: گفتگوها با ایران بسیار سازنده بود و باید ادامه پیدا کند
play_arrow
گروسی: گفتگوها با ایران بسیار سازنده بود و باید ادامه پیدا کند
گروسی: در پارچین و طالقان سایت‌های هسته‌ای نیست
play_arrow
گروسی: در پارچین و طالقان سایت‌های هسته‌ای نیست
گروسی: ایران توقف افزایش ذخایر ۶۰ درصد را پذیرفته است
play_arrow
گروسی: ایران توقف افزایش ذخایر ۶۰ درصد را پذیرفته است
سورپرایز سردار آزمون برای تولد امیر قلعه‌نویی
play_arrow
سورپرایز سردار آزمون برای تولد امیر قلعه‌نویی
رهبر انقلاب: حوزه‌ علمیه باید در مورد نحوه حکمرانی و پدیده‌های جدید نظر بدهد
play_arrow
رهبر انقلاب: حوزه‌ علمیه باید در مورد نحوه حکمرانی و پدیده‌های جدید نظر بدهد
حملات خمپاره‌ای سرایاالقدس علیه مواضع دشمن در جبالیا
play_arrow
حملات خمپاره‌ای سرایاالقدس علیه مواضع دشمن در جبالیا
کنایه علی لاریجانی به حملات تهدیدآمیز صهیونیست‌ها
play_arrow
کنایه علی لاریجانی به حملات تهدیدآمیز صهیونیست‌ها