یک تکنیک برای بهبود یادگیری ماشین از رفتار نوزادان انسان الهام گرفته است

رفتار نوزاد، الهامبخش بهبود یادگیری ماشین شد

محققان موسسه علوم و تکنولوژی پیشرفته کره (KAIST) اخیراً یک روش عادی سازی پاداش ذاتی را ایجاد کرده اند که به عاملان هوش مصنوعی اجازه می دهد اقداماتی را انتخاب کنند که به الگوهای شهودی آنها بیشترین بهبود را می بخشد.
سه‌شنبه، 1 مرداد 1398
تخمین زمان مطالعه:
پدیدآورنده: حمید وثیق زاده انصاری
موارد بیشتر برای شما
رفتار نوزاد، الهامبخش بهبود یادگیری ماشین شد
یک نمودار مفصل از رویکرد توسعه یافته توسط محققان. (راست پایین) برای هر جفت اشیاء، محققان ویژگی های آنها را به یک رمزگذار ارتباطی می خورانند تا رابطه ی rjj و sobji حالت i شیء را به دست آورند. (چپ بالا) با استفاده از روش حریصانه، برای هر شیء، آنها ماکزیمم مقدار Q را برای به دست آوردن شیء کانون، شیء ارتباط، و عمل پیدا می کنند. (بالا سمت راست) هنگامی که شیء کانونشان و شیء ارتباطشان را جمع کردند، آنها حالت ها و تمامی ارتباط های خود را به رمزگشاهایشان خوراندند تا تغییر در موقعیت و تغییر در سرعت را پیش بینی کنند. اعتبار: چوی و یون
 
از اولین سالهای زندگی، انسانها این توانایی ذاتی را دارند که به طور مداوم یاد بگیرند و مدل های ذهنی جهان را، به سادگی با مشاهده و تعامل با چیزها یا افراد در محیط اطراف خود، بسازند. مطالعات روانشناسی شناختی نشان می دهد که انسان ها از این دانش قبلا به دست آمده به طور گسترده استفاده می کنند، مخصوصا زمانی که با موقعیت های جدید رو به رو می شوند یا هنگامی که باید تصمیم گیری کنند.
 
علیرغم پیشرفت های اخیر مهم در زمینه هوش مصنوعی (AI)، اکثر عوامل مجازی هنوز هم نیاز به صدها ساعت آموزش برای دستیابی به عملکرد سطح انسان در وظیفه های متعددی را دارند، در حالی که انسان ها می توانند یاد بگیرد که چگونه این کارها را در چند ساعت یا کمتر انجام دهند. مطالعات اخیر دو مشارکت کننده کلیدی در توانایی انسان ها برای به دست آوردن دانشی اینچنین سریع را برجسته کرده اند، که عبارتند از فیزیک شهودی و روانشناسی شهودی.
 
این مدل های شهودی که در مراحل اولیه توسعه در انسان دیده می شود، ممکن است تسهیل کننده های اصلی یادگیری آینده باشند. بر اساس این ایده، محققان موسسه علوم و تکنولوژی پیشرفته کره (KAIST) اخیراً یک روش عادی سازی پاداش ذاتی را ایجاد کرده اند که به عاملان هوش مصنوعی اجازه می دهد اقداماتی را انتخاب کنند که به الگوهای شهودی آنها بیشترین بهبود را می بخشد. در مقاله شان که در arXiv پیش انتشار یافت، محققان به ویژه  یک شبکه فیزیکی گرافیکی یکی شده با یادگیری تقویتی عمیق الهام گرفته شده توسط رفتار یادگیری مشاهده شده در نوزادان انسان را پیشنهاد کردند.
 
محققان در مقاله خود توضیح می دهند: "نوزادان انسانی را در یک اتاق با اسباب بازی هایی قرار گرفته در اطراف، در فاصله ای قابل دسترس، تصور کنید." "آنها به طور مداوم در حال چنگ زدن، پرت کردن، و انجام عملیاتی بر روی اشیاء هستند؛ گاهی اوقات آنها عواقب بعدی اقدامات خود را مشاهده می کنند، اما گاهی اوقات، علاقه شان را از دست می دهند و به سمت شیء دیگری حرکت می کنند. دیدگاه "کودک به عنوان یک دانشمند" اشاره بر این دارد که نوزادان انسانی ذاتاً برانگیخته می شوند که آزمایشات خود را هدایت کنند، اطلاعات بیشتری را کشف کنند، و در نهایت یاد می گیرند که بین اشیاء مختلف تمیز قائل شوند و ارائه های داخلی غنی تری از آنها خلق کنند."
 
مطالعات روانشناسی نشان می دهد که در اولین سال های زندگی شان انسان ها به طور مداوم در حال آزمایش با محیط اطراف خود هستند و این امر به آنها امکان می دهد تا یک درک کلیدی از جهان را شکل دهند. علاوه بر این، هنگامی که کودکان نتایجی را مشاهده می کنند که انتظارات قبلی آنها را برآورده نمی کند، که به عنوان نقض انتظار شناخته می شود، آنها اغلب تشویق می شوند تا آزمایش بیشتری برای دستیابی به درک بهتر وضعیتی که در آن هستند، انجام دهند.
 
تیم محققان در KAIST تلاش کرد تا این رفتارها را در عوامل هوش مصنوعی با استفاده از یک رویکرد تقویت یادگیری بازتولید کند. در مطالعه خود، آنها برای اولین بار یک شبکه فیزیکی گرافیکی را معرفی کردند که می تواند روابط فیزیکی بین اشیاء را استخراج کند و رفتارهای بعدی آنها را در یک محیط سه بعدی پیش بینی کند. نوزادان انسانی ذاتاً برانگیخته می شوند که آزمایشات خود را هدایت کنند، اطلاعات بیشتری را کشف کنند، و در نهایت یاد می گیرند که بین اشیاء مختلف تمیز قائل شوند. سپس، آنها این شبکه را یکی کردند با یک مدل یادگیری تقویت عمیق، که یک تکنیک هنجار سازی پاداش ذاتی را معرفی می کند که یک عامل هوش مصنوعی را تشویق به کاوش و تشخیص فعالیت هایی می کند که به طور مداوم مدل شهودیش را بهبود خواهند داد.
 
محققان با استفاده از یک موتور فیزیک سه بعدی نشان دادند که شبکه فیزیک گرافیکی آنها می تواند به نحو مؤثری موقعیت ها و سرعت های اشیاء مختلف را استنتاج کند. آنها همچنین دریافتند که رویکرد آنها به شبکه یادگیری تقویت عمیق اجازه می داد تا به طور مداوم مدل شهودیش را بهبود بخشد، و آن را تشویق کند به تعامل با اشیاء صرفا بر مبنای تحریک های ذاتی.
 
در یک سری از ارزیابی ها، تکنیک جدیدی که توسط این تیم از محققان تدبیر شده، دقت قابل توجهی را به دست آورد، با عامل هوش مصنوعی اجرا کننده‌ی تعداد بیشتری از اقدامات اکتشافی مختلف. در آینده، این می تواند توسعه ابزارهای یادگیری ماشین را اطلاع دهد که می تواند از تجربیات گذشته خود سریع تر و موثرتر یاد بگیرد.
 
محققان در مقاله خود توضیح می دهند: "ما شبکه مان را در هر دو حالت ثابت و غیر ثابت در صحنه های مختلف با اشیاء کروی با جرم ها و شعاع های مختلف آزمایش کرده ایم." "امید ما این است که این مدل های شهودی پیش پرورده بعداً به عنوان یک دانش قبلی برای دیگر وظایف هدفدار مثل بازی های آتاری یا پیش بینی های ویدئویی مورد استفاده قرار گیرد."
 

اشاره ای به یک رویکرد الهام گرفته از زیست شناسی برای افزایش یادگیری در ANNها

مغز انسان به طور مداوم با گذشت زمان تغییر می کند، و ارتباطات جدید سیناپسی را براساس تجارب و اطلاعاتی که طی یک عمر فرا گرفته است، شکل می دهد. در طی چند سال گذشته، محققان هوش مصنوعی (AI) تلاش کرده اند تا این قابلیت جذاب، شناخته شده به عنوان قالب پذیری را در شبکه‌های عصبی مصنوعی (ANNs) بازتولید کنند.
 
مترجم: حمید وثیق زاده انصاری
منبع: اینگرید فَدِلی، Tech Xplore


مقالات مرتبط
ارسال نظر
با تشکر، نظر شما پس از بررسی و تایید در سایت قرار خواهد گرفت.
متاسفانه در برقراری ارتباط خطایی رخ داده. لطفاً دوباره تلاش کنید.
مقالات مرتبط
موارد بیشتر برای شما
رستوران و کافه نزدیک هتل لیلیوم کیش
رستوران و کافه نزدیک هتل لیلیوم کیش
فراخوان شصت و سومین سال جایزه (نخبگانی) سال 1404
فراخوان شصت و سومین سال جایزه (نخبگانی) سال 1404
حمله هوایی ارتش اسرائیل به یک خودرو در غزه
play_arrow
حمله هوایی ارتش اسرائیل به یک خودرو در غزه
رهبر انقلاب: روزی بخواهیم اقدام بکنیم احتیاجی به نیروی نیابتی نداریم
play_arrow
رهبر انقلاب: روزی بخواهیم اقدام بکنیم احتیاجی به نیروی نیابتی نداریم
رهبر انقلاب: فردای منطقه به لطف الهی از امروز بهتر خواهد بود
play_arrow
رهبر انقلاب: فردای منطقه به لطف الهی از امروز بهتر خواهد بود
نقشه شوم آمریکا برای جهان به روایت رهبر انقلاب
play_arrow
نقشه شوم آمریکا برای جهان به روایت رهبر انقلاب
پزشکیان: حضور زنان در آینده کشور مؤثر تر از من است که اینجا ایستاده‌ام
play_arrow
پزشکیان: حضور زنان در آینده کشور مؤثر تر از من است که اینجا ایستاده‌ام
اهدای جوایز به زنان موفق در مراسم آیین تجلیل از مقام زن
play_arrow
اهدای جوایز به زنان موفق در مراسم آیین تجلیل از مقام زن
رهبر انقلاب: مداحی یک رسانه تمام عیار است
play_arrow
رهبر انقلاب: مداحی یک رسانه تمام عیار است
رهبر انقلاب: مهم‌ترین کار حضرت زهرا(س) تبیین بود
play_arrow
رهبر انقلاب: مهم‌ترین کار حضرت زهرا(س) تبیین بود
سرود جمعی با اجرای نوشه‌ور در حسینیه امام خمینی(ره)
play_arrow
سرود جمعی با اجرای نوشه‌ور در حسینیه امام خمینی(ره)
مدیحه سرایی احمد واعظی در محضر رهبر انقلاب
play_arrow
مدیحه سرایی احمد واعظی در محضر رهبر انقلاب
مداحی اتابک عبداللهی به زبان آذری در حسینیه امام خمینی
play_arrow
مداحی اتابک عبداللهی به زبان آذری در حسینیه امام خمینی
مداحی مهدی ترکاشوند به زبان لری در محضر رهبر انقلاب
play_arrow
مداحی مهدی ترکاشوند به زبان لری در محضر رهبر انقلاب
خطر تخریب یکی از بزرگترین مساجد دوران قاجار
play_arrow
خطر تخریب یکی از بزرگترین مساجد دوران قاجار