یک نمودار مفصل از رویکرد توسعه یافته توسط محققان. (راست پایین) برای هر جفت اشیاء، محققان ویژگی های آنها را به یک رمزگذار ارتباطی می خورانند تا رابطه ی rjj و sobji حالت i شیء را به دست آورند. (چپ بالا) با استفاده از روش حریصانه، برای هر شیء، آنها ماکزیمم مقدار Q را برای به دست آوردن شیء کانون، شیء ارتباط، و عمل پیدا می کنند. (بالا سمت راست) هنگامی که شیء کانونشان و شیء ارتباطشان را جمع کردند، آنها حالت ها و تمامی ارتباط های خود را به رمزگشاهایشان خوراندند تا تغییر در موقعیت و تغییر در سرعت را پیش بینی کنند. اعتبار: چوی و یون
از اولین سالهای زندگی، انسانها این توانایی ذاتی را دارند که به طور مداوم یاد بگیرند و مدل های ذهنی جهان را، به سادگی با مشاهده و تعامل با چیزها یا افراد در محیط اطراف خود، بسازند. مطالعات روانشناسی شناختی نشان می دهد که انسان ها از این دانش قبلا به دست آمده به طور گسترده استفاده می کنند، مخصوصا زمانی که با موقعیت های جدید رو به رو می شوند یا هنگامی که باید تصمیم گیری کنند.
علیرغم پیشرفت های اخیر مهم در زمینه هوش مصنوعی (AI)، اکثر عوامل مجازی هنوز هم نیاز به صدها ساعت آموزش برای دستیابی به عملکرد سطح انسان در وظیفه های متعددی را دارند، در حالی که انسان ها می توانند یاد بگیرد که چگونه این کارها را در چند ساعت یا کمتر انجام دهند. مطالعات اخیر دو مشارکت کننده کلیدی در توانایی انسان ها برای به دست آوردن دانشی اینچنین سریع را برجسته کرده اند، که عبارتند از فیزیک شهودی و روانشناسی شهودی.
این مدل های شهودی که در مراحل اولیه توسعه در انسان دیده می شود، ممکن است تسهیل کننده های اصلی یادگیری آینده باشند. بر اساس این ایده، محققان موسسه علوم و تکنولوژی پیشرفته کره (KAIST) اخیراً یک روش عادی سازی پاداش ذاتی را ایجاد کرده اند که به عاملان هوش مصنوعی اجازه می دهد اقداماتی را انتخاب کنند که به الگوهای شهودی آنها بیشترین بهبود را می بخشد. در مقاله شان که در arXiv پیش انتشار یافت، محققان به ویژه یک شبکه فیزیکی گرافیکی یکی شده با یادگیری تقویتی عمیق الهام گرفته شده توسط رفتار یادگیری مشاهده شده در نوزادان انسان را پیشنهاد کردند.
محققان در مقاله خود توضیح می دهند: "نوزادان انسانی را در یک اتاق با اسباب بازی هایی قرار گرفته در اطراف، در فاصله ای قابل دسترس، تصور کنید." "آنها به طور مداوم در حال چنگ زدن، پرت کردن، و انجام عملیاتی بر روی اشیاء هستند؛ گاهی اوقات آنها عواقب بعدی اقدامات خود را مشاهده می کنند، اما گاهی اوقات، علاقه شان را از دست می دهند و به سمت شیء دیگری حرکت می کنند. دیدگاه "کودک به عنوان یک دانشمند" اشاره بر این دارد که نوزادان انسانی ذاتاً برانگیخته می شوند که آزمایشات خود را هدایت کنند، اطلاعات بیشتری را کشف کنند، و در نهایت یاد می گیرند که بین اشیاء مختلف تمیز قائل شوند و ارائه های داخلی غنی تری از آنها خلق کنند."
مطالعات روانشناسی نشان می دهد که در اولین سال های زندگی شان انسان ها به طور مداوم در حال آزمایش با محیط اطراف خود هستند و این امر به آنها امکان می دهد تا یک درک کلیدی از جهان را شکل دهند. علاوه بر این، هنگامی که کودکان نتایجی را مشاهده می کنند که انتظارات قبلی آنها را برآورده نمی کند، که به عنوان نقض انتظار شناخته می شود، آنها اغلب تشویق می شوند تا آزمایش بیشتری برای دستیابی به درک بهتر وضعیتی که در آن هستند، انجام دهند.
تیم محققان در KAIST تلاش کرد تا این رفتارها را در عوامل هوش مصنوعی با استفاده از یک رویکرد تقویت یادگیری بازتولید کند. در مطالعه خود، آنها برای اولین بار یک شبکه فیزیکی گرافیکی را معرفی کردند که می تواند روابط فیزیکی بین اشیاء را استخراج کند و رفتارهای بعدی آنها را در یک محیط سه بعدی پیش بینی کند. نوزادان انسانی ذاتاً برانگیخته می شوند که آزمایشات خود را هدایت کنند، اطلاعات بیشتری را کشف کنند، و در نهایت یاد می گیرند که بین اشیاء مختلف تمیز قائل شوند. سپس، آنها این شبکه را یکی کردند با یک مدل یادگیری تقویت عمیق، که یک تکنیک هنجار سازی پاداش ذاتی را معرفی می کند که یک عامل هوش مصنوعی را تشویق به کاوش و تشخیص فعالیت هایی می کند که به طور مداوم مدل شهودیش را بهبود خواهند داد.
محققان با استفاده از یک موتور فیزیک سه بعدی نشان دادند که شبکه فیزیک گرافیکی آنها می تواند به نحو مؤثری موقعیت ها و سرعت های اشیاء مختلف را استنتاج کند. آنها همچنین دریافتند که رویکرد آنها به شبکه یادگیری تقویت عمیق اجازه می داد تا به طور مداوم مدل شهودیش را بهبود بخشد، و آن را تشویق کند به تعامل با اشیاء صرفا بر مبنای تحریک های ذاتی.
در یک سری از ارزیابی ها، تکنیک جدیدی که توسط این تیم از محققان تدبیر شده، دقت قابل توجهی را به دست آورد، با عامل هوش مصنوعی اجرا کنندهی تعداد بیشتری از اقدامات اکتشافی مختلف. در آینده، این می تواند توسعه ابزارهای یادگیری ماشین را اطلاع دهد که می تواند از تجربیات گذشته خود سریع تر و موثرتر یاد بگیرد.
محققان در مقاله خود توضیح می دهند: "ما شبکه مان را در هر دو حالت ثابت و غیر ثابت در صحنه های مختلف با اشیاء کروی با جرم ها و شعاع های مختلف آزمایش کرده ایم." "امید ما این است که این مدل های شهودی پیش پرورده بعداً به عنوان یک دانش قبلی برای دیگر وظایف هدفدار مثل بازی های آتاری یا پیش بینی های ویدئویی مورد استفاده قرار گیرد."
از اولین سالهای زندگی، انسانها این توانایی ذاتی را دارند که به طور مداوم یاد بگیرند و مدل های ذهنی جهان را، به سادگی با مشاهده و تعامل با چیزها یا افراد در محیط اطراف خود، بسازند. مطالعات روانشناسی شناختی نشان می دهد که انسان ها از این دانش قبلا به دست آمده به طور گسترده استفاده می کنند، مخصوصا زمانی که با موقعیت های جدید رو به رو می شوند یا هنگامی که باید تصمیم گیری کنند.
علیرغم پیشرفت های اخیر مهم در زمینه هوش مصنوعی (AI)، اکثر عوامل مجازی هنوز هم نیاز به صدها ساعت آموزش برای دستیابی به عملکرد سطح انسان در وظیفه های متعددی را دارند، در حالی که انسان ها می توانند یاد بگیرد که چگونه این کارها را در چند ساعت یا کمتر انجام دهند. مطالعات اخیر دو مشارکت کننده کلیدی در توانایی انسان ها برای به دست آوردن دانشی اینچنین سریع را برجسته کرده اند، که عبارتند از فیزیک شهودی و روانشناسی شهودی.
این مدل های شهودی که در مراحل اولیه توسعه در انسان دیده می شود، ممکن است تسهیل کننده های اصلی یادگیری آینده باشند. بر اساس این ایده، محققان موسسه علوم و تکنولوژی پیشرفته کره (KAIST) اخیراً یک روش عادی سازی پاداش ذاتی را ایجاد کرده اند که به عاملان هوش مصنوعی اجازه می دهد اقداماتی را انتخاب کنند که به الگوهای شهودی آنها بیشترین بهبود را می بخشد. در مقاله شان که در arXiv پیش انتشار یافت، محققان به ویژه یک شبکه فیزیکی گرافیکی یکی شده با یادگیری تقویتی عمیق الهام گرفته شده توسط رفتار یادگیری مشاهده شده در نوزادان انسان را پیشنهاد کردند.
محققان در مقاله خود توضیح می دهند: "نوزادان انسانی را در یک اتاق با اسباب بازی هایی قرار گرفته در اطراف، در فاصله ای قابل دسترس، تصور کنید." "آنها به طور مداوم در حال چنگ زدن، پرت کردن، و انجام عملیاتی بر روی اشیاء هستند؛ گاهی اوقات آنها عواقب بعدی اقدامات خود را مشاهده می کنند، اما گاهی اوقات، علاقه شان را از دست می دهند و به سمت شیء دیگری حرکت می کنند. دیدگاه "کودک به عنوان یک دانشمند" اشاره بر این دارد که نوزادان انسانی ذاتاً برانگیخته می شوند که آزمایشات خود را هدایت کنند، اطلاعات بیشتری را کشف کنند، و در نهایت یاد می گیرند که بین اشیاء مختلف تمیز قائل شوند و ارائه های داخلی غنی تری از آنها خلق کنند."
مطالعات روانشناسی نشان می دهد که در اولین سال های زندگی شان انسان ها به طور مداوم در حال آزمایش با محیط اطراف خود هستند و این امر به آنها امکان می دهد تا یک درک کلیدی از جهان را شکل دهند. علاوه بر این، هنگامی که کودکان نتایجی را مشاهده می کنند که انتظارات قبلی آنها را برآورده نمی کند، که به عنوان نقض انتظار شناخته می شود، آنها اغلب تشویق می شوند تا آزمایش بیشتری برای دستیابی به درک بهتر وضعیتی که در آن هستند، انجام دهند.
تیم محققان در KAIST تلاش کرد تا این رفتارها را در عوامل هوش مصنوعی با استفاده از یک رویکرد تقویت یادگیری بازتولید کند. در مطالعه خود، آنها برای اولین بار یک شبکه فیزیکی گرافیکی را معرفی کردند که می تواند روابط فیزیکی بین اشیاء را استخراج کند و رفتارهای بعدی آنها را در یک محیط سه بعدی پیش بینی کند. نوزادان انسانی ذاتاً برانگیخته می شوند که آزمایشات خود را هدایت کنند، اطلاعات بیشتری را کشف کنند، و در نهایت یاد می گیرند که بین اشیاء مختلف تمیز قائل شوند. سپس، آنها این شبکه را یکی کردند با یک مدل یادگیری تقویت عمیق، که یک تکنیک هنجار سازی پاداش ذاتی را معرفی می کند که یک عامل هوش مصنوعی را تشویق به کاوش و تشخیص فعالیت هایی می کند که به طور مداوم مدل شهودیش را بهبود خواهند داد.
محققان با استفاده از یک موتور فیزیک سه بعدی نشان دادند که شبکه فیزیک گرافیکی آنها می تواند به نحو مؤثری موقعیت ها و سرعت های اشیاء مختلف را استنتاج کند. آنها همچنین دریافتند که رویکرد آنها به شبکه یادگیری تقویت عمیق اجازه می داد تا به طور مداوم مدل شهودیش را بهبود بخشد، و آن را تشویق کند به تعامل با اشیاء صرفا بر مبنای تحریک های ذاتی.
در یک سری از ارزیابی ها، تکنیک جدیدی که توسط این تیم از محققان تدبیر شده، دقت قابل توجهی را به دست آورد، با عامل هوش مصنوعی اجرا کنندهی تعداد بیشتری از اقدامات اکتشافی مختلف. در آینده، این می تواند توسعه ابزارهای یادگیری ماشین را اطلاع دهد که می تواند از تجربیات گذشته خود سریع تر و موثرتر یاد بگیرد.
محققان در مقاله خود توضیح می دهند: "ما شبکه مان را در هر دو حالت ثابت و غیر ثابت در صحنه های مختلف با اشیاء کروی با جرم ها و شعاع های مختلف آزمایش کرده ایم." "امید ما این است که این مدل های شهودی پیش پرورده بعداً به عنوان یک دانش قبلی برای دیگر وظایف هدفدار مثل بازی های آتاری یا پیش بینی های ویدئویی مورد استفاده قرار گیرد."
اشاره ای به یک رویکرد الهام گرفته از زیست شناسی برای افزایش یادگیری در ANNها
مغز انسان به طور مداوم با گذشت زمان تغییر می کند، و ارتباطات جدید سیناپسی را براساس تجارب و اطلاعاتی که طی یک عمر فرا گرفته است، شکل می دهد. در طی چند سال گذشته، محققان هوش مصنوعی (AI) تلاش کرده اند تا این قابلیت جذاب، شناخته شده به عنوان قالب پذیری را در شبکههای عصبی مصنوعی (ANNs) بازتولید کنند.
مترجم: حمید وثیق زاده انصاری
منبع: اینگرید فَدِلی، Tech Xplore