چت بات‌ها در مسیر تحول و بهتر شدن

در اینجا در این موارد می آموزیم: «آیا می توانم لیست قطعات شما را ببینم؟» آن چه که خطوط اقدام برای گپ زدن، در باره زبان ایجاد شده توسط کامپیوتر به ما می گویند. همچنین مطالب مفیدی در مورد آموزش به چت بات ها که چگونه کارهای درست انجام دهند را خواهیم دید.

سه‌شنبه، 8 تير 1400

تخمین زمان مطالعه:

مترجم : شهلا اسکندری

موارد بیشتر برای شما

آیا تا به حال فکر کرده اید که عشق ورزی با هوش مصنوعی چه شکلی است؟ دانشمند و مهندس تحقیق، ژانل شین با آموزش شبکه عصبی - الگوریتمی الهام گرفته از ساختارهای بیولوژیکی مغز - برای تولید خطوط گپ زنی، در این رابطه ایده ای به ما ارائه داد.

برخی از نتایج، خنده دار و کاملاً مزخرف هستند، مانند موارد و جملات غیر زیبا، مثل: " 2017 Rugboat 2-tone Neck Tie Shirt " اما برخی از آنها بسیار خوب ظاهر شدند، حداقل با در نظر گرفتن صدور آنها از روبات:
گفتار همچنین به عنوان نوعی کنش اجتماعی عمل می کند. * با چراغ قرمز شما می توانم بگویم که درون من هستی (I can tell by your red power light that you’re into me).

* شما شبیه یک چیز هستید و من شما را دوست دارم (You look like a thing and I love you).

* آیا می توانم لیست قطعات شما را ببینم (Can I see your parts list)؟

اما این خطوط چگونه تولید شده اند و چرا نتایج از نظر کیفیت و انسجام بسیار متفاوت هستند؟ این به انواع شبکه های عصبی که شین با آنها کار کرده است برمی گردد: همه بر اساس GPT-3 ، که بزرگ ترین مدل زبان جهان تاکنون است.

مدل سازی زبان

GPT مخفف generative pre-trained transformer به معنی مبدل قبلاً آموزش دیده مولد است. نسخه فعلی آن، که توسط OpenAI توسعه یافته است، سومین نسخه از سیستم های پردازش زبان طبیعی در حال پیشرفت است که برای تولید متن یا گفتار شبیه انسان آموزش داده شده است.
یک چت بات بهتر نه تنها به معنی و کاربرد کلمات نگاه می کند، بلکه به عواقب گفته ها نیز توجه می کند.پردازش زبان طبیعی یاNLP (مخفف Natural language processing)، به کاربرد رایانه ها برای پردازش و تولید مقادیر منسجم متن گفتاری یا نوشتاری اطلاق می شود. خواه از سیری به روز رسانی وضعیت هوا رادرخواست کنید، از الکسا بخواهید چراغ ها را روشن کند، یا از گوگل برای ترجمه پیام از فرانسه به انگلیسی استفاده کنید، به دلیل وجود تحولات در NLP است که می توانید این کارها را انجام دهید.

تصویر: گوینده Google Home از بالا عکس گرفته است. بلندگوهای هوشمند فعال شده با صدا از فناوری NLP برای درک درخواست های گفتاری شما استفاده می کنند. Vantage_DS / Shutterstock

برای برنامه هایی مانند سیری، تا رسیدن به اجابت موفقیت آمیز یک درخواست، تنوعی از کارهای مختلف NLP صورت می پذیرد - از تشخیص گفتار گرفته تا جدا کردن ساختار جمله ها. دستیار مجازی، دقیقاً مانند هر ابزار مبتنی بر زبان، با استفاده از هزاران جمله، که در حالت ایده آل تا حد امکان متنوع و مختلفند، آموزش می بیند.
صنعت چت بات در مسیر اشتباهی قرار دارد - صنعت چت بات چیزهای اشتباهی را به چت بات ها آموزش می دهد.از آن جا که زبان انسان بسیار پیچیده است، بهترین برنامه های NLP به طور فزاینده ای به مدل های از قبل آموزش دیده متکی هستند که "یاد گیری دو طرفه زمینه ای" را امکان پذیر می کنند. این به معنای در نظر گرفتن متن گسترده تر یک کلمه در یک جمله، و اسکن هر دو سمت چپ و راست هر کلمه مشخص برای شناسایی معنای مورد نظر کلمه است. مدل های جدیدتر حتی می توانند به ویژگی های بارزتر زبان انسان مانند کنایه و طعنه توجه کنند.

تعارف های رایانه ای

GPT-3 چنین هوش مصنوعی مولد زبانی است زیرا برای انجام یک کار جدید نیازی به آموزش مجدد و مکرر ندارد. در عوض، از آن چه مدل در مورد زبان آموخته است استفاده می کند و آن را در مورد چیز جدیدی به کار می برد - مانند نوشتن مقاله و کد رایانه، ایجاد گفتگوی جدید در بازی های ویدیویی یا فرمول خطوط گپ.

در مقایسه با مدل قبلیGPT-2 ، مدل نسل سوم، 116 برابر بزرگ تر است و در مورد میلیاردها کلمه داده آموزش داده شده است. برای تولید خطوط گفتگوی خود، از GPT-3 به سادگی خواسته شد متن مقاله را به صورت خودکار برای این عنوان تولید کند: "اینها بهترین خطوط انتخابی 2021 هستند! شکست را مغلوب کنید و نتیجه بگیرید! "

از آن جا که به روز رسانی های آموزش GPT-3 با گذشت زمان به تدریج اضافه شده اند، از همین دستور العمل می توان در انواع کوچک تر و اساسی تر نیز استفاده کرد – که به ایجاد خطوط گپ عجیب و غریب و کمتر منسجم منجر می شود:
یادگیری ماشینی کاربردی از هوش مصنوعی است که می تواند بدون کمک انسان یاد بگیرد. * سلام، اسم من جان اسمیت است. آیا وقتی من آشپزی می کنم روی جعبه نان من خواهید نشست یا نوعی محدودیت سرعت برای آن چیز وجود دارد؟

* ضروری است که شما یک ورزشکار حرفه ای شوید.

* سبک شنل

اما نسخه "DaVinci" از GPT-3 - که بزرگ ترین و با کفایت ترین تکرار آن تا به امروز است - تلاش های قانع کننده تری را انجام داده است که ممکن است در واقع برای یک معاشقه مؤثر باشد - با کمی تنظیم دقیق:

* شما زیباترین دندان های نیش را که من دیده ام دارید.

* دوستت دارم. اهمیتی نمی دهم که آیا تو توله محبوبی در یک پالتو کمر بند دار هستی یا نه.

* من دقیقاً چهار استیکر دارم. من به شما نیاز دارم که پنجمین آنها باشید.

آخرین نسخه GPT-3 در حال حاضر بزرگ ترین مدل زبان متنی در جهان است و قادر به انجام چندین کار بسیار چشمگیر است. اما آیا آن قدر هوشمند هست که بتواند به عنوان یک انسان از تست موفق بیرون آید؟
صنعت چت بات باید بر روی جنبه سوم نظریه آستین نیز متمرکز شود - تعیین تأثیر گفتار چت بات بر شخصی که از آن استفاده می کند.

تقریباً انسان

آلن تورینگ به عنوان یکی از پیشگامان محاسبات مدرن و دارای اعتقاد راسخ به هوش مصنوعی واقعی، در سال 1950 "بازی تقلید" را توسعه داد – که امروز به عنوان "آزمون تورینگ" شناخته می شود. اگر عملکرد رایانه بخواهد از عملکرد یک انسان قابل تشخیص نباشد، باید بتواند تست تورینگ را پشت سر گذارد. فقط در تولید زبان، GPT-3 می تواند به زودی آزمون آلن تورینگ را پشت سر بگذارد.

اما این که GPT-3 در آزمون تورینگ قبول شود یا خیر واقعاً مهم نیست. عملکرد آن احتمالاً به وظیفه خاصی که مدل برای آن استفاده می شود بستگی دارد - که، با قضاوت در مورد معاشقه این فناوری، احتمالاً باید چیزی غیر از هنر ظریف خط چت باشد.

و حتی اگر بتواند در آزمون تورینگ قبول شود، به هیچ وجه این مدل واقعاً هوشمند نخواهد بود. در بهترین حالت، در کارهای معنایی خاص به خوبی آموزش داده می شود. شاید سؤال مهم تر برای پرسیدن این باشد: آیا ما می خواهیم GPT-3 را حتی انسانی تر کنیم؟
فناوری فعلی چت بات بر بهبود توانایی چت بات ها در تقلید از معنی و کاربرد گفتار متمرکز است.

یادگیری از انسان ها

اندکی پس از ظهور آن در تابستان 2020، GPT-3 برای انتشار محتوای تکان دهنده جنسی و نژادپرستانه خبر ساز شد. اما این تعجب آور نبود. این مولد زبان بر روی مقادیر زیادی از متن ها در اینترنت آموزش دیده است و بدون باز سازی و آموزش مجدد محکوم به تکرار سوگیری ها، زبان های مضر و اطلاعات غلطی است که می دانیم به صورت آنلاین وجود دارد.

واضح است که مدل های زبانی مانند GPT-3 بدون خطرات احتمالی ارائه نمی شوند. اگر می خواهیم این سیستم ها اساس دستیارهای دیجیتال یا عوامل گفتگوی ما باشند، هنگام تهیه مطالب خواندنی برای یاد گیری آنها باید به گونه ای سخت گیرانه تر و انتخابی تر عمل کنیم.

تحقیقات اخیر نشان داده است که هنوز هم دانش GPT-3 در مورد سمت تاریک اینترنت می تواند برای تشخیص خودکار گفتار نفرت آنلاین، با حداکثر دقت 78٪، مورد استفاده قرار گیرد. بنابراین اگرچه بعید به نظر می رسد که خطوط گپ آن باعث ایجاد عشق بیشتر در جهان شود، اما ممکن است حداقل GPT-3 برای کاهش نفرت تنظیم شود.
زبان فقط کارها را توصیف نمی کند، بلکه در واقع آنها را "اجرا" می کند.

تصویر: روبات های چت یا چت بات های هوش مصنوعی هنوز در درک تأثیر کلمات خود تلاش می کنند.(Shutterstock)

در این عصر اطلاعات - و اطلاعات غلط - پیشرفت در فناوری ما را به چالش می کشد تا در مورد چگونگی عملکرد زبان تجدید نظر کنیم.
در پایه ای ترین حالت خود، زبان کارها را با کلمات انجام می دهد.به عنوان مثال، همچنان که در فوق گفته شد، چت بات های مکالمه ای را در نظر بگیرید. این برنامه های رایانه ای مکالمه انسان را از طریق متن یا صدا تقلید می کنند. شرکت تشک Casper برای برقراری ارتباط با افرادی که اختلالات خواب دارند Insomnobot-3000 را ایجاد کرد، که به کسانی که مشکل خواب دارند این فرصت را می دهد که در حالی که بقیه خواب هستند با "کسی" صحبت کنند.

اما Insomnobot-3000 نه تنها با کاربران خود گپ و گفت دارد بلکه به سؤالات آنها نیز پاسخ می دهد. هدف آن کاهش احساس تنهایی در مبتلایان به بی خوابی است. کلمات آن توانایی تأثیر گذاری در کاربر انسانی را دارند.

در پایه ای ترین حالت خود، زبان کارها را با کلمات انجام می دهد. این نوعی عمل است که بیش از بیان واقعیات عمل می کند.

این مشاهده کاملاً ساده در دهه 1950 توسط فیلسوف گمنام و کمی عجیب و غریب دانشگاه آکسفورد، جان لنگشاو آستین، انجام شد. آستین در کتاب خود، چگونه کارها را با کلمات انجام دهیم، مفهوم زبان کنشی را توسعه داد.

تصویر: هنگامی که نمی توانید بخوابید، Insomnobot-3000 کاسپر شما را همراهی می کند.(Shutterstock)

منظور آستین این بود که زبان فقط کارها را توصیف نمی کند، بلکه در واقع آنها را "اجرا" می کند. به عنوان مثال، اگر بگویم که گردنبند مروارید مادر بزرگم را به دخترم واگذار می کنم، بیش از توصیف یا گزارش دادن چیزی، دارم کاری می کنم. من یک اقدام معنی دار انجام می دهم.

آستین همچنین گفتار را به سه قسمت طبقه بندی کرد: معنی، کاربرد، و تأثیر. مطالعه و یافته های او در مورد زبان به عنوان تئوری گفتار - عمل شناخته شد. این نظریه نه تنها در فلسفه، بلکه در سایر زمینه ها مانند حقوق، ادبیات و اندیشه های فمینیستی نیز مهم بود.
اگر عملکرد رایانه بخواهد از عملکرد یک انسان قابل تشخیص نباشد، باید بتواند تست تورینگ را پشت سر گذارد.

نسخه ای برای صنعت چت بات

با این حساب، نظریه آستین در مورد چت بات های گفتگوی امروز چه چیزی می تواند به ما بگوید؟

تحقیقات ما متمرکز است بر روی تلاقی قانون و زبان و آن چه تئوری آستین باید بگوید در باره درک ما از این که چگونه ماشین آلات خلاقیت در حال تغییر عملیات سنتی جامعه اند، مانند رمان نوشتن توسط هوش مصنوعی، نوشتن گزارش های خبری توسط گزارشگران روبات، دوره های گسترده باز آنلاین (MOOC) (massive open online courses) که جایگزین کلاس ها و استادان با استفاده از نرم افزار درجه بندی مقاله می شوند.

فناوری فعلی چت بات بر بهبود توانایی چت بات ها در تقلید از معنی و کاربرد گفتار متمرکز است. یک مثال خوب در این مورد Cleverbot است.

اما صنعت چت بات باید بر روی جنبه سوم نظریه آستین نیز متمرکز شود - تعیین تأثیر گفتار چت بات بر شخصی که از آن استفاده می کند.

مطمئناً، اگر ما قادر به آموزش چت بات ها برای تقلید از معنا و کاربرد گفتار انسانی هستیم، باید بتوانیم به آنها یاد دهیم که از تأثیر آن نیز تقلید کنند؟

یادگیری مکالمه

جدیدترین چت بات ها بر یاد گیری پیشرفته ماشینی متکی هستند که به یادگیری عمیق معروف است.

یادگیری ماشینی کاربردی از هوش مصنوعی است که می تواند بدون کمک انسان یاد بگیرد. یادگیری عمیق که از شبکه نورون های مغز انسان الگو برداری شده است، یادگیری ماشین را حتی فراتر می برد. داده ها به شبکه های عصبی مصنوعی عمیق منتقل می شوند که برای تقلید از تصمیم گیری انسان طراحی شده اند.
آخرین نسخه GPT-3 در حال حاضر بزرگ ترین مدل زبان متنی در جهان است و قادر به انجام چندین کار بسیار چشمگیر است.چت بات هایی که با این فناوری شبکه عصبی طراحی شده اند فقط گفته ها را طوطی وار تکرار نمی کنند و یا پاسخ های کنسرو شده تولید نمی کنند. در عوض، آنها یاد می گیرند که چگونه مکالمه کنند.

چت بات ها مقادیر عظیمی از گفتار انسانی را تجزیه و تحلیل می کنند، و سپس پس از ارزیابی و رتبه بندی میزان تأیید امکانات این گفتار، در مورد چگونگی پاسخ تصمیم می گیرند. با این وجود، و با وجود این پیشرفت ها، این روبات های جدید هنوز هم از گاف های گهگاه رنج می برند، زیرا آنها بیشتر به معنی و کاربرد گفتار خود توجه دارند.

تصویر: آرم چت بات Tay

چت بات های قبلی بسیار بدتر بودند. در کمتر از 24 ساعت از انتشار در توییتر در سال 2016، چت بات مایکروسافت، که یک سیستم هوش مصنوعی به نامTay ، مخفف اختصاری "Thinking About You" به معنی «فکر کردن در مورد شما»، است و از الگوهای زبان یک دختر نوجوان الگو گرفته است، بیش از 50،000 دنبال کننده داشت و بیش از 100000 توییت.
مدل های جدیدتر حتی می توانند به ویژگی های بارزتر زبان انسان مانند کنایه و طعنه توجه کنند.همان طور که Tay به دنیا سلام می کرد، اولین توییت های او به اندازه کافی بی عیب و معصوم و پاک بودند. اما سپس او شروع به تقلید از دنبال کنندگان خود کرد.

او به سرعت به یک چت بات نژاد پرست، جنس پرست و کاملاً ناپسند تبدیل شد. مایکروسافت مجبور شد او را آفلاین کند.

Tay کاملاً وابسته به داده هایی بود که به او داده می شد - و مهم تر از همه، به افرادی که این داده ها را تهیه و شکل می دادند، متکی بود. او نمی فهمید که کاربران انسانی با زبان "چه می کنند". وی همچنین تأثیرات گفتار خود را درک نمی کرد.

آموزش نادرست به چت بات ها

برخی از محققان بر این باورند که هرچه چت بات ها داده بیشتری به دست آورند، تخلف کمتری نیز در پی خواهند داشت.

اما محاسبه پاسخ های احتمالی به یک سؤال معین می تواند مدت ها طول بکشد یا به قدرت محاسباتی زیادی متکی باشد. به علاوه، این راه حل برای جمع آوری اطلاعات بیشتر در مورد معنا و کاربرد، واقعاً فقط تاریخی است که خود را تکرار می کند."Zo" مایکروسافت، جانشینTay ، هنوز با سؤالات دشوار در مورد سیاست دست و پنجه نرم می کند.
دستیار مجازی، دقیقاً مانند هر ابزار مبتنی بر زبان، با استفاده از هزاران جمله، که در حالت ایده آل تا حد امکان متنوع و مختلفند، آموزش می بیند.به بیان ساده، صنعت چت بات در مسیر اشتباهی قرار دارد - صنعت چت بات چیزهای اشتباهی را به چت بات ها آموزش می دهد.

چت بات های تحول آفرین

یک چت بات بهتر نه تنها به معنی و کاربرد کلمات نگاه می کند، بلکه به عواقب گفته ها نیز توجه می کند.

گفتار همچنین به عنوان نوعی کنش اجتماعی عمل می کند. جودیت باتلر، فیلسوف، در کتاب خود با عنوان مشکل جنسیت، به عملکرد زبان و چگونگی افزایش درک ما از جنسیت پرداخت. او جنسیت را به عنوان کاری که شخص انجام می دهد و نه چیزی که هست دید - این که چیزی است که از طریق گفتار و اشاره های روزمره ساخته می شود.

چت بات های مکالمه برای مخاطبانی متنوع در نظر گرفته شده اند. تمرکز بر تأثیر گفتار می تواند ارتباطات را بهبود بخشد زیرا نقش چت بات همچنین به تأثیر کلمات آن مربوط می شود.

همان طور که باتلر در ساخت جنسیت به ما نشان داده است، در یک صنعت فناوری که به دلیل عدم تنوع و فراگیر بودن به چالش کشیده می شود، چنین چت باتی می تواند دگرگون کننده باشد.

البته یک هشدار وجود دارد. تمرکز بر تأثیر زبان، ویژگی تعیین کننده حقه بازی، تبلیغات و اطلاعات غلط است - "اخبار جعلی" - یک عمل گفتاری عمدی مهندسی شده، فقط مربوط به دستیابی به اثر است. از نظر شکل مهم نیست، اخبار جعلی صرفاً روزنامه نگاری را تقلید می کنند و فقط برای دستیابی به اثر ایجاد می شوند.

نظریه عملکردی آستین در زبان به ما کمک کرد تا دریابیم که چگونه با یکدیگر صحبت کنیم.
پردازش زبان طبیعی یاNLP (مخفف Natural language processing)، به کاربرد رایانه ها برای پردازش و تولید مقادیر منسجم متن گفتاری یا نوشتاری اطلاق می شود.صنعت چت بات علاوه بر کارهایی که قبلاً روی معنی و کاربرد کلمات انجام شده است، باید تلاش خود را بر روی تأثیر گفتار متمرکز کند. برای یک چت بات تنها در صورتی می توان گفتگوی واقعی داشت که در همه جنبه های یک عمل گفتار نقش داشته باشد.

منبع: استفانی اولمان، University of Cambridge، آماندا ترنبول، University of Ottawa