محاسبه ی تعادل نش

فرض کنید باب ده دلار به آلیس بدهکار است. باب پیشنهاد بازی ای را می دهد که در آن اگر او بِبَرد، بدهی اش کم می شود ( در جهان واقعی آلیس این پیشنهاد را قبول نمی کند و همان ده دلار را می خواهد ).
جمعه، 18 مهر 1393
تخمین زمان مطالعه:
موارد بیشتر برای شما
محاسبه ی تعادل نش
 محاسبه ی تعادل نش

 

نويسنده: تام سيگفريد
مترجم: مهدي صادقي




 

فرض کنید باب (1) ده دلار به آلیس (2) بدهکار است. باب پیشنهاد بازی ای را می دهد که در آن اگر او بِبَرد، بدهی اش کم می شود ( در جهان واقعی آلیس این پیشنهاد را قبول نمی کند و همان ده دلار را می خواهد ). اما برای روشن تر شدن نظریه ی بازی ها آلیس باید موافقت خود را اعلام کند. باب این قواعد را برای بازی پیشنهاد می کند: او و آلیس یکدیگر را در کتاب خانه ملاقات می کنند. اگر باب زودتر به کتاب خانه بیاید، چهار دلار به آلیس می دهد و اگر آلیس زودتر بیاید، او شش دلار به آلیس خواهد داد و اگر هر دو هم زمان برسند، باب 5 دلار می پردازد ( همان طور که قبلاً گفتم احتمالاً آلیس این پیشنهاد را رد می کند ).
این یک بازی مجموع - صفر است. دقیقاً آن چه باب از دست می دهد آلیس می برد و برعکس. اعداد در ماتریس بازی، مقادیری هستند که باب به آلیس پرداخت می کند، بنابراین در هر مورد، سود باب مقدار منفی از عدد مشخص شده است.

 

باب

 

 

پیاده

اتوبوس

 

 

6

3

اتوبوس

آلیس

4

5

پیاده

 

برای محاسبه ی تعادل نش، باید استراتژی مخلوط را برای هر بازیکن به گونه ای حساب کنید که بیش ترین سود را به دست آورد، با توجه به این که بازیکن دیگر نیز استراتژی مخلوط را برای بیش ترین سود انتخاب می کند. در این مثال، آلیس با احتمال p اتوبوس را و با احتمال p-1 پیاده روی را انتخاب می کند ( مجموع احتمالات باید برابر یک باشد ). باب با احتمال q اتوبوس را و با احتمال q-1 پیاده روی را انتخاب می کند.
آلیس می تواند « سود مورد انتظار » را برای انتخاب اتوبوس یا پیاده روی به شرح زیر محاسبه کند.
سود مورد انتظار از انتخاب اتوبوس برابر خواهد بود با:
سود او از اتوبوس وقتی که باب اتوبوس را انتخاب کند ضربدر احتمال این که باب اتوبوس را انتخاب کند، یا به عبارت دیگر 3 ضربدر q

به اضافه ی

سود او از اتوبوس وقتی که باب پیاده روی را انتخاب کند ضربدر احتمال این که باب پیاده روی را انتخاب کند، یا به عبارت دیگر 6 ضربدر (q-1)
سود مورد انتظار آلیس از انتخاب پیاده روی برابر خواهد بود با:
سود او از پیاده روی وقتی که باب اتوبوس را انتخاب کند ضربدر احتمال این که باب اتوبوس را انتخاب کند، یا به عبارت دیگر 5 ضربدر q

به اضافه ی

سود او از پیاده روی وقتی که باب پیاده روی را انتخاب کند ضربدر احتمال این که باب پیاده روی را انتخاب کند، یا به عبارت دیگر 4 ضربدر (q-1)
با جمع زدن خواهیم داشت:
(q-1)6+q3 = سود مورد انتظار آلیس از انتخاب اتوبوس
(q-1)4+q5 = سود مورد انتظار آلیس از انتخاب پیاده روی
با به کار بردن استدلال مشابهی برای محاسبه ی سود مورد انتظار باب خواهیم داشت:
(p-1)5- +p3- = سود مورد انتظار باب از انتخاب اتوبوس
(p-1)4- +p6- = سود مورد انتظار باب از انتخاب پیاده روی
حال، مقدار کلی سود مورد انتظار آلیس از بازی، برابر حاصل ضرب احتمال انتخاب اتوبوس توسط او ضربدر سود مورد انتظار به اضافه ی حاصل ضرب انتخاب پیاده روی ضربدر سود مورد انتظار است. برای باب نیز همین طور است. برای به دست آوردن تعادل نش، احتمالات آن ها برای دو انتخاب باید به گونه ای باشد که هیچ کدام نتوانند منفعت بیش تری را با تغییر این احتمالات به دست آورند. به عبارت دیگر، سود مورد انتظار برای هر انتخاب ( اتوبوس یا پیاده روی ) باید مساوی باشد ( اگر سود مورد انتظار برای انتخابی بیش از دیگری باشد، پس بهتر خواهد بود که بیش تر آن انتخاب را بازی کند که این به معنای افزایش احتمال آن بازی است ). برای باب، استراتژی نباید تغییرکند اگر:
(p-1)-+p6- =(p-1)5-+p3-
معادله ی بالا را می توان به صورت زیر نوشت:
p4+4-p6- =p5+5-p3-
p2-1 =p2
1=p4
حل معادله برای p، نشان می دهد که احتمال بهینه ی آلیس برای انتخاب اتوبوس برابر است با 4/1 =p
بنابراین آلیس باید یک بار از هر چهار بار، اتوبوس را انتخاب کند و سه بار دیگر پیاده برود.
حالا آلیس استراتژی اش را تغییر نخواهد داد اگر
(q-1)4+q5 = (q-1)6+q3
و حل این معادله برای q، احتمال بهینه برای انتخاب اتوبوس را می دهد.
q4-4+q5 =q6-6+q3
4+q4 = 6
q4 =2
2/1 =q
بنابراین، باب باید نیمی از مواقع اتوبوس و نیمی دیگر پیاده روی را انتخاب کند.
حال اجازه دهید فرض کنیم آلیس و باب قصد دارند بازی شاهین- فاخته را انجام دهند که در آن ساختار سود کمی پیچیده تر است؛ چرا که آن چه بازیکنی می برد ضرورتاً معادل آن چه نیست که دیگری می بازد. در ماتریس این بازی، اولین عدد، سود آلیس و دومین عدد سود باب را نشان می دهد.

 

باب

 

 

فاخته

شاهین

 

 

0 و 2

2- و 2-

شاهین

آلیس

1 و 1

2 و 0

فاخته

 

آلیس با احتمال p شاهین را و با احتمال p-1 فاخته را بازی می کند. باب با احتمال q شاهین را و با احتمال q-1 فاخته را بازی می کند. سود مورد انتظار آلیس برای بازی شاهین برابر (q-1)2+q2- و سود مورد انتظار او برای بازی فاخته برابر (q-1)1+q0 خواهد بود. سود مورد انتظار باب برای بازی شاهین برابر (p-1)2+p2- و سود مورد انتظار او برای بازی فاخته برابر (p-1)1+p0 خواهد بود.
باب استراتژی اش را تغییر نمی دهد وقتی که:
(p-1)1+p0 = (p-1)2+p2-
P3+1 =2
1=p3
3/1 =P
بنابراین، احتمال این که باب شاهین را بازی کند برابر است. در نتیجه، تعادل نش در این ساختار سود چنین است: در مواقع نقش شاهین و در مواقع در نقش فاخته بازی کند.

پي‌نوشت‌ها:

1- Bob.
2- Alice.

منبع مقاله :
سيگفريد، تام؛ (1392)، رياضيات زيبا: جان نش، نظريه بازي ها، و جست وجوي رمز طبيعت، ترجمه مهدي صادقي، تهران: نشر ني، چاپ دوم



 

 



ارسال نظر
با تشکر، نظر شما پس از بررسی و تایید در سایت قرار خواهد گرفت.
متاسفانه در برقراری ارتباط خطایی رخ داده. لطفاً دوباره تلاش کنید.
مقالات مرتبط