در نظریه بازی، استراتژی ماشه یکی از استراتژیهای پرکاربرد در بازیهای تکرارشونده است.
بازیکنی که استراتژی ماشه را به کار میبرد، در ابتدا همکاری میکند، اما به محض این که بازیکن دیگر استراتژی دیگری در پیش گرفت، بازیکنی که استراتژی ماشه را به کار بستهاست، تا انتهای بازی روشی غیر از حالت اولیه در پیش میگیرد. از آن که کوچکترین عدم همکاری از سوی بازیکن رقیب، موجب کنار گذاشتن همکاری تا ابد میشود، استراتژی ماشه بیشترین بیتفاوتی را برای بازیکنی که آن را در پیش گرفته، منعکس میسازد.
معمای دوراهی زندانی بینهایت تکرارشونده، مثالی خوب برای بررسی استراتژی ماشه است. شکل استاندارد بازی برای دو بازیکن، به صورت جدول زیر است:
زندانی ۲ سکوت میکند | زندانی ۲ خیانت میکند | |
---|---|---|
زندانی ۱ سکوت میکند | هر کدام یک ماه زندانی | زندانی ۱ یک سال حبس زندانی ۲ آزاد میشود |
زندانی ۱ خیانت میکند | زندانی۱ آزاد میشود زندانی ۲ یک سال حبس | هر کدام ۳ ماه زندانی |
در این بازی، در هر مرحله دو انتخاب برای هر یک از دو بازیکن وجود دارد:
اگر یک بازیکن تخطی کند، او در بقیه بازی تنبیه خواهد شد. در واقع، برای هر دو بازیکن بهتر است که همکاری کنند، تا این که یکی به دیگری خیانت کند؛ لذا انتخاب ترکیب استراتژی (سکوت، سکوت) نسبت به (خیانت، خیانت) برای هر دو بازیکن بهتر است. همچنین تنها تعادل نش بازی، ترکیب ترک همکاری و تنبیه یکدیگر است.
در استراتژی ماشه، یک بازیکن در دور اول و دورهای بعدی، همکاری میکند و این روند را تا زمانی که حریفش نسبت به توافقشان خیانت نکردهاست، ادامه میدهد. هر گاه یکی از بازیکنان متوجه شود که حریفش به او خیانت کردهاست، از مرحله بعد تا ابد او را تنبیه خواهد کرد.
به منظور محاسبه تعادل نش زیر بازی کامل برای استراتژی ماشه زیر که برای بازی در نظر گرفته شده، استراتژی برای بازیکنان i و j به صورت زیر است:
این استراتژی در صورتی که ضریب تنزیل باشد، تعادل نش زیربازی کامل است. به عبارت دیگر، اگر ضریب تنزیل کمتر از نیم باشد، هیچیک از دو بازیکن انگیزه ای برای خیانت و خروج از توافق ندارند.
برای اثبات این که این استراتژی تعادل نش زیربازی کامل است، نشان میدهیم که همکاری بهترین پاسخ به همکاری بازیکن دیگر است و ترک توافق نیز بهترین پاسخ به ترک توافق از سوی بازیکنِ حریف.
مرحله ۱: فرض میکنیم تاکنون خیانتی نشدهاست:
در این حالت، همکاری تا زمانی که باشد بهتر از خیانت است. این نشان میدهد که اگر باشد، همکاری بهینه پارتو است.
مرحله ۲: فرض کنید که تاکنون یک نفر خیانت کردهاست. در این صورت:
در این حالت نیز به ازای مقادیر مختلف دلتا، خیانت بهترین پاسخ است.
استدلال اخیر نشان میدهد که اگر دلتا از نیم بزرگتر باشد، انگیزه ای برای تخطی از همکاری وجود ندارد.
در روابط بینالملل، یک کشور تحت استراتژی ماشه تنها در صورتی با کشور شریکش همکاری میکند که هیچگاه از سوی آن کشور استثمار نشده و آن کشور به توافقهایش پایبند بوده باشد. از آن که در صورت تخطی یک کشور از توافق، کشور دیگر تا ابد خلاف آن توافق را عمل خواهد کرد، استراتژی ماشه میتواند تبدیل به یک حالت محدودکننده شود، حالتی که همه اعضا در آن به شدیدترین شکل رفتار میکنند. قضیه عامیانه بیان میکند که اگر دو کشور صبور باشند، میتوان به یک تعادل کامل دست یافت.
این به آن در و استراتژی ماشه، استراتژیهایی هستند که تا حدی به هم شبیهاند. در هر دو استراتژی در صورتی که بازیکن توان ترک توافقش را داشته باشد، در ابتدا از آن امتناع میکند. تفاوت در این است که استراتژی ماشه به شکل سختگیرانه ای شدیدترین تنبیه ممکن را برای بازیکنی که تخطی کردهاست در نظر میگرد، اما این به آن در (tit-for-tat) سخاوتمندانه تر است.
This article uses material from the Wikipedia فارسی article استراتژی ماشه, which is released under the Creative Commons Attribution-ShareAlike 3.0 license ("CC BY-SA 3.0"); additional terms may apply (view authors). محتوا تحت CC BY-SA 4.0 در دسترس است مگر خلافش ذکر شده باشد. Images, videos and audio are available under their respective licenses.
®Wikipedia is a registered trademark of the Wiki Foundation, Inc. Wiki فارسی (DUHOCTRUNGQUOC.VN) is an independent company and has no affiliation with Wiki Foundation.