Гладиаторы, пираты и игры на доверии. Как нами правят теория игр, стратегия и вероятности | страница 47



. Он просил многих людей, умных и мудрых, выслать ему искусные стратегии для итеративной версии «Дилеммы заключенного», определив правила игры так: если оба игрока хранят молчание, каждый получает 3 очка; если оба выбирают роль предателей, каждый получает 1 очко; если они совершают разный выбор, предатель получает 5 очков, а стойкий и молчаливый – 0. Аксельрод объявил, что для каждой игры отведено 200 раундов, и попросил предложить стратегию. Но что он имел в виду, говоря о «стратегии»?

В итеративной версии игр, основанных на «Дилемме заключенного», есть множество стратегических возможностей. «Всегда молчать» – одна из простейших стратегий, но она, несомненно, неразумна: предательство остается безнаказанным и второй игрок может легко сколотить капитал. «Всегда предавать» – гораздо более крутая стратегия. Можно выбирать всевозможные, даже самые странные стратегии: чередовать предательство с молчанием, подбрасывать монетку, выбирать случайным образом…

Вам, мой искушенный читатель, уже, наверное, ясно, что лучшая стратегия – отвечать на действия противника. И правда, на первых олимпиадах, где играли в компьютерные версии игр, основанных на «Дилемме заключенного», стратегия, приводящая к победе, была описана как «око за око». Кроме того, она была самой короткой: четыре строки на бейсике.

Создателем этой стратегии стал Анатолий Рапопорт (1911–2007), уроженец России, работавший в США. Его шаблон таков: в первом раунде вы храните молчание – иными словами, играете красиво. Потом и далее, начиная со второго раунда, вы просто повторяете предыдущий ход противника: если в первом раунде он промолчал, вы молчите во втором. Спрашивайте не о том, что вы можете сделать с противником, но о том, что он прежде сделал с вами, и поступайте так же. Стратегия «око за око» позволяла заработать в среднем 500 очков, а это довольно много. Не забывайте: если оба игрока решают молчать, они получают по 3 очка за раунд, а значит, 600 очков за игру – это и правда очень хороший результат. Эта стратегия получила высшие оценки.

Что интересно, самая сложная стратегия, с самым длинным описанием, получила низший балл. На второй олимпиаде появился подход «око за два»: если другой предает, вы даете ему возможность искупить грехи, и только если он снова выбирает предательство, вы отвечаете на это своим предательством. Эта стратегия еще «красивее», чем исходная «око за око», но ее красота может вам слишком дорого обойтись: стратегия заняла не слишком высокое место.