Стратегия godfather и hitmans в повторяющейся дилемме заключенного — Декабрь 2018

Я уже писал год назад про дилемму заключенного. Пост ниже будет интересен тем, кто знает что это такое.

Так вот, простая стратегия «Око за око с прощением» очень хорошо работает (по результатам соревнований) при повторяющихся играх. Все такие успешные стратегии удовлетворяли четырем условиям.

Они были добрые. Не предают, если этого не делает оппонент.
Они были мстительные. Если оппонент предлавал, то стратегия начинала предавать в ответ.
Они прощали. В каком-то проценте случаев, стратегия прощала оппонента и не предавала в ответ, чтобы предотвратить замкнутый круг мщения (из-за ошибки передачи, например)
Они были независтливы. Не пытались набрать больше очков, чем оппонент.

Прочитал тут интересную штуку. Оказывается, если нет ограничений на количество стратегий от игрока, то внезапно начинает хорошо работать другая стратегия. Выставляется большое количество стратегий одновременно, одна из которых главная (godfather), а все остальные вспомогательные (hitmans). Дальше работает следующая схема:

Каждая стратегия идентифицирует себя определенными шагами. Если стратегии узнают друг друга, то godfather всегда “предает”, а “hitman” всегда “сотрудничает”. Это максимизирует количество очков для godfather
Если стратегия hitman не распознает в оппоненте своего, то она всегда “предает”, чтобы минимизировать количество очков у оппонентов.
Если стратегия godfather не распознает в оппоненте своего, то она всегда выбирает “око за око” подход, который максимизирует очки для нее

Евгений Казначеев ↑ / Все заметки / Декабрь 2018

Стратегия godfather и hitmans в повторяющейся дилемме заключенного — Декабрь 2018 — Заметка №5

Декабрь 2018