Перейти в канал

Tg: Орда

189
Двое преступников — А и Б — попались примерно в одно и то же время на сходных преступлениях. Есть основания полагать, что они действовали по сговору, и полиция, изолировав их друг от друга, предлагает им одну и ту же сделку: если один свидетельствует против другого, а тот хранит молчание, то первый освобождается за помощь следствию, а второй получает максимальный срок лишения свободы (10 лет). Если оба молчат, их деяние проходит по более лёгкой статье, и каждый из них приговаривается к полугоду тюрьмы. Если оба свидетельствуют друг против друга, они получают минимальный срок (по 2 года). Каждый заключённый выбирает, молчать или свидетельствовать против другого. Однако ни один из них не знает точно, что сделает другой. Что произойдёт? Разумеется, что произойдёт, никто не знает, это умозрительная задача, но! Если мы будем исходить из того, что оба заключённых подходят к вопросу максимально рационально – и знают, что их визави также будет действовать максимально рационально – то лучшей стратегией для каждого из них будет сдать второго человека. При таком раскладе, если ты сдал напарника, то ты либо выходишь на свободу за сделку со следствием, либо получаешь не максимальный срок, если твой подельник тебя сдал. Да, если никто никого не сдаст, то оба выйдут из тюрьмы в кратчайший срок, но и риск для каждого залететь на 10 лет тоже весьма неиллюзорен – и в данном случае сильно перевешивает потенциальную выгоду. Поэтому наиболее математически верным решением подобной задачи является – сдать сообщника. Ну и чё за пурга, как это всё относится к внешним дипломатическим коммуникациям? Как финка НКВД к телеграм-каналу военблогера, дорогие друзья, давайте не будем бежать вперёд паровоза, ща всё разложим. Классическая версия дилеммы заключённого, по сути, рассказывает о любой почти интеракции между людьми, группами людей или целыми структурами вплоть до государства, потому что позволяет размотать их через призму «честного» и «нечестного» (на самом деле оптимального и неоптимального) поведения в одном раунде. Условно: если государство А идёт навстречу государству Б, но то в ответ кидает государство А через бедро – это вполне стандартная дилемма заключённого, которую вы можете натянуть на любой российский «жест доброй воли» или любую зерновую сделку, которой наша с вами Федерация за последние девять месяцев огорчила уже не одного блогера. Потому что стандартный блогер живёт именно одним раундом. Случилось событие – он отбомбился, дальше ждёт следующего, чтобы отбомбиться точно так же, сам по себе событийный процесс у него бьётся на довольно короткие отрезки и не предполагает какой-либо долгосрочной стратегии. Однако. По прошествии десятилетий классическая дилемма заключённого, разумеется, была много раз пересмотрена и дополнена, потому что наши с вами жизненные интеракции одним раундом не ограничиваются. И пересматривали её (в основном америкацы) именно с целью создания оптимальных долгосрочных стратегий. То есть. Если государство А пошло навстречу государству Б, но то в ответ начало козлить и обмануло оппонента – какой в подобном случае должна быть дальнейшая стратегия государства А при бесконечно возможном количестве раундов? В семидесятых годах прошлого столетия американский экономист Роберт Аксельрод чёрт знает откуда достал какую-то допотопную ЭВМ и загнал в неё пресловутую задачку, чтобы вычислить оптимальную стратегию взаимодействия для двух игроков в бесконечно длинном количестве раундов. В процессе программирования он опросил огромное число своих умных (без иронии) друзей-математиков, экономистов, разных нобелевских лауреатов и жидорептилоидов, чтобы те сформулировали собственные сценарии решения. И когда их получил, пустил всё по циклическому алгоритму – при таком раскладе все долгосрочные стратегии поср