​Международной группе исследователей из МФТИ, Сколтеха, Томского государственного университета и Орегонского университета удалось теоретически описать сильные отклонения участников от рационального поведения в «Дилемме Заключенного» — известной стратегической игре из теории игр.

После знакомства и недолгого общения участников лабораторных экспериментов, уровень их кооперации повысился со стандартных 20% до более чем 50%. Результат был опубликован в журнале PLOS ONE.

Теория игр — это наука о принятии решений, математический метод изучения оптимальных стратегий в играх, где игроки обладают разными интересами и могут действовать нерационально. Её методики активно используются в экономике, политологии, психологии и многих других социальных сферах жизни.

В исследовании применялись методы экспериментальной экономики. Она позволяет выявлять модели поведения людей в определенных социально-экономических ситуациях, понимать влияние одних событий и факторов на другие, прослеживать логику принятия решения в различных экономических областях.

Чтобы проанализировать социальные характеристики поведения людей во время игрового взаимодействия в группах от 4-х до 12-ти человек, ученые в течение трех лет проводили эксперименты в Лаборатории экспериментальной экономики МФТИ совместно со Сколтехом. Исследователи изучали индивидуальные процессы принятия решения при различных условиях, а также влияние социальных факторов, психологии и физиологии. В опубликованной работе исследователи представили результаты восьми экспериментов, в каждом из которых принимало участие 12 игроков. Всего было задействовано 96 человек: 59 мужчин и 37 женщин.

Студенты МФТИ, которые принимали участие в экспериментах, изначально были незнакомы, и вначале действовали по стандартной схеме выбора стратегий в игре «Дилемма Заключенного». Ее суть заключалась в том, что участникам предлагалось анонимно взаимодействовать друг с другом посредством двух действий: кооперировать (К) или предавать (П). По правилам игры, если один игрок выбирает «К», а другой «П», предатель получает 10 очков, а кооператор - 0 очков. Если оба игрока выбирают «К», каждому достается по 5 очков, если «П» -  каждый получает всего по 1 очку. Зная правила, можно понять, что кооперироваться выгодно, хотя с точки зрения математики рациональнее выбирать предательство. Именно эта ситуация является в данной игре равновесием по Нэшу, то есть математически верной стратегией, названной именем автора — знаменитого нобелевского лауреата Джона Форбса Нэша. Отклонение от равновесия Нэша не приводит к увеличению выигрыша, если другие участники игры своих стратегий не меняют. В начале игры уровень кооперации в группах составил в среднем 21%, то есть участники скорее выбирали рациональную стратегию предательства. Но после знакомства и «социализации», средний уровень кооперации увеличился до 53% и выше, то есть в среднем участники скорее отклонялись от равновесия Нэша, чем придерживались рациональной стратегии.

Расчеты ученых показали, что поведение участников до социализации может быть описано с помощью модели Quantal Response Equilibrium (QRE). Концепция QRE возникла на стыке теории игр и экспериментальной экономики для объяснения наблюдаемого поведения участников лабораторных экспериментов в тех случаях, когда оно отличается от равновесия Нэша. Эта модель хорошо соответствовала практике для порядка 20% процентов отклонений. Но оказалось, что стандартный подход QRE не может применяться для описания поведения участников после социализации, потому что отклонений участников от равновесия Нэша в этом случае становится слишком много - больше половины, то есть их уже нельзя считать случайными ошибками, как это делается в традиционной модели.

Поэтому математики решили применить марковские стратегии для теоретического обоснования полученных экспериментальных данных. Ученые построили и проанализировали модель повторяющейся игры «Дилеммы Заключенного». Каждый участник мог реагировать только на то, какую стратегию (кооперировать или предавать) реализовал его случайный анонимный партнер ход назад. Анализируя эту информацию, он делал выбор стратегии на текущем ходе. Такой подход, названный в честь автора - русского математика Андрея Маркова, в итоге позволил получить игру в нормальной форме: то есть состоящей из множества игроков, множества чистых стратегий и множества действий каждого игрока. Также удалось показать, что выигрыши нелинейно зависят от вероятностей поведения игроков. Ученые нашли в явном виде семейство внутренних симметричных равновесий Нэша: набор оптимальных стратегий, одинаковый для обоих партнеров и зависящий только от вероятностей поведения игроков.

Таким образом, ученым удалось построить теоретическую модель, позволяющую описывать преобладание выбора кооперативных стратегий в повторяющейся игре «Дилемма Заключенного»  и соответствующую экспериментальным данным.

Иван Меньшиков, доцент кафедры анализа систем и решений МФТИ: «Парадокс индивидуальной рациональности разбирается на примере «Дилеммы Заключенного» уже на первой лекции практически любого курса по теории игр. Тем не менее, эта игра в чем-то сложнее шахмат: применение каждым участником своей наилучшей стратегии приводит к плохому исходу для всех. Нам удалось полностью исследовать повторяющуюся «Дилемму Заключенного» в марковских стратегиях. Более того, нам повезло еще раз. Оказалась, что поведение участников экспериментов приближается к теоретическим равновесным положениям, найденных нами, причем при разных уровнях социализации. Еще один удивительный пример, как математическая модель рождается из анализа поведения людей».

По словам ученых, остаются открытыми вопросы теоретического обоснования результатов таких игр, как «Игра на доверие» и «Игра-Ультиматум», экспериментальные данные которых не соответствуют известным теоретическим игровым моделям в рамках исследования влияния социального взаимодействия.

Исследование было поддержано Программой повышения конкурентоспособности Томского государственного университета.

Источники

Математики построили модель сотрудничества "заключенных"
Научная Россия (scientificrussia.ru), 28/02/2018

Похожие новости

  • 27/10/2017

    Ректор ТУСУРа принимает участие в форуме Russian Blockchain Week – 2017

    Ректор ТУСУРа Александр Шелупанов принимает участие в форуме Russian Blockchain Week – 2017, который проходит 26 – 28 октября в Российском экономическом университете им. Г. В. Плеханова (РЭУ).
    588
  • 16/03/2018

    Томские ученые предложили установить на дорогах роботов-полицейских

    ​В Москве прошел заключительный этап X Всероссийского робототехнического фестиваля "Робофест-2018". В финале команда Томского политехнического университета представила проект "Создание системы распознавания дорожных знаков для беспилотных транспортных средств" и завоевала бронзовую медаль в конкурсе.
    205
  • 02/11/2017

    Студент ТПУ разработал приложение, объединяющее патриотичных студентов по всей России

    ​Студент Инженерной школы энергетики Томского политехнического университета Даниил Акулин создал мобильное приложение, которое поможет объединить активную, патриотично настроенную молодежь. Средства на проект, представленный на Всемирном фестивале молодежи и студентов, собираются через краудфандинговую платформу.
    317
  • 03/05/2017

    В онлайн-курс СКОЛКОВО по управлению университетами включен опыт ТГУ

    ​Московская школа управления СКОЛКОВО запустила онлайн-курс "Управление университетами", цель которого - посмотреть на университет как на объект управления и расширить представления о том, что и как можно менять в российских университетах.
    886
  • 27/04/2018

    Томский ученый разрабатывает экономичную систему навигации для подводной робототехники

    ​Программист отдела программного обеспечения Инженерной школы информационных технологий и робототехники Томского политехнического университета Руслан Нурмухаметов разрабатывает инерциальную систему навигации, адаптированную для использования в подводной робототехнике.
    166
  • 18/05/2018

    В ТУСУРе разработали электронный курс по теории игр

    ​На факультете безопасности ТУСУРа разработан электронный курс по дисциплине "Теория игр и исследование операций" с индивидуализацией обучения, с помощью которого студенты осваивают материал, анализируют ошибки и выполняют контрольные работы.
    102
  • 05/02/2018

    Россия должна преодолеть риски цифровой экономики

    Технологии будут развиваться только если государство сделает акцент на привлечении и удержании квалифицированных специалистов, обеспечив доступ к финансированию и создав благоприятные условия для роста экономики.
    340
  • 20/04/2018

    ТПУ представил свои разработки на международном салоне образования

    ​С 18 по 21 апреля делегация Томского политеха работает на V Московском международном салоне образования (ММСО), представляя лучшие практики ТПУ, уникальные образовательные программы и опыт вуза в области интернационализации образования.
    145
  • 26/04/2017

    Студент ТУСУРа представил инновационную разработку для образования и развлечений

    Студент Томского госуниверситета систем управления и радиоэлектроники разработал прототип электронного устройства для применения в сферах образования, игр, развлечения и даже для сценических шоу. Простой, но вариативный По словам разработчика студента 2-го курса кафедры электронных приборов (ЭП) ТУСУРа Егора Полынцева, электронное устройство "РобоBall", над которым он работает, можно использовать в трех основных сферах: это образование, детские игры и развлечения, а также для постановки различных шоу-программ.
    588
  • 19/07/2017

    Ученые ТПУ представляют свои разработки на крупнейшем авиасалоне МАКС-2017

    ​​18 июля XIII Международный авиационно-космический салон "МАКС-2017" - один из крупнейших мировых авиасалонов - начал свою работу на аэродроме в подмосковном Жуковском. Томский политехнический университет представляет здесь свои уникальные разработки, среди которых тепловой дефектоскоп для контроля композиционных материалов авиационной техники, технологии 3D-печати в условиях невесомости, покрытия для станций "Глонасс" и для защиты солнечных батарей, антиметеоритные защитные пленки для иллюминаторов космических кораблей.
    400