Сигнальная игра - Signaling game

An обширная форма представление сигнальной игры

В теория игры, а сигнальная игра это простой тип динамичный Байесовская игра.[1]

Это игра с двумя игроками, которая называется отправитель (S) и приемник (Р):

  • Отправитель может иметь один из нескольких типы. Тип отправителя t определяет функцию выплаты отправителя. Это личная информация отправителя - она ​​не известна получателю.
  • Приемник имеет только один тип, поэтому, исходя из общих априорных значений, их функция выплаты известна обоим игрокам.

Игра состоит из двух этапов:

  • Отправитель играет на первом этапе. Они могут воспроизводить одно из нескольких действий, которые называются «сообщениями». Набор возможных сообщений M = {m1, м2, м3, ..., мj}.
  • Получатель воспроизводит на втором этапе после просмотра сообщения отправителя. Набор возможных действий: A = {a1, а2, а3, ...., аk}.

Два игрока получают выплаты в зависимости от типа отправителя, сообщения, выбранного отправителем, и действия, выбранного получателем.[2][3]

Идеальное байесовское равновесие

В концепция равновесия что актуально для сигнальных игр Идеальное байесовское равновесие- доработка обоих Байесовское равновесие по Нэшу и идеальное равновесие по подиграм.

Тип отправителя отправляет сообщение в множестве вероятностных распределений над M. ( представляет вероятности, которые вводят примет любое из сообщений в M.) Получатель, наблюдающий за сообщением m, выполняет действие в пространстве вероятностных распределений над A.

Игра находится в идеальном байесовском равновесии, если она удовлетворяет всем четырем из следующих требований:

  • Получатель должен иметь представление о том, какие типы могли отправить сообщение m. Эти убеждения можно описать как распределение вероятностей , вероятность того, что отправитель имеет тип если они выберут сообщение . Сумма по всем типам из этих вероятностей должно быть 1 условным для любого сообщения m.
  • Действие, которое выбирает получатель, должно максимизировать ожидаемую полезность получателя с учетом его убеждений о том, какой тип мог отправить сообщение. , . Это означает, что сумма максимально. Действие что максимизирует эту сумму .
  • Для каждого типа , отправитель решает отправить сообщение что максимизирует полезность отправителя учитывая стратегию, выбранную получателем, .
  • Для каждого сообщения отправитель может отправить, если существует тип такой, что присваивает строго положительную вероятность (т.е. для каждого сообщения, которое отправляется с положительной вероятностью), мнение получателя о типе отправителя, если они наблюдают за сообщением , удовлетворяет Правило Байеса:

Идеальные байесовские равновесия в такой игре можно разделить на три категории: объединение равновесий, разделяя равновесия и полуразделяя

  • А балансирующее равновесие - это равновесие, в котором отправители разных типов выбирают одно и то же сообщение. Это означает, что сообщение отправителя не дает получателю никакой информации, поэтому убеждения получателя не обновляются после просмотра сообщения.
  • А разделяющее равновесие - это равновесие, при котором отправители разных типов всегда выбирают разные сообщения. Это означает, что сообщение отправителя всегда раскрывает тип отправителя, поэтому убеждения получателя становятся детерминированными после просмотра сообщения.
  • А полураздельное равновесие (также называемый частичное объединение) равновесие - это равновесие, при котором одни типы отправителей выбирают одно и то же сообщение, а другие типы выбирают разные сообщения.

Обратите внимание, что если типов отправителей больше, чем сообщений, равновесие никогда не может быть разделяющим равновесием (но может быть частично разделяющим равновесием). гибридные равновесия, в котором отправитель произвольно выбирает между объединением и разделением.

Примеры

Репутационная игра

Приемник
Отправитель
ОставатьсяВыход
Вменяемый, PreyP1 + P1, D2P1 + M1, 0
Вменяемый, РазмещатьД1 + Д1, Д2Д1 + М1, 0
Сумасшедший, ДобычаX1, P2Х1, 0

В этой игре[1]:326–329[4] отправитель и получатель - фирмы. Отправитель - действующая фирма, а получатель - фирма-новичок.

  • Отправитель может быть одного из двух типов: Здравомыслящий или же Псих. Вменяемый отправитель может отправить одно из двух сообщений: Добыча и Приспособить. Сумасшедший отправитель может только Prey.
  • Получатель может выполнить одно из двух действий: Оставаться или же Выход.

Выплаты указаны в таблице справа. Мы предполагаем, что:

  • M1> D1> P1, то есть разумный отправитель предпочитает быть монополистом (M1), но если это не монополия, он предпочитает приспосабливать (D1), чем добывать (P1). Обратите внимание, что значение X1 не имеет значения, поскольку безумная фирма имеет только одно возможное действие.
  • D2> 0> P2, то есть получатель предпочитает оставаться на рынке с разумным конкурентом (D2), чем выходить с рынка (0), но предпочитает выйти, чем оставаться на рынке с сумасшедшим конкурентом (P2).
  • Априори, у отправителя есть вероятность п быть вменяемым и 1-п быть сумасшедшим.

Теперь мы ищем идеальное байесовское равновесие. Удобно различать разделяющие равновесия и объединяющие равновесия.

  • В нашем случае разделяющее равновесие - это такое равновесие, к которому всегда приспосабливается нормальный отправитель. Это отделяет его от сумасшедшего отправителя. Во втором периоде получатель имеет полную информацию: их убеждения таковы: «Если приспосабливается, то отправитель вменяемый, в противном случае отправитель сумасшедший». Их лучший ответ: «Если приспосабливаетесь - оставайтесь, если добыча - уходите». Выплата отправителя при размещении составляет D1 + D1, но если они отклоняются от Prey, их выплата меняется на P1 + M1; следовательно, необходимое условие для разделяющего равновесия - это D1 + D1≥P1 + M1 (т.е. стоимость добычи превышает выгоду от монополии). Можно показать, что этого условия также достаточно.
  • Равновесие объединения - это такое равновесие, при котором разумный отправитель всегда получает прибыль. Во втором периоде у получателя нет новой информации. Если отправитель жертвует, то убеждения получателя должны быть равны априорным убеждениям, то есть отправитель с вероятностью вменяем. п и сумасшедший с вероятностью 1-п. Следовательно, ожидаемая выгода от пребывания получателя составляет: [п D2 + (1-п) P2]; получатель остается, если и только если это выражение положительное. Отправитель может получить выгоду от охоты, только если получатель уйдет. Следовательно, необходимым условием равновесия пулинга является п D2 + (1-п) P2 ≤ 0 (интуитивно получатель осторожен и не войдет в рынок, если есть риск, что отправитель сошел с ума. Отправитель знает это и, таким образом, скрывает свою истинную личность, всегда охотясь как сумасшедший). Но этого условия недостаточно: если получатель выходит также после приспосабливания, то отправителю лучше принять приспосабливание, поскольку это дешевле, чем Prey. Таким образом, необходимо, чтобы получатель оставался после приспосабливания, и необходимо, чтобы D1 + D1

Подвести итоги:

  • Если добыча обходится здравомыслящему отправителю дорого (D1 + D1≥P1 + M1), они приспосабливаются, и будет уникальная разделяющая PBE: получатель останется после приспосабливания и выйдет после жертвы.
  • Если добыча обходится не слишком дорого для здравомыслящего отправителя (D1 + D1 п D2 + (1-п) P2 ≤ 0), отправитель будет добывать, и будет уникальный пул PBE: снова получатель останется после приспосабливания и выйдет после добычи. Здесь отправитель готов потерять некоторую ценность, охотясь в первом периоде, чтобы построить репутация хищной фирмы и убедить получателя уйти.
  • Если добыча не является дорогостоящей для отправителя и не вредна для получателя, в чистых стратегиях не будет PBE. В смешанных стратегиях будет уникальный PBE - и отправитель, и получатель будут случайным образом выбирать между своими двумя действиями.

Образовательная игра

Эта игра была впервые представлена Майкл Спенс.[5][1]:329–331 В этой игре отправитель - рабочий, а получатель - работодатель.

  • Рабочий может быть одного из двух типов: Мудрый (с вероятностью п) или же Тупой (с вероятностью 1-п). Каждый тип может выбрать свой уровень образования, например Иди в колледж или же Оставайся дома. Поступление в колледж дорого обходится; Цена для мудрого работника ниже, чем для немого.
  • Работодатель должен решить, какую зарплату предложить работнику. Цель работодателя - предложить высокую зарплату Мудрому и низкую зарплату Тупому. Однако работодатель не знает настоящего таланта работника - только его уровень образования.

В этой модели предполагается, что уровень образования не влияет на производительность труда; он используется только как сигнал о таланте рабочего.

Подводя итог: только работники с высокими способностями могут получить определенный уровень образования, не обходясь дороже, чем повышение их заработной платы. Другими словами, выгода от образования только больше, чем затраты для работников с высоким уровнем способностей, поэтому только работники с высокими способностями получат образование.

Пиво-киш

Пивной пирог с заварным кремом из Чо и Крепса[6] опирается на стереотип едоки пирога менее мужественны. В этой игре человек B думает, стоит ли дуэль с другим индивидуумом A. B знает, что A либо слабак или это угрюмый но не какой. B предпочел бы дуэль, если A слабак но нет, если A угрюмый. Игрок A, независимо от его типа, хочет избежать дуэли. Перед принятием решения у B есть возможность увидеть, предпочитает ли A пиво или же киш на завтрак. Оба игрока знают, что слабаки предпочитаю киш, пока угрюмые предпочитаю пиво. Смысл игры состоит в том, чтобы проанализировать выбор завтрака каждым видом А. Это стало стандартным примером сигнальной игры. Видеть[7]:14–18 Больше подробностей.

Приложения сигнальных игр

Сигнальные игры описывают ситуации, когда один игрок имеет информацию, которой нет у другого. Эти ситуации асимметричной информации очень распространены в экономике и поведенческой биологии.

Философия

Первая сигнальная игра была Сигнальная игра Льюиса, которое произошло в Дэвид К. Льюис Кандидатская диссертация (и более поздняя книга) соглашение. Видеть[8] Отвечая на W.V.O. Куайн,[9][10] Льюис пытается разработать теорию соглашение и смысл с помощью сигнальных игр. В своих самых крайних комментариях он предполагает, что понимание свойств равновесия соответствующей сигнальной игры охватывает все, что нужно знать о значении:

Теперь я описал характер сигнала, не упоминая значения сигналов: два фонаря означают, что красные мундиры прибывают по морю или что-то еще. Но, похоже, ничего важного не осталось недосказанным, так что сказанное должно каким-то образом подразумевать, что сигналы имеют свое значение.[11]

Использование сигнальных игр продолжено в философской литературе. Другие использовали эволюционные модели сигнальных игр для описания появления языка. Работа над появлением языка в простых сигнальных играх включает модели Huttegger,[12] Мрачный, и другие.,[13] Skyrms,[14][15] и Цольман.[16] Хармс,[17][18] и Хаттеггер,[19] попытались расширить исследование, включив в него различие между нормативный и описательный язык.

Экономика

Первое применение сигнальных игр к экономическим проблемам было Майкл Спенс с Образовательная игра. Второе приложение было Репутационная игра.

Биология

Ценные успехи были достигнуты благодаря применению сигнальных игр к ряду биологических вопросов. В частности, Алан Графен s (1990) инвалидность модель отображения привлекательности товарища.[20] Рога оленей, сложное оперение павлины и Райская птица, а песня из соловей все такие сигналы. Проведенный Графеном анализ биологической сигнализации формально похож на классическую монографию об экономической рыночной сигнализации. Майкл Спенс.[21] Совсем недавно в серии работ Гетти[22][23][24][25] показывает, что анализ Графена, как и анализ Спенса, основан на критическом упрощающем предположении о том, что сигнальщики дополняют затраты на выгоды аддитивным способом, как люди вкладывают деньги для увеличения дохода в той же валюте. Это предположение о том, что компромисс между затратами и выгодами аддитивно, может быть справедливым для некоторых биологических сигнальных систем, но неприменимо для мультипликативных компромиссов, таких как компромисс между затратами на выживание и выгодой для воспроизводства, который, как предполагается, опосредует эволюцию сигналов, отобранных половым путем.

Чарльз Годфрей (1991) моделировали попрошайничество птенцов птиц как сигнальную игру.[26] Выпрашивание птенцов не только сообщает родителям о том, что птенец голоден, но и привлекает в гнездо хищников. Родители и птенцы конфликтуют. Птенцам выгодно, если родители усерднее работают, чтобы прокормить их, чем максимальный уровень вложений родителей. Родители обменивают вложения в нынешних птенцов на вложения в будущее потомство.

Сигналы сдерживания преследования были смоделированы как сигнальные игры.[27] Известно, что газели Томпсона иногда исполняютStott ', прыжок в воздух на несколько футов с белым хвостом при обнаружении хищника. Алкок и другие предположили, что это действие является сигналом хищника о скорости газели. Это действие успешно различает типы, потому что это было бы невозможно или слишком дорого для больного существа, и, следовательно, хищник удерживается от преследования стоттинг-газели, потому что она, очевидно, очень проворна и ее будет трудно поймать.

Концепция чего-либо информационная асимметрия в молекулярной биологии уже давно.[28] Хотя молекулы не являются рациональными агентами, моделирование показало, что посредством репликации, отбора и генетического дрейфа молекулы могут вести себя в соответствии с динамикой сигнальной игры. Такие модели были предложены для объяснения, например, появления генетического кода из мира РНК и аминокислот.[29]

Дорогостоящая сигнализация по сравнению с бесплатной

Одно из основных применений сигнальных игр как в экономика и биология заключалась в том, чтобы определить, при каких условиях честная сигнализация может быть равновесием игры. То есть, при каких условиях мы можем ожидать, что рациональные люди или животные, подверженные естественному отбору, раскроют информацию о своих типах?

Если у обеих сторон совпадают интересы, то есть они обе предпочитают одинаковые результаты во всех ситуациях, то честность - это равновесие. (Хотя в большинстве этих случаев существуют и некоммуникативные равновесия.) Однако, если интересы сторон не полностью совпадают, то поддержание информационных систем сигнализации создает важную проблему.

Рассмотрим обстоятельства, описанные Джон Мейнард Смит о передаче между связанными лицами. Предположим, сигнальщик может голодать или просто голодать, и он может сообщить об этом другому человеку, у которого есть еда. Предположим, что они хотели бы больше еды независимо от своего состояния, но человек, у которого есть еда, хочет давать им еду только в том случае, если они голодают. В то время как оба игрока имеют одинаковые интересы, когда связист голодает, у них противоположные интересы, когда сигнальщик только голоден. Когда они только голодны, у них есть стимул лгать о своих потребностях, чтобы получить пищу. А если сигнальщик регулярно врет, то получатель должен игнорировать сигнал и делать то, что считает лучшим.

Определение того, насколько устойчивы сигналы в этих ситуациях, интересовало как экономистов, так и биологов, и оба независимо предположили, что стоимость сигнала может играть роль. Если отправка одного сигнала обходится дорого, то голодающий может заплатить только за то, чтобы подать сигнал. Анализ того, когда необходимы затраты для поддержания честности, был важной областью исследований в обеих этих областях.

Смотрите также

Рекомендации

  1. ^ а б c Подраздел 8.2.2 в Fudenberg Trole 1991, стр. 326–331
  2. ^ Гиббонс, Роберт (1992). Учебник по теории игр. Нью-Йорк: Harvester Wheatsheaf. ISBN  978-0-7450-1159-2.
  3. ^ Осборн, М. Дж. И Рубинштейн, А. (1994). Курс теории игр. Кембридж: MIT Press. ISBN  978-0-262-65040-3.
  4. ^ которая представляет собой упрощенную версию модели репутации, предложенной в 1982 году Крепсом, Уилсоном, Милгромом и Робертсом.
  5. ^ Спенс, А.М. (1973). «Сигнализация рынка труда». Ежеквартальный журнал экономики. 87 (3): 355–374. Дои:10.2307/1882010. JSTOR  1882010.
  6. ^ Чо, Ин-Ку; Крепс, Дэвид М. (май 1987 г.). «Сигнальные игры и стабильные равновесия». Ежеквартальный журнал экономики. 102 (2): 179–222. CiteSeerX  10.1.1.407.5013. Дои:10.2307/1885060. JSTOR  1885060.
  7. ^ Джеймс Пек. «Идеальное байесовское равновесие» (PDF). Государственный университет Огайо. Получено 2 сентября 2016.
  8. ^ Льюис, Д. (1969). Соглашение. Философское исследование. Кембридж: Издательство Гарвардского университета.
  9. ^ Куайн, В. В. О. (1936). «Правда по условности». Философские эссе для Альфреда Норта Уайтхеда. Лондон: Longmans, Green & Co., стр. 90–124. ISBN  978-0-8462-0970-6. (Перепечатка)
  10. ^ Куайн, В. В. О. (1960). «Карнап и логическая истина». Синтез. 12 (4): 350–374. Дои:10.1007 / BF00485423.
  11. ^ Льюис (1969), стр. 124.
  12. ^ Хаттеггер, С. М. (2007). «Эволюция и объяснение смысла». Философия науки. 74 (1): 1–24. Дои:10.1086/519477.
  13. ^ Grim, P .; Кокалис, Т .; Алай-Тафти, А .; Kilb, N .; Сен-Дени, Поль (2001). «Осуществление смысла». Технический отчет № 01-02. Стоуни Брук: Группа логики и формальной семантики SUNY, Стоуни Брук.
  14. ^ Скирмс, Б. (1996). Эволюция общественного договора. Кембридж: Издательство Кембриджского университета. ISBN  978-0-521-55471-8.
  15. ^ Скирмс, Б. (2010). Развитие сигналов, обучение и информация. Нью-Йорк: Издательство Оксфордского университета. ISBN  978-0-19-958082-8.
  16. ^ Золлман, К. Дж. С. (2005). «Разговор с соседями: эволюция регионального смысла». Философия науки. 72 (1): 69–85. Дои:10.1086/428390.
  17. ^ Хармс, В. Ф. (2000). «Адаптация и моральный реализм». Биология и философия. 15 (5): 699–712. Дои:10.1023 / А: 1006661726993.
  18. ^ Хармс, В. Ф. (2004). Информация и значение в эволюционных процессах. Кембридж: Издательство Кембриджского университета. ISBN  978-0-521-81514-7.
  19. ^ Хаттеггер, С. М. (2005). «Эволюционные объяснения указателей и императивов». Erkenntnis. 66 (3): 409–436. Дои:10.1007 / s10670-006-9022-1.
  20. ^ Графен, А. (1990). «Биологические сигналы как помеха». Журнал теоретической биологии. 144 (4): 517–546. Дои:10.1016 / S0022-5193 (05) 80088-8. PMID  2402153.
  21. ^ Спенс, А. М. (1974). Сигнализация рынка: передача информации при найме и связанных процессах. Кембридж: Издательство Гарвардского университета.
  22. ^ Гетти, Т. (1998). «Сигнализация инвалидности: когда плодовитость и жизнеспособность не сходятся». Поведение животных. 56 (1): 127–130. Дои:10.1006 / anbe.1998.0744. PMID  9710469.
  23. ^ Гетти, Т. (1998). «Надежная сигнализация не должна быть помехой». Поведение животных. 56 (1): 253–255. Дои:10.1006 / anbe.1998.0748. PMID  9710484.
  24. ^ Гетти, Т. (2002). «Сигнальное здоровье против паразитов». Американский натуралист. 159 (4): 363–371. Дои:10.1086/338992. PMID  18707421.
  25. ^ Гетти, Т. (2006). «Сигналы, выбранные половым путем, не похожи на спортивные увечья». Тенденции в экологии и эволюции. 21 (2): 83–88. Дои:10.1016 / j.tree.2005.10.016. PMID  16701479.
  26. ^ Годфрей, Х. К. Дж. (1991). «Сигнализация потребности потомством своим родителям». Природа. 352 (6333): 328–330. Дои:10.1038 / 352328a0.
  27. ^ Ячи, С. (1995). «Как может развиваться честная сигнализация? Роль принципа гандикапа». Труды Лондонского королевского общества B. 262 (1365): 283–288. Дои:10.1098 / rspb.1995.0207.
  28. ^ Джон Мейнард Смит. (2000) Концепция информации в биологии. Философия науки. 67 (2): 177-194
  29. ^ Jee, J .; Sundstrom, A .; Massey, S.E .; Мишра, Б. (2013). «Что информационные асимметричные игры могут рассказать нам о контексте« Замороженной аварии »Крика?». Журнал интерфейса Королевского общества. 10 (88): 20130614. Дои:10.1098 / rsif.2013.0614. ЧВК  3785830. PMID  23985735.