Сигнальная игра - Signaling game

An обширная форма представление сигнальной игры

В теория игры, а сигнальная игра это простой тип динамичный Байесовская игра.^[1]

Это игра с двумя игроками, которая называется отправитель (S) и приемник (Р):

Отправитель может иметь один из нескольких типы. Тип отправителя t определяет функцию выплаты отправителя. Это личная информация отправителя - она не известна получателю.
Приемник имеет только один тип, поэтому, исходя из общих априорных значений, их функция выплаты известна обоим игрокам.

Игра состоит из двух этапов:

Отправитель играет на первом этапе. Они могут воспроизводить одно из нескольких действий, которые называются «сообщениями». Набор возможных сообщений M = {m₁, м₂, м₃, ..., м_j}.
Получатель воспроизводит на втором этапе после просмотра сообщения отправителя. Набор возможных действий: A = {a₁, а₂, а₃, ...., а_k}.

Два игрока получают выплаты в зависимости от типа отправителя, сообщения, выбранного отправителем, и действия, выбранного получателем.^[2]^[3]

Идеальное байесовское равновесие

В концепция равновесия что актуально для сигнальных игр Идеальное байесовское равновесие- доработка обоих Байесовское равновесие по Нэшу и идеальное равновесие по подиграм.

Тип отправителя ${ displaystyle t_ {j}}$ отправляет сообщение ${ displaystyle m ^ {*} (t_ {j})}$ в множестве вероятностных распределений над M. ( ${ displaystyle m (t_ {j})}$ представляет вероятности, которые вводят ${ displaystyle t_ {j}}$ примет любое из сообщений в M.) Получатель, наблюдающий за сообщением m, выполняет действие ${ Displaystyle а ^ {*} (м)}$ в пространстве вероятностных распределений над A.

Игра находится в идеальном байесовском равновесии, если она удовлетворяет всем четырем из следующих требований:

Получатель должен иметь представление о том, какие типы могли отправить сообщение m. Эти убеждения можно описать как распределение вероятностей ${ Displaystyle му (т_ {я} | м)}$ , вероятность того, что отправитель имеет тип ${ displaystyle t_ {i}}$ если они выберут сообщение ${ displaystyle m}$ . Сумма по всем типам ${ displaystyle t_ {i}}$ из этих вероятностей должно быть 1 условным для любого сообщения m.
Действие, которое выбирает получатель, должно максимизировать ожидаемую полезность получателя с учетом его убеждений о том, какой тип мог отправить сообщение. ${ displaystyle m}$ , ${ Displaystyle му (т | м)}$ . Это означает, что сумма ${ displaystyle sum _ {t_ {i}} mu (t_ {i} | m) U_ {R} (t_ {i}, m, a)}$ максимально. Действие ${ displaystyle a}$ что максимизирует эту сумму ${ Displaystyle а ^ {*} (м)}$ .
Для каждого типа ${ displaystyle t}$ , отправитель решает отправить сообщение ${ displaystyle m ^ {*}}$ что максимизирует полезность отправителя ${ Displaystyle U_ {S} (т, м, а ^ {*} (м))}$ учитывая стратегию, выбранную получателем, ${ displaystyle a ^ {*}}$ .
Для каждого сообщения ${ displaystyle m}$ отправитель может отправить, если существует тип ${ displaystyle t}$ такой, что ${ Displaystyle м ^ {*} (т)}$ присваивает строго положительную вероятность ${ displaystyle m}$ (т.е. для каждого сообщения, которое отправляется с положительной вероятностью), мнение получателя о типе отправителя, если они наблюдают за сообщением ${ displaystyle m}$ , ${ Displaystyle му (т | м)}$ удовлетворяет Правило Байеса: ${ Displaystyle му (т | м) = п (т) / сумма _ {т_ {я}} р (т_ {я})}$

Идеальные байесовские равновесия в такой игре можно разделить на три категории: объединение равновесий, разделяя равновесия и полуразделяя

А балансирующее равновесие - это равновесие, в котором отправители разных типов выбирают одно и то же сообщение. Это означает, что сообщение отправителя не дает получателю никакой информации, поэтому убеждения получателя не обновляются после просмотра сообщения.
А разделяющее равновесие - это равновесие, при котором отправители разных типов всегда выбирают разные сообщения. Это означает, что сообщение отправителя всегда раскрывает тип отправителя, поэтому убеждения получателя становятся детерминированными после просмотра сообщения.
А полураздельное равновесие (также называемый частичное объединение) равновесие - это равновесие, при котором одни типы отправителей выбирают одно и то же сообщение, а другие типы выбирают разные сообщения.

Обратите внимание, что если типов отправителей больше, чем сообщений, равновесие никогда не может быть разделяющим равновесием (но может быть частично разделяющим равновесием). гибридные равновесия, в котором отправитель произвольно выбирает между объединением и разделением.

Примеры

Репутационная игра

Приемник Отправитель	Оставаться	Выход
Вменяемый, Prey	P1 + P1, D2	P1 + M1, 0
Вменяемый, Размещать	Д1 + Д1, Д2	Д1 + М1, 0
Сумасшедший, Добыча	X1, P2	Х1, 0

В этой игре^[1]^:326–329^[4] отправитель и получатель - фирмы. Отправитель - действующая фирма, а получатель - фирма-новичок.

Отправитель может быть одного из двух типов: Здравомыслящий или же Псих. Вменяемый отправитель может отправить одно из двух сообщений: Добыча и Приспособить. Сумасшедший отправитель может только Prey.
Получатель может выполнить одно из двух действий: Оставаться или же Выход.

Выплаты указаны в таблице справа. Мы предполагаем, что:

M1> D1> P1, то есть разумный отправитель предпочитает быть монополистом (M1), но если это не монополия, он предпочитает приспосабливать (D1), чем добывать (P1). Обратите внимание, что значение X1 не имеет значения, поскольку безумная фирма имеет только одно возможное действие.
D2> 0> P2, то есть получатель предпочитает оставаться на рынке с разумным конкурентом (D2), чем выходить с рынка (0), но предпочитает выйти, чем оставаться на рынке с сумасшедшим конкурентом (P2).
Априори, у отправителя есть вероятность п быть вменяемым и 1-п быть сумасшедшим.

Теперь мы ищем идеальное байесовское равновесие. Удобно различать разделяющие равновесия и объединяющие равновесия.

В нашем случае разделяющее равновесие - это такое равновесие, к которому всегда приспосабливается нормальный отправитель. Это отделяет его от сумасшедшего отправителя. Во втором периоде получатель имеет полную информацию: их убеждения таковы: «Если приспосабливается, то отправитель вменяемый, в противном случае отправитель сумасшедший». Их лучший ответ: «Если приспосабливаетесь - оставайтесь, если добыча - уходите». Выплата отправителя при размещении составляет D1 + D1, но если они отклоняются от Prey, их выплата меняется на P1 + M1; следовательно, необходимое условие для разделяющего равновесия - это D1 + D1≥P1 + M1 (т.е. стоимость добычи превышает выгоду от монополии). Можно показать, что этого условия также достаточно.
Равновесие объединения - это такое равновесие, при котором разумный отправитель всегда получает прибыль. Во втором периоде у получателя нет новой информации. Если отправитель жертвует, то убеждения получателя должны быть равны априорным убеждениям, то есть отправитель с вероятностью вменяем. п и сумасшедший с вероятностью 1-п. Следовательно, ожидаемая выгода от пребывания получателя составляет: [п D2 + (1-п) P2]; получатель остается, если и только если это выражение положительное. Отправитель может получить выгоду от охоты, только если получатель уйдет. Следовательно, необходимым условием равновесия пулинга является п D2 + (1-п) P2 ≤ 0 (интуитивно получатель осторожен и не войдет в рынок, если есть риск, что отправитель сошел с ума. Отправитель знает это и, таким образом, скрывает свою истинную личность, всегда охотясь как сумасшедший). Но этого условия недостаточно: если получатель выходит также после приспосабливания, то отправителю лучше принять приспосабливание, поскольку это дешевле, чем Prey. Таким образом, необходимо, чтобы получатель оставался после приспосабливания, и необходимо, чтобы D1 + D1

Подвести итоги:

Если добыча обходится здравомыслящему отправителю дорого (D1 + D1≥P1 + M1), они приспосабливаются, и будет уникальная разделяющая PBE: получатель останется после приспосабливания и выйдет после жертвы.
Если добыча обходится не слишком дорого для здравомыслящего отправителя (D1 + D1 п D2 + (1-п) P2 ≤ 0), отправитель будет добывать, и будет уникальный пул PBE: снова получатель останется после приспосабливания и выйдет после добычи. Здесь отправитель готов потерять некоторую ценность, охотясь в первом периоде, чтобы построить репутация хищной фирмы и убедить получателя уйти.
Если добыча не является дорогостоящей для отправителя и не вредна для получателя, в чистых стратегиях не будет PBE. В смешанных стратегиях будет уникальный PBE - и отправитель, и получатель будут случайным образом выбирать между своими двумя действиями.

Образовательная игра

Эта игра была впервые представлена Майкл Спенс.^[5]^[1]^:329–331 В этой игре отправитель - рабочий, а получатель - работодатель.

Рабочий может быть одного из двух типов: Мудрый (с вероятностью п) или же Тупой (с вероятностью 1-п). Каждый тип может выбрать свой уровень образования, например Иди в колледж или же Оставайся дома. Поступление в колледж дорого обходится; Цена для мудрого работника ниже, чем для немого.
Работодатель должен решить, какую зарплату предложить работнику. Цель работодателя - предложить высокую зарплату Мудрому и низкую зарплату Тупому. Однако работодатель не знает настоящего таланта работника - только его уровень образования.

В этой модели предполагается, что уровень образования не влияет на производительность труда; он используется только как сигнал о таланте рабочего.

Подводя итог: только работники с высокими способностями могут получить определенный уровень образования, не обходясь дороже, чем повышение их заработной платы. Другими словами, выгода от образования только больше, чем затраты для работников с высоким уровнем способностей, поэтому только работники с высокими способностями получат образование.

Пиво-киш

Пивной пирог с заварным кремом из Чо и Крепса^[6] опирается на стереотип едоки пирога менее мужественны. В этой игре человек B думает, стоит ли дуэль с другим индивидуумом A. B знает, что A либо слабак или это угрюмый но не какой. B предпочел бы дуэль, если A слабак но нет, если A угрюмый. Игрок A, независимо от его типа, хочет избежать дуэли. Перед принятием решения у B есть возможность увидеть, предпочитает ли A пиво или же киш на завтрак. Оба игрока знают, что слабаки предпочитаю киш, пока угрюмые предпочитаю пиво. Смысл игры состоит в том, чтобы проанализировать выбор завтрака каждым видом А. Это стало стандартным примером сигнальной игры. Видеть^[7]^:14–18 Больше подробностей.

Приложения сигнальных игр

Сигнальные игры описывают ситуации, когда один игрок имеет информацию, которой нет у другого. Эти ситуации асимметричной информации очень распространены в экономике и поведенческой биологии.

Философия

Первая сигнальная игра была Сигнальная игра Льюиса, которое произошло в Дэвид К. Льюис Кандидатская диссертация (и более поздняя книга) соглашение. Видеть^[8] Отвечая на W.V.O. Куайн,^[9]^[10] Льюис пытается разработать теорию соглашение и смысл с помощью сигнальных игр. В своих самых крайних комментариях он предполагает, что понимание свойств равновесия соответствующей сигнальной игры охватывает все, что нужно знать о значении:

Теперь я описал характер сигнала, не упоминая значения сигналов: два фонаря означают, что красные мундиры прибывают по морю или что-то еще. Но, похоже, ничего важного не осталось недосказанным, так что сказанное должно каким-то образом подразумевать, что сигналы имеют свое значение.^[11]

Использование сигнальных игр продолжено в философской литературе. Другие использовали эволюционные модели сигнальных игр для описания появления языка. Работа над появлением языка в простых сигнальных играх включает модели Huttegger,^[12] Мрачный, и другие.,^[13] Skyrms,^[14]^[15] и Цольман.^[16] Хармс,^[17]^[18] и Хаттеггер,^[19] попытались расширить исследование, включив в него различие между нормативный и описательный язык.

Экономика

Первое применение сигнальных игр к экономическим проблемам было Майкл Спенс с Образовательная игра. Второе приложение было Репутационная игра.

Биология

Ценные успехи были достигнуты благодаря применению сигнальных игр к ряду биологических вопросов. В частности, Алан Графен s (1990) инвалидность модель отображения привлекательности товарища.^[20] Рога оленей, сложное оперение павлины и Райская птица, а песня из соловей все такие сигналы. Проведенный Графеном анализ биологической сигнализации формально похож на классическую монографию об экономической рыночной сигнализации. Майкл Спенс.^[21] Совсем недавно в серии работ Гетти^[22]^[23]^[24]^[25] показывает, что анализ Графена, как и анализ Спенса, основан на критическом упрощающем предположении о том, что сигнальщики дополняют затраты на выгоды аддитивным способом, как люди вкладывают деньги для увеличения дохода в той же валюте. Это предположение о том, что компромисс между затратами и выгодами аддитивно, может быть справедливым для некоторых биологических сигнальных систем, но неприменимо для мультипликативных компромиссов, таких как компромисс между затратами на выживание и выгодой для воспроизводства, который, как предполагается, опосредует эволюцию сигналов, отобранных половым путем.

Чарльз Годфрей (1991) моделировали попрошайничество птенцов птиц как сигнальную игру.^[26] Выпрашивание птенцов не только сообщает родителям о том, что птенец голоден, но и привлекает в гнездо хищников. Родители и птенцы конфликтуют. Птенцам выгодно, если родители усерднее работают, чтобы прокормить их, чем максимальный уровень вложений родителей. Родители обменивают вложения в нынешних птенцов на вложения в будущее потомство.

Сигналы сдерживания преследования были смоделированы как сигнальные игры.^[27] Известно, что газели Томпсона иногда исполняютStott ', прыжок в воздух на несколько футов с белым хвостом при обнаружении хищника. Алкок и другие предположили, что это действие является сигналом хищника о скорости газели. Это действие успешно различает типы, потому что это было бы невозможно или слишком дорого для больного существа, и, следовательно, хищник удерживается от преследования стоттинг-газели, потому что она, очевидно, очень проворна и ее будет трудно поймать.

Концепция чего-либо информационная асимметрия в молекулярной биологии уже давно.^[28] Хотя молекулы не являются рациональными агентами, моделирование показало, что посредством репликации, отбора и генетического дрейфа молекулы могут вести себя в соответствии с динамикой сигнальной игры. Такие модели были предложены для объяснения, например, появления генетического кода из мира РНК и аминокислот.^[29]

Дорогостоящая сигнализация по сравнению с бесплатной

Одно из основных применений сигнальных игр как в экономика и биология заключалась в том, чтобы определить, при каких условиях честная сигнализация может быть равновесием игры. То есть, при каких условиях мы можем ожидать, что рациональные люди или животные, подверженные естественному отбору, раскроют информацию о своих типах?

Если у обеих сторон совпадают интересы, то есть они обе предпочитают одинаковые результаты во всех ситуациях, то честность - это равновесие. (Хотя в большинстве этих случаев существуют и некоммуникативные равновесия.) Однако, если интересы сторон не полностью совпадают, то поддержание информационных систем сигнализации создает важную проблему.

Рассмотрим обстоятельства, описанные Джон Мейнард Смит о передаче между связанными лицами. Предположим, сигнальщик может голодать или просто голодать, и он может сообщить об этом другому человеку, у которого есть еда. Предположим, что они хотели бы больше еды независимо от своего состояния, но человек, у которого есть еда, хочет давать им еду только в том случае, если они голодают. В то время как оба игрока имеют одинаковые интересы, когда связист голодает, у них противоположные интересы, когда сигнальщик только голоден. Когда они только голодны, у них есть стимул лгать о своих потребностях, чтобы получить пищу. А если сигнальщик регулярно врет, то получатель должен игнорировать сигнал и делать то, что считает лучшим.

Определение того, насколько устойчивы сигналы в этих ситуациях, интересовало как экономистов, так и биологов, и оба независимо предположили, что стоимость сигнала может играть роль. Если отправка одного сигнала обходится дорого, то голодающий может заплатить только за то, чтобы подать сигнал. Анализ того, когда необходимы затраты для поддержания честности, был важной областью исследований в обеих этих областях.

Смотрите также

Дешевый разговор
Обширная игра формы
Неполная информация
Интуитивный критерий и Божественное равновесие - доработки PBE в сигнальных играх.
Показ игры - родственная игра, в которой получатель, вместо того, чтобы выбирать действие на основе сигнала, дает отправителю предложения на основе типа отправителя, который отправитель имеет некоторый контроль.
Сигнализация (экономика)
Теория сигналов

Темы в теория игры
Определения	Кооперативная игра Решительность Эскалация обязательств Игра в расширенной форме Победа первого и второго игрока Сложность игры Графическая игра Иерархия убеждений Информационный набор Игра в нормальной форме Предпочтение Последовательная игра Одновременная игра Выбор одновременного действия Решенная игра Лаконичная игра
Равновесие концепции	равновесие по Нэшу Совершенство подигры Устойчивое равновесие по Мертенсу Байесовское равновесие по Нэшу Идеальное байесовское равновесие Дрожащая рука Правильное равновесие Эпсилон-равновесие Коррелированное равновесие Последовательное равновесие Квази-совершенное равновесие Эволюционно устойчивая стратегия Доминирование риска Основной Значение Шепли Парето эффективность Равновесие Гиббса Квантовое равновесие отклика Самоподтверждающееся равновесие Сильное равновесие по Нэшу Марковское идеальное равновесие
Стратегии	Доминирующие стратегии Чистая стратегия Смешанная стратегия Аргумент кражи стратегии Око за око Мрачный спусковой крючок Сговор Обратная индукция Прямая индукция Марковская стратегия Затенение ставки
Классы игр	Симметричная игра Идеальная информация Повторная игра Сигнальная игра Показ игры Дешевый разговор Игра с нулевой суммой Конструкция механизма Проблема торга Стохастическая игра Среднее поле игры п-игровая игра Большая игра Пуассона Нетранзитивная игра Глобальная игра Строго определенная игра Возможная игра
Игры	Идти Шахматы Бесконечные шахматы Шашки Крестики-нолики Дилемма заключенного Игра по обмену подарками Необязательная дилемма заключенного Дилемма путешественника Координационная игра Курица Сороконожка игра Дилемма волонтера Долларовый аукцион Битва полов Охота на оленя Соответствующие пенни Ультиматум игра Камень ножницы Бумага Пиратская игра Диктаторская игра Игра в общественные блага Блотто игра Война на истощение Проблема с баром Эль Фарол Справедливое деление Ярмарка нарезки торта Игра Курно Тупик Дилемма закусочной Угадайте 2/3 среднего Покер куна Игра Нэша в торг Индукционные головоломки Доверительная игра Игра принцесс и монстров Проблема рандеву
Теоремы	Теорема о невозможности Эрроу Теорема согласия Ауманна Народная теорема Теорема о минимаксе Теорема Нэша Теорема очищения Принцип откровения Теорема Цермело
Ключ цифры	Альберт В. Такер Амос Тверски Антуан Огюстен Курно Ариэль Рубинштейн Клод Шеннон Даниэль Канеман Дэвид К. Левин Дэвид М. Крепс Дональд Б. Гиллис Дрю Фуденберг Эрик Маскин Гарольд В. Кун Герберт Саймон Эрве Мулен Жан Тироль Жан-Франсуа Мертенс Дженнифер Тур Чейес Джон Харсаньи Джон Мейнард Смит Джон Нэш Джон фон Нейман Кеннет Эрроу Кеннет Бинмор Леонид Гурвич Ллойд Шепли Мелвин Дрешер Меррилл М. Флуд Ольга Бондарева Оскар Моргенштерн Пол Милгром Пейтон Янг Райнхард Зельтен Роберт Аксельрод Роберт Ауманн Роберт Б. Уилсон Роджер Майерсон Сэмюэл Боулз Сюзанна Скотчмер Томас Шеллинг Уильям Викри
Смотрите также	All-pay аукцион Альфа – бета обрезка Парадокс Бертрана Ограниченная рациональность Комбинаторная теория игр Анализ конфронтации Сотрудничество Эволюционная теория игр Преимущество первого хода в шахматах Игровая механика Глоссарий теории игр Список теоретиков игр Список игр по теории игр Безвыигрышная ситуация Решение шахмат Топологическая игра Трагедия общественного достояния Тирания малых решений