<<
>>

П.2. Стабильные информационные равновесия

Одной из особенностей «классического» равновесия Нэша является его самоподдерживающийся характер - если игра повторяется несколько раз, и все игроки кроме i-го выбирают одни и те же равновесные действия, то и i-му нет резона отклоняться от своего равновесного действия.
Это обстоятельство очевидным образом связано с тем, что представления всех игроков о реальности адекватны - значение состояния природы является общим знанием.

В случае информационного равновесия ситуация, вообще говоря, может быть иной. Действительно, в результате однократного разыгрывания игры может оказаться, что какие-то из игроков (или даже все) наблюдают не тот результат, на который они рассчитывали. Это может быть связано как с неверным представлением о состоянии природы, так и с неадекватной информированностью о представлениях оппонентов. В любом случае, самоподдерживающийся характер равновесия нарушается - если игра повторяется во второй раз, действия игроков могут измениться.

Однако в некоторых случаях самоподдерживающийся характер равновесия может иметь место и при различных (и, вообще говоря, неверных) представлениях агентов. Говоря неформально, это происходит тогда, когда каждый агент (как реальный, так и фантомный) наблюдает тот результат игры, которого ожидает. Для формального изложения нам понадобится дополнить описание рефлексивной игры.

Напомним, что рефлексивная игра задается кортежем {N, (X) е N, fi( )i е N, W, I}. Дополним эту конструкцию набором функций wi(-): W х X' ® W,, i e N, каждая из которых отображает вектор (в, x) в элемент wi некоторого множества W,. Этот элемент Wi и есть то, что i-ый агент наблюдает в результате разыгрывания игры.

Функцию w() будем называть функцией наблюдения i-го агента [77]. Будем считать, что функции наблюдения являются общим

знанием среди агентов, а также примем, что свое собственное действие агент всегда наблюдает.

Если w,(0, x) = (0, x), т.

е. W, = W x X', то i-ый агент наблюдает как состояние природы, так и действия всех агентов. Если, напро-тив, множество W состоит из одного элемента, то i-ый агент ничего не наблюдает.

Пусть в рефлексивной игре существует информационное равновесие Xt , т е S+ (напомним, что т - произвольная непустая конечная последовательность индексов из N). Зафиксируем i е N и рассмотрим i-го агента. Он ожидает в результате игры пронаблюдать величину

w, (0,, xi1, .¦¦ , xi i-1, xi, xi i+1, . — , xin).

На самом же деле он наблюдает величину

Wi (0, X1, ... , Xi-1, Xi, Xi+1, Xn).

Поэтому требование стабильности для i-агента означает совпадение величин (1) и (2) (напомним, что эти величины являются элементами некоторого множества W-).

Пусть величины (1) и (2) равны, т.е. i-агент и после разыгрывания игры не сомневается в истинности своих представлений. Однако является ли это достаточным основанием для того, чтобы он и в следующий раз выбрал то же действие x,? Ясно, что ответ отрицательный, что продемонстрируем на следующем примере.

Пример П.1. [77]. Пусть в рефлексивной биматричной игре, где W = {1, 2}, выигрыши заданы биматрицами (агент 1 выбирает строку, агент 2 - столбец, то есть X1 = X2 = {1; 2}), приведенными на Рис. 31,

0 = 1 0 = 2 ' (1,1) (0,0) ^ Г (0,1) (1,2) ^

v (0,1) (2,0) J [ (1,1) (2,2) 0

Рис. 32. Граф рефлексивной игры в примере П.1

Рис. 32. Граф рефлексивной игры в примере П.1

Рис.

31. Матрицы выигрышей в примере П.1 а граф рефлексивной игры имеет вид, изображенный на Рис. 32.

Пусть при этом в = в1 =1, в2 = в21 = 2, и каждый агент наблюдает свой выигрыш (т.е. функция наблюдения агента совпадает с его функцией выигрыша). Ясно, что информационным равновесием является набор x1 = x2 = x21 = 2, т. е. первый и второй агенты, а также 21-агент выбирают вторые действия. Однако реальное состояние природы в = 1 становится известным второму агенту после розыгрыша игры (и получения им выигрыша 0 вместо ожидаемого 2). Поэтому в следующий раз второй агент выберет действие x2 = 1, что в случае повторяющейся игры побуждает и первого агента изменить свое действие (выбрать x1 = 1). •

Таким образом, для стабильности равновесия необходимо чтобы и /j-агент, i, j e N, наблюдал «нужную» величину. Он ожидает в результате игры пронаблюдать

wj (вij, xij1, .¦¦ , xijj-1, xij, xijj+1, xijn).

На самом же деле (т. е. i-субъективно, ведь /j-агент существует в сознании /-агента) он наблюдает величину

w (e x/u . , x i j-1, Xij, xi j+1, * * ^ xin).

Поэтому требование стабильности для /j-агента означает совпадение величин (3) и (4).

В общем случае, т.е. для и-агента, ti eS+, условие стабильности определим следующим образом.

Информационное равновесие x^ , ti eS+, будем называть стабильным при заданной структуре информированности I, если для любого ti eS+ выполняется

wi (вti, xti1, .¦¦ , xti xti, xti i+1, xtin)

wi (ви xт1, .¦¦ , xтi-1, xti, xti+Ь xtn).

Информационное равновесие, не являющееся стабильным, будем называть нестабильным. В частности, информационное равновесие в примере П.1 является нестабильным. Следующее утверждение дает оценку сложности проверки стабильности информационного равновесия.

Утверждение П.1. [77]. Пусть структура информированности I имеет сложность v, и существует информационное равновесие x ti eS+. Тогда система соотношений (5) содержит не более чем v попарно различных условий.

<< | >>
Источник: НОВИКОВ Д.А.. Математические модели формирования и функционирования команд. - М.: Издательство физико- математической литературы,2008. - 184 с.. 2008

Еще по теме П.2. Стабильные информационные равновесия:

  1. ПРЕДИСЛОВИЕ
  2. 3.2. Безопасность, объект охраны, опасность и ее источники
  3. 1.3. Применение полносвязных ИНС
  4. 5.4. РОЛЬ ИНФОРМИРОВАННОСТИ АГЕНТОВ
  5. 5.5. ПРИМЕР УПРАВЛЕНИЯ НОРМАМИ ДЕЯТЕЛЬНОСТИ: "АККОРДНАЯ ОПЛАТА ТРУДА"
  6. Модель купли-продажи.
  7. Модель определения затрат исполнителя
  8. Введение
  9. ФОРМИРОВАНИЕ И ФУНКЦИОНИРОВАНИЕОДНОРОДНОЙ КОМАНДЫ
  10. Неполная информированность относительно типов агентов.
  11. 5.4. НОРМЫ И РЕПУТАЦИЯ: ФУНКЦИОНИРОВАНИЕ КОМАНДЫ