5.4. НОРМЫ И РЕПУТАЦИЯ: ФУНКЦИОНИРОВАНИЕ КОМАНДЫ
Обозначим множество равновесий
X(z, r) = Arg max V(x, r),
xeX (z)
где V(x, r) = V V (x, r.,).
ie N
Предположим, что V z e XQ, V r e W множество X(z, r) состоит из одной точки x (z, r).
Это предположение, которое содержа-тельно означает, что для данного набора агентов (характеризуемого вектором типов r e W) существует единственный эффективный (в смысле максимума суммы целевых функций) способ достижения результата z e XQ совместной деятельности, имеет место во многих практически важных случаях - см. [7Q], а также примеры ниже.В рассматриваемой модели согласованной нормой деятельности i-го агента будет выбор действия x. (z, r), то есть при условии, что r e W - общее знание, имеем:
Ki(z) = x*(z, r), i e N, z e X0, r e W.
Пусть теперь общее знание относительно вектора типов агентов отсутствует.
Обозначим Г1 = (rib ri2, ..., rin) - вектор представлений i-го агента о типах оппонентов, rv = (j j ..., Г,1П) - представления i-го агента о представлениях j-го агента о типах оппонентов, i, j e N.
Если структура информированности имеет единичную глубину (i-ый агент считает общим знанием вектор Г1), то агент i e N ожидает от агента j выбора действия x- (z, Г1), i, j e N. Следовательно, репутацией j-го агента в глазах i-го агента является
j) = x/(z, r1), i, j e N.
Предположим, что каждый агент наблюдает все действия, выбранные своими оппонентами, а также, естественно, знает, какое действие выбрал он сам. Тогда репутация будет оправдываться, если взаимные представления агентов таковы, что
V i, j e N x*(z, r1) = x*(z, j
то есть, если агенты будут выбирать (в соответствии со своими собственными представлениями о векторе типов - см.
правую часть выражения (4)) те действия, которых от них ожидают оппоненты. Определение (4) оправданности репутации легко обобщается на случай, когда каждый агент наблюдает значение некоторой функции (называемой функцией наблюдения - см. Приложение) от действий оппонентов, по аналогии с тем, как это делается в [105].Поэтому командой с точки зрения репутации можно назвать множество агентов, взаимные представления которых удовлетворяют (4). Отметим, что такое понимание команды тесно связано с понятием стабильного информационного равновесия [77], в котором все агенты (реальные и фантомные) наблюдают те выборы оппонентов, которых они и ожидали - см. раздел 2.5 и Приложение.
Если структура информированности имеет глубину, большую, чем единица, то условие оправданности репутации будет определяться соответствующими этой структуре информированности условиями стабильности информационного равновесия [77]. Приведем иллюстративный пример, являющийся «рефлексивным» обобщением рассмотренной выше модели формирования однородной команды.
Пример 5.4. Пусть v(x, ri) = xi - xi2 /2 Г,, i e N, z = Yx, (см.
jeN
также пример 3.2). Тогда предположения (2) и (13) раздела 5.3 выполнены, и
x*(z, r) = z r, / V r3 , i e N.
jeN
Условия (4) примут вид:
rij rj
= _Z_ 5 i, j e N.
V ril V rjk
leN keN
Если n = 2, то (4) можно записать в виде:
r2
r12
r + r r + r
112 21 2
r21 = r1
r + r r + r
2 21 2 12
что эквивалентно следующему условию:
r12 r21 = r1 r2. •
Модель, рассмотренная в предыдущем примере, может быть обобщена.
Утверждение 5.3. Если
v,(x, ri) = C. - r. jx. / r,), i e N,
где j(-) - возрастающая дифференцируемая выпуклая функция, то оптимальные действия агентов удовлетворяю (5), а условие оправданности репутации имеет вид (6).
Пример 5.4 иллюстрирует утверждение 5.3 для случая (p(t) = t2/2. Содержательная интерпретация целевой функции (8) такова: агент получает фиксированный доход и несет затраты, зависящие от его действия и его типа.
Таким образом, в настоящем разделе мы рассмотрели рефлексивную модель функционирования команды, в рамках которой устойчивость совместной деятельности коллектива агентов обусловлена «правильными» их взаимными представлениями о существенных характеристиках друг друга. Однако вне рассмотрения остался вопрос - а что произойдет, если взаимные представления агентов не удовлетворяют, например, (4). Для того чтобы ответить на этот вопрос, необходимо рассмотреть модель формирования команды, описывающую в терминах норм деятельности и репутации динамику взаимных представлений агентов на основании наблюдаемой ими информации о действиях оппонентов.