<<
>>

5.4. НОРМЫ И РЕПУТАЦИЯ: ФУНКЦИОНИРОВАНИЕ КОМАНДЫ

В соответствии с результатами предыдущего раздела, если выполнено условие (13) (а в ходе дальнейшего изложения будем считать выполненными условия (2) и (13) раздела 5.3), то агенты будут выбирать эффективные по Парето равновесия Нэша своей игры.

Обозначим множество равновесий

X(z, r) = Arg max V(x, r),

xeX (z)

где V(x, r) = V V (x, r.,).

ie N

Предположим, что V z e XQ, V r e W множество X(z, r) состоит из одной точки x (z, r).

Это предположение, которое содержа-тельно означает, что для данного набора агентов (характеризуемого вектором типов r e W) существует единственный эффективный (в смысле максимума суммы целевых функций) способ достижения результата z e XQ совместной деятельности, имеет место во многих практически важных случаях - см. [7Q], а также примеры ниже.

В рассматриваемой модели согласованной нормой деятельности i-го агента будет выбор действия x. (z, r), то есть при условии, что r e W - общее знание, имеем:

Ki(z) = x*(z, r), i e N, z e X0, r e W.

Пусть теперь общее знание относительно вектора типов агентов отсутствует.

Обозначим Г1 = (rib ri2, ..., rin) - вектор представлений i-го агента о типах оппонентов, rv = (j j ..., Г,1П) - представления i-го агента о представлениях j-го агента о типах оппонентов, i, j e N.

Если структура информированности имеет единичную глубину (i-ый агент считает общим знанием вектор Г1), то агент i e N ожидает от агента j выбора действия x- (z, Г1), i, j e N. Следовательно, репутацией j-го агента в глазах i-го агента является

j) = x/(z, r1), i, j e N.

Предположим, что каждый агент наблюдает все действия, выбранные своими оппонентами, а также, естественно, знает, какое действие выбрал он сам. Тогда репутация будет оправдываться, если взаимные представления агентов таковы, что

V i, j e N x*(z, r1) = x*(z, j

то есть, если агенты будут выбирать (в соответствии со своими собственными представлениями о векторе типов - см.

правую часть выражения (4)) те действия, которых от них ожидают оппоненты. Определение (4) оправданности репутации легко обобщается на случай, когда каждый агент наблюдает значение некоторой функции (называемой функцией наблюдения - см. Приложение) от действий оппонентов, по аналогии с тем, как это делается в [105].

Поэтому командой с точки зрения репутации можно назвать множество агентов, взаимные представления которых удовлетворяют (4). Отметим, что такое понимание команды тесно связано с понятием стабильного информационного равновесия [77], в котором все агенты (реальные и фантомные) наблюдают те выборы оппонентов, которых они и ожидали - см. раздел 2.5 и Приложение.

Если структура информированности имеет глубину, большую, чем единица, то условие оправданности репутации будет определяться соответствующими этой структуре информированности условиями стабильности информационного равновесия [77]. Приведем иллюстративный пример, являющийся «рефлексивным» обобщением рассмотренной выше модели формирования однородной команды.

Пример 5.4. Пусть v(x, ri) = xi - xi2 /2 Г,, i e N, z = Yx, (см.

jeN

также пример 3.2). Тогда предположения (2) и (13) раздела 5.3 выполнены, и

x*(z, r) = z r, / V r3 , i e N.

jeN

Условия (4) примут вид:

rij rj

= _Z_ 5 i, j e N.

V ril V rjk

leN keN

Если n = 2, то (4) можно записать в виде:

r2

r12

r + r r + r

112 21 2

r21 = r1

r + r r + r

2 21 2 12

что эквивалентно следующему условию:

r12 r21 = r1 r2. •

Модель, рассмотренная в предыдущем примере, может быть обобщена.

Утверждение 5.3. Если

v,(x, ri) = C. - r. jx. / r,), i e N,

где j(-) - возрастающая дифференцируемая выпуклая функция, то оптимальные действия агентов удовлетворяю (5), а условие оправданности репутации имеет вид (6).

Пример 5.4 иллюстрирует утверждение 5.3 для случая (p(t) = t2/2. Содержательная интерпретация целевой функции (8) такова: агент получает фиксированный доход и несет затраты, зависящие от его действия и его типа.

Таким образом, в настоящем разделе мы рассмотрели рефлексивную модель функционирования команды, в рамках которой устойчивость совместной деятельности коллектива агентов обусловлена «правильными» их взаимными представлениями о существенных характеристиках друг друга. Однако вне рассмотрения остался вопрос - а что произойдет, если взаимные представления агентов не удовлетворяют, например, (4). Для того чтобы ответить на этот вопрос, необходимо рассмотреть модель формирования команды, описывающую в терминах норм деятельности и репутации динамику взаимных представлений агентов на основании наблюдаемой ими информации о действиях оппонентов.

<< | >>
Источник: НОВИКОВ Д.А.. Математические модели формирования и функционирования команд. - М.: Издательство физико- математической литературы,2008. - 184 с.. 2008

Еще по теме 5.4. НОРМЫ И РЕПУТАЦИЯ: ФУНКЦИОНИРОВАНИЕ КОМАНДЫ: