5.5. НОРМЫ И РЕПУТАЦИЯ: ФОРМИРОВАНИЕ КОМАНДЫ
W(x) = {r e W | x e Arg max V(y, r)}
yeX (Q ( x))
множество таких векторов r e W типов агентов, что вектор действий x e X' доставляет максимум суммарной полезности агентов, обладающих этими типами.
Обозначим
W_,(x, si) = {r e W(x) | r, = s,}, s, e W,, x e X', i e N,
множество типов оппонентов, которые i-ый агент, обладающий типом si, может восстановить, наблюдая выбранный агентами вектор действий x e X'.
Пусть взаимодействие агентов происходит многократно. На шаге t = 0, 1, 2, .... агенты, имеющие представления { rt' }. eN, выбирают действия x. (z, rt'), i e N, и каждый агент наблюдает действия, выбранные всеми агентами. Агент i, зная свой тип rможет «восстановить» следующее множество типов оппонентов:
W-i({x*(z, r; )}, r,). Для завершения описания динамической модели осталось определить, как агенты будут изменять свои представления, то есть каковы станут представления r1t+l i-го агента на шаге t + 1, i e N.
Здесь возможны различные варианты. По аналогии сразделом 3 для описания динамики характеристик агентов можно использовать процедуру индикаторного поведения [10, 19, 48, 62, 80].
В рассматриваемой модели гипотеза индикаторного поведения выглядит следующим образом. Вычислим текущее «положение цели»:
w. (x, rrj) = arg min |s - rj |, i, j e N, t = 1, 2, ... .
sePrj (x,r.)
Если первоначально агенты имели некоторые представления r0i о типах оппонентов, i e N, то динамика их представлений описывается следующим образом - агенты делают в каждом периоде времени «шаг» от текущих представлений в сторону «положения
32
цели» :
(4) r = rj + Yi [ wi ({xk*(z, rtk_1 )}k e N, ri, j) - j],
где gt e [0; 1] - константы, определяющие «величину шага»
i, j e N, t = 1, 2, ...
.Процедура (4) обладает тем свойством, что любой набор взаимных представлений, удовлетворяющий условию (4) раздела 5.4, является ее стационарной точкой. Сходимость процедуры (4) и области притяжения ее стационарных точек требуют в каждом случае отдельного исследования.
Система (4) описывает динамику представлений агентов о типах оппонентов. Так как эти представления полностью определяют то, каких действий ожидает агент от оппонентов, следовательно, можно считать, что (4) описывает и динамику репутации. Так как выше командой было предложено считать множество агентов с «оправдываемой» репутацией, то стабильной команде соответствует стационарная точка процедуры (4), а динамика репутации, описываемая этой процедурой, отражает процесс формирования команды (команду можно считать сформировавшейся, если взаимные представления ее членов не изменяются со временем в процессе функционирования команды). Примеры динамики взаимных представлений (результаты имитационного моделирования) агентов в процессе формирования команды приведены в [77].