<<
>>

5.5. НОРМЫ И РЕПУТАЦИЯ: ФОРМИРОВАНИЕ КОМАНДЫ

Впервые модели динамики иерархии взаимных представлений агентов в приложении к задаче формирования команд рассматри-вались в [65, 77]. Рассмотрим процесс формирования команды. Для этого введем множество X(Q(x)) с X' таких векторов действий агентов, которые приводят к тому же результату деятельности, что и вектор x e X'.
Обозначим

W(x) = {r e W | x e Arg max V(y, r)}

yeX (Q ( x))

множество таких векторов r e W типов агентов, что вектор действий x e X' доставляет максимум суммарной полезности агентов, обладающих этими типами.

Обозначим

W_,(x, si) = {r e W(x) | r, = s,}, s, e W,, x e X', i e N,

множество типов оппонентов, которые i-ый агент, обладающий типом si, может восстановить, наблюдая выбранный агентами вектор действий x e X'.

Пусть взаимодействие агентов происходит многократно. На шаге t = 0, 1, 2, .... агенты, имеющие представления { rt' }. eN, выбирают действия x. (z, rt'), i e N, и каждый агент наблюдает действия, выбранные всеми агентами. Агент i, зная свой тип rможет «восстановить» следующее множество типов оппонентов:

W-i({x*(z, r; )}, r,). Для завершения описания динамической модели осталось определить, как агенты будут изменять свои представления, то есть каковы станут представления r1t+l i-го агента на шаге t + 1, i e N.

Здесь возможны различные варианты. По аналогии сразделом 3 для описания динамики характеристик агентов можно использовать процедуру индикаторного поведения [10, 19, 48, 62, 80].

В рассматриваемой модели гипотеза индикаторного поведения выглядит следующим образом. Вычислим текущее «положение цели»:

w. (x, rrj) = arg min |s - rj |, i, j e N, t = 1, 2, ... .

sePrj (x,r.)

Если первоначально агенты имели некоторые представления r0i о типах оппонентов, i e N, то динамика их представлений описывается следующим образом - агенты делают в каждом периоде времени «шаг» от текущих представлений в сторону «положения

32

цели» :

(4) r = rj + Yi [ wi ({xk*(z, rtk_1 )}k e N, ri, j) - j],

где gt e [0; 1] - константы, определяющие «величину шага»

i, j e N, t = 1, 2, ...

.

Процедура (4) обладает тем свойством, что любой набор взаимных представлений, удовлетворяющий условию (4) раздела 5.4, является ее стационарной точкой. Сходимость процедуры (4) и области притяжения ее стационарных точек требуют в каждом случае отдельного исследования.

Система (4) описывает динамику представлений агентов о типах оппонентов. Так как эти представления полностью определяют то, каких действий ожидает агент от оппонентов, следовательно, можно считать, что (4) описывает и динамику репутации. Так как выше командой было предложено считать множество агентов с «оправдываемой» репутацией, то стабильной команде соответствует стационарная точка процедуры (4), а динамика репутации, описываемая этой процедурой, отражает процесс формирования команды (команду можно считать сформировавшейся, если взаимные представления ее членов не изменяются со временем в процессе функционирования команды). Примеры динамики взаимных представлений (результаты имитационного моделирования) агентов в процессе формирования команды приведены в [77].

<< | >>
Источник: НОВИКОВ Д.А.. Математические модели формирования и функционирования команд. - М.: Издательство физико- математической литературы,2008. - 184 с.. 2008

Еще по теме 5.5. НОРМЫ И РЕПУТАЦИЯ: ФОРМИРОВАНИЕ КОМАНДЫ: