5.5. ПРИМЕР УПРАВЛЕНИЯ НОРМАМИ ДЕЯТЕЛЬНОСТИ: "АККОРДНАЯ ОПЛАТА ТРУДА"
Стратегией i-го агента является выбор действия у, е A, = , i е N, стратегией центра - выбор системы стимулирования, определяющей размер вознаграждения каждого агента в зависимости от результата их совместной деятельности.
Предположим, что технология взаимодействия агентов такова, что для достижения требуемого результата необходимо, чтобы сумма их действий была не меньше заданной величины в е W. В этом случае i-ый агент получает от центра фиксированное вознаграждениеВыбор действия у. > 0 требует от i-го агента затрат сг(у, гг), где r' > 0 - его тип (параметр, описывающий индивидуальные харак-теристики), i е N.
Относительно функций затрат агентов предположим, что с.(у, r.) - непрерывная возрастающая по у. и убывающая по r. функция, причем "у4 е A4, " r. > 0 сг(0, у_г, гг) = 0, i е N.
Определим множество индивидуально рациональных действий агентов
IR = {у е A' I "i е Ns, >c,(r,)}.
В случае, если затраты агентов сепарабельны, то есть затраты с1(у1, r,) каждого агента зависят только от его собственных действий и не зависят от действий других агентов, получаем, что
IR = П [0; у+ ], где
ieN
у+ = max {у, > 0 I с,(у,, r,) ? s,}, i е N. Обозначим
?(в) = {у е A' I Xу{ = в},
ieN
Г*(в) = Arg min X с,- (у, r ).
yeY(в) ieN
Рассмотрим последовательно различные варианты информированности агентов о значении параметра в е W.
Вариант I. Предположим, что значение ве W является общим знанием. Тогда равновесием игры агентов является параметрическое равновесие Нэша, принадлежащее множеству равновесий Нэша:
Ед(в) = IR п У(в).
Определим также множество эффективных по Парето действий агентов:
Par (в) = IR п Y*(0).
Так как " в е W Y (в) с Y(в), то из (5) и (6) следует, что множество эффективных по Парето действий является одним из рав-новесий Нэша.
Но множество равновесий Нэша может оказаться шире - в частности, при в > max у+ оно всегда содержит векторieN
нулевых действий.
Отметим, что множество (6) Парето-эффективных действий может быть сделано непустым за счет мотивационного управления, то есть выбора соответствующего вектора вознаграждений {О,}.
Из того, что " в е W Par(B) сEN(0) следует, что любая норма деятельности а(), для которой выполнено (7) " в е W а(в) е Par{0),
является одновременно и согласованной, и эффективной по Паре- то. Содержательно, при использовании нормы, удовлетворяющей
, центр указывает агентам среди достаточно широкого множества равновесий Нэша (при том, что каждому агенту наиболее выгоден выбор минимального действия, принадлежащего соответствующей проекции множества равновесий Нэша (5)) конкретную точку, которая является эффективной по Парето, то есть минимизирует суммарные затраты агентов по достижению требуемого результата.
Приведем пример. Пусть имеются n = 2 агента с функциями затрат типа Кобба-Дугласа: ^(у, r,) = r, (р(у, / r,), где j( ) - гладкая монотонно возрастающая выпуклая функция, удовлетворяющая j(0) = 0.
Тогда эффективной по Парето является единственная точка: у*(в) = {у*(в)}, где у*(в) = вr,/ Xr, , i е N.
jeN
Вычислим уi = r, j~1(ai /ri), i е N, тогда при
O > r, j(q/ Xrj), i е N,
jeN
множество Парето не пусто (причем множество Парето при различных в е W составляет отрезок прямой с углом наклона, равным отношению типов агентов) и согласованной является норма
а,(в) = у*, i е N. Множества равновесий Нэша в рассматриваемом примере для двух значений в: в2 > в1 приведены на рисунке 2 (точка (0; 0) является равновесием Нэша в обоих случаях).
Рис. 2. Параметрическое равновесие Нэша игры агентов
Итак, мы рассмотрели первый вариант информированности агентов, соответствующий ситуации, когда значение параметра в е W является общим знанием. Рассмотрим следующий (в порядке возрастания сложности структуры информированности агентов - см.
раздел 5.4) вариант информированности, в рамках которого общим знанием являются индивидуальные представления {в,} агентов о значении параметра в е W.Вариант II. Предположим, что представления агентов о неопределенном параметре попарно различны (и при этом являются общим знанием). Не ограничивая общности, занумеруем агентов таким образом, чтобы их представления возрастали: в! < ... < вп. Структура возможных равновесий в этой ситуации описывается следующим утверждением.
Утверждение 7. В игре «аккордная оплата труда», для которой в, Ф в, при i Ф j, равновесными (в зависимости от соотношения между параметрами) могут быть следующие (п + 1) исходов: {у* | у* = 0, i e N}; {у* | у*= вк , у*= 0, i e N, i Ф k}, к e N. Содер-
жательно это означает следующее: либо никто не работает, либо работает один k-й агент, выбирая действие 6k.
Доказательство утверждения 7. Пусть вектор действий
y = (y*, ..., y*) является равновесием (очевидно, при этом
* + т—г
y{ < y{ для любого i е N). Пусть существует такое k e N, что y* > 0. Покажем, что в этом случае X У* = 6k.
ieN
Действительно, если X У* < 6ъ то k-ый агент не рассчитывает
ieN
на получение вознаграждения и, следовательно, может увеличить свой (субъективно ожидаемый) выигрыш с отрицательного до
нулевого, выбрав нулевое действие. Если же XУ* > 6ъ то k-ый
ieN
агент рассчитывает на получение вознаграждения, однако он может увеличить свой выигрыш, выбрав вместо yk* действие
y{ } < yk. Таким образом, при X У{ Ф 6k k-ый
ieN\{k} ieN
агент может увеличить свой выигрыш, что противоречит равно*
весности вектора y .
Мы показали, что, если у* > 0, то X У* = Но в силу усло-
ieN
вия 6i Ф 6j, i Ф j, это равенство может выполняться лишь для одного
**
k e N. Поэтому если yk > 0, то y. = 0 для всех i Ф k. При этом,
очевидно, yk = 6k. Утверждение 7 доказано.
Рассмотрим теперь вопрос о том, при каких соотношениях между параметрами 6г, y+ , i e N, реализуется каждое из равновесий, перечисленных в формулировке утверждения 7.
Вектор (0, ..., 0) является равновесным в случае, когда никакой i-ый агент не может собственными усилиями выполнить достаточную (с его точки зрения) для получения вознаграждения
работу (либо это усилие составляет в точности y+, так что выигрыш i-го агента остается нулевым).
Это условие формально записывается следующим образом: y+ < 6. для любого i.Вектор {y | y* = вк , y* = 0, i Ф к} является равновесным, если вк < y+ , а все агенты с номерами i > к, считая, что вознаграждения не будет, являются недостаточно эффективными, чтобы собственными усилиями компенсировать величину в* - вк. Формально: вк + У* ? в* для любого i > к.
Возможные равновесия в игре двух агентов изображены на рисунке 3. Заметим, что, в отличие от варианта I, существует область, в которой равновесие отсутствует.
У+
в1 У1
Рис. 3. Равновесия в игре двух агентов (область, где равновесия нет, обозначена символом «0»)
Рассмотрим теперь общий случай, когда представления агентов могут и совпадать: в1 < ... < вп. В этом случае может появиться целая область равновесий, аналогично варианту I. Пусть, например, выполняются соотношения вт = вт+1 = ... = вт+р, в* Ф вт при
m + p
i g {m, ..., m + p}. Тогда при выполнении условий XУ* — вт и
к=m
вт + У+ < в/, i > m, равновесным является любой вектор
* V ч * * + *
(у IXУк = qm, Ук ? Ук , к e {m, m+p}; у, = 0,
к=m
i g {m, ..., m + p}}. Содержательно это означает, что в равновесии всю работу выполняют агенты, которые одинаково представляют себе необходимый для получения вознаграждения объем работы.
Вариант III. Пусть теперь структура информированности игры имеет глубину 2, но каждый агент считает, что играет в игру с асимметричным общим знанием. В этом случае множество возможных равновесных ситуаций становится максимально возможным: ^ [0; у. ]. Более того, справедливо следующее утверждение.
ieN
Утверждение 8. В игре «аккордная оплата труда» для любого вектора действий у e ^ [0; у+) существует такая структура
ieN
информированности глубины два (при которой каждый агент
субъективно играет в игру с асимметричным общим знанием), что
*
вектор У является единственным равновесием.
Доказательство утверждения 8. Достаточно для каждого i e N
{* * > 0'
У'', У1 ; (здесь e - произвольное положи-
У++ e, У* = 0
тельное число) и выбрать любые вц > XУ+ , je N\ {'}.
Тогда i-ыйieN
агент ожидает от оппонентов нулевых действий, а его собственным
*
субъективно равновесным действием является у. . Утверждение 8 доказано.
Замечание 1. Построенное в доказательстве утверждения 8
равновесие является (объективно) Парето-эффективным, если
Z*
у' равна истинному значению неопределенного пара-
ieN
метра в.
Замечание 2. Действие у* = у+ является равновесным, если
вi = у+ . Однако при этом равновесным будет и действие у* = 0 - в обоих случаях субъективно ожидаемый i-ым агентом выигрыш равен нулю.
Вариант IV. Пусть теперь структура информированности игры имеет глубину два, и на нижнем уровне имеется симметричное общее знание. Иными словами, каждый фантомный агент считает: неопределенный параметр равен в, и это общее знание.
Оказывается, что и в этом случае множество равновесных ситуаций является максимально возможным: ^ [0; у* ]. Более того,
ie N
справедливо следующее утверждение.
Утверждение 9. В игре «аккордная оплата труда» для любого
вектора действий y е ^ [0; уг+) существует такая структура
ie N
информированности глубины два с симметричным общим знанием
*
на нижнем уровне, что вектор y является единственным равновесием.
Доказательство утверждения 9. Возьмем любое значение в > X У* и будем считать, что это значение является общим зна-
ie N
нием среди фантомных агентов. Тогда единственным равновесием в игре фантомных агентов является выбор каждым из них нулевого действия.
Далее, для каждого i e N положим
(* * „
у > у > 0 yii?, у* = 0'
где ? - произвольное положительное число. Тогда, как нетрудно видеть, наилучшим ответом i-го агента на ожидаемые им нулевые действия оппонентов является выбор действия yi* . Утверждение 9 доказано.
Замечания 1 и 2, сделанные при анализе варианта III, можно повторить дословно и для варианта IV.
Таким образом, игра "аккордная оплата труда", помимо эффектов сложной зависимости структуры информационных равновесий от вида структур информированности и рефлексивного управления, интересна тем, что она иллюстрирует роль управления нормами деятельности в случаях, когда множество равновесий игры агентов состоит более чем из одной точки.