<<
>>

5.2. НЕПОЛНАЯ ИНФОРМИРОВАННОСТЬ

Предположим, что центр не имеет достоверной информации о векторе типов агентов, который по-прежнему является среди них общим знанием. Если у центра имеются представления W0 с W о множестве возможных значений вектора типов агентов, то он может устранить неопределенность относительно типов агентов вычислением гарантированного результата [24, 29] и решать следующую задачу управления:

min min F(y, u) ® max.

reQо y^EN (u,r) ueU

Решение задачи (1) обозначим u (W0).

Возможно также использование других методов устранения неопределенности - см.

монографию [71], посвященную задачам управления организационными системами, функционирующими в условиях неопределенности.

Если взаимодействие центра с агентами производится многократно, то он может использовать наблюдения за действиями, выбираемыми агентами, для корректировки своих представлений об их типах. Обозначим

Yr(u, x) = {r e W j x e EN(u, r)}

множество таких векторов типов агентов, при которых выбор ими вектора действий x e X' является равновесием Нэша при использовании центром управления u e U.

Рассмотрим модель «обучения» центра. Предположим, что первоначальные представления центра W0 не противоречат истине, то есть r e W0. Тогда возможно использование алгоритма корректировки представлений центра:

Центр решает задачу (1) и сообщает агентам управление u (W0);

Агенты, зная управление u (W0) и вектор своих типов, выбирают действие x e EN(u (W0), r), являющееся равновесием Нэша;

Центр, наблюдая вектор x действий агентов, вычисляет Yr(u (W0), x ) в соответствии с (2).

Если Yr(u (W0), x*) = W0, то алгоритм останавливается, если же Yr(u (W0), x*) с W0, то центр корректирует свои пред-

ставления о множестве возможных значений вектора типов агентов следующим образом: (3) W0 := W0 n Yr(u*(W0), x*) и переходит к пункту 1.

Отметим, во-первых, что использование приведенного выше алгоритма подразумевает, что агенты выбирают действия, являющиеся равновесиями Нэша.

Если бы они были дальновидны - максимизировали бы свои выигрыши в повторяющейся игре, зная об использовании центром принципа принятия решений (2)-(3), то для них было бы рациональным выбирать на каждом шаге не соответствующее равновесие Нэша, а такие действия, которые максимизировали бы их выигрыш в суперигре [69, 127], с учетом того, что центр будет корректировать свои представления и выбирать управления в будущих периодах на основании наблюдаемых действий агентов (см. эффект обмена ролями в [69]).

Во-вторых, процедура (3) корректировки представлений центра не является единственно возможной (см. модели индикаторного поведения в [48, 80]).

В-третьих, использование процедуры (3) может в ряде случаев (см. примеры ниже) дать центру возможность найти истинный вектор типов агентов за один шаг. В то же время, в ряде случаев процедура (3) может остановиться на представлениях центра, представляющих собой целое множество возможных типов агентов (см. пример 5.3).

Пример 5.1. Пусть n = 1, fx, u, r) = u x - x2 / 2 r, W = [rmin, + да), F(x, u) = (l - u) x, X = [0; +?), U = [0; +?), W() = [r0; +?), r() > rmm, r0 ? r. Содержательно, целевая функция агента представляет собой разность между доходом и затратами, причем центр управляет «внутренней ценой» единицы продукции, производимой агентом (ставка оплаты в случае, когда агент является работником, внутренняя цена объединения в случае, когда агент является подразде-

лением корпорации или холдинга). Целевая функция центра зависит от разности между рыночной ценой и «внутренней ценой».

Тогда

EN(U, r) = Arg max fy, u, r) = {u r}.

ye A

То есть x = U r, а и = l / 2, занчит в данном примере оптимальное управление не зависит от типа агента и представлений центра об этом типе. При этом Yr(u (W), x) = r, то есть за один шаг, независимо от используемого управления, центр восстанавливает достоверную информацию о типе агента. Отметим, что в рассматриваемом примере дальновидные агенты будут вести себя таким же образом, что и недальновидные.

Пример 5.2. Пусть n = 2, f(x, и, ri) = и x, - x2 /2 (ri + a x3-1), F(x, и) = (l - и) (x1 + X2), W = [rm,n, + ?), W = [re; +?), r0 > rmm, X = [Q; +?), i = 1, 2, U = [Q; +?), a > Q, l > Q, a l ? 1. Содержательно, затраты агента зависят не только от его собственных действий, но и от действий других агентов - чем большие действия они выбирают, тем меньше его затраты (случай «возрастающей отдачи на масштаб»).

Тогда En{U, r) = (x1 *, x2*), где (4) x, (и) = (и r, + a и2 r3-i) / (1 - a2 и2), i = 1, 2.

* (l - и)и

Из (1) следует, что F(x (и), и, r) = (r1 + r2), тогда

1 - a и

и = (1 - л/1 — al ) / a, то есть оптимальное управление не зависит от типов агентов и представлений центра об этих типах.

При этом Yr(u (WQ), x ) определяется из решения системы

« / л \ * *

уравнений (4) относительно r1 и r2 при известных x1 и x2 , то есть вычисляется однозначно и за один шаг, независимо от используемого управления, центр восстанавливает достоверную информацию о типах агентов:

r1(x , и) = x1 / и - a x2 , r2(x , и) = x2 / и - a x1 . • Пример 5.3. Пусть n = 1, fx, и, r) = и x - x2 /2 r, W = [rmin, + ?), F(x, U) = (l - U) x, X = [Q; a], U = [Q; +?), W = [re; +?), re > rmin, rQ ? r. Содержательно, l может интерпретироваться как рыночная,

*

а u - как внутренняя цена единицы продукции, производимой агентом.

Тогда

EN(u, r) = Arg max fy, u, r) = {min (a; u r)}.

yeA

То есть x* = min (a; u r). Если бы тип агента был достоверно известен центру, то оптимальным было бы управление * ГА/2, r ? 2a/А

u(1, r) = j , > 2 , А .

[ a / r, r > 2a / А

Если центр использует управление u > 0, то, наблюдая выбираемое при этом агентом действие x, центр может восстановить

Г r = x / u, x < a

Yr(u, x) = ^ .

[[a / w; + ?), x = a

Видно, что при определенных соотношениях параметров a, А и r0 центр, используя оптимальное управление, не может в силу (5) получить дополнительной информации о типе агента. Качественный вывод таков - не ставя перед агентами задач на пределе их возможностей, центр никогда не узнает реальных возможностей агентов.•

В заключение настоящего раздела отметим, что в ситуации, когда приведенный выше алгоритм «зацикливается» на достаточно широком множестве, для дальновидного центра может оказаться более эффективным использовать в течение нескольких первых периодов на каждом шаге не оптимальное в каждом периоде управление, а то, которое позволило бы лучше идентифицировать тип агента. Постановка и решение подобных задач активной иден_ тификации [11] выходит за рамки настоящей работы.

<< | >>
Источник: НОВИКОВ Д.А.. Математические модели формирования и функционирования команд. - М.: Издательство физико- математической литературы,2008. - 184 с.. 2008

Еще по теме 5.2. НЕПОЛНАЯ ИНФОРМИРОВАННОСТЬ: