4.1. МОДЕЛИ ПРИНЯТИЯ РЕШЕНИЙ
В соответствии с подходами теории иерархических игр [12] и теории активных систем [16] центром будем называть игрока, делающего ход первым (то есть метаигрока, обладающего правом устанавливать правила игры для других игроков), а агентами - игроков, делающих ход вторыми при известных им выборе первого игрока.
В моделях управления социально-экономическими системами центр играет роль управляющего органа, агент - роль управляемого субъекта, причем первоначально распределение «ролей» может не быть фиксированным (см. модели сетевого взаимодействия в [30]).Для решения задачи выбора оптимального управляющего воздействия (объектами этого воздействия могут быть перечисленные во втором разделе параметры ОС) центр должен уметь предсказывать поведение управляемых субъектов, следовательно, он должен использовать ту или иную модель принятия решений агентами.
Опишем, следуя [16], модель принятия решений одним агентом (случай индивидуального принятия решений). Пусть агент способен выбирать некоторое действие y из множества A допустимых действий. В результате выбора действия y е A агент получает выигрыш fy), где f: A ® Ш - действительнозначная целевая функция, отражающая предпочтения агента.
Примем гипотезу рационального поведения (ГРП) [16, 29], заключающуюся в том, что агент с учетом всей имеющейся у него информации выбирает действия, которые наиболее предпочти-тельны с точки зрения значений своей целевой функции. В соответствии с гипотезой рационального поведения агент выбирает альтернативу из множества «лучших» альтернатив. В рассматриваемом случае это множество является множеством альтернатив, на которых достигается максимум целевой функции.
Следовательно, выбор действия агентом определяется правилом индивидуального рационального выбора P(f A) с A, которое выделяет множество наиболее предпочтительных с точки зрения агента действий : С(/, A) = Arg max fy).
ye A
Можно усложнить модель, предположив, что выигрыш агента определяется не только его собственными действиями, но и значением неопределенного параметра в е W - состояния природы.
То есть в результате выбора действия y е A и реализации состояния природы в е W агент получает выигрыш Дв, y), где f W X A ® S?.Если выигрыш агента зависит, помимо его действий, от неопределенного параметра - состояния природы, то в общем случае не существует однозначно «лучшего» действия - принимая решение о выбираемом действии, агент должен «предсказывать» состояние природы.
Поэтому введем гипотезу детерминизма, заключающуюся в том, что агент стремится устранить с учетом всей имеющейся у него информации существующую неопределенность и принимать решения в условиях полной информированности [16, 33] (другими словами, окончательный критерий, которым руководствуется агент, принимающий решения, не должен содержать неопределенных параметров).
В зависимости от той информации I, которой обладает агент о неопределенных параметрах, различают [29, 33]: интервальную неопределенность (когда известно только множество W возможных значений неопределенных параметров); вероятностную неопределенность (когда, помимо множества W возможных значений неоп-
ределенных параметров, известно их вероятностное распределение р(в)); нечеткую неопределенность (когда, помимо множества W возможных значений неопределенных параметров, известна функция принадлежности их значений).
Интервальная неопределенность устраняется вычислением максимального гарантированного результата (МГР), вероятностная - ожидаемого значения целевой функции, нечеткая - множества максимально недоминируемых альтернатив. Обозначим f => f
- процедуру устранения неопределенности, то есть процесс перехода от целевой функции Дв, у) к целевой функции f (y), которая не зависит от неопределенных параметров. В соответствии с введенным предположением в случае интервальной неопределенности
f (y) = min f(e, y), в случае вероятностной неопределенности
в eQ
f (y) = I f (y,e)р(в)de и т.д. [29, 33].
Q
Устранив неопределенность, получаем детерминированную модель, то есть правило индивидуального рационального выбора имеет вид:
С(/, A, I) = Arg max f (y),
yeA
где I - информация, используемая агентом при устранении неопре-деленности f => f.
До сих пор мы рассматривали индивидуальное принятие ре-шений.
Возможна и игровая неопределенность, отражающая совместное принятие решений несколькими агентами (при заданных управлениях со стороны центра), в рамках которой существенными являются предположения агента о множестве возможных значений обстановки игры (действий других агентов, выбираемых ими в рамках тех или иных неточно известных рассматриваемому агенту принципов поведения). При игровой неопределенности в качестве предсказуемого и устойчивого исхода игры агентов выбирается та или иная концепция равновесия [16]. Более подробное рассмотрение моделей принятия решений в условиях игровой неопределен-ности приводится ниже при описании соответствующих задач институционального управления.
Завершив краткое рассмотрение модели принятия решений и подчеркнув, что выбор агента зависит от множества, из которого этот выбор производится, перейдем к постановке задачи институционального управления как управления ограничениями деятельности (модели управления нормами деятельности рассматриваются в пятом разделе).