4. Механизмы стимулирования в активных системах

Рассмотрим сначала одноэлементную задачу. В соответствии с классификацией, введенной выше, базовой детерминированной задачей стимулирования является следующая задача. Пусть активная система состоит из центра и одного активного элемента.

Интересы участников выражены их целевыми функциями: Ф(У) = H(y) и f(y) = s(y) - c(y), где y e A - действие АЭ, H(y) - функция дохода центра, s(y) e M - функция стимулирования, c(y) - функция затрат АЭ. Стратегией центра является назначение функции стимулирования из класса M с целью максимизации своей целевой функции Fj(y) при условии, что АЭ выберет при известной функции стимулирования действие из множества A, максимизирующее его собственную

целевую функцию f(y). Множество действий АЭ, доставляющих максимум его целевой функции при данной системе стимулирования называется множеством реализуемых действий (множеством

решений игры): P(s) = Arg max {s(y) - c(y)}.

y eA

Эффективность стимулирования в рамках гипотезы

благожелательности определяется как K(s) = max F(y). Задачей

У eP( s )

синтеза оптимальной функции стимулирования называется задача

K(s)®max . Если целевая функция центра имеет приведенный выше

s eM

вид, то соответствующая задача стимулирования называется задачей первого рода [236,382]. Задачей второго рода называется аналогичная задача, отличающаяся лишь видом целевой функции центра - в ней из дохода вычитаются затраты на стимулирование: Fn(y) = H(y) - s(y). В многоэлементных задачах затратами на

стимулирование называется величина J(y,s) = ?&i(yj), где i -

i=1

номер АЭ, i e I = {1, 2, n}, n - число АЭ в системе, y = (yi, y2, , yn). Затратами на стимулирование по реализации действия ye A' = n

П Ai системой стимулирования s e M называется величина J(y, s), i=1

где yeP(s). Минимальные затраты на стимулирование по

реализации действия yeA есть J(y) = min J(y,s).

Если

{ s eM\y eP( s)}

действие не реализуемо ни одной из систем стимулирования из класса M, то затраты на его реализацию считаются равными бесконечности. Такое определение минимальных затрат на стимулирование делает их инструментом анализа задач стимулирования первого рода, эквивалентным анализу свойств множеств реализуемых действий. Понятно, что в задачах стимулирования второго рода исследования множеств реализуемых действий недостаточно [152, 195, 382].

При решении задач стимулирования в АС со скалярными предпочтениями АЭ, как правило, вводятся следующие стандартные предположения (если в многоэлементной системе индекс i опущен то

по умолчанию будем считать, что предположение (уравнение, неравенство и т.д.) имеет место для всех АЭ): A=%+; c(y) - ограничена снизу, непрерывна и монотонно возрастает, c(0)=0, иногда дополнительно предполагают, что c(y) выпукла и непрерывно дифференцируема и c'(0) = 0. Обозначим M' - множество положительнозначных кусочно-непрерывных функций, M = {s | " ~ n

yeA 0i=1

называется ограничением механизма стимулирования . Известны следующие факты:

в задаче стимулирования первого рода оптимальна система

Г 0,y < x

стимулирования С-типа (скачкообразная): sC(x,y) = < , где x

[C,y > x

e P = [0, y ], y+ = max {y e A | c(y) < C }, а оптимальн^1й план определяется как решение следующей задачи ОСП:

x = arg max H(x) ;

x eP

в задачах стимулирования первого и второго рода оптимальна система стимулирования QK-типа (квазикомпенсаторная):

Г0, y * x

sQK(y)=i / , ;

[ c(y),y = x

решение задачи стимулирования второго рода состоит из двух этапов:

определение системы стимулирования, реализующей заданное действие с минимальными затратами - минимальные затраты на стимулирование по реализации действия x e A равны: J(x)

= c(x) - cmin, где cmin = min c(y).

y eA

выбор оптимального реализуемого действия (задача ОСП): x

= arg max B(y), где B(y) = H(y) - J(y).

y eA

8 Мы надеемся, что использование при дальнейшем изложении не совсем удачной, но исторически сложившейся, системы обозначений (c(y) - функция затрат, C - ограничение механизма и т.д.) не приведет к неоднозначности.

Содержательно, в задаче первого рода АЭ поощряется на фиксированную величину, если его действие не меньше заданного (плана), если же его действие строго меньше плана, то он не поощряется вообще.

В задачах второго рода элементу в точности компенсируются его затраты в случае выбора действия, совпадающего с планом.

Вариации рассмотренной выше детерминированной модели АС с независимыми АЭ (отличающиеся вводимыми предположениями о целевых функциях и допустимых множествах) можно найти в [34, 39, 48, 54, 59, 60, 70, 143, 146, 150, 192, 278, 299, 301, 316, 341, 382].

Обширный и достаточно глубоко и подробно исследованный подкласс задач стимулирования составляют задачи синтеза согласованных механизмов стимулирования.

Пусть система стимулирования зависит от параметра - плана xeX и действия АЭ yeA, где X - множество допустимых планов (для простоты положим X = A): s = s(x,y). Тогда целевая функция АЭ зависит от стимулирования, плана и действия АЭ: f = f(s, x, y). Множество реализуемых действий также параметрически зависит от

плана: P(s,x) = Arg max f(s,x,y). Изменяя планы, центр может

y eA

системой стимулирования s(,y) реализовать следующее множество

действий: P(s) = U P(s, x).

x eX

Обозначим B(s) = {x e X \ "y e A s(x,x) - c(x) > s(x,y) - c(y)} множество согласованных планов, то есть таких планов, выполнять которые при заданной системе стимулирования для АЭ выгодно.

Как уже отмечалось выше при обсуждении соотношения между задачами планирования и задачами стимулирования, задавая систему стимулирования s(x,y), центр имеет возможность оперативно изменять значения планов, не меняя функцию стимулирования, что достаточно привлекательно, так как особенно в динамике частые изменения механизма управления целиком не всегда возможны с точки зрения адаптивных свойств АЭ.

Согласованной называется система стимулирования s e M, для которой выполнено B(s) = P(s). Значительное внимание исследователей уделялось поиску необходимых и достаточных условий согласованности систем стимулирования, а также изучению

соотношения таких свойств как согласованность и эффективность систем стимулирования - подавляющее большинство работ в ТАС на рубеже 70-80 годов было посвящено именно этой тематике.

Поэтому проведем несколько более подробное обсуждение результатов, полученных для согласованных механизмов управления АС (достаточно полное и систематическое их изложение приведено в монографиях [54, 84, 195, 201]).

В работах по теории активных систем рассматривался целый ряд требований согласования интересов центра и АЭ, формулируемых как необходимость обеспечения требуемых соотношений между планами активных элементов и их реализациями (выбором - действиями АЭ). Среди них: механизмы, согласованные по выполнению плана (см. определение выше) в системах с полным, частичным и агрегированным планированием, x- согласованные механизмы, D(x)--согласованные механизмы, L- согласованные механизмы [106, 146, 149-151, 196, 199, 299, 300, 324-327] и др. В упомянутых работах развиваются как методы решения задачи синтеза оптимальных механизмов функционирования, так и задачи синтеза оптимальных механизмов функционирования, согласованных по выполнению плана.

Наиболее известным и изящным достаточным условием согласованности системы штрафов c(x,y) (для задачи стимулирования, в которой целевая функция АЭ представляет собой разность между доходом и штрафами - эта постановка является "двойственной" к описанной выше модели, в которой целевая функция АЭ определяется разностью между стимулированием и затратами [382]) является так называемое "неравенство треугольника": " x, y, z c(x,y) ? %(x,z) + %(z,y). Описание достаточных условий согласованности можно найти в [195].

Важным шагом в развитии методологии и понимании проблем оптимальности в АС явилось построение основ теории необходимых и достаточных условий оптимальности механизмов, согласованных по выполнению планов, разработка техники получения конструктивно проверяемых условий их выполнения. Результаты этих исследований нашли отражение в упомянутых выше монографиях и статьях [49-51, 150, 328].

Понятие степени централизации, введенное в [84] и отражающее "жесткость" штрафов, позволило получить ряд результатов по сохранению свойства выполнения плана при увеличении степени централизации [195].

Результаты решения задач оптимального синтеза согласованных систем стимулирования и их составляющих изложены в [47, 48, 285-287]. Дальнейшее развитие этого направления (для согласованных механизмов, оптимальных по критерию гарантированного относительно неизвестных параметров результата) было произведено в [134, 135, 305, 333]. Результаты по задачам последовательного синтеза адаптивных согласованных механизмов можно найти в [31-38, 201, 409-412].

Задачи оптимального планирования дискретных производственных систем, сформулированные в виде задач теории расписаний, и методы их решения, которые использовались для оценки целевой функции системы в соответствующих задачах согласованного планирования, рассмотрены в работах [52, 53, 61-64, 284, 358, 359, 395].

Перейдем к рассмотрению задач стимулирования в многоэлементных АС - проведем их классификацию и укажем работы, содержащие описание результатов исследования различных классов. Обозначим y, e A, - действие i-го активного элемента, y=(yi, n

y2, , yn) e A' = П A, - вектор действий активных элементов, z=Q(y), i=1

где Q: A' ® A0 - результат деятельности активных элементов системы, A0 - множество возможных результатов деятельности.

Индивидуальные затраты i-го активного элемента по выбору действия yi в общем случае зависят от действий всех АЭ, то есть С,=С,(У). Стимулирование i-го АЭ s(), назначаемое центром, в общем случае может зависеть от действий всех АЭ и от результата деятельности системы, то есть s,: A'XA0 ® Ж. Таким образом, целевая функция i-го АЭ имеет вид "стимулирование минус затраты": f(y,si) = s(y,z) - c(y), i e I = {1, 2, , n}.

Целевая функция центра, в задаче второго рода представляющая собой разность между доходом от действий АЭ и результатов деятельности системы - H(y,z) и суммарными затратами на стимулирование, имеет вид:

F(y,s) = H(y,Q(y)) - ?s,(y,Q(y)) , где s = (sh s2, , sj e M,M- i=1

множество допустимых систем стимулирования, которое может

определяться M, M' или M (см.

выше).

Предположим, что при использовании центром системы стимулирования s e M множество решений игры АЭ (то есть - множество действий, реализуемых системой стимулирования s) есть P(s) с A'. В многоэлементной АС в качестве множества решений игры (множества реализуемых действий) P(s) может рассматриваться равновесие в доминантных стратегий Ed(s) (если оно существует), равновесие Нэша EN(s) или какая-либо другая некооперативная (и оговариваемая в каждом конкретном случае) теоретико-игровая концепция равновесия. По умолчанию под равновесием (множеством реализуемых действий) ниже мы будем подразумевать равновесие Нэша (точнее - множество равновесных по Нэшу при заданной системе стимулирования векторов стратегий АЭ).

Как и в одноэлементной АС, эффективностью (гарантированной эффективностью) стимулирования является максимальное (минимальное) значение целевой функции центра на множестве

решений игры: K(s) = max F(y, s), а задача синтеза оптимальной

УeP(s)

функции стимулирования заключается в поиске допустимой системы стимулирования s e M, имеющей максимальную

эффективность s = arg max K(s).

s eM

И в одноэлементных, и в многоэлементных АС задача синтеза оптимальной системы стимулирования фактически сводится либо к анализу множеств реализуемых действий, либо (и) к анализу минимальных затрат на стимулирование [195, 382]. В одноэлементной активной системе множеством решений игры (реализуемых действий) является множество действий активного элемента, доставляющих максимум его целевой функции. В многоэлементной АС активные элементы вовлечены в игру - выигрыш каждого АЭ в общем случае зависит как от его собственных действий, так и от действий других активных

элементов (еще раз напомним, что в настоящей работе допускается лишь некооперативное взаимодействие участников системы). Поэтому основное качественное отличие задач стимулирования в многоэлементных системах по сравнению с одноэлементными (помимо простого увеличения числа участников системы и соответствующего ему "линейного" по их числу росту сложности задачи) заключается в том, что в многоэлементных системах множество решений игры может иметь достаточно сложную структуру. В том числе, например, одной системой стимулирования могут реализовываться несколько Парето эффективных (с точки зрения АЭ) векторов действий и т. д.

Другими словами, отсутствие на сегодняшний день относительно полных (если принять за "идеал" совокупность результатов исследования одноэлементных задач) аналитических методов решения многоэлементных задач стимулирования, помимо высокой их структурной и вычислительной сложности, отчасти объясняется отсутствием единой концепции решения игры в теории игр - в зависимости от информированности игроков (участников АС), гипотез об их поведении и т.д. может изменяться эффективность тех или иных управлений.

Так как целевая функция АЭ определяется разностью стимулирования и затрат, то, классифицируя задачи стимулирования в многоэлементных АС, необходимо учитывать возможные свойства и ограничения на функции стимулирования и затрат. Для описания конкретной теоретико-игровой модели стимулирования предлагается использовать значения признаков классификации по

следующим основаниям , приводимым в следующем порядке - первичное основание, вторичное и т.д.:

1. Переменные, от которых зависит функция стимулирования (индивидуальное вознаграждение АЭ). По данному основанию возможны следующие значения признаков:

- индивидуальное вознаграждение конкретного АЭ явным образом зависит только от его собственных действий. При этом возможны следующие варианты:

9 Основанием классификации оснований вводимой системы классификаций служит набор параметров, который однозначно описывает большинство моделей многоэлементных АС.

отсутствуют общие ограничения на индивидуальные стимулирования АЭ;

присутствуют общие ограничения на стимулирование.

индивидуальное вознаграждение конкретного АЭ явным образом зависит только от вектора действий всех АЭ.

индивидуальное вознаграждение конкретного АЭ явным образом зависит только от результата деятельности АС.

смешанная зависимость, когда индивидуальное вознаграждение конкретного АЭ явным образом зависит и от результата деятельности АС и от вектора действий всех АЭ (например, аддитивно).

Свойства функций затрат АЭ. Ограничимся пока рассмотрением двух случаев - сепарабельных и несепарабельных затрат. Сепарабельными называются такой набор функций индивидуальных затрат АЭ, в котором затраты каждого АЭ зависят только от его собственных действий: Vy, e Ai V y_t e A_t c(y) = ci(yi),

где y4 = (yi, y2, , y-i, y+i, , y„) - обстановка для i-го АЭ, A4 = П Aj.

j * i

Несепарабельными называются индивидуальные затраты АЭ, зависящие от его собственных действий и действий других игроков.

Унифицированность системы стимулирования. В первом приближении ограничимся персонифицированными и унифицированными системами стимулирования. В первом случае функции стимулирования различных АЭ различны (общий случай "обычных" систем стимулирования, оперируя с которыми мы будем опускать прилагательное "персонифицированная"). Во втором случае функция стимулирования одинакова для всех АЭ, но может для различных АЭ зависеть от различных параметров (например, их индивидуальных действий и т.д.). Унифицированные системы стимулирования описаны в [363].

Комбинируя четыре значения признаков по первому основанию классификации и два по второму, получаем следующие восемь (не учитывающих унифицированность) основных классов моделей стимулирования в многоэлементных АС.

1. Индивидуальное вознаграждение конкретного АЭ явным образом зависит только от его собственных действий, затраты сепарабельны. Возможные следующие варианты. Первый - общие

ограничения на индивидуальные стимулирования АЭ отсутствуют - получаем набор несвязанных одноэлементных задач стимулирования (см. выше). Второй вариант - присутствуют общие ограничения на систему стимулирования в АС - получаем АС со слабо связанными активными элементами, решение задачи стимулирования в которой распадается на решение набора параметрических одноэлементных задач и последующим поиском оптимального значения параметра (например, плана и т.д.) в результате решения соответствующей стандартной задачи условной оптимизации [195, 233, 237, 382].

Индивидуальное вознаграждение конкретного АЭ явным образом зависит только от его собственных действий, затраты несепарабельны. Общие результаты для этого класса задач стимулирования отсутствуют - см. обзоры [141, 152, 371].

Индивидуальное вознаграждение конкретного АЭ явным образом зависит только от вектора действий всех АЭ, затраты сепарабельны. Подклассом являются ранговые системы стимулирования, при использовании которых индивидуальное вознаграждение АЭ зависит либо от принадлежности его действия заранее заданному элементу разбиения множества A - так называемые нормативные ранговые системы стимулирования, либо от места, занятого конкретным АЭ в упорядочении действий всех АЭ - так называемые соревновательные ранговые системы стимулирования [84, 195, 293, 392, 396, 397, 410, 412, 420].

Для этого класса задач стимулирования в многоэлементных АС можно показать, что в случае сепарабельных затрат для любой системы стимулирования из некоторого класса, зависящей от вектора действий всех АЭ, в том же классе найдется система стимулирования, зависящая для каждого АЭ только от его индивидуальных действий, и реализующая тот же вектор действий, что и исходная система стимулирования [410, 415].

Индивидуальное вознаграждение конкретного АЭ явным образом зависит только от вектора действий всех АЭ, затраты несепарабельны. Общие результаты для этого класса задач стимулирования отсутствуют - см. обзоры [141, 152, 371].

6. Индивидуальное вознаграждение конкретного АЭ явным образом зависит только от результата деятельности АС, затраты сепарабельны или несепарабельны. Эти классы моделей называются

моделями коллективного стимулирования. Немногочисленные результаты их изучения приведены в [156, 294, 296, 363, 429].

7, 8. Индивидуальное вознаграждение конкретного АЭ явным образом зависит и от вектора действий всех АЭ, и от результата деятельности АС (смешанная зависимость), затраты сепарабельны или несепарабельны. Общие результаты для этого класса задач стимулирования отсутствуют - см. обзоры [141, 152, 371].

<< | >>

↑

Источник: Бурков В.Н., Новиков Д.А.. ТЕОРИЯ АКТИВНЫХ СИСТЕМ: СОСТОЯНИЕ И ПЕРСПЕКТИВЫ. М.: Синтег,1999. - 128 с.. 1999

Еще по теме 4. Механизмы стимулирования в активных системах:

- Автоматизация - Гидрология - Документоведение, делопроизводство - Информационные системы - Коммуникации - Криптография - Машиностроение - Метрология - Механика - Микроэлектроника - Нефтегазовое дело - Пищевая промышленность - Приборостроение - Программирование - Системный анализ, управление и обработка информации - Строительство - Технология и оборудование механической и физико-технической обработки - Электрическая энергия - Энергетика -

- Архитектура и строительство - Безопасность жизнедеятельности - Библиотечное дело - Бизнес - Биология - Военные дисциплины - География - Геология - Демография - Диссертации России - Естествознание - Журналистика и СМИ - Информатика, вычислительная техника и управление - Искусствоведение - История - Конфликтология - Культурология - Литература - Маркетинг - Математика - Медицина - Менеджмент - Педагогика - Политология - Право России - Право України - Промышленность - Психология - Реклама - Религиоведение - Социология - Страхование - Технические науки - Учебный процесс - Физика - Философия - Финансы - Химия - Художественные науки - Экология - Экономика - Энергетика - Юриспруденция - Языкознание -