Использование линейной оптимизации при решении матричных игр
Пусть игра не имеет оптимального решения в чистых стратегиях, т.е. седловая точка отсутствует
.
Будем считать, что все элементы платежной матрицы неотрицательны (если это не так, то можно ко всем элементам матрицы добавить некоторое число L, переводящее платежи в область неотрицательных значений - очевидно, при этом цена игры увеличится на L, а решение задачи не изменится). Таким образом, предполагаем, что >0.
Будем искать решение игры в смешанных стратегиях:
;
Применение игроком I оптимальной смешанной стратегии гарантирует ему, независимо от поведения игрока II, выигрыш, не меньший цены игры
.
Пусть игрок II применяет свою активную чистую j-ю стратегию, а игрок I - свою оптимальную стратегию . Тогда средний выигрыш игрока I будет равен
Учитывая, что
не может быть меньше
, запишем условия:
|

Разделив левую и правую части каждого из неравенств (4.4) на цену игры >0, получим:
(4.5)
При использовании обозначений
(4.6)
неравенства (4.5) примут вид:
|
где, очевидно, все , так как
.
Из равенства и в силу определения (4.6) следует, что переменные (
) удовлетворяют условию
Учитывая, что игрок I стремится максимизировать , получаем линейную функцию
(4.8)
Таким образом, задача решения игры свелась к следующей задаче линейной оптимизации: найти неотрицательные значения переменных минимизирующие линейную функцию (4.8) и удовлетворяющие ограничениям (4.7).
Из решения задачи линейной оптимизации легко найти цену игры и оптимальную стратегию
игрока I:
В свою очередь, оптимальная стратегия игрока II может быть найдена из выражения
где - неотрицательные переменные задачи линейной оптимизации:
,
которая является двойственной по отношению к задаче, представленной условиями (4.7) и (4.8).
В этой системе неравенств переменные
Таким образом, оптимальные стратегии и
игры с платежной матрицей
(
) могут быть найдены путем решения симметричной пары двойственных задач линейной оптимизации.
Исходная задача | Двойственная задача | |
![]()
| ![]()
|
Цена игры и вероятности применения стратегий игроками I и II равны: