2.1. Постановка задачи оптимального управления
Будем рассматривать объект, состояние которого в фиксированный момент времени описывается набором из чисел
.






Движение объекта (например, течение химической реакции) проявляется в том, что его фазовые координаты меняются с течением времени , т.е. фазовый вектор является вектор – функцией
. При движении объекта фазовая (т.е. изображающая) точка
описывает в фазовом пространстве
кривую – фазовую траекторию. Обычно фазовые координаты являются инерционными (меняются плавно), так что вектор – функция
непрерывна.
Пусть множество представляет собой совокупность всех фазовых состояний
, в которых объекту разрешается находиться. Тогда при движении объекта его состояние
в каждый момент времени
должно подчиняться условию
,
которое называется фазовым ограничением.
Предположим, что объект находится под воздействием управления, параметры которого в каждый момент времени описываются набором из чисел
(например, углы поворота рулей, мощность двигателя; в химической реакции – количество добавляемых или убираемых ингредиентов, и т.д.). Этот набор чисел составляет вектор управления
, его можно изобразить точкой (или вектором)
мерного пространства
. Управление - вектор – функция
обычно является кусочно-непрерывной функцией (может иметь конечное число скачков в моменты переключения управления). Параметры управления не могут быть совершенно произвольными из-за конструктивных особенностей объекта, ограниченности ресурсов, условий эксплуатации объекта. Это значит, что в пространстве
управляющих параметров выделяется некоторое множество
, называемое областью управления. В любой момент времени точки
должны принадлежать этому множеству:
.
Это условие называется ограничением на управление. Кусочно–непрерывные функции управления ![]() | ![]() |
Чтобы указать, как именно фазовая траектория объекта определяется по выбранному управлению
, надо задать закон движения объекта (управляемой системы). Будем предполагать, что закон движения объекта задается системой обыкновенных дифференциальных уравнений
(1)
где известная вектор – функция, непрерывная как функция
переменных и имеющая непрерывные частные производные по фазовым переменным
.
При фиксированном допустимом управлении система (1) превращается в нормальную систему обыкновенных дифференциальных уравнений с
неизвестными функциями
. Её решение
называется фазовой траекторией, соответствующей выбранному управлению
.
Говорят, что управление , определенное на отрезке времени
, переводит объект (1) из фазового состояния
в фазовое состояние
, если соответствующая этому управлению фазовая траектория – решение системы (1) с начальным условием
удовлетворяет фазовому ограничению
и в момент времени
попадает в фазовое состояние
.




,
,
(2)
имела решение , удовлетворяющее фазовому ограничению
.
Если эта задача имеет решение при любых краевых условиях (т.е. всегда найдется допустимое управление , переводящее объект (1) из любого состояния
в любое другое состояние
), то говорят, что система (2) управляема.
Если система (2) управляема, то обычно она имеет бесконечно множество решений: имеется бесконечно множество допустимых управлений, переводящих объект (1) из фазового состояния в фазовое состояние
по различным траекториям
. Поэтому ставится задача оптимального выбора: среди допустимых управлений, решающих задачу (2), выбрать такое, при котором управляемый процесс будет наилучшим в каком – либо смысле. Другими словами, если качество процесса оценивается некоторой числовой характеристикой (себестоимость, время процесса и т.п.), то задача заключается в том, чтобы выбором подходящего управления обеспечить максимальное или минимальное значение этой числовой характеристики.





Задача оптимального управления
состоит в отыскании управления , обеспечивающего экстремум этого функционала:
,
,
,
.
Управление , обеспечивающее экстремум критерия качества
, называется оптимальным управлением, а соответствующая этому уравнению фазовая траектория
оптимальной траекторией.
Наиболее широко используется интегральные критерии качества – функционалы вида
,
где имеет такие же свойства, как и
(в смысле непрерывности и дифференцируемости).