Принцип максимума Понтрягина

Рефераты, курсовые, дипломные, контрольные (предпросмотр)

Тип: Доклад. Файл: Word (.doc) в архиве zip. Категория: Информатика, IT
Адрес этого реферата http://referat-kursovaya.repetitor.info/?essayId=24689 или
Загрузить
В режиме предпросмотра не отображаются таблицы, графики и иллюстрации. Для получения полной версии нажмите кнопку «Загрузить». Рефераты, контрольные, дипломные, курсовые работы предоставляются в ознакомительных целях, не для плагиата.
Страница 1 из 3 [Всего 3 записей]1 2 3 »

Состояние объекта управления характеризуется n -мерной вектор функцией, например, функцией времени

Так, шестимерная вектор-функция времени полностью определяет положение самолета как твердого тела в пространстве. Три координаты определяют положение центра масс, а три - вращение вокруг центра масс.

От управляющего органа к объекту управления поступает вектор-функция . Векторы x' и u' , обычно связаны между собой каким-то соотношением. Наиболее развитым в настоящее время является уравнение, в котором векторы связаны системой обыкновенных дифференциальных уравнений.

И так, пусть движение управляемого объекта описывается системой дифференциальных уравнений

где - вектор координат объекта или фазовых координат,

- заданная вектор-функция, - вектор управлений или просто управление.

В уравнении (1.1) векторы являются функциями переменной t, обозначающей время, причем, где - отрезок времени, на котором происходит управление системой.

На управление обычно накладывается условие

где U(t) - заданное множество в при каждом .

Будем называть далее управлением кусочно-непрерывную на отрезке (т. е. имеющую конечное число разрывов первого рода) r--мерную вектор-функцию и, непрерывную справа в точках разрыва и непрерывную в точке Т. Управление и называется допустимым, если оно удовлетворяет ограничению (1.2).

Заметим, что ограничиться рассмотрением непрерывных управлений оказывается невозможным, так как с их помощью трудно моделировать моменты переключения управления такие, как, например, включение и отключение двигателей, отделение ступеней ракеты, поворот рулей и т. д.

Иногда рассматривают и более широкие классы допустимых управлений, например, класс всех ограниченных измеримых управлений, удовлетворяющих условию (1.2).

Покажем, как при произвольном начальном положении и допустимом управлении и определяется траектория управляемого объекта. Рассмотрим задачу Коши

Поскольку при разрывных правых частях классическое понятие решения системы дифференциальных уравнений неприменимо, поясним, что понимается в данном случае под решением задачи (1.3). Для этого поступим следующим образом.

Пусть функция и имеет скачки в точках причем. Предположим, что задача (1.3) имеет решение х, определенное на всем отрезке [to,], причем . Далее рассмотрим задачу Коши

.

Предполагая, что она имеет решение на отрезке [] и ,приходим к задаче

и т. д.

Если функцию х удалось определить указанным способом на всем отрезке [to. Т], то будем называть ее решением задачи (1.3) или фазовой траекторией (иногда просто траекторией), соответствующей управлению и. Отметим, что x - непрерывная по построению функция, удовлетворяющая на отрезке равенству

При выполнении определенных условий на f решение задачи (1.3), соответствующее управлению и, существует и единственно при произвольном начальном положении и произвольном допустимом управлении и.

Помимо ограничения на управление могут существовать ограничения и на фазовые координаты

Ограничения на концах траектории целесообразно рассматривать отдельно:

здесь, S (Т) - заданные множества из R";

-заданные множества из R, причем inf sup, to.T.

Таким образом, начальный и конечный моменты времени не обязательно фиксированы. Случаю фиксированных to, Т соответствуют множества , , состоящие из одной точки; при этом говорят, что рассматривается задача с закрепленным временем.

Если So (to) = {} при любом ,то левый конец траектории называют закрепленным. Если же So (to) == R" при всех , то левый конец траектории называют свободным. Во всех остальных случаях левый конец называют подвижным. В аналогичных ситуациях говорят о закрепленном, свободном или подвижном правом конце траектории.

Цель управления в задаче оптимального управления состоит в минимизации некоторого функционала на множестве допустимых наборов.

Если каждой функции y=f(x) определенного класса ставится в соответствии по некоторому закону определенное числовое значение переменной I, то эту переменную называют функционалом от одной функциональной переменной I=I[y]=I[y(x)]=I[f(x)].

Наиболее часто под задачами управления понимаются задачи, в которых роль функционала выполняет интегральный функционал

Мы будем рассматривать задачу с целевым функционалом

представляющим собой сумму интегрального функционала

и терминального

функционала Ф(х(Т), Т). Эта задача называется задачей Больца. Ее частными случаями являются задача с интегральным функционалом, называемая задачей Лагранжа, и задача с терминальным функционалом, называемая задачей Майера. Задача с интегральным функционалом при называется задачей оптимального быстродействия.

Набор (to, Т, х, и, х), минимизирующий функционал (1.6), называется решением задачи оптимального управления, управление и - оптимальным управлением, а траектория х - оптимальной траекторией. Часто решением задачи оптимального управления называют пару (ц, х).

Принцип максимума Понтрягина.

Эффективным средством исследования задач оптимального управления является принцип максимума Понтрягина, представляющий собой необходимое условие оптимальности в таких задачах.

Формулировка принципа максимума.

Рассмотрим задачу оптимального управления, являющуюся частным случаем задачи, сформулированной выше

При этом предполагается, что моменты to, Т фиксированы, т. е. рассматривается задача с закрепленным временем; множество U не зависит от времени, фазовые ограничения отсутствуют. Положим

,

где -константа,

Функция Н называется функцией Гамильтона.

Система линейных дифференциальных уравнений относительно переменных называется сопряженной системой, соответствующей управлению и и траектории х. Здесь

.

В более подробной покоординатной записи сопряженная система принимает вид

Система (2.3) имеет при любых начальных условиях единственное решение , определенное и непрерывное на всем отрезке .

Следующая теорема выражает необходимые условия оптимальности в задаче (2.1).

Теорема (принцип максимума Понтрягина).

Пусть функции и, Ф, g1, ..., gm имеют частные производные по переменным х1, ..., Хn и непрерывны вместе с этими производными по совокупности аргументов х , и U, t [to. Т]. Предположим, что (и, х)-решение задачи (2.1). Тогда существует решение сопряженной системы (2.3), соответствующей управлению и и траектории х, и константа такие, что

| | + || (t) || при t [to, Т], и выполняются следующие условия:

а) (условие максимума) при каждом t [to. Т] функция Гамильтона, достигает максимума по при v=u (t), т. е.

H(x(t), u(t),=max H(x(t), v(t), (2.4)

б)(условие трансверсальности на левом конце траектории) существуют числа, такие, что

в) (условие трансверсальности на правом конце траектории) существуют числа такие, что

Центральным в теореме является условие максимума -(2.4).

Если отказаться от предположения о том, что конечный момент времени Т фиксирован, то теорема останется справедливой за исключением условия трансверсальности на правом конце траектории. Условие (2.6) заменим условием

и добавить еще одно условие трансверсальности на правом конце траектории:

Примеры применения принципа максимума.

1. Простейшая задача оптимального быстродействия.

Пусть точка движется по прямой в соответствии с законом

где х - координата. Требуется найти управление и, переводящее точку из начального положения в начало координат за минимальное время Т (задача оптимального быстродействия). При этом скорость точки в конце траектории должна быть нулевой, а управление - удовлетворять условию

.

Применим к сформулированной задаче принцип максимума Понтрягина . Введем фазовые переменные . Тогда движение управляемого объекта описывается системой двух дифференциальных уравнений первого порядка:

Начальное положение

при t0=0 и конечное положение (0, 0) фиксированы, а конечный момент времени Т не фиксирован.

В обозначениях п.п. 1, 2 в данной задаче U ==[-1, 1], f0=1, Ф=0, а функция Гамильтона имеет вид

Общее решение сопряженной системы

легко выписывается в явном виде

где С, D - постоянные.

RSSСтраница 1 из 3 [Всего 3 записей]1 2 3 »


При любом использовании материалов сайта обязательна гиперссылка на сайт «Репетитор».
Разработка и Дизайн компании Awelan
www.megastock.ru
Проверить аттестат