авторефераты диссертаций БЕСПЛАТНАЯ БИБЛИОТЕКА РОССИИ

КОНФЕРЕНЦИИ, КНИГИ, ПОСОБИЯ, НАУЧНЫЕ ИЗДАНИЯ

<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ


Pages:     | 1 ||

«Ю.Ю. Громов, Н.А. Земской, А.В. Лагутин, О.Г. Иванова, В.М. Тютюнник СПЕЦИАЛЬНЫЕ РАЗДЕЛЫ ТЕОРИИ УПРАВЛЕНИЯ. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ...»

-- [ Страница 2 ] --

5.3. Ослабленное необходимое условие Уточненное необходимое условие для основной задачи оптимального координатного управления на основе принципа оптимальности, частично свободное от требования непрерывной дифференцируемости функции V(t, x), формулируется сле дующим образом.

Формулировка задачи. Пусть краевые условия имеют вид x(t 0 ) = x 0 ;

q(t1, x(t1 )) = 0. (52) Минимизируемый функционал имеет вид t J [t 0, x 0, u] = (t1, x(t1 )) + f 0 (t, x, u)dt (53) t и определен на траекториях системы (41) с управлением u(t ) U m (t, x).

Закон управления v(t, x) считается допустимым, если u(t) = v(t, x(t)), v(t, x(t )) U m (t, x), и является кусочно непрерывным.

Если управление u = u*(t), t0 t t1 доставляет минимум функционалу J, то ему соответствует оптимальная траектория x*(t).

Пусть t V (t0, x 0 ) = min (t1, x(t1 )) + f 0 (t, x, u)dt = m uU t * t f 0 (t, x (t ), u (t )) dt.

* * * * = (t1, x (t1 )) + (54) t Тогда t V (t 0, x 0 ) (t1, x(t1 )) + f 0 (t, x(t ), u(t ))dt, t где u(t) произвольно.

Необходимые условия. Предполагается, что искомое оптимальное управление u* = v*(t, x) существует. Тогда можно ус тановить необходимые условия для основной задачи оптимального координатного управления.

Пусть в области G пространства состояний X n выполняются следующие условия.

1. Для x G в момент t функция n V V, u = f 0 (t, x, u) + H t, x, f i (t, x, u) x xi i = имеет абсолютный минимум по u, т.е. min H = H * (t, x, Vx ) при u * = v * (t, x) = u * (t, x, Vx ) по всем допустимым u u(t ) U m (t, x), где Vx = V x – градиент V(t, x).

2. Решение x(t) системы (41) существует и является непрерывной функцией для всех допустимых u(t ) U m (t, x).

3. Функция f 0 (t, x, u) непрерывна по t.

4. Функция Vt (t, x) = V t непрерывна по t и x;

вектор-функции Vx (t, x) и f(t, x, u) либо непрерывны по t и x, либо имеют равные левый и правый пределы для скалярного произведения Vx f вдоль любой траектории x(t) системы (41):

lim [Vx (t, x)f (t, x(t )), u(t ))] = lim [Vx (t, x)f (t, x(t ), u(t ))].

t t 0 + 0 t t 0 5. Существует оптимальное движение для каждого начального x0 G в некоторое состояние, удовлетворяющее усло вию q(t1, x1 ) = 0, и причем такое, что траектория не выходит из G.

6. Каждая точка в G, не удовлетворяющая условию q(t, x) = 0, имеет окрестность, целиком лежащую в G.

Тогда функция V(t, x) в области G удовлетворяет уравнению Гамильтона–Беллмана dV min + f 0 (t, x(t ), u(t )) = 0, (55) uU dt u m или V (t, x) + Vx (t, x)f (t, x, u) + f 0 (t, x, u) = min t uU m V (t, x) = + min H (t, x,Vx (t, x), u) = (55') t uU m V (t, x) + H * (t, x, Vx (t, x)) = = t с граничным условием V (t, x) = (t, x) (55") на гиперповерхности q(t, x) = 0.

Здесь обозначено H * (t, x, Vx (t, x)) = min H (t, x, Vx (t, x), u) ;

uU m dV dt – полная производная вдоль траектории, реализуемой под действием управления u.

u Так как при известной функции V(t, x) u * = arg min H = u * (t, x,Vx (t, x)) = v * (t, x), uU m то найденное решение V(t, x) уравнения (55) одновременно дает решение проблемы синтеза оптимального закона управле ния.

Замечания.

dV 1. Требование 4 влечет за собой непрерывность функций и V(t, x) по времени t.

dt u 2. Когда Vt, Vx и fi непрерывны по t и x, уравнение (55) представляет собой уравнение Гамильтона–Якоби.

Общая последовательность действий, которой целесообразно придерживаться при решении задачи синтеза оптимально го закона управления методом динамического программирования, представлена в табл. 2.

2. Последовательность действий при использовании метода динамического программирования Шаг Последовательность действий Образуется функция H, в которой сопряженные перемен ные i заменяются на компоненты вектора V (t, x) V (t, x) V (t, x) dV = grad xV (t, x) = Vx =, т.е.

x, x,..., xn dx 1 H (t, x, u,Vx ) = Vxf (t, x, u) + f 0 (t, x, u) 2 Минимизируется H (t, x, u,Vx ) по u U m и находится явная зависимость управления u* от компонент вектора Vx :

u * = u * (x, Vx, t ) = arg min H (t, x, u, Vx ) uU m Находится минимальное значение H* путем подстановки в H значения u * (t, x, Vx ) :

H * (t, x,Vx ) = H (t, x, u * (t, x, Vx ),Vx ) 4 Решается дифференциальное уравнение в частных производных Гамильтона–Беллмана V H * (t, x, Vx ) + = t с соответствующим граничным условием для функции V(t, x) V (t, x) = (t, x) на гиперповерхности q(t, x) = 5 Подставляя результаты шага 4 в выражение для u * (t, x, Vx ), получаем закон управления с обратной связью V (t, x) u * = v * (t, x) = u * t, x, x 5.4. Сводка общих процедур метода динамического программирования для вычисления оптимального закона управления u* = v*(t, x) П р и м е р 2. Синтез оптимального закона управления для линейной системы с квадратичным критерием качества. Про блема аналитического конструирования оптимальных автопилотов.

Пусть нестационарная линейная система описывается векторным линейным дифференциальным уравнением x = A(t )x + B (t )u + Cf (t ) (I) & с начальным условием x(t 0 ) = x;

t 0 t t1, (II) где t1 – фиксировано;

t 0, x 0 – известные величины (которые, однако, специально не выбираются), и пусть критерий качест ва имеет вид 1T T J [u] = l1 x1 + x1 R1x1 + t1 l T (t ) x(t ) + l T (t )u + 2 +1 T dt.

(III) + (x Q(t )x + x T N (t )u + u T N T (t )x + u T P (t )u) t0 2 Здесь x = ( x1, x2,..., xn )T ;

f = ( f1,..., f n )T ;

C, A(t) – матрицы размерности n n;

u = (u1,..., u m )T, x1 = x(t1 ) ;

B(t), N(t) – мат рицы размерности n m;

R1, Q(t ) – положительно полуопределенные симметричные матрицы размерности n n;

P(t) – положительно определенная симметричная матрица размерности m m;

P(t) – известная функция времени;

l1, l 2 (t ), l1, l 2 (t ) – n-мерные векторы;

l 3 (t ) – m-мерный вектор.

Напомним, что симметричная матрица Q называется положительно полуопределенной, если все ее собственные значе ния неотрицательны или если соответствующая ей квадратичная форма неотрицательна, т.е. xT Qx 0 для всех x = ( x1, x2,..., x n )T 0. Для того чтобы матрица Q была положительно полуопределенной, необходимо и достаточно, чтобы все главные (а не только угловые!) миноры были неотрицательны:

i i... i p Q 1 2 i i... i p 0 (1 i1 i2... i p n;

p = 1, n).

1 2 Предполагается, что на значения управляющего вектора u не накладывается каких-либо ограничений, а матрицы Q(t), N(t), P(t) таковы, что выполняется условие Q(t ) N (t ) P 1 (t ) N T (t ) (это условие гарантирует отсутствие сопряженных точек в данной задаче).

Необходимо найти закон управления с обратной связью u* = v*(x, t), минимизирующий критерий J[u]. Заметим, что значения вектора фазовых координат x при t = t1 не заданы (т.е. рассматри ваемая задача относится к числу задач оптимального управления со свободным правым концом).

Пусть V(t, x) – минимальное значение критерия качества J[u] при движении системы (I) из произвольной начальной точки (t, x) (нижний индекс «0» опущен) на отрезке времени [t, t1 ], t t1 :

J * = J minV (t, x) = min J [u].

u При решении задачи методом динамического программирования целесообразно руководствоваться последовательно стью действий, изложенной в сводке общих процедур (см. табл. 2). В соответствии с табл. 2 составляем функцию H (t, x,, u) (гамильтониан) для данной задачи H (t, x,, u) = f 0 (t, x, u) + T f (t, x, u) = l T x + l T u + 2 1T (x Qx + xT Nu + u T N T x + u T Pu) + T ( Ax + Bu + Cf ) + V (t, x) и заменяем сопряженный вектор T на градиент Vx (t, x) (градиент = Vx (t, x) функции V (t, x) считается вектором x строкой) функции V(t, x) по x:

1T (x Qx + 2xT Nu + u T Pu) + Vx ( Ax + Bu + Cf ).

H (t, x,Vx, u) = l T x + l T u + 2 Дифференциальное уравнение Гамильтона–Беллмана (45) в данном случае имеет вид T 1T T T T l 2 x + l 3 u + (x Qx + 2x Nu + u Pu) + V + min =0, (IV) t u + Vx ( Ax + Bu + Cf ) где функция V(t, x) удовлетворяет граничному условию (55"):

1T T V (t1, x) = l 1 x + x R1x. (V) Поскольку, по предположению, P(t) – положительно определенная матрица, то минимум H (t, x, Vx, u) достигается в H = 0.

стационарной точке, где u u* = arg min H (t, x, Vx, u) = P 1[l 3 + N T x + B T VxT ]. (VI) u Подставляя теперь полученное выражение для u* в (VI), находим окончательный вид основного дифференциального уравнения динамического программирования (в данном случае это будет дифференциальное уравнение Гамильтона–Якоби, так как u* найдено из условия стационарности H):

V 1 + Vx Ax Vx BP 1l 3 Vx BP 1 N T x Vx BP 1B T VxT + t 2 1 + VxCf + l T x l T P 1l 3 l T P 1 N T x l 3 P 1B T VxT + 2 3 2 1T 1T + x Qx x NP 1 N T x = 0. (VII) 2 Доказано, что в линейных системах с квадратичным критерием качества при сделанных предположениях относительно матриц Q(t), P(t), N(t), R1 решение уравнения (VII) с краевым условием (V) существует и его можно искать в виде 1T x R (t )x + q T (t )x + r (t ), V (t, x) = (VIII) где R(t) – симметричная матрица размерности n n;

q(t) – n-мерный вектор;

r(t) – скаляр.

Частные производные функции V(t, x), записанной в форме (VIII), имеют вид V (t, x) 1 T & = x R (t )x + q T (t )x + r (t ) ;

(IX) & & t T V (t, x) V (t, x) VxT (t, x) = = xT R + qT.

= R(t )x + q(t );

(X) x x Подставляя выражения (IX) и (X) в уравнение (VII) и учитывая, что:

1) при одновременном умножении произвольной матрицы М слева и справа на вектор x имеет место соотношение 1 x Mx = xT ( M + M T )x (т.е. происходит выделение симметричной части ( M + M T ) матрицы М);

T 2 2) скалярное произведение обладает свойством транспонируемости y T b = b T y, получим 1T& x [ R + R ( A BP 1 N T ) + ( A BP 1 N T )T R + Q NP 1 N T RBP 1B T R]x + [qT + qT ( A BP 1 N T ) l T P 1B T R qT BP 1B T R & 1 T 1 T l T P 1 N T + l T + (Cf )T R ]x + r q BP B q l T P 1B T q + qT Cf & 3 2 1 T l3 P l3 = 0. (XI) Поскольку условие (XI) должно выполняться тождественно для любых значений x и поскольку при t = t1 для любых значений x должно выполняться тождественно следующее соотношение [см. (V) и (VIII)] 1T x R (t1 )x + q T (t1 )x + r (t1 ) = xT R1x + l1 x, T 2 то для определения матрицы R(t), вектора q(t) и скаляра r(t) получаем следующие уравнения и граничные условия:

1) R + R ( A BP 1 N T ) + ( A BP 1 N T )T R RBP 1 B T R + Q & NP 1 N T = R + RA + AT R ( RB + N ) P 1 ( N T + B T R ) + Q = 0;

(XII) & R (t1 ) = R1. (XII') 2) qT + qT ( A BP 1 N T ) l T P 1 BT R qT BP 1B T R & l T P 1 N T + l T + (Cf )T R = 0 ;

(XIII) 3 qT (t1 ) = l1.

T (XIII') 3) 1 r q T BP 1 B T q l T P 1 B T q + q T Cf l T P 1l 3 = 0 ;

(XIV) & 3 2 r (t1 ) = 0. (XIV') Полученные уравнения следует интегрировать в обратном времени от t = t1 к t = t0.

Оптимальный закон управления с обратной связью имеет вид u * (x, t ) = P 1 (t )[ B T (t ) R(t ) + N T (t ))x + B T (t )q(t ) + l 3 (t )]. (XV) Решения некоторых других задач оптимального управления для линейных систем с квадратичным критерием качества приведены в табл. 3. В пп. 1 – 7 (строках 1 – 7) этой таблицы приведены постановка и решения задачи синтеза оптимального закона управления при свободных граничных условиях на правом конце траектории, а в п. 8 – постановка и решение задачи при заданных граничных условиях на правом конце. В пп. 1 – 6, 8 рассматриваются однородные линейные системы, в п. 7 – неоднородная линейная система. В п. 1 дано решение задачи синтеза для нестационарной линейной системы и нестационар ного квадратичного критерия качества при фиксированном конечном интервале времени процесса управления, в п. 2 – для стационарной (независящей явно от t) системы и стационарного критерия качества при фиксированном конечном интервале времени процесса управления, в п. 3 – для стационарной системы и стационарного критерия качества на неограниченном интервале времени ( [0, ] ), в п. 4 – для нестационарной системы и нестационарного квадратичного критерия более общего вида, чем в пп. 1 – 3 (критерий содержит перекрестные члены типа xT Nu ). В п. 5 приведено решение задачи, которая в оп ределенном смысле эквивалентна задаче п. 4 (см. 5-й столбец таблицы), в п. 6 дано решение для оптимизации отклонения системы от заданного желаемого поведения, в п. 7 рассмотрен случай синтеза оптимального закона управления для неодно родной линейной системы, в п. 8 – синтез оптимального закона управления при заданных граничных условиях на правом конце и квадратичном критерии более общего вида. Некоторые из приведенных в табл. 3 решений (пп. 1 – 4, 6, 7) являются частными случаями рассмотренной выше задачи.

Контрольные вопросы 1. Принцип оптимальности динамического программирования.

2. Ослабленное необходимое условие.

3 Оптимизация линейных систем с квадратичным критерием качества при отсутствии ограничений на значения управляющих функций Оптимальный закон управле Начальные и Оптимальное Уравнение движения ния № строки конечные Критерий качества J[u] значение крите (в смысле минимума J[u]) системы условия рия качества * * u = v (x, t) 1 2 3 4 5 x = A(t )x + B(t )u, 1 u * = P 1 (t ) B T (t ) R (t )x, t 0 – задано, & 1T J * = J min = J [u] = x1 R1x1 + x(t 0 ) = x 0 – T x = ( x1,..., x n ), где R(t) – решение матрич- = V (t 0, x 0 ) = ного уравнения Риккати:

t задано, u = (u1,..., u m ) T, + [xT Q(t )x + uT P(t )u] dt R (t ) = R (t ) A(t ) = x T (t 0 ) & t 0 t t1 2t A(t) – матрица раз мерности n n, B(t) t1 – задано, R, Q(t ) – положительно A(t ) R(t ) Q(t ) + R (t 0 )x(t 0 ) – матрица размер- x(t1 ) = x1 – 1 + R (t ) B (t ) P 1 (t ) B T (t ) R (t ), полуопределенные сим ности n m свободно R (t1 ) = R метричные матрицы размерности n n;

(интегрирование от P(t) – положительно до t0 ) или t определенная симмет ричная матрица размер- d ( R (t )) = AR 1 + R 1 AT ности m m dt BP 1B T + R 1QR R 1 (t1 ) = R x = Ax + B u t0 = 0, 2 & u* = K (t1 t )x, 1T J * = J min = J [u] = x1 R1x1 + x(t 0 ) = x 0 – = V (t0, x0 ) = A, B – постоянные t где 1 задано, матрицы размер [xT Qx + uT Pu]dt, + = xT (t0 ) K (t1 t ) = P 1 B T R (t1 t ) 0 t t ности n n и n R(t1 t0 )x(t0 ) m, соответственно R (t1 t ) – решение мат t1 – задано, t0 = Q, R1 – постоянные ричного уравнения Рикка x(t1 ) = x1, x = ( x1,..., xn )T, ти:

положительно полуоп x1 – сво u = (u1,..., u m )T ределенные симмет бодно dR ричные матрицы раз- = R () A + AT R () + Q d мерности n n;

P – по стоянная положительно R () BP 1 B T R (), определенная симмет R (0) = R1, = t1 t, ричная матрица раз 0 t мерности mm x = Ax + B u J [u] = t0 = 0, 3 u* = –Kx, & J * = J min = = V (t0, x 0 ) = [xT Qx + uT Pu] dt, K = P 1BT R = A, B – постоянные x(t0 ) = x0 – где – посто 20 1T матрицы размер- = x 0 R0 x R0 – уста задано, ности n n и n янная матрица;

m, соответственно новившееся решение мат Q – постоянная поло 0 t t1 = ричного уравнения Рикка жительно полуопреде ти, т.е.

ленная симметричная x = ( x1,..., xn )T,, матрица размерности n u = (u1,..., u m )Y, R0 = lim R() n;

P – постоянная x(t1 ) –, x = ( x1,..., xn ) T, положительно опреде свободно ленная симметричная u = (u1,..., u m ) T, где матрица размерности m m dR = RA + A T R + Q d RBP 1 B T R;

R (0) = 3 R0 может быть также оп ределена из квадратного алгебраического матрич ного уравнения Риккати R0 A + AT R0 + Q R0 BP 1 B T R0 = как его единственное по ложительно определенное решение x = A(t )x + B (t )u, 4 u * = P 1 [ B T R + N T ]x, t0 – задано, & 1T J [u] = x1 R1x1 + 2 x(t0 ) = x0 – t где A(t), B(t), x, u – Q N x где задано, [xT, uT ] T udt, матрицы и векто t0 t t1, N P ры, определенные t t1 – задано, в п. x(t1 ) = x1, Q NP 1N T 0 ;

& R = RA A T R + где x1 – + ( RB + N ) P N(t) – матрица размер свободно ности n m;

P(t) – по ( N T + B T R ) Q, ложительно опреде R (t1 ) = R ленная матрица раз мерности m m;

R1 – см. п. 5 x = ( A BP1 N T )x + t 0 – задано, u * = P 1 B T R x = 1T & J [u] = x1 R1x1 + + Bu, x0 – зада- = u*4) + P 1 N T x, ( t но, 2 t [xT, uT ] + t 0 t t1, u*4) где A(t), B(t), x, u – 0 ( где R и определены в t1 – задано, матрицы и векто- Q NP1N T, 0 x п. dt ры, определенные x(t1 ) = x1, Pu 0, в п. 1;

P(t), N(t) – x матрицы, опреде- – лённые в п. 4 свободно u* = C (t )x + h(t ), x = A(t )x + B(t )u, & 6 t 0 – задано, t J [u] = [(y (t ) где x0 – зада- 2t где A(t), B(t), x, u – но, C = P 1 B T R;

M (t )x)T Q(t )(y (t ) матрицы и векто t 0 t t1, ры, определенные h = P 1 B T g, M (t )x) + uT P (t )u]dt, t1 – задано, в п. а матрица R(t) и вектор g(t) x(t1 ) = x1, где y(t) – заданная определяется из решений функция (желаемый x1 уравнений:

– выходной сигнал);

M(t) свободно & R = RA AT R + – матрица размерности n n;

P(t), Q(t) – см.

+ RBP 1BT R M T QM, п. 2;

R(t1 ) = 0, M(t)x – полученный выходной сигнал g = ( AT RBP 1B T )g + & y = ( y1, y 2,..., y n )T + M T Qy, g(t1 ) = x = A(t )x + 7 t0 – задано, u* = P 1 B T ( Rx + w ), & 1T J [u] = x1 R1x1 + x(t0 ) = x0 – + B(t )u + f (t ), 2 2 где где f(t) – известный задано, t & R = RA AT R [xT Q(t )x + uT P(t )u]dt, вектор;

t0 t t1, n-мерный Q + RBP 1B T R, элементы A(t), B(t), t1 – задано, t 0 R (t1 ) = R1, x, u – определены в x(t1 ) = x1 – R1, Q(t ), P(t ) – см. п. 1 w = ( RBP 1B T AT )w Rf, & п. 1 w (t1 ) = свободно & = A(t )x + B(t )u, 8 t 0 – задано, x t u * = P 1 [ N T + B T J * = J min = J [u] = [xT Q (t )x + где A(t), B(t), x, u – x(t 0 ) = x 0 ( R FG 1 * F T )]x – = V (t 0, x 0 ) = 2t матрицы и векторы, задано, P 1 B T FG 1 1, 1T определенные в п. 1 t 0 t t1, 2x N (t )u + uT P (t )u]dt + T = x 0 (R(t 0 ) где t1 – задано, 1 & R = RA AT R Q + T + x1 R1x1, F (t )G 1 (t ) + ( RB + N ) P 1 ( N T + BT R), Mx(t1 ) = 1, R(t1 ) = R1, M – матрица Q (t), N(t), P(t), R – F T (t ))x 0 + (q n);

F = [ AT (RB + N ) P 1BT ]F, & + (FG11 ) см. п. 1 – заданный F (t1 ) = M T, 1T q-мерный G = F T BP1BT F, & x 0 1 G вектор q n G(t1 ) = 0 Глава НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ ОСОБОГО УПРАВЛЕНИЯ 6.1. Краткая формулировка задачи При решении задач встречаются случаи, когда управление u входит в дифференциальные уравнения математической модели объекта линейно, dx = f (t, x, u) = (x, t ) + R(x, t )u, (56) dt где x = ( x1, x2,..., xn )T, x X n ;

u = (u1, u 2,..., u m )T, u U m ;

= ( 1, 2,..., n )T ;

R = {rij (t, x)} (i = 1, n, j = 1, m) ;

t [t 0, t1 ], а критерий качества имеет вид t f 0 (t, x, u)dt = (t0, t1, x0, x1 ) + J [u, t0, t1, x 0, x1 ] = (t0, t1, x 0, x1 ) + t t + [ 0 (x, t ) + uT r0 (x, t )]dt, (57) t m где r0 = (r01, r02,..., r0 m )T ;

u T r0 = r0 u j.

j = Функция Гамильтона H для (56), (57) имеет вид n n n m rij u j = H= i fi = i i (x, t ) + i i =0 i =0 i =0 j = n m n i i (x, t ) + i rij u j.

= (58) i =0 j =1 i = Если U m – m-мерный прямоугольник:

U m = {u = (u1, u 2,..., u m )T a1 u1 b1, a2 u 2 b2,..., am u m bm }, a j b j ( j = 1, m) ( a j, b j могут зависеть от t), то в силу принципа максимума (см. п. 4.3) для минимизации J[u] оптимальное управление опре деляется из условия u = arg min H (t, x, u, ) (59) uU m или n i rij 0 ;

a j при i = uj = (60) n b при i rij 0.

j i = При некоторых значениях x и функция H в (58) может оказаться независящей явно от какой-либо компоненты u j на отрезке [1, 2 ] 2 1 0. В этом случае выполняется соотношение (рис. 9) n i rij (x, t ) 0, j (, x, t ) = (61) i = которое формально совпадает с условием n H = i rij (x, t ) 0 (62) u j i = на отрезке [1, 2 ].

Отрезок [1, 2 ], на котором имеет место соотношение (61), называется участком особого управления для компоненты u j, а оптимальное управление u * (t ) на таком участке существует, называется особым оптимальным управлением. Такое j название объясняется тем, что поскольку гамильтониан H от u j не зависит, оптимальное управление не может быть найдено непосредственно с помощью принципа максимума. Более того, в случае выполнения условия (61) ни необходимые условия классического вариационного исчисления, ни необходимые условия динамического программирования (см. п. 5.2) не могут служить для непосредственного вычисления компоненты u *, хотя все эти условия формально не выполняются.

j Рис. 9. Поведение гамильтонианов H1 (u j ) = + j u j и H 2 (u j ) = j u j + u j + в зависимости от j :

а, б, г, д – строгий минимум (регулярное управление);

в, е – нестрогий минимум (особое управление) Так, например, если гамильтониан H от управления u j не зависит, то H достигает максимума при любом u j.

Условия (61) не могут установить различие между управлениями u j, дающими минимум или максимум функционалу J[u]. На участке особого управления выполняется соотношение 2H 0 (i, j = 1, m) на [1, 2 ], (62) det ui u j показывающее, что условие Гильберта невырожденности вариационной задачи нарушено. Задачи, для которых имеет место условие, в классическом вариационном исчислении называются вырожденными. Если множество U m – замкнуто и ограни чено, то в вырожденных задачах может наблюдаться два режима оптимального управления: регулярный, когда u определяет ся из принципа максимума [как, например, (60)], и особый, когда u не может быть найдено из принципа максимума [как, на пример, при выполнении (61)] и когда требуется особая процедура для его отыскания.

6.2. Процедура нахождения особого управления Общая теория вырожденных вариационных задач разработана недостаточно. Наиболее полно исследован случай особо го управления по одной компоненте u j. В этом случае решение можно получить следующим образом.

Условие (62) показывает, что режим особого управления на участке [1, 2 ] (участке особого управления) имеет место, если n H = i rij (t, x) 0.

u j i = Последовательное дифференцирование этого соотношения по t приводит к соотношениям H dk 0 на [1, 2 ] (k = 0, 1, 2,...). (64) u j dt k Можно показать, что первое ненулевое значение величины dk H k u j u j dt возможно лишь при четном k. Обозначим его k = k min = 2 p. Число p называется порядком вырожденности (сингулярности) вариационной задачи (оптимального управления).

d H При k = 2p управление u j войдет в k явным образом. Теперь величину особого оптимального управления u * u j j dt можно найти из условия H d2p = 0 на [1, 2 ], (65) u j dt 2 p которое линейно по u j (в силу линейности по u системы (56)). Уравнения сопряженной системы в данном случае имеют вид r n n m d s i ij u j.

= i i + (66) x s x s dt j =1 i = 0 i = Считая, что все остальные компоненты вектора u регулярны, т.е. определяются соотношениями типа (60), условие (65) можно записать в виде d 2 p H = M 1 (x,, t ) + u j M 2 (x,, t ) = 0, (67) dt 2 p u j откуда и может быть найдено особое управление для компонент M 1 ( x,, t ) uj =.

M 2 (x,, t ) 6.3. Необходимое условие оптимальности особого управления Для минимума критерия качества J[u] на особом управлении u * в задаче (56)–(57) должно выполняться следующее не j обходимое условие:

d 2p H 0, (1) p 2p p = 0, 1, 2,.... (68) u j u j dt При максимизации критерия качества знак в неравенстве (68) следует заменить на обратный.

Отметим, что при p = 0, т.е. для невырожденных задач, это условие переходит в условие 2 H u 2 0 (при m = 1) и, та j ким образом, (68) является аналогом условия Лежандра–Клебша для особых (вырожденных) экстремалей (для одномерного управления u j ). При p = 1 условие (68) имеет вид d H 0.

u j u j dt 6.4. Необходимые условия в точках сопряжения особого и регулярного управлений Результаты, полученные в пп. 6.2 и 6.3, применимы, если значения оптимального особого управления u * (t ) являются j внутренними точками множества U m на отрезке [1, 2 ]. Необходимые условия для перехода с регулярного оптимального управления на особое оптимальное в случае, когда U m – m-мерный прямоугольник a j (t ) u j (t ) b j (t ), а 1 – момент вре мени начала перехода, определяются следующими неравенствами:

[ M 1 (x,, t ) + b j (t ) M 2 (x,, t )]1 0 (69) (необходимое условие для возможности перехода регулярного управления с верхней границы u j (t ) = b j (t ) на особое опти мальное управление) и [ M1 (x,, t ) + a j (t ) M 2 (x,, t )]1 0 (70) (необходимое условие для возможности перехода регулярного управления с верхней границы u j (t ) = b j (t ) на особое оптимальное управление).

Требование совместного выполнения условий (69) и (70) может быть представлено в виде неравенства d 2p H 0.

(71) u j u j dt 2 p Это условие является необходимым для возможности перехода с обеих границ регулярного управления на особое. Не обходимое условие (71) легче проверить, так как оно не связано с вычислением M 1 (x,, t ). Однако следует иметь в виду, что оно является более слабым, чем условия (69) и (70), поскольку последние из него не вытекают.

Контрольные вопросы 1. Что такое особое управление, и когда оно возникает?

2. Процедура нахождения особого управления.

3. Необходимое условие оптимальности особого управления.

4. Необходимые условия в точках сопряжения особого и регулярного управлений.

Глава НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ УПРАВЛЕНИЯ В ЗАДАЧАХ С ОГРАНИЧЕНИЯМИ ТИПА НЕРАВЕНСТВ, СОДЕРЖАЩИМИ ТОЛЬКО ФАЗОВЫЕ КООРДИНАТЫ x В технических приложениях имеется ряд задач, когда при формировании оптимальной траектории необходимо учиты вать ограничения на область допустимых значений фазовых координат. Например, при наборе самолетом высоты или при рассмотрении траекторий спуска (h(t ))v 2 (t ) q= qзад, т.е.

q(h(t ), v(t ), t ) q зад 0.

При движении ЛА типичными также являются ограничения на допустимые значения высоты полета h и массы m ЛА:

h(t) 0;

m(t) m.

В общем случае ограничения указанного типа можно записать в виде (t, x) 0, (72) где = (1, 2,..., µ1 )T ;

x = ( x1, x2,..., xn )T.

7.1. Краткая формулировка задачи Пусть эволюция рассматриваемой системы S описывается векторным дифференциальным уравнением dx = f (t, x, u), (73) dt где f = ( f1, f 2,..., xn )T ;

x = ( x1, x2,..., xn )T ;

u = (u1, u 2,..., u m )T ;

u U m ;

U m – некоторая замкнутая и ограниченная область в пространстве R m.

Заданы:

• начальное значение x(t 0 ) = x 0, (74) • интервал времени [t0, t1 ], • критерий качества t f 0 (t, x, u)dt.

J [u] = (t1, x(t1 )) + (75) t Необходимо найти такое кусочно-непрерывное управление u(t ) U m, которое переводит начальное условие (t 0, x 0 ) в некоторую конечную точку (t1, x(t1 )), удовлетворяющую условиям q(t1, x(t1 )) = 0, q = (q1, q 2,..., ql )T, (76) l n + 1, и минимизирует функционал J[u] на траекториях, удовлетворяющих условиям (t, x) 0, = (1, 2,..., µ1 )T. (76') Здесь значения функции i не зависят явно от управления u. Предполагается, что t, f 0, обладают непрерывными произ водными до второго порядка.

7.2. Необходимые условия оптимальности В постановке п. 7.1 вся оптимальная траектория полета в общем случае может состоять из двух типов участков: участ ков, целиком лежащих внутри допустимой области, и участков, лежащих на границе допустимой области (рис. 10). Количе ство таких участков и их чередование зависит от конкретной задачи и граничных условий. На участках, целиком располо женных внутри допустимой области, условия (72) выполняются в виде строгих неравенств (t, x) 0.

Для этих участков справедлив принцип максимума, сформулированный в п. 4.3.

На участках, лежащих на границе допустимой области, одно или несколько условий типа (72) выполняются в виде ра венств. Эти участки называются граничными, для них принцип максимума п. 4.3 уже не справедлив. Наличием этих участ ков данная задача и отличается от задач п. 4.1.

Известно несколько эквивалентных подходов к получению необходимых условий оптимальности для участков, распо ложенных на границе (t, x) = 0. Будучи эквивалентными, эти подходы ведут к различным вычислительным процедурам получения решения.

Рис. 10. Типы возможных оптимальных траекторий в задачах с ограничениями на фазовые координаты:

а – г – случаи, когда допустимые траектории располагаются внутри некоторой области (не обязательно замкнутой);

а – траектория, цели ком лежащая внутри допустимой области;

б – траектория, имеющая с границей области одну общую точку (типа отражения от границы);

в – траектория, целиком лежащая на границе;

г – траектория, частично расположенная на границе;

д – з – случаи, когда допустимые траектории располагаются вне некоторой области;

д – случай двух траекторий, доставляющих относи тельный минимум в задаче о кратчайшем пути на плоскости;

е – случай невыпуклой запрещенной области, траектории с несколькими уча стками входа и схода;

ж – 1–2 – траектория, не имеющая общих точек с границей;

1–3 – траектория, имеющая одну общую точку (касание) с границей;

з – случай негладкой границы допустимой области;

1 – начальная точка траектории;

2 – конечная точка траектории;

1' – точка входа на границу;

2' – точка схода с границы Рассмотрим случай одного скалярного ограничения вида i (t, x) 0.

7.3. Первый тип необходимых условий оптимальности для граничных участков траектории Для простоты рассматривается случай, когда лишь одно из ограничений типа (72) выполняется в виде равенства (на пример, ограничение 1 ). Пусть это ограничение 1 (t, x) = 0 (77) таково, что полная производная по времени d1 (t, x) 1 1 = + x = 1 + 1 f (t, x, u) (78) & t x t x dt содержит управление u явно.

Необходимое и достаточное условие того, что (77) имеет место на некотором ненулевом отрезке [t1, t 2 ], вводится в уравнение d (t, x) 1 & & 1 = 1 = + f (t, x, u) = 1 (t, x, u) = 0 (79) t x dt Составляется гамильтониан H1 для граничных участков & H 1 = H + 1 (t, x, u), (80) где n fii ;

H = 0 f0 + i = = 0 на участках, где 1 0;

0 на участках, где 1 = 0.

Теперь необходимые условия для граничного участка совпадают с необходимыми условиями п. 8.3 с заменой в услови & ях (95), (97), (101) функции на 1. Отличие этой задачи от задачи п. 8.2 заключается в условиях, накладываемых на пере менные в точках выхода траектории на границу и схода с нее. В этих точках сопряженные переменные i (t ) могут претер певать разрывы. Если имеется всего два участка, то сопряженные переменные непрерывны. При этом условие 1 (t, x) = может толковаться либо как связь, наложенная на начальные значения (t 0, x 0 ), либо как связь, наложенная на конечные значения (t1, x1 ), в зависимости от порядка следования участков с 1 0 и 1 = 0.

При трех участках, если сначала идет граничный участок, затем участок с 1 0 и далее снова граничный участок, множители тоже непрерывны вдоль всей траектории. При всех других порядках следования участков, если последних боль ше трех, сопряженные переменные имеют разрыв типа скачка. Этот скачок в значениях i (t ) можно осуществить на любом конце граничного участка, при этом на другом конце множители уже могут быть выбраны непрерывными (выбор конца, на котором происходит скачок, не имеет значения). Если этот конец выбран в момент времени t 2, то условия скачка имеют вид 1 (t 2 ) + (t 2 ) = (t 2 ) C ;

(81) x 1 (t 2 ) H + (t 2 ) = H 1 (t 2 ) + C ;

(82) t 1 (t 2 ) = 0, (83) где С – произвольная постоянная;

индексы «+» и «–» обозначают пределы справа и слева, соответственно.

& Если условия (81) подставить в (82), то коэффициент при С будет 1 и, таким образом, условие (82) не зависит от С, а содержит только значения (t 2 ). После указанной подстановки уравнение (82) может быть использовано в качестве экви валентного необходимого условия.

В данной задаче решение x(t ), (t ) не зависит от i 0, С как от параметров x = x(t, i 0, C );

= (t, i 0, C ).

В каждой точке разрыва непрерывности сопряженных переменных должна добавляться новая константа С. Величина С не может быть определена заранее из необходимых условий и является дополнительным параметром, определяющим точку схода. Поскольку число граничных участков заранее неизвестно, задача становится проблемой с переменным числом пара метров, что существенно усложняет ее практическое решение даже с помощью ЭВМ.

П р и м е р 3. Пусть имеются три участка оптимальной траектории, следующие в таком порядке:

1 участок – траектория в открытой области, 1 0 ;

2 участок – граничная траектория, 1 = 0 ;

3 участок – снова траектория в открытой области, 1 0.

Необходимые условия в конечной точке дают (n + 1) уравнение относительно (n + 2) неизвестных i 0, t1, C. Условия (82), (83) и (t 2 + 0) = 0 (84) определяют точку t 2 и дают дополнительное уравнение относительно неизвестных i 0, t1, C. Задача, таким образом, све лась к нахождению решения (n + 2) уравнений с (n + 2) неизвестными.

Если участков больше, чем три, задача сводится к многоточечной краевой проблеме.

7.4. Второй тип необходимых условий для оптимальности управления на граничных участках Пусть tвх – момент входа траектории на границу допустимой области, tсх – момент схода с этой границы. Гамильтони ан H 2 для граничных участков может быть представлен в следующем виде:

n i f i + 11 + 21 = H + 11 + 2 1, & & H 2 = 0 f0 + i = & где 1 = 2 = 0, если 1 0 ;

1 0, 2 0, если 1 = 0, а 1 определяется правой частью соотношения (78).

На граничном участке (т.е. при t вх t t сх ) вдоль оптимальной траектории выполняются условия t T H 2 H & & x=, =, 1 = 0, 1 = 0. (85) & x Оптимальное управление на граничном участке определяется из условия минимума H по u U1m (t, x), где U1m (t, x) – та часть значений u из области U m, которая удовлетворяет условию 1 (t, x, u) = 0.

Если минимум H по u в области U1m (t, x) достигается в ее внутренней точке, то H 2 H & & = + 2 ((t, x, u)) = 0, 1 (t, x) = 0, 1 (t, x, u) = 0.

u u u Значения вектора и гамильтониана H 2 непрерывны в точке входа на границу допустимой области:

(t вх + 0) = (t вх 0);

H 2 (t вх + 0) = H 2 (t вх 0).

Остальные недостающие граничные условия могут быть найдены из общих условий трансверсальности (см. п. 4.3). В частности, из этих условий следует, что при t = t T L ;

L = (t1, x(t1 )) + µ T q(t1, x(t1 )) ;

(t1 ) = x t = t L + H 2 (t1 ) = 0 (если t1 – не задано).

t Кроме того, к этим условиям надо добавить заданное граничное условие (76):

q(t1, x(t1 )) = 0.

Контрольные вопросы 1. Необходимые условия оптимальности.

2. Первый тип необходимых условий оптимальности для граничных участков траектории.

3. Второй тип необходимых условий для оптимальности управления на граничных участках.

Глава НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ УПРАВЛЕНИЯ В ЗАДАЧАХ С ОГРАНИЧЕНИЯМИ ТИПА НЕРАВЕНСТВ, СОДЕРЖАЩИМИ ОДНОВРЕМЕННО ФАЗОВЫЕ КООРДИНАТЫ x И УПРАВЛЕНИЕ u При рассмотрении технических систем часто встречаются задачи, в которых допустимые значения управляющих функ ций не должны превосходить пределов, зависящих от текущего состояния системы.

Ограничения рассматриваемого типа можно записать в виде (t, x, u) 0, (86) где явным образом зависит от состояния x и управления u. Принцип максимума, сформулированный в п. 4.3, справедлив лишь для неравенств типа i (t, u) 0, (87) т.е. не содержащих фазовых координат x явно.

Ниже приводится формулировка принципа максимума, пригодная для ограничений типа (86).

8.1. Краткая формулировка задачи Пусть эволюция системы S описывается векторным дифференциальным уравнением dx = f (t, x, u), (88) dt где x = ( x1, x2,..., xn )T – n-мерный вектор состояния;

u = (u1, u2,..., um )T – m-мерный вектор управления.

На значения управляющего вектора u наложены ограничения (t, x, u) 0, (89) где = (1, 2,..., v1 )T – v1 -мерный вектор, причем число связей, одновременно удовлетворяющихся в виде равенств, не превосходит m.

Область U m допустимых значений u зависит от t, x: U m = U m (t, x) и задается уравнением (89). Предполагается, что вектор u явно входит в уравнение (89).

В начальный момент времени t = t0 задано состояние системы x(t 0 ) = x 0. (90) Необходимо перевести систему S из состояния x0 в некоторое конечное состояние, определяемое соотношениями q(t1, x(t1 )) = 0, (91) где q = (q1, q 2,..., ql2 ), l 2 n + 1.

Требуется найти такой допустимый кусочно-непрерывный вектор u(t), удовлетворяющий (89), что функционал t f0 (t, x, u)dt J [u] = (t1, x(t1 )) + (92) t принимает минимальное значение на решениях системы (88).

Решения x(t) системы (88) предполагаются непрерывными и обладающими, по крайней мере, абсолютно непрерывными производными. Точки t, где одна или более компонент вектора u терпят разрыв первого рода, называются угловыми точ ками. Точки t s, в которых изменяется знак «» на «=» (или наоборот) в одном или нескольких ограничениях (89), называют ся точками соединения.

8.2. Типы граничных условий Задача, в которой (t1, x(t1 )) 0, а граничные условия (97) имеют вид xi (t1 ) xi1 = 0 (i = 1, l2 n) (93) или xi (t1 ) xi1 = 0 (i = 1, l 2 1 n), (94) t1 t зад = 0, где xi1, t зад – заданные числа, называется иногда простейшей.

При l2 = n условия (93) приводят к задаче с закрепленным правым концом и свободным временем. При l2 n условия (93) приводят к задаче с частично свободным правым концом и свободным временем t1. Условия типа (94) относятся к зада че с закрепленным временем t1 = tзад и частично свободным правым концом траектории.

8.3. Необходимые условия оптимальности Если u * (t ) U m (x, t ) [ U m определяется условиями (89)] является управлением, минимизирующим функционал J[u], то найдутся такие постоянные числа 0 = 1, µ = (µ1,..., µ l2 )T, не все равные нулю, и такие одновременно не обращающиеся в нуль переменные векторы (t ) = 1 (t ),..., n (t ))T (непрерывный на [t 0, t1 ] ) и (t ) = (1 (t ),..., v1 (t ))T (непрерывный на [t 0, t1 ] всюду, за исключением, быть может, точек разрыва управления u(t), где, однако, у него существуют единственные право- и левосторонние пределы), что на [t 0, t1 ] имеют место соотношения T T T H H d = 1 ;

= (95) x x x dt T T dx H 1 H = = ;

(96) dt j j = 0 ( j = 1, v1 ), (97) где 0. (98) Для всех фиксированных (t, x, ) и u, удовлетворяющих (89), выполняется принцип максимума (см. п. 4.3) H (t, x,, u * ) H (t, x,, u), (99) т.е.

min H (t, x,, u) = H (t, x,, u * ), uU m где гамильтониан H определяется, как и в п. 4.2, выражением H = 0 f0 + T f, (100) а H1 = H + T. (101) Если минимум H достигается во внутренней точке области U m, то T H 1 H = +. (102) u u u В угловых точках t выполняются следующие условия:

а) сопряженный вектор (t ) непрерывен, т.е.

(t + 0) = (t 0) ;

(103) б) функция H непрерывна, т.е.

H (t, x(t ), (t ), u * (t + 0)) = H (t, x(t ), (t ), u * (t 0)) (104) (условие (99) соблюдается со знаком равенства);

в) уравнения (97) и (102) сохраняются.

Условия a) – в) являются аналогом условий Вейерштрасса–Эрдмана.

В конечной точке (t1, x1 ) для любых значений dt1, dx(t1 ) выполняются условия трансверсальности T T q T q f0 + T f + + µT dt1 + + µ dx(t1 ) = 0 ;

t1 t1 t =t x x t =t 1 (105) q(t1, x(t1 )) = 0.

Из (105) следует, что q H (t1 ) = ( f 0 + T f ) t1 = + µT ;

(106) t1 t1 t T q T (t1 ) = + µ. (107) x x t Для простейшей задачи условия (106) и (107) упрощаются. Так, например, в случае (93) они имеют вид H (t1 ) = 0;

i (t1 ) = µ i (i = 1, l 2 );

(108) i (t1 ) = 0(i = l 2 + 1, n).

8.4. Аналог необходимого условия Клебша Обозначим через те компоненты вектора ограничений, которые в каждой точке минимизирующей кривой x*(t), * u (t) удовлетворяются в виде равенств. Пусть – соответствующий им вектор множителей. Тогда H1 = H + T (109) и для внутренних точек области U m на минимизирующем управлении u*(t) имеет место неравенство 2 H T 0 (110) u для всех = (1, 2,..., m )T 0, удовлетворяющих условию =0. (111) u Здесь 2 H1 2 H, L, u1 u m u H = L L.

L u 2 2H 2 H, L, u m u1 u m Условия (110) и (111) эквивалентны требованию положительности корней s характеристического уравнения 2H T sE, u D( s ) = det u = 0. (112) u Неравенство нулю определителя матрицы 2H T u u 2 (113) u во всех точках x*(t), u*(t) оптимальной траектории эквивалентно условию Гильберта (см. п. 9.4) и в данном случае означает непрерывность управления u*(t). Если указанный определитель отличен от нуля в каждой точке экстремали, то задача назы вается невырожденной.

С л е д с т в и я. 1. Условия для открытого ядра области U m (t, x) (условия (95) – (99)) означают, что во всех точках тра ектории, в которых минимум H по u, u U m (x, t ) достигается при выполнении строгих неравенств i (t, x, u) 0 (i = 1, v) (114) (т.е. в так называемом открытом ядре области U m (x, t ) ) справедлив принцип максимума (см. п. 4.3), не учитывающий нали чие связей (89). Здесь все i = 0 (i = 1, v1 ) и дифференциальные уравнения (95)–(96) при условии (99), дающем u = u(t, x, ) имеют единственное решение:

xi = xi (t, t 0, x 0, i 0 );

(115) i = i (t, t 0, x 0, i 0 ).

В этом случае u = u(t, t 0, x 0, i 0 ) (116) и решение задачи оптимизации погружено в (2n + 1) параметрическое семейство решений, причем решение (115) зависит от параметров (t, t 0, xi 0, i 0 ), по крайней мере, непрерывно.

Если же на траектории нет точек разрыва функции u(t), то решение, по крайней мере, дважды непрерывно дифференци руемо по (t, t 0, xi 0, i 0 ).

2. Если i (t, x, u) не зависит явно от x, то условия (95), (99) эквивалентны принципу максимума п. 4.3, так как в этом случае U m (x, t ) зависит лишь от t: U m = U m (t ).

3. Условия для границы области U m (x, t ) находятся следующим образом. Если при определении минимума H по u часть компонент вектора удовлетворяются в виде равенств, то недостающие множители j могут быть найдены из усло U m, то управление u j и множители j нахо вий (102). Если минимум H по u достигается во внутренней точке области дятся из условий (102) и тех из (89), которые выполняются в виде равенств T H ~ + = 0;

u u (117) (t, x, u) = 0.

~ ~~ Из (117) находятся u и. При этом u = u(x, ), = (x, ) непрерывны в точке соединения, если только в ней нет раз рыва в функции u(t).

Контрольные вопросы 1. Типы граничных условий.

2. Необходимые условия оптимальности.

3. Аналог необходимого условия Клебша.

Глава ЭЛЕМЕНТЫ КЛАССИЧЕСКОГО ВАРИАЦИОННОГО ИСЧИСЛЕНИЯ Задачи, в которых уравнения движения не приведены к форме Коши (т.е. не записаны в виде дифференциальных урав нений первого порядка, разрешенных относительно производных)*, а управляющие функции u(t) явно не введены (и по ка ким-либо причинам такое приведение невозможно или нежелательно), можно решать методами классического вариационно го исчисления.

Отметим, что с точки зрения вычислений всегда желательно привести систему уравнений к форме Коши, так как имен но для такой системы разработаны эффективные алгоритмы численного интегрирования.

9.1. Задачи Больца, Майера, Лагранжа Задача Больца. Одна из наиболее общих формулировок для задач с однократными интегралами и дополнительными условиями заключается в следующем.

Пусть класс траекторий определяется:

1) кривыми x(t) c координатами xi (t ) (i = 1, n), t 0 t t1 ;

2) параметрами a j ( j = 1, r ).

Параметры a j можно рассматривать как некоторые постоянные координаты кривой С: z (t ) = (x(t ), a)Y в (n + r)-мерном пространстве, z = ( x1, x2,..., xn, a1,..., a r )T.

Пусть кривые (x(t), a) удовлетворяют уравнениям движения (или уравнениям связей, вообще говоря, неинтегрируемым) вида F j = (t, x, x, a) = 0 ( j = 1, m n) (118) & и условиям t f k (t, x, x, a)dt = I k = k (t 0, x(t 0 ), t1, x(t1 ), a) + (k = 1, ), (119) & t где dx = ( x1,..., xn )T.

x= & & & dt Необходимо найти кривую из указанного класса траекторий, которая минимизирует функционал t f (t, x, x, a)dt.

J = (t 0, x 0, x1, t1, a) + (120) & t Задача Майера. Эта задача формально получается из задачи Больца при f 0, f k 0 (k = 1, ). В этом случае краевые условия (119) становятся общими граничными условиями, число которых должно быть = 2n + r + 2. Если фиксирован век тор параметров а, то число степеней свободы системы дифференциальных уравнений (118), равное разности между чис лом зависимых переменных и числом независимых дифференциальных уравнений, для задачи Майера равно: = n m.

Задача Лагранжа. Эта задача вытекает из задачи Больца при 0, f k 0, k = 1,.

tt f k (t, x, x, a)dt = k (a), где все или Виды связей и граничных условий. Связи вида (119) при k = k (a), т.е. при & t часть компонент вектора а фиксирована, называются изопериметрическими. Если f k 0, то связи типа (119) задают под вижные граничные условия. Если связи типа (119) имеют вид k1 xk1 (t 0 ) xk1 0 = 0 (k1 = 1, n);

k 2 xk 2 (t1 ) xk 2 1 = 0 (k 2 = 1, n);

2 n +1 t 0 t 00 = 0, 2 n + 2 t1 t10, где xk1 0,..., t10 – заданные числа, то граничные условия называются закрепленными.

Если k1 = 1, n;

k 2 = 1, n1 n;

t 0 t 00 = 0;

t1 t10 = 0, то n1 концов закреплено, а остальные условия называются свобод ными граничными условиями.

Если граничные условия k (t0, t1, x0, x1 ) = 0 при ( f k = 0, k = 1, ) можно разбить на две группы k1 (t 0, x 0 ) = 0 ;

k 2 (t1, x1 ) = 0 ;

k1 = 1, 1, k 2 = 1 + 1,...,, 1 n и если q (t1, x1 ) h(t0, x0 ), то задача называется задачей с разделенными условиями для концов.

Общие условия (119) называются смешанными граничными условиями.

9.2. Первое необходимое условие экстремума функционала в задаче Больца Первое необходимое условие экстремума состоит из:

• правила множителей Лагранжа;

• уравнений Эйлера–Лагранжа;

• условий Эрдмана–Вейерштрасса;

• условий трансверсальности.

Пусть минимизирующая кривая С: {x = x(t), a} допускает в любой точке слабые (малые как по x(t), так и по x(t ) ) ва & ~ (t ), x(t ) = x(t ) ~ (t ) по любым совместимым со связями (118) направлениям в пространстве & риации x(t ) = x(t ) x x & & X n, x X n и функции f, f k,, k обладают непрерывными производными до третьего порядка. Тогда необходимые ус ловия экстремума формулируются следующим образом.

Правило множителей Лагранжа: существуют функции µ0, µk, j (t ) и функции m F = µ 0 f + µ k f k + j (t ) F j (t, x, x, a) ;

(121) & k =1 j = µ k k (t0, x(t0 ), t1, x(t1), a) L = µ 0 (t0, x(t0 ), t1, x(t1 ), a) + (122) k = такие, что множители µ 0 0, µ k – постоянные и решение исходной задачи на условный экстремум лежит среди решений t задачи на безусловный экстремум для вспомогательного функционала J = L + Fdt.

t Всегда можно считать µ 0 = 1, за исключением особых (анормальных) случаев.

Уравнения Эйлера–Лагранжа. Между угловыми точками (см. 126) минимизирующей кривой: C: {x = x(t), a} выполня ются уравнения Эйлера–Лагранжа:

d n F xi Fx = Ft ;

(123) & &i dt i = d Fxi Fx = 0 (i = 1, n), (124) & dt i где F F F Fxi = ;

Fxi = ;

Ft =.

& xi xi t & З а м е ч а н и е. Уравнение (123) является следствием остальных (при условии, что все xi (t ) обладают вторыми произ водными) и для функций F, не содержащих явно t, приводит к первому интегралу.

n xi Fx& F =C (125) & i i = в силу (127), (128), непрерывному при переходе через угловую точку.

Решения x(t) уравнения Эйлера–Лагранжа называются экстремалями независимо от того, являются ли они минимизи рующими, максимизирующими или седловыми кривыми для функционала J со связями (118), (119).

n Условия Эрдмана–Вейерштрасса. Величины F xi Fxi и Fxi (i = 1, n) непрерывны вдоль кривой С: {x = x(t), a}. В && & i = частности, если при t = t кривая С имеет угловую точку, т.е. хотя бы по одной компоненте xi (t ) имеет место разрыв (перво го рода) в производной:

dxi (t ) dx (t ) = xi+, i xi = (126) & & dt t =t 0 dt t =t + то справедливы соотношения F F = Fx+ (i = 1, n) Fx = = (127) &i & xi xi & & i xi = xi+ xi = xi && && и n n n n xi Fx& = F xi Fxi = F xi Fxi = F + xi+ Fx+.

F & && && & &i i xi = xi xi = xi i =1 i =1 i =1 i = + && && (128) Здесь F = F (t, x, x, a) x = x ;

F + = F (t, x, x, a) x = x + ;

& & && && x + = ( x1, x2,..., xn )T ;

x = ( x1 = x2,..., xn )T.

&+ &+ &+ & & & & & Условие трансверсальности. Концевые точки 0 и 1 кривой С: {x = x(t), a} таковы, что равенство r t n n Fa da j dt = F xi Fxi dt + Fxi dxi + dL + (129) && & j i =1 i =1 j =1 t выполняется тождественно для dt 0, dt1, dxi 0 = dxi (t 0 ), dxi1 = dxi (t1 ), da j (т.е. для всех произвольных и независимых значений указанных вариаций концов траекторий и вариаций параметров). Здесь dL – полный дифференциал функции L(t 0, t1, x(t 0 ), x(t1 ), a, µ k ) :


n n r L L L L L xi0 dxi0 + t1 dt1 + xi1 dxi1 + a j da j.

dL = dt 0 + (130) t 0 i =1 i =1 j = r r t0 (a) t (a) З а м е ч а н и е. Если t 0 = t 0 (a), t1 = t1 (a), то dt0 = da j, dt1 = 1 da j. В силу независимости величин a j j =1 a j j = dt 0, dt1, dxi 0, dxi1 условие (129) эквивалентно 2n + 2 + r равенствам вида L L n F xi Fxi + dt1 = 0,..., Fxi + & x dxi1 = 0 (i = 1, n) ;

(131) && t i t = t t = t i =1 L n F xi Fx + L dt0,..., Fxi + & x dxi 0 = 0 (i = 1, n) ;

(132) & &i t i t = t i =1 t =t0 L t1 F a + a dt da j = 0 (i = 1, n), (133) jt j число которых достаточно для того, чтобы совместно с уравнениями (118), (119), (124) определить недостающие значения µ 0, µ k (k = 1, ), j (t ) ( j = 1, m), xi (t ) (i = 1, n), a j ( j = 1, r ).

9.3. Второе необходимое условие минимума функционала в задаче Больца (условие Вейерштрасса) для случая f 0, fk Для допустимой кривой С: {x = x(t), a}, реализующей минимум в задаче Больца, всегда существует такая система мно жителей µ k (k = 0, ), j (t ) ( j = 1, m), что для кривой С с этими множителями выполняется правило множителей (см. п. 9.2), а & для всякого элемента (t, x, x, µ, ) (в том числе и в угловых точках) кривой С функция Вейерштрасса E(t, x, x,, X) :

& & n ( X i xi ) Fx& (t, x, x, ) & & & E(t, x, x,, X) = F (t, x, X, ) F (t, x, x, ) (134) & & & & i i = удовлетворяет неравенству & Е(t, x, x,, X) 0. (135) & & Неравенство (135) имеет место при всех возможных допустимых элементах (t, x, X, ), не совпадающих с элементами (t, x, x, ) кривой С, но удовлетворяющих условиям & F j (t, x, x, a) = 0 ( j = 1, m).

& Если минимизирующая кривая C: {x = x(t), a} нормальна, то система множителей µ 0 = 1, µ k, j (t ) ( j = 1, m, k = 1, ) – единственна и условие Вейерштрасса для этой системы выполняется.

9.4. Третье необходимое условие минимума в задаче Больца (условие Лежандра–Клебша) для случая f = 0, fk = Если кривая С: {x = x(t), a} реализует минимум в задаче Больца, то всегда найдется такая система множителей µ0, µk (k = 1, ), j (t ) ( j = 1, m), что для этой кривой С удовлетворяется правило множителей, а для всякого ее элемента (t, x, x, µ, ) & выполняется неравенство n n Fx& x& (t, x, x, ) i k 0 (136) & ik i =1 k = при любых = (1, 2,..., n ) (0, 0,..., 0), удовлетворяющих уравнениям n F jx& (t, x, x) i = 0 ( j = 1, m), (137) & j i = где F j 2F F jxi = ;

Fxi xk =.

&& xi xi xk & && В рассматриваемой задаче важную роль играет матрица Fxi xk Fxi Fxx Fx && & && & = (138) F 0 ( Fx )T xk & & 2F ( F1, F2,..., Fm ) (i, k = 1, n), Fx = ;

Fxx = (, = 1, m).

& && ( x1, x 2,..., xn ) xi xk && & && Определитель этой матрицы называется определителем Гильберта. Вариационные задачи с отличным от нуля опреде лителем Гильберта называется регулярными (невырожденными).

9.5. Четвертое необходимое условие в задаче Больца (условие Якоби–Майера–Кнезера) Условие Якоби–Майера–Кнезера носит нелокальный (интегральный) характер и характеризует экстремальность всей кривой в целом на основе рассмотрения поведения экстремалей, лежащих в малой окрестности от данной экстремали.

Условие Якоби–Майера–Кнезера. Чтобы экстремаль C: {x(t)} доставляла на отрезке [t 0, t1 ] минимум функционалу в задаче Больца, необходимо, чтобы отрезок [t 0, t1 ] не содержал точек, сопряженных с t0.

~ ~ Сопряженная точка. Считается, что экстремаль C: {x(t)} имеет на интервале (t 0, t1 ) точку t, t0 t t1, сопряженную с t0, если существует последовательность экстремалей, выходящих из той же начальной точки (t 0, x(t 0 )) и бесконечно близких к данной экстремали x(t), такая, что каждая из этих экстремалей пересекает данную экстремаль x(t) и последова ~ ~~ тельность точек пересечения имеют точку t своим пределом. Сопряженная точка ( t, x( t )) является точкой касания экстре мали x(t) с огибающей семейства экстремалей, в которое данная экстремаль x(t) включена (заметим, что огибающая может ~~ вырождаться в точку). Это показывает, что в сопряженной точке ( t, x( t )) расстояние между данной экстремалью x(t) и про извольной близкой экстремалью ~ (t ), выходящей из той же начальной точки (t 0, x(t 0 )), есть величина выше первого поряд x ~ ~~ ка малости по сравнению с указанным расстоянием вне сопряженной точки ( t, x( t )) (т.е. при t0 t t ).

Методы определения сопряженных точек весьма трудоемки. В частности, они могут основываться на вычислении опре делителей Майера–Кнезера.

Для задачи Майера (см. п. 9.1) с закрепленными концами F j (t, x, x) = 0 ( j = 1, m), t 0 t t1, (139) & где t 0, t1 – заданные числа, x(t 0 ) = x 0, x(t1 ) = x1 = ( x1 (t1 ),..., xn1 (t1 )), (140) где x 0, x1 – заданные векторы, и с функционалом J = (t 0, t1, x 0, x1 ) = xn (t1 ) (141) ~ сопряженная точка t может быть вычислена как момент времени, в который обращается в нуль определитель Кнезера:

x1 (t, 0 ) x1 (t, 0 ) L 10 n 1, ( x1, x2,..., xn 1 ) ~ D( t, 0 ) = = =0, L L L (10, 20,..., n 1,0 ) xn 1 (t, 0 ) xn 1 (t, 0 ) ~ t=t L 10 n 1,0 ~ t=t (142) T 0 = (10, 20,..., n 1,0 ) ;

(143) ) где x( x, 0 ) = ( x1 (t, 0 ),..., xn1 (t, 0 )) – экстремаль, удовлетворяющая при = 0 заданным условиям (140).

З а м е ч а н и е. При применении численных методов решения краевой задачи иногда [например, в методе Ньютона] од новременно с основной экстремалью x(t) вычисляется (n – 1) дополнительных экстремалей x n1 (t ), лежащих в близкой окре стности к основной и выходящих из той же точки (начальной) (t 0, x 0 ) по линейно-независимым направлениям (соответст вующим линейно-независимым начальным условиям для множителей Лагранжа 0 ). В этом случае можно утверждать, что ~ ~ точка t будет сопряженной с точкой t0 в сформулированной выше задаче, если в точке t определитель x1 (t ) x11) (t ), ( x2 (t ) x21) (t ), ( L, xn1 (t ) xn1)1 (t ) ( x (t ) x1 2) (t ), ( x2 (t ) x22) (t ), ( L, xn1 (t ) xn2) (t ) ( ~ ( t, 0 ) = L L L L x1 (t ) x1 (t ), x2 (t ) x2n1) (t ), ( n 1) n ( L, xn1 (t ) xn1 (t ) t =~ t (144) ~ представляет бесконечно малую величину более высокого порядка, чем при t0 t t.

Контрольные вопросы 1. Задачи Больца, Майера, Лагранжа;

привести формулировки.

2. Первое необходимое условие экстремума функционала в задаче Больца.

3. Второе необходимое условие минимума функционала в задаче Больца (условие Вейерштрасса) для случая f 0, fk 0.

4. Третье необходимое условие минимума в задаче Больца (условие Лежандра–Клебша) для случая f = 0, fk = 0.

5. Четвертое необходимое условие в задаче Больца (условие Якоби–Майера–Кнезера).

Глава НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ В ЗАДАЧАХ С РАЗРЫВНЫМИ ФАЗОВЫМИ КООРДИНАТАМИ Для ряда технических систем, в частности механики полета (особенно для ракетодинамики) важен случай, в котором допускаются конечные разрывы (разрывы первого рода) в фазовой траектории (например, мгновенный «сброс» массы после отделения ступени). При расчете ступенчатых ракет, химических реакторов, а также целого ряда химико-технологических и информационных процессов, полезны результаты следующей задачи с фиксированным заранее числом разрывов и варьи руемой переменной величиной «скачка» в точке разрыва.

10.1. Краткая формулировка задачи Пусть q – 1 – число интервалов, внутри которых траектория непрерывна;

t j ( j = 1, q) – моменты времени, в которые на ступают разрывы фазовых координат. Точки t j считаются в общем случае неизвестными. Индекс j указывает, что функции рассматриваются на j-ом отрезке времени t j t t j +1.

На каждом j-ом отрезке задана система связей F ( j ) (t, x(t ), x(t )) = 0, (145) & где F ( j ) = ( F1( j ), F2( j ),..., Fm j ) )T ;

( x = ( x1, x2,..., xn )T ;

x = ( x1, x2,..., xn )T, & && & и краевые условия в точке разрыва функций xi (t ) + g (t j, x(t r ), x(t s )) = 0, (146) где g = ( g1, g 2,..., g p )T ;

j = 1, q;

r = j;

1 j q 1;

s = j ;

2 j q;

t1 t 2... t j... t q ;

p 2(q 1)n + q.

Требуется минимизировать функционал + J = (t j, x(t r ), x(t s )). (147) З а м е ч а н и е. Здесь величины x(tr+ ) суть правосторонние пределы в точке разрыва t j, а x(t s ) – левосторонние преде лы.

10.2. Необходимые условия оптимальности Необходимые условия экстремума функционала (147) состоят из:

• правила множителей Лагранжа;

• уравнений Эйлера–Лагранжа;

• условий Эрдмана–Вейерштрасса;

• условий трансверсальности.

Для рассматриваемых разрывных задач эти условия имеют следующий вид.

Правило множителей. Вводятся функции Лагранжа для разрывных задач:

m i Fi( j ) F ( j) = ( j = 1, q 1) (148) i = и p µk gk, L=+ (149) k = а затем отыскиваются функции xi (t ), i (t ), µ k, удовлетворяющие (145), (146) и доставляющие стационарное значение вспо могательному функционалу J (стационарной величиной называется такое значение J, вариация J которой равна нулю:

J = 0 ):

tq q 1 t j + F ( j ) dt.

J = L + Fdt =L + (150) j = t1 tj В этом случае вариация J функционала J имеет следующее выражение:

n n F (1) F (1) L L J = dxi (t1 ) + + dxi (t 2 ) + & & i =1 xi (t1 ) xi i =1 xi (t 2 ) xi t1 t n n F ( q1) F ( 2) L L + dxi (t 2 ) +... + + dxi (t q ) + + & + + i =1 xi (t 2 ) xi i =1 xi (t q ) xi & t2 tq L F (1) L n n n F (1) F ( 2) + xi + xi dt1 + x dt 2 + + & & & & & & t1 i=1 xi t 2 i =1 xi t2 i =1 xi t1 t + L F ( q1) n t n d F (1) F (1) xi dt q + +... + + x xi dt + & t q i =1 xi & i =1 t1 dt xi tq & i tq d F ( q1) F ( q1) n +... + + xi (t )dt. (151) dt xi xi & i =1 t + q Уравнения Эйлера–Лагранжа. Из выражения (151) вытекает, что если x(t) – кривая, доставляющая стационарное зна чение функционалу J (т.е. J = 0 ), то между точками разрывов удовлетворяются уравнения Эйлера–Лагранжа:


d F ( j ) F ( j ) x = 0 (i = 1, n;

j = 1, q 1). (152) dt xi & i Условия Эрдмана–Вейерштрасса и условия трансверсальности. В концевых точках t1, t q и точках разрыва t j вы полняются соотношения, обобщающие условия трансверсальности и условия Эрдмана–Вейерштрасса (см. п. 9.2):

1) при t = t L n F (1) F ( j ) L + = 0;

=0;

(153) xi & t1 i =1 xi xi (t1 ) xi & & t =t t =t 2) при t = t j ( j = 2, 3,..., q 1) F ( j 1) F ( j ) L L + = 0;

=0;

(154) xi (t ) + xi (t ) t =t xi (t j ) xi (t ) t =t + & j j j n F ( j ) n F ( j 1) L + =0;

(155) xi xi & & t j i =1 xi i t =t + i =1 xi & & t =t j j 3) при t = tq n F ( q 1) F ( q 1) L L xi = 0;

+ =0. (156) & t g i =1 xi xi (t q ) xi & & t t q q Для задач с фиксированными величинами разрывов (скачков) краевые условия типа (146) включают соотношения вида g k xi (t ) xi (t + ) (i j ), (157) j j где (i j ) – постоянная (величина скачка xi в момент времени t j ), i = 1, n, j = 2, q 1, k = 1, p.

Тогда при t = t j ( j = 2, q 1) условия (154) и (155) имеют вид n F ( j ) n F ( j 1) L + =0;

(158) xi xi & & t j i =1 xi t =t + i =1 xi & & t =t j j F ( j ) F ( j 1) L + =0. (159) xi (t j ) xi xi t =t & & t =t + j j Контрольные вопросы 1. Перечислите необходимые условия оптимальности.

2. Приведите физическую интерпретацию задачи с разрывами.

Глава ЗАДАЧА ЛАГРАНЖА И ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ 11.1. Принцип Лагранжа для задачи Лагранжа Задачей Лагранжа называется следующая экстремальная задача в пространстве = C 1 (, R n ) C (, R r ) R 2 :

0 (x(), u(), t 0, t1 ) inf ;

(з) (x(), u(), t 0, t1 ) = x(t ) (t, x(t ), u(t )) = 0 ;

(1) & i (x(), u (), t 0, t1 ) 0, i = 1, m ;

(2) i (x(), u(), t 0, t1 ) = 0, i = m + 1, m, (3) где t f i (t, x, u) dt + i (t0, x(t0 ), t1, x(t1 )), i (x(), u(), t 0, t1 ) = i = 0, m.

t Здесь – заданный конечный отрезок, t0, t1, fi : R Rn Rr R – функции n + r + 1 переменных, i : R R n R R n R – функции 2n + 2 переменных, : R R n R r R n вектор-функция n + r + 1 переменных.

Ограничение (1) называется дифференциальной связью, вектор-функция x() = ( x1 (),..., xn ()) – фазовой переменной, вектор-функция u() = (u1 (),..., u r ()) – управлением.

(x(), u(), t 0, t1 ) Четверка называется управляемым процессом в задаче Лагранжа, если x() C 1 (, R n ), u() C (, R r ), t 0, t1 int, t 0 t1, и всюду на отрезке [t 0, t1 ] выполняется дифференциальная связь (1), и допустимым управляемым процессом, если эта четверка является управляемым процессом и, кроме того, выполнены огра ничения (2), (3).

Допустимый управляемый процесс = (x(), u&), t0, t1 ) называется оптимальным (в слабом смысле) процессом, или ( слабым минимумом в задаче (з), если существует такое 0, что для любого допустимого управляемого процесса = (x(), u(), t 0, t1 ), удовлетворяющего условию, выполнено неравенство () ().

Правило решения.

1. Составить функцию Лагранжа:

(x(), u(), t 0, t1 ;

p(), ) = t m m = i f i (t, x, u) + p(t )(x (t, x, u)) dt + i i (t 0, x(t 0 ), t1, x(t1 )), & t0 i = 0 i = = ( 0, 1,..., m ), p () C 1 ([t 0, t1 ], R n* ).

2. Выписать необходимые условия оптимального в слабом смысле процесса = (x(), u(), t0, t1 ) :

а) стационарности по x – уравнение Эйлера:

m d i fix (t ) p(t ) x (t )t [t0, t1 ] Lx (t ) + Lx (t ) = 0 p (t ) = & & dt i = для лагранжиана m i f i (t, x, u) + p(t )(x (t, x, u)) ;

L= & i = б) трансверсальности по x:

m i ix(t ), Lx (t k ) = (1) k lx (tk ) p (t k ) = (1) k & k = 0, k i = для терминанта m i i (t0, x(t0 ), t1, x(t1 )) ;

l= i = в) стационарности по u:

m i fiu (t ) p(t ) u (t ) = Lu (t ) = 0 t [t 0, t1 ] ;

i = г) стационарности по t k :

m m i fi (tk ) + i ( it & t k = 0 (1) k +1 + ix (tk ) x(t k )) = 0, k = 0, k i =0 i = (условие стационарности по t k выписывается только для подвижных концов);

д) дополняющей нежесткости i i () = 0, i = 1, m ;

е) неотрицательности i 0, i = 0, m.

3. Найти допустимые управляемые процессы, для которых выполняются условия п. 2 с множителями Лагранжа и p (), одновременно не равными нулю. При этом бывает полезно отдельно рассмотреть случаи 0 = 0 и 0 0. Во втором случае можно положить 0, равным единице или любой другой положительной константе.

4. Среди всех найденных в п. 3 допустимых экстремальных процессов отыскать решение или доказать, что решения нет.

Предлагаем проверить, что правило решения составлено в полном соответствии с общим принципом Лагранжа.

Набор условий для нахождения оптимального процесса является полным. Действительно, для определения неизвестных функций x(), p(), u() мы имеем систему из дифференциальных уравнений (1) и условий б), в). Выражая из последнего (ра зумеется, когда это можно сделать, например, если выполнены условия теоремы о неявной функции) u() через x() и p(), мы получаем систему из 2n скалярных дифференциальных уравнений. Ее общее решение зависит от 2n произвольных посто янных и еще от множителей Лагранжа i, среди которых m независимых. Добавляя сюда еще t0 и t1, получаем всего 2n + m + 2 неизвестных. Для их определения мы имеем 2n условий трансверсальности б), m условий дополняющей нежесткости и заданных ограничений (3) и два условия стационарности по t k. Таким образом, число неизвестных совпадает с числом урав нений. (Разумеется, разрешимости полученной системы уравнений указанное обстоятельство не гарантирует.) 11.2. Принцип максимума в форме Лагранжа Задачей оптимального управления (в понтрягинской форме) будем называть следующую задачу в пространстве KC (, R n ) KC (, R r ) R 2 [14]:

0 (x(), u(), t 0, t1 ) inf ;

(з) x(t ) = (t, x(t ), u(t )) ;

(1) & u(t ) U t [t 0, t1 ] ;

(2) i (x(), u(), t 0, t1 ) 0, i = 1, m ;

(3) i (x(), u(), t 0, t1 ) = 0, i = m + 1, m, (4) где t f i (t, x(t ), u(t )) dt + i (t0, x(t0 ), t1, x(t1 )), i (x(), u(), t 0, t1 ) = i = 0, m.

t Здесь – заданный конечный отрезок, t 0, t1, fi : R Rn Rr R – функции n + r + 1 переменных, i : R R n R R n R – функции 2n + 2 переменных;

: R R n R r R n – вектор-функция n + r + 1 переменных, U – произвольное множество из R r. Частным случаем задачи (з) является задача, в которой один из концов или даже оба закре плены.

Вектор-функция x() называется фазовой переменной, u() – управлением. Уравнение (1), называемое дифференциаль ной связью, должно выполняться во всех точках непрерывности управления u() на интервале (t 0, t1 ) (это множество будет обозначаться через T).

Четверка (x(), u(), t 0, t1 ) называется управляемым процессом в задаче оптимального управления, если x() KC 1 (, R n ), u() KC (, R r ) и выполняются дифференциальная связь (1) и ограничение типа включения (2). Управ ляемый процесс является допустимым, если, кроме того, выполняются соотношения (3) и (4).

Допустимый управляемый процесс = (x(), u(), t0, t1 ) называется (локально) оптимальным (или еще говорят опти мальным в сильном смысле процессом), если существует 0 такое, что для всякого допустимого управляемого процесса = (x(), u(), t 0, t1 ), для которого (x(), t 0, t1 ) (x(), t 0, t1 ) C (, R n )R выполняется неравенство 0 () 0 ().

Правило решения.

1. Составить функцию Лагранжа:

t1 m = i f i (t, x, u) + p(t )(x (t, x, u)) dt + & t0 i = 0 m i i (t0, x(t0 ), t1, x(t1 )) ;

+ i = = ( 0, 1,..., m ), p() KC 1 ([t 0, t1 ], R n* ).

2. Выписать необходимые условия оптимальности процесса = ( x(), u (), t 0, t1 ) :

а) стационарности по x – уравнение Эйлера:

m d i fix (t ) p(t ) x (t ), Lx (t ) + Lx (t ) = 0 p(t ) = & & dt i = для лагранжиана m i f i (t, x, u) + p(t )(x (t, x, u)) ;

L= & i = б) трансверсальности по x:

m i ix Lx (t k ) = (1) k lxk p(t k ) = (1) k &, k = 0, 1, k i = для терминанта m i i (t0, x0, t1, x1 ) ;

l = l (t 0, x0, t1, x1 ) = i = в) оптимальности по u – принцип минимума в лагранжевой форме:

& & min L(t, x(t ), x(t ), u) = L(t, x(t ), x(t ), u(t )) uU m min i f i (t, x(t ), u) p(t ) (t, x(t ), u) = uU i =0 m i f i (t, x(t ), u(t )) p(t ) (t, x(t ), u(t )) = i = или в гамильтоновой (понтрягинской) форме в виде принципа максимума:

max H (t, x(t ), u, p(t )) = H (t, x(t ), u(t ), p(t )), uU где m i f i (t, x, u) – H (t, x, u, p) = p(t, x, u ) i = функция Понтрягина;

г) стационарности по t k :

m m i fi (tk ) + i ( it & tk = 0 (1) k +1 + ixk x(tk )) = k i =0 i = H (tk ) = (1) k +1 lt k, k = 0, (условие стационарности выписывается только для подвижных концов);

д) дополняющей нежесткости i i () = 0, i = 1, m ;

е) неотрицательности i 0, i = 0, m.

3. Найти допустимые управляемые процессы, для которых выполняются условия п. 2 с множителями Лагранжа и p (), одновременно не равными нулю. При этом бывает удобно отдельно рассмотреть случаи 0 = 0 и 0 0. Во втором случае можно положить 0 равным единице или любой другой положительной константе.

4. Отыскать решение среди найденных допустимых экстремальных процессов или показать, что решения нет.

Можно показать, что описанное выше правило решения находится в полном соответствии с принципом Лагранжа сня тия ограничений.

ЗАКЛЮЧЕНИЕ В настоящем учебном пособии представлена точка зрения авторов на процесс подготовки студентов информационно инженерных специальностей по данной дисциплине.

Особое внимание уделено изучению роли методов теории оптимальных процессов при решении прикладных технико экономических задач.

Рассмотрен набор необходимых условий оптимальности как для основной задачи оптимального управления, так и для случаев, когда управление является особым, а задача осложнена фазовыми и смешанными ограничениями. Элементы классиче ского вариационного исчисления рассматриваются как следствие использования «принципа максимума».

В отдельных главах представлены задачи с разрывными фазовыми координатами. Особое внимание уделено рассмотре нию принципа максимума в форме Лагранжа, что, на взгляд авторов, облегчает его понимание. Приведена методика изуче ния необходимых условий оптимальности для решения прикладных задач.

Следует отметить, что отсутствие методов выбора оптимизируемых функционалов ограничено сдерживает применение методов теории оптимальных процессов при решении прикладных задач.

Это связано с трудностями построения математических критериев, определяющих свойства переходных процессов в замкнутых динамических системах.

За рамками предлагаемого учебного пособия остается широкий круг вопросов, связанных с построением оптимальных управлений системами, функционирующими в условиях неопределенности стохастической или нечеткой природы.

Следует отметить, что для более глубокого изучения вопросов, рассматриваемых в данном учебном пособии необходи мо обратиться к списку литературы, в который включены работы, ставшие классическими.

Изложение представленного материала не перегружено математическими конструкциями, выходящими за рамки мате матики для инженерных специальностей высших учебных заведений.

Исследования авторов настоящего учебного пособия, направленные на совершенствование процесса обучения специа листов в области информационных систем по рассматриваемой дисциплине, найдут отражение в дальнейших разработках и публикациях.

СПИСОК ЛИТЕРАТУРЫ 1. Математическая теория оптимальных процессов / Л.С. Понтрягин [и др.]. – М. : Наука, 1969. – 384 с.

2. Болтянский, В.Г. Математические методы оптимального управления / В.Г. Болтянский. – М. : Наука, 1969. – 408 с.

3. Красовский, Н.Н. Теория управления движением / Н.Н. Красовский. – М. : Наука, 1968. – 476 с.

4. Красовский, Н.Н. Управление динамической системой / Н.Н. Красовский. М.: Наука, 1985. 520 с.

5. Красовский, А.А. Аналитическое конструирование контуров управления летательными аппаратами / А.А. Красов ский. – М. : Машиностроение, 1969. – 238 с.

6. Летов, А.М. Динамика полета и управление / А.М. Летов. – М. : Наука, 1969. – 360 с.

7. Основы теории оптимального управления / В.Ф. Кротов [и др.] ;

под ред. В.Ф. Кротова. – М. : Высшая школа, 1990. – 429 с.

8. Кротов, В.Ф. Методы и задачи оптимального управления / В.Ф. Кротов, В.И. Гурман. – М. : Наука, 1973. – 448 с.

9. Моисеев, Н.Н. Элементы теории оптимальных систем / Н.Н. Моисеев. – М. : Наука, 1975. – 420 с.

10. Фельдбаум, А.А. Основы теории оптимальных автоматических систем / А.А. Фельдбаум. – М. : Физматлит, 1963. – 552 с.

11. Зубов, В.И. Лекции по теории управления / В.И. Зубов. – М. : Физматлит, 1975. – 495 с.

12. Дубовицкий, А.Я. Необходимые условия слабого экстремума в общей задаче оптимального управления / А.Я. Дубо вицкий, А.А. Милютин. – М. : Наука, 1971. – 115 с.

13. Иоффе, А.Д. Теория экстремальных задач / А.Д. Иоффе, В.М. Тихомиров. – М. : Наука, 1974. – 470 с.

14. Алексеев, В.М. Оптимальное управление / В.М. Алексеев, В.М. Тихомиров, С.В. Фомин. – М. : Наука, 1979. – 430 с.

15. Евтушенко, Ю.Г. Методы решения экстремальных задач и их применение в системах оптимизации / Ю.Г. Евтушен ко. – М. : Наука, 1982. – 432 с.

16. Калман, Р.Е. Об общей теории систем управления / Р.Е. Калман // Труды I конгресса ИФАК / Изв. АН СССР. – М., 1961. – Т. 2. – 231 с.

17. Атанс, М. Оптимальное управление / М. Атанс, П.Л. Фалб. – М. : Наука, 1968. – 764 с.

18. Ли, Э.Б. Основы теории оптимального управления / Э.Б. Ли, Л. Маркус. – М. : Наука, 1972. – 576 с.

19. Беллман, Р. Динамическое программирование / Р. Беллман. – М., 1960. – 326 с.

20. Федоренко, Р.П. Приближенное решение задач оптимального управления / Р.П. Федоренко. – М. : Наука, 1978. – с.

21. Поляк, Б.Т. Методы линеаризации при наличии ограничений / Б.Т. Поляк // Итоги науки и техники. Матем. анализ Е.

2 / ВИНИТИ. – М., 1974. – С. 147 – 148.

22. Поляк, Б.Т. Методы решения задач на условный экстремум при наличие случайных помех / Б.Т. Поляк // ВМ и МФ.

– М., 1979. – Т. 19, № 1. – С. 147 – 148.

23. Полак, Э. Численные методы оптимизации. Единый подход / Э. Полак. – М. : Мир, 1974. – 374 с.

24. Эльсгольц, Л.Э. Дифференциальные уравнения и вариационное исчисление / Л.Э. Эльсгольц. – М. : Наука, 1969. – 424 с.

25. Цлаф, Л.Я. Вариационное исчисления и интегральные уравнения / Л.Я. Цлаф. – М. : Наука, 1970. – 191 с.

26. Петров, Ю.П. Вариационные методы теории управления / Ю.П. Петров. – М. : Наука, 1973.

27. Цирлин, А.М. Вариационные методы оптимизации управляемых объектов / А.М. Цирлин, В.С. Балакирев, Е.Г. Дуд ников. – М. : Наука, 1984.

28. Калихман, И.А. Динамическое программирование в примерах и задачах / И.А. Калихман. – М. : Высшая школа, 1979. – 125 с.

Оглавление ВВЕДЕНИЕ …………………………………………………………... Глава РОЛЬ МЕТОДОВ ТЕОРИИ ОПТИМАЛЬНЫХ ПРОЦЕССОВ …... 1.1. Общая задача оптимального управления и ее математи ческая модель ………………………………………………. 1.2. Классификация методов теории оптимальных процессов 1.3. Необходимые условия оптимальности управления, дос таточные условия оптимальности и проблема существо вания оптимального управления ………………………….. 1.4. Общая характеристика результатов, которые могут быть получены методами теории оптимального управления …. 1.5. Условие рационального применения методов оптими зации ………………………………………………………… Глава ОСНОВНЫЕ ПОНЯТИЯ И ОПРЕДЕЛЕНИЯ МАТЕМАТИЧЕ СКОЙ ТЕОРИИ ОПТИМАЛЬНЫХ ПРОЦЕССОВ УПРАВЛЕНИЯ 2.1. Математические модели. Переменные состояния (фазо вые координаты) управляемого процесса ………………... 2.2. Управление ………………...………………...……………... 2.3. Эволюция состояния системы. Дифференциальные урав нения движения ………………...……………….………….. 2.4. Функционал. Критерий качества управления...……….…. 2.5. Автономные системы ………………...……………….…… 2.6. Допустимое программное управление ……………….…... 2.7. Допустимый закон управления ……………….…………... 2.8. Допустимые траектории и процессы ……………….…….. 2.9. Граничные условия. Краевая задача ……………….……... Глава ПОСТАНОВКА ОСНОВНЫХ ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ ………………………………………………………. Основная задача оптимального координатного управле 3.1.

ния …………………………………………………………... 3.2. Оптимальные траектории …………………………………. Свойства оптимальных управлений и оптимальных тра 3.3.

екторий ……………………………………………………… Геометрическая интерпретация основной задачи опти 3.4.

мального управления ………………………………………. Глава НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ ДЛЯ ОСНОВНОЙ ЗАДАЧИ ПРОГРАММНОГО УПРАВЛЕНИЯ.

ПРИНЦИП МАКСИМУМА ………………………………………… 4.1. Краткая формулировка задачи ……………………………. 4.2. Некоторые вспомогательные построения и терминология 4.3. Принцип максимума Л.С. Понтрягина …………………… 4.4. Некоторые следствия принципа максимума ……………... Глава НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ ДЛЯ ОСНОВНОЙ ЗАДАЧИ СИНТЕЗА ЗАКОНА УПРАВЛЕНИЯ.

МЕТОД ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ ……... 5.1. Задача синтеза оптимального закона управления …….…. Принцип оптимальности динамического программиро 5.2.

вания ……...……...……...……...……...……...……...……... 5.3. Ослабленное необходимое условие ……...……...…….….. Сводка общих процедур метода динамического про 5.4.

граммирования для вычисления оптимального закона управления u* = v*(t, x)..……...……...……...……………... Глава НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ ОСОБОГО УПРАВЛЕНИЯ ……………………………………………………….

6.1. Краткая формулировка задачи ……………………………. 6.2. Процедура нахождения особого управления …………….. 6.3. Необходимое условие оптимальности особого управле ния …………………………………………………………...

6.4. Необходимые условия в точках сопряжения особого и регулярного управлений …………………………………... Глава НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ УПРАВЛЕ НИЯ В ЗАДАЧАХ С ОГРАНИЧЕНИЯМИ ТИПА НЕРАВЕНСТВ, СОДЕРЖАЩИМИ ТОЛЬКО ФАЗОВЫЕ КООРДИНАТЫ x ……..

7.1. Краткая формулировка задачи ……….……….…………... 7.2. Необходимые условия оптимальности ……….……….….. 7.3. Первый тип необходимых условий оптимальности для граничных участков траектории ……….……….………… 7.4. Второй тип необходимых условий для оптимальности управления на граничных участках ……….……….……... Глава НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ УПРАВЛЕ НИЯ В ЗАДАЧАХ С ОГРАНИЧЕНИЯМИ ТИПА НЕРАВЕНСТВ, СОДЕРЖАЩИМИ ОДНОВРЕМЕННО ФАЗОВЫЕ КООРДИНА ТЫ x И УПРАВЛЕНИЕ u …………………………………………… 8.1. Краткая формулировка задачи ……………………………. 8.2. Типы граничных условий …………………………………. 8.3. Необходимые условия оптимальности …………………… 8.4. Аналог необходимого условия Клебша …………………... Глава ЭЛЕМЕНТЫ КЛАССИЧЕСКОГО ВАРИАЦИОННОГО ИСЧИСЛЕНИЯ ……………………………………………………….

9.1. Задачи Больца, Майера, Лагранжа ………………………... Первое необходимое условие экстремума функционала в 9.2.

задаче Больца ………………………………………………. Второе необходимое условие минимума функционала в 9.3.

задаче Больца (условие Вейерштрасса) для случая f 0, fk 0 …………………………………………………………. Третье необходимое условие минимума в задаче Больца 9.4.

(условие Лежандра–Клебша) для случая f = 0, fk = 0 …….. Четвертое необходимое условие в задаче Больца (усло 9.5.

вие Якоби–Майера–Кнезера) ……………………………… Глава НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ В ЗАДАЧАХ С РАЗРЫВНЫМИ ФАЗОВЫМИ КООРДИНАТАМИ ……………. 10.1. Краткая формулировка задачи ……………………………. 10.2. Необходимые условия оптимальности …………………… Глава ЗАДАЧА ЛАГРАНЖА И ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ……. 11.1. Принцип Лагранжа для задачи Лагранжа ………………... 11.2. Принцип максимума в форме Лагранжа …………………. ЗАКЛЮЧЕНИЕ ……………………………………………………… СПИСОК ЛИТЕРАТУРЫ ……………………………………………

Pages:     | 1 ||
 





 
© 2013 www.libed.ru - «Бесплатная библиотека научно-практических конференций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.