авторефераты диссертаций БЕСПЛАТНАЯ БИБЛИОТЕКА РОССИИ

КОНФЕРЕНЦИИ, КНИГИ, ПОСОБИЯ, НАУЧНЫЕ ИЗДАНИЯ

<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ


Pages:     | 1 |   ...   | 4 | 5 ||

«ISSN 1512–1712 Академия Наук Грузии Институт Кибернетики СОВРЕМЕННАЯ МАТЕМАТИКА И ЕЕ ПРИЛОЖЕНИЯ Том 23 ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ...»

-- [ Страница 6 ] --

5. КАНОНИЧЕСКИЙ ПРЕДСТАВИТЕЛЬ ЛИНЕЙНОЙ УПРАВЛЯЕМОЙ СИСТЕМЫ В. М. Миллионщиков доказал [13], что всякая линейная система x = A(t)x с рекуррентной матрицей A(t) приводима рекуррентным перроновским преобразованием x = P (t)y к верхне треугольной системе y = F (t)y с рекуррентной матрице F (t). Аналог этой теоремы для управ ляемой системы x = A(t)x + B(t)u получен в [16]: если размерность пространства управляемости рассматриваемой линейной системы равна r, r n, и матрицы A(t) и B(t) рекуррентны, то система приводима рекуррентным перроновским преобразованием x = P (t)y к системе y = F (t)y + G(t)u с рекуррентными F (t) и G(t), причем F (t) — верхне-треугольная матрица, а последние n r строк матрицы G(t) равны нулю. Система y = F (t)y + G(t)u называется каноническим представителем системы x = A(t)x + B(t)u. В данном разделе приведены две теоремы (доказательства см. в [24]) о каноническом представителе для семейства (S, ) систем вида x = A(f t )x + B(f t )u, (t,, x, u) R Rn Rm.

(5.1).

Это семейство мы будем отождествлять с парой (S, ), где S() = (A(), B()), а фиксирован ную систему семейств (S, ) — с парой (S, ). Пространство всех систем (S, ) с непрерывными и ограниченными на функциями S() обозначим S. Любой системе (S, ) и любому поставим в соответствие линейное пространство.

X(0, t, )B(f t )Rm dt L (S, ) = в Rn, которое называется пространством управляемости системы (S, ) на отрезке [0, ]. Тогда (см. [6, с. 46]) имеет место равенство L (S, ) = Im W (S, ), где.

X(0, t, )B(f t )B (f t )X (0, t, )dt, W (S, ) = и поэтому dim L (S, ) = rank W (S, ). Система (S, ) называется вполне управляемой, если найдется такое 0, что dim L (S, ) = n.

Определение 4. Семейство (S, ) назовем регулярным, если найдется 0 0 такое, что для всех 0 размерность dim L (S, ) пространства L (S, ) не зависит от и. Далее, регулярное семейство (S, ) назовем каноническим, если:

.

1) для каждого k = 1,..., n и любого линейное пространство Lk = lin{e1,..., ek }, где e1,..., ek — ортонормированный базис в Rn, инвариантно относительно системы (A, ) (т.е.

если x(t) — решение (A, ) и x(0) Lk, то x(t) Lk для всех t R);

2) найдется 0 0 такое, что для каждого и всех 0 имеет место равенство.

r, где r = dim L (S, ).

L (S, ) = L 152 Е. Л. ТОНКОВ Из этого определения следует, что семейство (S, ) является каноническим в том и только том случае, если для каждого матрица A() верхне-треугольная и последние n dim L (S, ) строк матрицы B() равны нулю.

Определение 5. Каноническое семейство (C, ), где C() = (F (), G()), будем называть кано ническим представителем семейства (S, ), если найдется ортогональная при каждом матрица P () M(n), непрерывная по вместе с производной.

P () = lim P (f ) P () и такая, что при каждом преобразование x = P (f t )y приводит систему (5.1) к системе (C, ):

y = F (f t )y + G(f t )u, (t,, x, u) R Rn Rm ;

в этом случае F () = P ()P () + P ()A()P (), G() = P ()B().

Преобразование x = P (f t )y будем называть стационарным перроновским преобразованием системы (A, ) (в отличие от нестационарного перроновского преобразования x = P (t, )y оно задается не зависящей от времени t функцией P : M(n)).

Пусть фиксированы две топологические динамические системы (, g t ) и (, f t ). Тогда [1, с. 164] система (, g t ) называется расширением системы (, f t ) (а система (, f t ) — фактором системы (, g t )), если существует непрерывная проекция p пространства на, сопрягающее потоки, т.е.

p() = и диаграмма p t ft g p t = f t p. Простым примером расширения системы (, f t ) служит следующая коммутативна: pg конструкция. Пусть (X, ht ) — еще одна топологическая динамическая система, = X. Поток {g t } на определим равенством g t = (f t, ht ), p() = — проекция точки = (, x) на.

Тогда система (, g t ) является расширением системы (, f t ).

Если (, g t ) — расширение динамической системы (, f t ) и задано семейство (S, ), где S S, то для каждого и любого p1 () определена непрерывная и ограниченная на функция.

S() = S(p()) = S(). (5.2).

Построенная так функция S = (A, B) : M(n, n + m) порождает семейство (S, ) систем (S, ) вида x = A(g t )x + B(g t )u, (t,, x, u) R Rn Rm.

Это новое семейство (S, ) (назовем его псевдорасширением семейства (S, )) фактически яв ляется другой записью семейства (S, ) (действительно, в силу определения (5.2), для каждого.

все системы (S, ) на слое () = { : p() = } совпадают с системой (S, )). Поэтому для каждого и всех () матрица Коши X (t, s, ) системы (A, ) совпадает с матрицей Коши X(t, s, ) системы (A, ). Следовательно, для каждого и всех () имеет место равенство L(S, ) = L(S, ).

Теорема 9. Для всякой топологической динамической системы (, f t ) с компактным фа зовым пространством и любого регулярного семейства (S, ), где S S, найдется такое расширение (, g t ) с компактным фазовым пространством, что отвечающее ему псевдорас ширение (S, ) семейства (S, ) обладает каноническим представителем (C, ).

В силу теоремы 9 псевдорасширение (S, ) семейства (S, ) приводимо стационарным перро новским преобразованием x = P (g t )y к каноническому семейству (C, ).

ГЛОБАЛЬНО УПРАВЛЯЕМЫЕ ЛИНЕЙНЫЕ СИСТЕМЫ Теорема 10. Для всякой топологической динамической системы (, f t ) с минимальным (относительно f t ) компактным фазовым пространством и любого семейства (S, ), где S S, найдется такое расширение (, g t ) с минимальным (относительно g t ) компактным фазовым пространством, что отвечающее ему псевдорасширение (S, ) семейства (S, ) обладает каноническим представителем (C, ).

Из теоремы 10 следует, в частности, что если размерность пространства управляемости системы x = A(t)x + B(t)u, равна r, r n, и матрицы A(t) и B(t) рекуррентны, то система приводима рекуррентным перроновским преобразованием x = P (t)y к системе y = F (t)y + G(t)u с рекуррент ными F (t) и G(t), причем F (t) — верхне-треугольная матрица, а последние n r строк матрицы G(t) равны нулю.

6. МНОЖЕСТВО УПРАВЛЯЕМОСТИ ЛИНЕЙНОЙ УПРАВЛЯЕМОЙ СИСТЕМЫ Пусть заданы динамическая система (, f t ) и непрерывные функции A : M(n), U :

conv(Rn ). Рассмотрим семейство (S, ) линейных управляемых систем x = A(f t )x + u, u U (f t ), (6.1). n ). Далее предполагаем, что выполнены следующие условия:

где S = (A, U ) : M(n) conv(R 1) функция A : M(n) непрерывна и ограничена на ;

2) функция U : conv(Rn ) непрерывна и для каждого функция t U (f t ) измерима (существует счетное семейство {u(t, )} измеримых сечений, аппроксимирующих U (f t ) для почти всех t R);

3) 0 U () для всех (не исключается и так называемый критический случай, когда 0 U (), возможно при всех ).

Если U () = B()U, где B : M(n, m), U conv(Rn ), то (6.1) запишется в виде x = A(f t )x + B(f t )u, u U.

В этом случае мы по-прежнему пользуемся обозначением (S, ), где S = (A, B).

Определение 6. Всякое измеримое по t сечение u(t, ) отображения U (f t ) называется допу стимым (программным) управлением системы (S, ). Множество управляемости D (, ) си стемы (S, ) на отрезке [, + ] состоит из всех точек x0 Rn, для каждой из которых найдутся момент времени T = T (x0,, ) [0, ] и допустимое управление t u(t) = u(t, x0,, ) такие, что решение x(t) задачи x = A(f t )x + u(t,, x0 ), x( ) = x0,.

обращается в нуль при t = + T : x( + T ) = 0. Далее, D(, ) = D (, ) — множество управляемости системы (S, ) на полуоси [, ), а функция быстродействия T : Rn+1 [0, ] (время быстродействия) системы (S, ) определяется равенством T (x,, ) = inf 0 : x D (, ) ;

если x D(, ), то T (x,, ) = +.

/ Непосредственно из этого определения вытекает равенство + X(, t, )U (f t )dt, D (, ) = 0. (6.2) Напомним [1, с. 158], что функция (t, ) g(t, ), определенная на R и принимающая значения в метрическом пространстве, называется стационарной (относительно потока {f t }), если для всех t выполнено равенство g(t, ) = g(0, f t ). Если g стационарна, то вместо g(t, ) будем писать g(f t ).

Лемма 8. Функции (, ) D (, ), (, ) D(, ), (, ) T (, x, ) стационарны отно сительно потока {f }.

154 Е. Л. ТОНКОВ Доказательство. Докажем, что D (, ) = D (0, f ). Действительно, + t X(, t +, )U (f t+ )dt = D (, ) = X(, t, )U (f )dt = X(0, t, f )U (f t (f ))dt = D (0, f ) = (последнее равенство использует стационарность оператора Коши). Стационарность D(, ) и T (x,, ) следует из стационарности D (, ) при каждом 0.

Непосредственно из определения 6 и (6.2) следует, что при фиксированных 0, R и множества D (f ), D(f ) выпуклы, а D (f ) еще и компактно. Далее, для всех 0, R и имеют место равенства D (f ) = x Rn : T (x, f ) D(f ) = x Rn : T (x, f ) +.

, Таким образом, для каждого множество D () является множеством уровня функции x T (x, f ), а множество управляемости D(, ) — ее эффективной областью определения. Кроме того, 0 D (f ) D(f ) для всех 0, R и, и если 1 2, то D1 (f ) ).

D2 (f Теорема 11. Функции (, ) D (), (, ) h(,, ), где h — опорная функция множества D (), непрерывны.

Доказательство. Покажем, что для любого 0 найдется 0, что для всех (, ), удо влетворяющих неравенству | 0 | + (, 0 ) ( — метрика в ), выполнено неравенство, где dist — метрика Хаусдорфа в conv(Rn ). Последнее неравенство рав dist D (), D0 (0 ) носильно следующим двум условиям:

1) для каждого x D () найдется такое x0 D0 (0 ), что |x x0 | (свойство полунепре рывности сверху функции (, ) D () в точке (0, 0 ));

2) для каждого x0 D0 (0 ) найдется такое x D (), что |x0 x| (свойство полунепре рывности снизу функции (, ) D () в точке (0, 0 )).

Докажем, что функция (, ) D () полунепрерывна сверху в точке (0, 0 ). Предположим пока, что 0 (в случае 0 доказательство аналогично). Для любого x D () найдется допустимое управление t u(t, ), 0 t, такое, что x= X(0, t, )u(t, )dt.

Пусть u(t, 0 ) — измеримое сечение функции t U (f t 0 ), ближайшее к u(t, ). Тогда |u(t, ) u(t, 0 )| = u(t, ), U (f t 0 ), 0 t,.

x0 = X(0, t, 0 )u(t, 0 )dt D0 (0 ).

Имеем далее:

|x x0 | X(0, t, )u(t, )dt X(0, t, )u(t, 0 )dt + 0 + X(0, t, )u(t, 0 )dt X(0, t, 0 )u(t, 0 )dt.

0 ГЛОБАЛЬНО УПРАВЛЯЕМЫЕ ЛИНЕЙНЫЕ СИСТЕМЫ dist U (f t ), U (f t 0 ) получаем:

Поэтому с учетом неравенства |u(t, ) u(t, 0 )| |X(0, t, )| dist U (f t ), U (f t 0 ) dt+ |x x0 | (6.3) 0 + |X(0, t, ) X(0, t, 0 )||u(t, 0 )|dt + |X(0, t, )||u(t, 0 )|dt.

0 U (f t ), В силу непрерывности функций X(0, t, ) (равномерной по t [0, ]) каждый из интегралов (6.3) стремится к нулю при (, ) (0, 0 ).

Докажем, что функция (, ) h(,, ) непрерывна. Пусть последовательность {(i, i )} схо дится к (, ) S. Тогда в силу ограниченности последовательности управлений {u(t, i, i )} из нее можно выделить слабо сходящуюся на [0, ] подпоследовательность (мы ее снова обозначим {u(t, i, i )}). Обозначим этот слабый предел u(t,, ). В силу выпуклости множества U последо вательность i X(0, t, i )u(t, i, i ), где u(t, i, i ), находится из условия максимума max i X(0, t, i )u = i X(0, t, i )u(t, i, i ), uU слабо сходится к X(0, t, )u(t,, ).

7. ГЛОБАЛЬНАЯ УПРАВЛЯЕМОСТЬ Пусть заданы динамическая система (, f t ), непрерывные ограниченные функции A : M(n), B : M(n, m) и множество U Rm.

Определение 7. Система (S, ) вида x = A(f t )x + B(f t )u, (t,, x, u) R Rn U, где S = (A, B), называется равномерно локально управляемой, если найдутся такие 0 и 0, что O D (f ) для всех n 0, и глобально управляемой, если D() = Rn. Семейство (S, ) называется глобально управляемым, если каждая система (S, ) семейства (S, ) глобально управляема.

Непосредственно из определения равномерной локальной управляемости системы (S, ) следует, n что O D () для некоторых 0, 0 и всех orb+ ().

Введем в рассмотрение следующее условие:

множество U компактно, выпукло и 0 int U. (Q) Лемма 9. Пусть выполнено условие (Q), пространство компактно и. Семейство (S, orb+ ()) глобально управляемо в том и только том случае, если для любого N 0 найдется 0 такое, что ON D (f ) для всех 0.

n Доказательство. Если выполнено условие леммы, то для всех S и всех 0 выполнено неравенство h(, f, ) N, где h — опорная функция множества D (f ). Так как функция.

(, ) h(,, ) непрерывна на S (теорема 11), то h(,, ) N для всех (, ) G = S orb+ (). Фиксируем последовательность {Ni }, Ni, и построим i 0 из следующего i= условия: h(,, i ) Ni при всех (, ) G. Так как Di () D(), то h(, ) =, где h(, ) — опорная функция множества D().

Если условие леммы не выполнено, то найдется такое N, что для любого 0 существуют и x0 ON такие, что x0 D (f ). Поэтому h(, f, ) N для некоторого S. Фиксируем / последовательность {i }, i, и построим последовательности {i }, {i }, i S, такие, что i= h(i, i, i ) N, где i = f i. В силу компактности множества G из последовательности ({i, i )} выделим сходящуюся к некоторой точке (, ) G подпоследовательность (обозначим ее снова {i, i }).

156 Е. Л. ТОНКОВ Покажем, что h(, ) N. Действительно, если h(, ) N, то поскольку функция h(,, ) не убывает (в силу монотонности D () по ), а функция (, ) h(,, ) непрерывна, найдется такой номер i0, что h(i, i, i ) N при всех i i0.

Теорема 12. Пусть выполнено условие (Q), пространство компактно,, система (A, ) приводима (к системе с постоянной матрицей) и n (A, ) 0. Если система (S, ) равномерно локально управляема, то семейство (S, orb+ ()) глобально управляемо.

Пример 1. Покажем, что условие приводимости системы (A, ) нельзя ослабить до требования правильности. Рассмотрим скалярное уравнение (a, 1): x = a(t)x + u, где a(t) = при t (, 0), a(t) = (t+1)1 при t [0, ) и 1. Пусть |u| 1. Наряду с этим уравнением будем рассматри вать семейство уравнений {(a, 1)}+, где множество {a}+ состоит из всех функций a, полученных в результате замыкания множества сдвигов влево функции t a(t). Непосредственной проверкой можно убедиться, что (a) = (a) = 0 при всех a {a}+. Поэтому всякое уравнение в {a}+ правильное. Кроме того, непосредственной проверкой убеждаемся, что уравнение (a, 1) равномерно локально управляемо. С другой стороны, для опорной функции h(a ), где a (t) = a( + t), 0, множества управляемости D(a ) уравнения {(a, 1)}+ имеем:

(t + 1) dt, h(1, a ) = (1 + ) 0, поэтому семейство {(a, 1)}+ не является глобально управляемым.

Доказательству теоремы 12 и формулируемой ниже теоремы 13 посвящены следующие разделы.

Теорема 13. Пусть выполнено условие (Q), пространство компактно и. Если для всякого нетривиального решения системы (A, ) выполнено неравенство |x(t)| lim (7.1) t t и система (S, ) равномерно локально управляема, то (S, ) глобально управляема.

Замечание 1. Если система (S, ) приводима и n (A, ) 0, то всякое решение x(t) системы (A, ) размерности n 1 удовлетворяет неравенству |x(t)| lim. (7.2) t tn Можно предположить, что теорема 13 останется верной, если при n 2 неравенство (7.1) заменить на (7.2). Оказывается, что без дополнительного предположения о приводимости системы (S, ) неравенство (7.2) нельзя ослабить даже до неравенства |x(t)| lim t t1+ при любом 0. Действительно, вернемся к уравнению (a, 1) из примера 1. При 1 все условия теоремы 13 выполнены, следовательно, уравнение (a, 1) глобально управляемо, но при любом уравнение (a, 1) не является глобально управляемым.

Отметим еще, что утверждение теоремы 13 нельзя заменить более сильным: семейство (S, orb+ ()) глобально управляемо. Соответствующий пример приведен ниже.

Пусть компактно и µ — нормированная борелевская мера на, инвариантная относительно потока f t, т.е. µ задана на -алгебре борелевских множеств пространства, µ() = 1 и µ(V ) = µ(f t V ) для всякого µ-измеримого множества V и каждого t R. Множество инвариантных нормированных мер на обозначим M ().

Теорема 14. Пусть выполнено условие (Q), пространство компактно, и семейство (S, orb+ ()) глобально управляемо. Тогда неравенство n () 0 выполнено для почти всех orb+ () относительно любой меры µ M (orb+ ()). Далее, если система (A, ) приводима, то n () 0 для всех orb+ ().

ГЛОБАЛЬНО УПРАВЛЯЕМЫЕ ЛИНЕЙНЫЕ СИСТЕМЫ Доказательство этой теоремы проводится по схеме, изложенной в работе [19].

8. ОЦЕНКИ ОПОРНОЙ ФУНКЦИИ Всюду далее мы предполагаем, что выполнено условие (Q). Будем подчеркивать в этом па раграфе, зависимость множества управляемости D(, U ) и опорной функции h(,, U ) от U. Из определения D(, U ) следует равенство X(0, t, )B(f t )U dt, D(, U ) = а опорная функция h(,, U ) множества D(, U ) имеет вид X(0, t, )B(f t )u(t, )dt, h(,, U ) = где управление u(t, ) удовлетворяет условию максимума max X(0, t, )B(f t )u = X(0, t, )B(f t )u(t, ).

uU Лемма 10. Пусть выполнено условие (Q), компактно и система (S, ) равномерно локаль но управляема. Тогда найдется такое 0 0, что для всех orb+ () и 0 имеем h(,, U ) (8.1) () X(0, i, ) () X(0, i, ), i=0 i= причем () и () не зависят от (, ) S orb+ () и () (0 ) 0.

m m Доказательство. Найдутся такие 1 0 и 2 1, что O1 U O2. Поэтому m m D(, O1 ) D(, U ) D(, O2 ), t X(0, t, )B(f t ) dt 1 X(0, t, )B(f ) dt h(, ) 0 для всех (, ) S. После несложных преобразований получаем:

X(0, t, )B(f t ) dt = i X i, i + t, B f i+t dt = i=0 (8.2) i X(0, t, i )B(f t i ) dt = m = |i | |i |h i, i,, O1, i=0 i= где i = X(0, i, ), i = i /|i | S, i = f i. Из непрерывности функции h(,,, O1 ) по m (, ) S следует, что найдутся наименьшее c1 () и наибольшее c2 () значения h на S orb+ (), причем c1 () и c2 () не убывают по. Далее, в силу условия равномерной локальной управляемости, c1 () 0 при всех достаточно больших. Неравенства (8.1) следуют теперь из (8.2) при () = 1 c1 (), () = 2 c2 ().

Лемма 11. Пусть выполнено условие (Q), пространство компактно и система (S, ) рав номерно локально управляема. Тогда найдутся 1 0 и 2 1 такие, что h(,, U ) (, ) S orb+ (). (8.3) 1 X(0, t, ) dt 2 X(0, t, ) dt, 0 158 Е. Л. ТОНКОВ Доказательство. Пусть таково, что выполнены неравенства (8.1). Далее, пусть d1 и d2 — наи меньшее и наибольшее значения интеграла I(, ) = X(0, t, ) dt на S orb+ (). Очевидно, d1 0. Так как I(, ) = X(0, i + t, ) dt = |i | i X(0, t, i ) dt, i=0 0 i=0 f i, где i = X(0, i, ), i = i /|i |, i = то |i | |i |.

d1 I(, ) d i=0 i= Поэтому неравенства (8.3) выполнены при 1 = ()/d2, 2 = ()/d1.

Доказательство теоремы 13. Из равномерной локальной управляемости системы (S, ) следует неравенство h(, ) 1 I(, ) (лемма 11), а из условия (7.1) — неравенство |X(t, 0, ) | c(t + 1), S.

Поэтому 1 (t + 1)1 dt =.

|X(0, t, )| [c(t + 1)], h(, ) 1 I(, ) 1 c Теорема 13 доказана.

9. ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ Лемма 12. Пусть пространство компактно, и L(t, ) — преобразование Ляпунова, приводящее систему (A, ) к системе y = F y с постоянной матрицей F. Тогда для каждого orb+ () найдется преобразование Ляпунова L(t, ), приводящее систему (A, ) к системе F.

Доказательство. Если L(t, ) — преобразование Ляпунова системы (A, ), то.

L (t, ) = L(t +, ) — преобразование Ляпунова системы (A, F ). Зафиксируем orb+ () и такую последователь ность {i }, что f i. Так как последовательности {Li (t, )}, {L1 (t, )} ограниченны на i i= R и имеют, в силу равенства L(t, ) = F L(t, ) L(t, )A(f t ), t 0, (9.1) ограниченную производную, то они локально компактны. Выделим из этих последовательно стей равномерно на каждом отрезке сходящиеся подпоследовательности и сохраним прежние обозначения. С учетом равенства (9.1) и равенств Li (t, )L1 (t, ) = In замечаем, что если i L(t, ) = lim Li (t, ), то L1 (t, ) = lim L1 (t, ) и L(t, ) ограничена на R вместе с обратной i матрицей и имеет на R ограниченную производную. Следовательно, L(t, ) = L(t, ).

Лемма 13. Пусть пространство компактно, и L(t, ) — преобразование Ляпунова, приводящее систему (A, ) к системе y = F y с постоянной матрицей F. Тогда существуют такие константы d1 0, d2 d1, что каждой точке (, ) пространства Sorb+ () отвечает = (, ) S, обеспечивающее неравенства |Y (t)|dt |X(0, t, )|dt |Y (t)|dt, Y (t) = exp(F t). (9.2) d1 d 0 0 ГЛОБАЛЬНО УПРАВЛЯЕМЫЕ ЛИНЕЙНЫЕ СИСТЕМЫ Доказательство. Обозначим I(, A, ) = |X(0, t, )|dt.

Тогда из равенства X(t, s, ) = L1 (t, )Y (t s)L(s, ) следует равенство 1 I(, A, ) = (0, )Y (t)L(t, ) dt = L (0, ) Y (t)L(t, ) dt, L 0 L1 (0, )/|L1 (0, )| где orb+ (), = S. Так как Y (t) L1 (t, ) Y (t)L(t, ) Y (t) L(t, ), то неравенства (9.2) выполнены при L1 (0, ) sup |L1 (t, )| L1 (0, ) sup |L(t, )|.

d1 = inf d2 = sup, (,)S t0 t (,)S Лемма доказана.

Доказательство теоремы 12. Достаточно показать, что h(, S, ) = для всех (, ) S orb+ (), где h(, S, ) — опорная функция множества управляемости D(S, ) системы (S, ). В силу равномерной локальной управляемости системы (S, ) и леммы 11, это эквивалентно равенству I(, A, ) = для всех (, ) S orb+ (). Так как система (A, ) приводима к системе с постоянной матрицей F, то в силу леммы 13 семейство (S, orb+ ()) глобально управляемо в том и только в том случае, если I(, F ) = для всех S.

Можно считать, что F имеет жорданову форму: F = diag[Q1,..., Qp ], где Q1,..., Qp — жорда новы клетки. Тогда exp(tF ) = diag[exp(tQ1 ),..., exp(tQp )].

Пусть 1... p — действительные части собственных значений матрицы F, = (1,..., n );

тогда | exp(tF )| |1 | exp(t1 ) |1 | при t 0 (1 0 в силу неположительности показателей Ляпунова). Таким образом, если 1 = 0, то I(, F ) =. Аналогично доказывается, что если = (0,..., 0, s,..., n ) и s = 0, то | exp(tF )| |s | exp(tj(s) ) |s |, поэтому I(, F ) =.

10. ВЕРОЯТНОСТНЫЕ ХАРАКТЕРИСТИКИ МНОЖЕСТВА УПРАВЛЯЕМОСТИ Напомним, что через M () мы обозначаем множество инвариантных вероятностных мер на. Если пространство компактно, то в силу теоремы Н. М. Крылова и Н. Н. Боголюбова (см. [15, с. 514], [9, с. 42]) множество M () не пусто. Далее, для произвольного множества.

0 : f t 0 } называется относительно в и любой точки 0 множество c(, 0 ) = {t измеримым, если существует предел mes{[0, ] c(, 0 )}.

(, 0 ) = lim (10.1) (здесь mes — мера Лебега на прямой). Предел (10.1) называется частотой попадания движения t f t в множество 0.

Мера µ из M () называется эргодической, если для всякого инвариантного множества 0 из его мера равна нулю или единице. Если существует эргодическая мера, то динамическая система (, f t ) называется эргодической. Система (, f t ) называется строго эргодической, если эргоди ческая мера на единственна. Напомним, что если пространство минимально (в этом случае всякое движение рекуррентно, см. теорему 5), то динамическая система (, f t ) эргодическая, но не 160 Е. Л. ТОНКОВ обязательно строго эргодическая. Примером строго эргодической системы служит поток на мини мальном множестве, состоящий только из почти периодических движений. В случае эргодической системы для всякой µ-интегрируемой функции V : R и почти всех (в смысле меры µ) из имеет место равенство (теорема Биркгофа—Хинчина, см. [9, с. 20]) V (f t )dt.

V ()µ(d) = lim В частности, если V0 — индикатор множества 0, то µ(0 ) = (, 0 ) при почти всех.

Если (, f t ) — эргодическая динамическая система и (, g t ) — ее расширение (см. раздел 5), то определим на -алгебру B борелевских множеств равенством B = p(A), где p — проекция на, A — -алгебра на. Пусть далее, мера на B определена равенством (Q) = µ(p(Q)) для всякого Q B. Тогда (g t Q) = µ(pg t Q) = µ(f t pQ) = µ(pQ) = (Q) и, следовательно, мера инвариантна и эргодична. Таким образом, псевдорасширение эргодическо го семейства (S, ) приводит к эргодическому семейству (S, ). Кроме того, поскольку семейство (A, ) также эргодическое, то эргодическим останется и псевдорасширение (A, ). Далее, в силу теоремы 10 канонический представитель (C, ) семейства (S, ) тоже останется эргодическим.

Пусть M — множество всех таких, что система (S, ) глобально управляема. Тогда M по ложительно инвариантно относительно потока f t и поэтому, если динамическая система (, f t ) эргодическая, то мера µ(M) равна либо нулю, либо единице. Следовательно, в случае эргодично сти либо для почти всех система (S, ) глобально управляема, либо почти всякая система (S, ) не является глобально управляемой.

Теорема 15. Пусть выполнено условие (Q), пространство минимально и µ — фиксирован ная эргодическая мера на. Если система (S, ) равномерно локально управляема и показате ли Ляпунова почти всякой (относительно меры µ) системы (A, ) неположительны, то почти всякая система (S, ) глобально управляема.

Следствие 1. В условиях теоремы 15 множество N систем (S, ), не являющихся глобаль но управляемыми, имеет первую категорию Бэра (т.е. N представимо в виде не более чем счетного объединения нигде не плотных множеств).

Напомним [3, с. 116], что верхним центральным показателем системы (S, ) называется число k ln X, 0, f (i1) () = inf lim.

0 k k i= Теорема 16. Пусть выполнено условие (Q), пространство минимально и найдется такое, что движение t f t почти периодично. Тогда почти всякая система семейства (S, ) глобально управляема в том и только в том случае, если система (S, ) вполне управляема и () 0.

Доказательство теоремы 16 опирается на теорему 6 и во многом повторяет рассуждения рабо ты [19].

11. ДОКАЗАТЕЛЬСТВО 15 ТЕОРЕМЫ И СЛЕДСТВИЯ Для произвольной непрерывной функции : R R введем в рассмотрение множество J () = {t : (t) ( ) 1}.

Лемма 14 (см. [5, лемма 12]). Пусть предел lim (t) существует и неположителен. Тогда t.

для любого 0 множество c = { 0 : mes J () } относительно измеримо и его относительная мера lim mes{[0, ] c } равна нулю.

ГЛОБАЛЬНО УПРАВЛЯЕМЫЕ ЛИНЕЙНЫЕ СИСТЕМЫ Доказательство. Если это неверно, то mes{[0, ] c } lim = 0.

Следовательно, для любого 0 0 справедливо равенство mes{[0, ] c } lim = и поэтому найдется такое 1 20, что mes{[0, 1 ] c } (11.1).

1 0 Выберем 1 таким, что 1 0 8/, и на отрезке [0, 1 ] построим промежутки 1,..., k.

длины 4/. Тогда максимальное k не превосходит (1 0 )/4 и промежуток k+1 = [0, 1 ] \ k j имеет длину 4/.

j= Пусть mj = mes(j ) c. Из (11.1) следует неравенство m1 + · · · + mk+1 = mes{[0, 1 ] c } (1 0 ).

Обозначим через d количество промежутков j, для которых mj. Так как имеют место неравенства mj mes j 4/, то 4d (1 0 ) m1 + · · · + mk+1 + (k + 1 d).

2 Поэтому (1 0 ) (4 ) 4 3(1 0 ) d + (k + 1) d+.

2 Следовательно, выполнено неравенство (1 0 )/2 4d/ и поэтому d (1 0 ), где = 2 /32.

Пронумеруем промежутки j, для которых mes{j c }, в порядке их расположения на числовой прямой и введем для них обозначения E1, E2,..., Ed. При больших выполнено неравенство d 2. Пусть t1 — произвольная точка множества E1 c. Тогда mes Jt1 () и найдется точка t2 (E2 c ) \ Jt1 (). Действительно, если t2 не существует, то E2 c Jt1 () и поэтому mes(E2 c ) mes Jt1 (), противоречие. Аналогично построим точки t3,..., td такие, что tj (Ej c ) \ Jtj1 (). Поскольку tj Jtj1 (), j = 2,..., d, (tj ) (tj1 ) + 1, поэтому / (td ) (t1 ) + d 1 (t1 ) + (1 0 ) 1. (11.2) Так как 1 20 и 0 t1 · · · td 1, то из (11.2) получаем неравенства (td ) (t1 ) 1 (t1 ) + (1 0 ) + (1 0 ) td td td td td d или (td ) (t1 ) 1 (t1 ) + +.

2 td td 1 0 td Построим функцию t p(t) = min{0, (t)/t}, t 0. Из определения p следует легко проверяемое (t1 ) неравенство p(t1 ), поэтому td (td ) p(t1 ) +.

2 td (t) Так как lim = lim p(t) = 0, то устремляя в последнем неравенстве 0 к + (при этом t1 и t t t td ), получим 0.

162 Е. Л. ТОНКОВ Доказательство теоремы 15. А. В силу равномерной локальной управляемости системы (, f t ) и минимальности семейство (S, ) регулярно (определение 4) и поэтому в силу теоремы 10, до пускает каноническое представление (определение 5). Поскольку свойства локальной и глобальной управляемости инвариантны относительно перроновских преобразований и, кроме того, перронов ские преобразования сохраняют эргодичность, будем сразу предполагать, что семейство (S, ) записано в канонической форме (следовательно, матрица A() верхне-треугольная).

Б. Наряду с каноническим семейством (S, ) будем рассматривать семейство систем (T, ), где T () = (A(), In ), In — единичная матрица. Нетрудно убедиться в том, что функция I(, ) = |X(0, t, )|dt n является опорной функцией множества управляемости D(, T, O1 ) системы (T, ) с ограничиваю щим множеством U = O1 Rn. В силу леммы 11 система (S, ) глобально управляема в том и n только в том случае, если система (T, ) глобально управляема. Поэтому достаточно доказать, что мера множества глобально управляемых систем (T, ) равна единице.

Пусть a1 (),..., an () — диагональные элементы матрицы A() и t.

M1 = : exp an (f s )ds dt =, 0 t.

Mi = Mi1 : exp ani+1 (f s )ds dt =, i = 2,..., n.

0 Легко проверить, что каждое из множеств Mi положительно инвариантно (т.е. если Mi, то f Mi для всех 0). Отметим далее, что множество M1 состоит из всех, для которых система (T, ) глобально управляема из пространства P0 = Rn на подпространство.

P1 = x = col(x1,..., xn ) Rn : xn = n с помощью допустимых управлений t u(t) O1. Далее, множество M2 состоит из всех, для которых система (T, ) одновременно глобально управляема из P0 на подпространство P1 и глобально управляема из P1 на подпространство.

P2 = x = col(x1,..., xn ) Rn : xn1 = 0, xn = вдоль P1, т.е. для всякого x0 P0 найдутся моменты времени 0 0, 1 0 и управление n u0 : [0, 0 + 1 ] O1 такие, что решение x(t, x0 ) системы (T, ) с управлением u0 (t) удовлетворяет следующим условиям: x(t, x0 ) P1 при всех t [0, 0 + 1 ] и x(0 + 1, x0 ) P2. Рассуждая аналогичным образом, получаем включение Mn M(T ), где M(T ) — множество всех таких, что система (T, ) глобально управляема.

В. Введем в рассмотрение множества t Ni (p) = : exp ani+1 (f s )ds dt p, i = 1,..., n.

0 Обозначим через N(T ) множество таких, что система (T, ) не является глобально управ ляемой, и покажем, что n.

N(T ) Ni, где Ni = Ni (p).

p= i= n Действительно, если Ni, то Ni для всех i = 1,..., n, поэтому N1 (p) для всех / / / i= целых p 1. Следовательно, M1. Далее, так как N2 (p) для всех целых p 1 и M1, / ГЛОБАЛЬНО УПРАВЛЯЕМЫЕ ЛИНЕЙНЫЕ СИСТЕМЫ то M2. Продолжая эти рассуждения, получим включение Mn. Поскольку Mn M(T ), то M(T ) и поэтому N(T ).

/ Докажем, что множество Ni (p) замкнуто. Пусть последовательность {i } такова, что k k= Ni (p) и k. Допустим, что Ni (p). Введем обозначение / t exp ani+1 (f s )ds dt.

p0 = 0. p0 + p Так как p0 p, то = p. Выберем таким, что t exp ani+1 (f s )ds dt =.

0 Поскольку последовательность функций t t exp ani+1 (f s k )ds, k = 1, 2,..., (11.3) равномерно ограничена и равностепенно непрерывна на отрезке [0, ], то из нее можно выделить равномерно на [0, ] сходящуюся подпоследовательность. Будем считать, что сама последователь ность (11.3) сходится. Тогда t exp ani+1 (f s k )ds dt, 0 поэтому для достаточно больших k t t exp ani+1 (f s k )ds dt exp ani+1 (f s k )ds dt p0, 0 0 0 что противоречит включению k Ni (p).

Г. Так как для почти всех (относительно любой эргодической меры µ на ) выполнено равенство µ(Ni (p)) = (, Ni (p)), то равенство µ(Ni (p)) = 0 будет выполнено, если найдется такое множество Q, что µ(Q) = 1 и (, Ni (p)) = 0 для всех Q. Пусть Q — множество таких, что система (A, ) правильная (из результатов [14] следует, что множество таких, что система (A, ) правильная, имеет полную меру) и старший показатель n () положителен, n () 0. Тогда в силу условий теоремы µ(Q) = 1.

Докажем, что (, Ni (p)) = 0 для всех Q, всех p 0 и всех i = 1,..., n. Введем обозначение t ani+1 (f s )ds, i (, t) = i = 1,..., n, и рассмотрим множества J (i ) = t : i (, t) i (, ) 1.

Оказывается, что c(, Ni (p)) 0 : mes J (i ) pe, где e — основание натурального логарифма. Действительно, если c(, Ni (p)), то +t exp ani+1 (f s )ds dt exp (i (, ) i (, + t)) dt p.

0 164 Е. Л. ТОНКОВ Так как mes J (i ) exp i (, ) i (, + t) dt exp i (, ) i (, + t) dt, e J (i ) то mes J (i ) pe, поэтому 0 : mes J (i ) pe.

i (, t) Поскольку для всякого Q пределы lim существуют и неположительны, то из нера t t венств (, Ni (p)) lim mes [0, ] : mes J (i ) pe и леммы 14 получаем, что (, Ni (p)) = 0 для всех Q, p 0 и поэтому µ(Ni (p)) = 0.

Доказательство следствия 1. Так как пространство минимально и компактно, то µ(Q) 0 для любого открытого множества Q (см. [9, теорема 3]). Мы показали ранее, что µ(Ni (p)) = для любого p = 1, 2,.... Поэтому множество Ni (p) нигде не плотно в. Действительно, если существует открытое множество Q Ni (p), то 0 µ(Q) µ(Ni (p)). Поскольку множество Ni n представимо в виде Ni = Ni (p) то N = Ni — множество первой категории Бэра.

p=1 i= СПИСОК ЛИТЕРАТУРЫ 1. Аносов Д. В., Арансон С. Х., Арнольд В. И., Бронштейн И. У., Гринес В. З., Ильяшенко Ю. С.

Динамические системы/ Итоги науки и техники. Серия «Современные проблемы математики. Фунда ментальные направления». — М.: ВИНИТИ АН СССР, 1985. — 1. — 244 с.

2. Благодатских В. И. Введение в оптимальное управление. — М.: Высшая школа, 2001. — 239 с.

3. Былов Б. Ф., Виноград Р. Э., Гробман Д. М., Немыцкий В. В. Теория показателей Ляпунова и ее приложения к вопросам устойчивости. — М.: Наука, 1966. — 576 с.

4. Иванов А. Г., Тонков Е. Л. О множестве управляемости линейной почти периодической системы// Диффер. уравн. — 1991. — 27, № 10. — С. 1692–1699.

5. Иванов А. Г., Тонков Е. Л., Шнейберг И. Я. О мере множества глобально управляемых системы// в кн.: Нелинейн. колебания и теор. управл. — Ижевск, 1981. — 3. — С. 3–32.

6. Калман Р., Фалб П., Арбиб М. Очерки по математической теории систем. — М.: Мир, 1971. — 400 с.

7. Каток А. Б., Хасселблат Б. Введение в современную теорию динамических систем. — М.: Факториал, 1999. — 768 с.

8. Керимов А. К. Управляемость в целом линейных периодических систем при наличии ограничений на управления// Диффер. уравн. — 1975. — 11, № 9. — С. 1575–1583.

9. Корнфельд И. П., Синай Я. Г., Фомин С. В. Эргодическая теория. — М.: Наука, 1980. — 383 с.

10. Красовский Н. Н. К теории оптимального регулирования// Прикл. мат. мех. — 1959. — 23, № 4. — С. 625–639.

11. Красовский Н. Н. Теория управления движением. — М.: Наука, 1968. — 475 с.

12. Ли Э. Б., Маркус Л. Основы теории оптимального управления. — М.: Наука, 1972. — 574 с.

13. Миллионщиков В. М. О связи между устойчивостью характеристических показателей и почти при водимостью систем с почти периодическими коэффициентами// Диффер. уравн. — 1967. — 3, № 12. — С. 2127–2134.

14. Миллионщиков В. М. Статистически правильные системы// Мат. сб. — 1968. — 75, № 1. — С. 140–151.

15. Немыцкий В. В., Степанов В. В. Качественная теория дифференциальных уравнений. — М.: ГИТТЛ, 1949. — 550 с.

16. Попова С. Н., Тонков Е. Л. Согласованные системы и управление показателями Ляпунова// Диффер.

уравн. — 1997. — 33, № 2. — С. 226–235.

17. Родина Л. И., Тонков Е. Л. Условия полной управляемости нестационарной линейной системы в критическом случае// Кибернетика и системн. анализ. — 2004. — 40, № 2. — С. 87–100.

18. Родионова А. Г. Тонков Е. Л. О непрерывности функции быстродействия в критическом случае// Изв.

вузов. Сер. мат. — 1993. — 5 (372). — С. 101–111.

19. Тонков Е. Л. Стабилизация и глобальная управляемость почти периодической системы// Диффер.

уравн. — 1979. — 15, № 4. — С. 757–758.

ГЛОБАЛЬНО УПРАВЛЯЕМЫЕ ЛИНЕЙНЫЕ СИСТЕМЫ 20. Тонков Е. Л. Критерий равномерной управляемости и стабилизация линейной рекуррентной системы// Диффер. уравн. — 1979. — 15, № 10. — С. 1804–1813.

21. Тонков Е. Л. Динамическая система сдвигов и вопросы равномерной управляемости линейной систе мы// Докл. АН СССР. — 1981. — 256, № 2. — С. 290–294.

22. Тонков Е. Л. О равномерной локальной управляемости линейного уравнения// в кн.: Матем. физика/ Республ. межведомств. сб. — Киев, 1983. — 33. — С. 44–53.

23. Тонков Е. Л. О множестве управляемости линейного уравнения// Диффер. уравн. — 1983. — 19, № 2. — С. 269–278.

24. Тонков Е. Л. Канонический представитель линейной управляемой системы// Вестн. Удмурт. ун-та.

Сер. мат. — Ижевск, 2003. — С. 113–128.

E-mail: elt@udman.ru Современная математика и ее приложения. Том 23 (2005). С. 166– УДК 517. ИГРОВАЯ ЗАДАЧА О «МЯГКОЙ ПОСАДКЕ»

ДЛЯ СИСТЕМ ВТОРОГО ПОРЯДКА c 2005 г. А. А. ЧИКРИЙ, А. А. БЕЛОУСОВ АННОТАЦИЯ. Рассматривается игровая задача о сближении одного управляемого объекта, движуще гося в пространстве, с другим, движение которого происходит в горизонтальной плоскости. При этом горизонтальная плоскость играет роль фазовых ограничений для преследователя, которому, следо вательно, предписано движение лишь в верхнем полупространстве. Динамика игроков моделирует движение разнотипных объектов в среде с трением. Цель преследователя — сближение геометриче ских координат и скоростей игроков (мягкая посадка) в некоторый конечный момент времени.

В работе выделены начальные фазовые состояния преследователя, а также установлены достаточ ные условия на параметры конфликтно-управляемого процесса, при которых задача о «мягкой посадке»

разрешима за конечное время. При этом используется прием, позволяющий свести игровую задачу к эквивалентной задаче управления. На основе детального исследования множества достижимости последней в явном (аналитическом) виде строятся управления преследователя, позволяющие решить исходную задачу. На первом этапе,на основе правила экстремального прицеливания Н. Н. Красовского производится выравнивание скоростей игроков, а на заключительной стадии непосредственно осуще ствляется «мягкая посадка». На каждом этапе время на выполнение задачи может быть определено априорно.

В заключение проводится обсуждение результатов моделирования процесса «мягкой посадки».

СОДЕРЖАНИЕ 1. Введение............................................. 2. Постановка игровой задачи о «мягкой посадке», сведение к задаче управления..... 3. Вспомогательные утверждения................................. 4. Достаточные условия разрешимости задачи о «мягкой посадке».............. 5. Аналитическое описание области управления эквивалентной задачи........... 6. Оптимальное быстродействие при нулевой начальной скорости.............. 7. Игровое выравнивание скоростей объектов.......................... 8. Моделирование процесса «мягкой посадки»......................... 9. Заключение............................................ Список литературы....................................... 1. ВВЕДЕНИЕ Проблема «мягкой посадки» для управляемых объектов известна достаточно давно. Ее акту альность продиктована прежде всего важными практическими приложениями. Такие задачи как посадка космического аппарата на Луну или другие планеты, стыковка космических аппаратов, посадка летательного аппарата на палубу корабля существенно предполагают проведение «мягкой посадки». По этому поводу существует обширная библиография. Мы приведем лишь некоторые источники [22, 26, 27].

С открытием принципа максимума Л. С. Понтрягина [14] появился мощный математический аппарат для обоснования выбора оптимальных управлений. Однако, как показывают публика ции [1–3, 6, 8, 9, 14, 17, 23], уже при решении сравнительно простых многомерных линейных задач Работа выполнена при поддержке Государственного фонда фундаментальных исследований Украины (ДФФД), проект № 01.07/013, и Научно-технологического центра Украины (НТЦУ), проект № 1746.

c Ин-т кибернетики АН Грузии, ISSN 1512– ИГРОВАЯ ЗАДАЧА О «МЯГКОЙ ПОСАДКЕ» быстродействия возникают серьезные проблемы, касающиеся конструктивного синтеза оптималь ных управлений. Эти трудности существенно увеличиваются при наличии фазовых ограничений, а для игровых постановок они возрастают уже многократно.

Задаче о «мягкой посадке» в игровой постановке, по-видимому, впервые было уделено специаль ное внимание в работах Д. Зонневенда [4, 5] и М. С. Никольского [10]. В них была рассмотрена игровая задача для систем второго порядка с трением в пространствах одинаковой размерности и без фазовых ограничений. Для нее получены достаточные условия разрешимости за конечное время. Эти работы показали, что прямое применение классических методов теории дифференци альных игр к задаче о «мягкой посадке» не дает результата. Одной из причин этого является тот факт, что для исследуемой задачи по существу не выполняется условие Л. С. Понтрягина [13, 18].

Поэтому каждым из упомянутых авторов были предложены специальные приемы, позволившие добиться результата.

Исследуемая в данной работе задача впервые поставлена в [19] как проблема «eagle snatch»

(«захват орла»). В силу различной размерности фазовых пространств игроков, а также наличия фазового ограничения на состояние преследователя, такая задача является существенно более трудной. Один из способов решения задачи о «мягкой посадке» предложен в [25]. В ней процесс разбивается на три стадии. На первой реализуется сближение по геометрическим координатам.

На второй стадии осуществляется переход из точки в точку с попаданием на след убегающего в плоскости. Заключительная стадия — преследование по следу в плоскости. Один из способов преследования по следу, связанный с идеологией запаздывания информации, содержится также в [24].

Достаточно обширный обзор возможных методов решения задачи о «мягкой посадке» с про граммной реализацией различных алгоритмов представляет работа [20].

Структура данной работы следующая. В разделе 2 игровая задача о «мягкой посадке» сводится к задаче управления по переводу траектории из заданной точки в начало координат с учетом фазовых ограничений. При этом получившаяся область управления имеет негладкую границу. Построению специальных управлений преследователя для системы второго порядка, свойствам множества до стижимости, управляемости при наличии фазового ограничения посвящен раздел 3. Достаточные условия разрешимости задачи о «мягкой посадке» даны в разделе 4 (теорема 1). Аналитическому описанию области управления эквивалентной задачи управления, а также нахождению ее опорной функции на основе правила множителей Лагранжа посвящен раздел 5. Решение задачи оптималь ного быстродействия в случае нулевой начальной скорости предлагается в разделе 6 (теорема 2).

Вспомогательная задача о выравнивании скоростей на основе правила экстремального прицелива ния Н. Н. Красовского решается в разделе 7 (теорема 3). Наконец, раздел 8 посвящен вопросам моделирования процесса «мягкой посадки».

2. ПОСТАНОВКА «МЯГКОЙ ИГРОВОЙ ЗАДАЧИ О ПОСАДКЕ», СВЕДЕНИЕ К ЗАДАЧЕ УПРАВЛЕНИЯ Динамика преследователя и убегающего задается дифференциальными уравнениями:

x = x + u, x = (x1, x2, x3 ) R3, x(0) = x0, x(0) = x0, u R3, 1, 0, 0;

(1) u y = y + v, y = (y1, y2, y3 ) R3, y(0) = y 0, y(0) = y 0, v R3, 1, 0, 0. (2) v Эти уравнения моделируют движение динамических объектов в среде с трением.

Под «мягкой посадкой» понимается выполнение (в некоторый момент времени T ) равенств x(T ) = y(T ), x(T ) = y(T ).

(3) Требуется также выполнение фазовых ограничений для траекторий объектов:

x3 (t) 0, y3 (t) 0 при t 0. (4) Из этих условий сразу следует, что v3 (t) 0.

Задача состоит в построении такого измеримого управления преследователя u(·), удовлетворяю щего ограничениям (1), которое не приводит к нарушению фазового ограничения (4) и гарантирует «мягкую посадку» (3) для любого измеримого управления убегающего v(·), связанного ограниче ниями (2) и обеспечивающего соотношение (4).

168 А. А. ЧИКРИЙ, А. А. БЕЛОУСОВ Обозначим через оператор ортогонального проектирования трехмерного пространства R3 на горизонтальную плоскость:

(z1, z2, z3 ) = (z1, z2, 0).

Пусть D = z R3 : z 1 — единичный шар в R3 ;

тогда D = {z D : z3 = 0} — единичный шар в горизонтальной плоскости.

Напомним несколько определений из выпуклого анализа [11, 16]. Пусть A — выпуклый компакт в конечномерном пространстве Rn. Обозначим символом A его границу. Опорной функцией мно жества A называется функция Rn, = 0.

CA () = max a,, (5) aA Эта функция является выпуклой, положительно однородной и полунепрерывной снизу. Для вы пуклых компактов A и B выполняется следующее свойство: A B тогда и только тогда, когда CA () CB () для всех = 0. Опорным множеством к A в направлении = 0 называется множество A() = a A : a, = CA () A.

Геометрической разностью множеств A и B в Rn называется множество A B = {z Rn : z + B A} = (A b).

bB Известно [13], что геометрическая разность выпуклых компактов есть выпуклый компакт.

Вернемся к уравнениям (1), (2) и сделаем замену переменных = x y R3. Тогда = + ( )y + u v, (6) где y определяется уравнением (2). Фазовое ограничение (4) примет вид 3 x3 0, (7) терминальное множество (3) (, ) R3 R3 : = = 0, (8) начальные условия 0 = x0 y0, 0 = x0 y0.

(9) Полученная таким образом задача сближения (6)–(9) будет полностью эквивалентна исходной задаче (1)–(4).

Предлагается строить управление преследователя по формуле u(t) = v(t) + ( )y(t) + w(t), (10) где w(t) W = D sD R3, s = 1 + 1. Следующее условие на параметры игры обеспечивает непустоту этого множества W.

Условие 1. 1+ 1.

Подставив управление (10) в уравнение (6), получим управляемую систему = + w, w W. (11) Таким образом, исходная игровая задача сведется к построению управления w(t) W, которое переводит траекторию системы (11) из точки (9) на терминальное множество (8) при выполнении фазового ограничения (7).

Отметим, что аналогичный прием уже использовался М. С. Никольским [10] для подобных задач, но без фазовых ограничений.

Далее нам предстоит доказать, что, во-первых, выбор управления в виде (10) допустим, а во вторых, задача управления (11), (7)–(9) разрешима.

ИГРОВАЯ ЗАДАЧА О «МЯГКОЙ ПОСАДКЕ» 3. ВСПОМОГАТЕЛЬНЫЕ УТВЕРЖДЕНИЯ Сформулируем и докажем сначала несколько вспомогательных утверждений.

Лемма 1. Из произвольного начального состояния (x0, x0 ) R3 R3 система (1) может быть переведена (с помощью подходящего управления) в любое конечное состояние (x, x) такое, что x /.

Доказательство. Рассмотрим множество достижимости системы (1) в момент t [8]:

t 1 et 0 1 e(t ) 3 3 M (t) = (x, x) R R : x = x + x + u( )d, u(·)L1 ([0,t],D) (12) t x = et x0 + e(t ) u( )d, где объединение берется по всем измеримым на интервале [0, t] функциям u(·), принимающим значения в единичном шаре D.

Как известно [8], это множество является выпуклым компактом. Запишем его опорную функцию CM (t) (p, q), (p, q) R3 R3 :

CM (t) (p, q) = max x, p + x, q = (x,x)M (t) t 1 et 1 e p, x0 + et q, x0 + p + e q, u(t ) d = = p, x + max u(·)L1 ([0,t],D) t 1 et 1 e = p, x0 + p, x0 + et q, x0 + p + e q, u d = max uD t x p p p p, x0 + + et q, x0 + = +e q d.

Отметим, что предпоследнее равенство выполняется в силу теоремы Ляпунова о векторных мерах [2, 6], которая гарантирует возможность внесения максимума под знак интеграла.

t = Оценим теперь третье слагаемое последней суммы. Очевидно, что при p = 0 и t t 1 q p p p + e q max 0, ln 2 это слагаемое будет не меньше величины d, p t причем t t p p p p + e q (t t ) при t.


d = d 2 t t Поэтому можно утверждать, что при p = 0, CM (t) (p, q) при p = 0.

t q Справа в этом соотношении записана в точности опорная функция цилиндра:

Z = (x, x) R3 R3 : x.

Таким образом, отсюда можно сделать вывод, что любая точка внутри этого цилиндра будет поглощена M (t) для досточно большого t.

170 А. А. ЧИКРИЙ, А. А. БЕЛОУСОВ В формулировке леммы 1 никак не учитывались фазовые ограничения (4). Наличие таких огра ничений существенно осложняет исследование множеств достижимости. Однако, учитывая резуль таты леммы 1, удается сформулировать определенные выводы и в этом случае.

Условие 2. Точка фазового пространства системы (1) (x, x) R3 R3 такова, что, во первых, x3 0, во-вторых, либо x3 0, либо x3 0 и x3 x3 + + 2 ln 1 x 0.

Смысл этого условия (и это будет видно из дальнейшего) состоит в том, что если начальное состояние системы (1) не удовлетворяет этому условию, то неизбежно спустя некоторое время любая траектория системы нарушит фазовое ограничение.

Лемма 2. Из произвольного начального состояния, удовлетворяющего условию 2, не нару шая фазовых ограничений, система (1) может быть переведена в любое конечное состояние (x, x) R3 R3 такое, что x /, x3 0, x3 = 0.

Доказательство. Возьмем произвольные (из упомянутых в формулировке леммы 2) начальную (x0, x0 ) и конечную (x, x ) точки.

Доказательство разобьем на три этапа. На первом этапе обнулим вертикальную скорость (x3 = 0). На втором этапе построим управление, переводящее систему в точку (x, x) с x3 = x и x3 = 0. На третьем этапе переведем систему в конечную точку, двигаясь по четырехмерной аффинной плоскости L = (x, x) R3 R3 : x3 = x, x3 = 0.

Итак, обнулим вертикальную скорость. Возьмем на этом этапе постоянное управление u3 (t) = sign(x0 ), u1 (t) = u2 (t) 0, 3 (13) где sign(x) = 1 при x 0, sign(x) = 1 при x 0. Требуемый момент определится из условия t et x0 e(t ) u3 ( )d = 0.

x3 (t) = 3 + (14) Несложно убедиться, что этот момент равен 1 ln 1 + x t1 =, а соответствующее значение координаты x3 (t1 ) = x0 + x + t1.

Отсюда видно, что условие 2 обеспечивает выполнение фазового ограничения в этот момент t1. Из формулы (14) видно, что вертикальная скорость изменяется монотонно до нуля. Значит, координата x3 (t) достигает минимума на концах интервала [0, t1 ]. В связи с вышесказанным это означает, что фазовое ограничение на этом этапе не нарушится.

На втором этапе используем релейное управление с одним переключением. Положим a = [x x3 (t1 )], t = ln 1 1 e|a|, t2 = 2t |a|, при t [0, t ], sign(a) u1 (t1 + t) = u2 (t1 + t) 0, u3 (t1 + t) = при t (t, t2 ].

sign(a) Прямой подстановкой этого управления в формулу Коши для решения системы линейных диффе ренциальных уравнений (12) можно убедиться, что это и будет требуемое на этом этапе управле ние, т.е. x3 (t1 + t2 ) = x и x3 (t1 + t2 ) = 0, причем фазовое ограничение не нарушится.

Подчеркнем, что на этих двух этапах предлагаются управления, которые решают поставленные задачи за минимальное время.

ИГРОВАЯ ЗАДАЧА О «МЯГКОЙ ПОСАДКЕ» Наконец, укажем, что если ограничиться управлениями из горизонтальной плоскости (u3 (·) 0, u2 (·) + u2 (·) 1), то сужение системы (1) на аффинную плоскость L будет иметь точно такой же 1 вид, как и исходная, но с четырехмерным фазовым пространством R2 R2. При этом фазовое огра ничение (x3 0) будет выполняться автоматически. Несложно убедиться, что в этом случае все рассуждения леммы 1 для сужения системы (1) сохраняют свою силу. Поэтому можно утверждать, что существует допустимое управление (u1 (t), u2 (t)) для t t1 t2 [0, t3 ], которое переводит систему в точку x, x, x, x R2 R2 такую, что x2 + x2 / при сохранении равенств 1 2 1 2 1 x3 (t1 + t2 + t3 ) = x и x3 (t1 + t2 + t3 ) = 0.

Лемма 3. Если начальная скорость объекта (2) ограничена величиной y 0 /, то для любого допустимого управления v(·) скорость и в дальнейшем не превысит той же величины:

, t 0.

y(t) Если же это ограничение на начальную скорость не выполняется, то можно утверждать, что начиная с некоторого момента норма скорости y(t) не превысит величину, сколь угодно близкую к /.

Доказательство. Для произвольного допустимого управления (2) можно оценить норму скорости:

t t t 0 (t ) t e(t ) v( ) d y(t) = e y + v( )d + e e y 0 et 1 et y 0 + + et y =.

Из этой оценки сразу следует доказательство, причем время, через которое произойдет приближение, равно 1 ln y T= ln.

Лемма доказана.

4. ДОСТАТОЧНЫЕ «МЯГКОЙ УСЛОВИЯ РАЗРЕШИМОСТИ ЗАДАЧИ О ПОСАДКЕ»

Теперь мы готовы доказать утверждение о разрешимости исходной игровой задачи (1)–(4).

Теорема 1. Пусть выполнено условие 1. Тогда решение игровой задачи о «мягкой посадке»

(1)–(4) возможно для любых начальных положений убегающего из произвольного начального положения преследователя, удовлетворяющего условию 2.

Доказательство. Начнем с обнуления вертикальной скорости преследователя. Выбрав управление в виде (13) из леммы 2, в некоторый момент t1 получим x3 (t1 ) = 0. При этом в силу условия 2 фа зовое ограничение не будет нарушено. Поэтому, не ограничивая общности, можно считать момент t1 начальным и x0 = 0.

Предположим, что y 0 /. Из леммы 3 и условия 1 следует, что для любого допустимого управления v(·) имеем ( )y(t) v(t) | | + = s. (15) Это означает, что для любого допустимого v(t) и произвольной функции w(t) W = D s · D выполняется включение w(t) + v(t) + ( )y(t) D, т.е. выбор управления преследователя по формуле (10) допустим.

Теперь докажем разрешимость задачи управления (11), (7)–(9). Из условия 1 следует, что шар D принадлежит W для некоторого 0. Кроме того, учитывая что x0 = 0, начальная точка 172 А. А. ЧИКРИЙ, А. А. БЕЛОУСОВ (9) удовлетворяет условию 2. Поэтому к системе (11) с управлениями w(t) D применима лем ма 2, которая гарантирует существование искомого управления w(t) D W. Следовательно, разрешима и исходная игровая задача (1)–(4).

Будем считать теперь, что y 0 /. Тогда в силу леммы 3 можно утверждать, что, начиная с некоторого момента, величина y(t) будет сколь угодно близко оцениваться числом /. Поэтому начиная с этого времени, будет выполнено неравенство (15) для числа s, несколько большего величины 1 + 1. Все следующие рассуждения могут быть в точности повторены, что завершит доказательство теоремы и в этом случае.

5. АНАЛИТИЧЕСКОЕ ОПИСАНИЕ ОБЛАСТИ УПРАВЛЕНИЯ ЭКВИВАЛЕНТНОЙ ЗАДАЧИ Теорема 1 является теоремой существования. Хотелось бы получить конструктивный алгоритм решения задачи (11), (7)–(9). Более того, хотелось бы решить эту задачу за минимальное время.

Таким образом, естественно возникает задача оптимального быстродействия для (11), (7)–(9). Ее исследование начнем с более конструктивного описания выпуклого компакта W.

Лемма 4. Справедливы следующие утверждения:

1) Множество W задается неравенством 2 s2.

+ 2s · x x 2) Опорная функция множества W имеет вид ( R3, = 0) s при s 0, CW () = 2 s2 · | | в противном случае.

Доказательство. Учитывая свойства опорной функции (5), можно записать:

W = x R3 :, x + s R3 = x R3 : max, x + s (16).

= Для нахождения этого максимума воспользуемся правилом множителей Лагранжа [2, 6], которое дает необходимые условия экстремума в задачах условной оптимизации.

Функция Лагранжа для этой задачи имеет вид ( 2 1), R.

L(, ) =, x + s + Эта функция дифференцируема всюду на сфере S = { R3 : = 1}, кроме двух точек ±(0, 0, 1). Поэтому всюду на S (кроме этих двух точек) условие экстремума примет вид L =x+s + = 0, (17) откуда s x = s, x = +.

s x Рассмотрим сначала случай + 0. Тогда =, а из (17) получаем x x = x + s.

x Найдем отсюда экстремальные значения переменной S и множителя Лагранжа, обозначив их соответственно и. Последовательно получаем:

2 = 2 x 2 + 2s x + s2 = 1, = x 2 + 2s x + s2, 1 x = x + s = x + s.

, x ИГРОВАЯ ЗАДАЧА О «МЯГКОЙ ПОСАДКЕ» s Эти значения и удовлетворяют сделанному предположению + 0. Соответствующее значение целевой функции (16) равно 2 + s x + s( x + s) x, x + s = 2 + 2s x + s2.

= (18) x s Если же предположить, что + 0, то аналогично предыдущему имеем x 2 2s x + s2 = 1, | | = 2 2s x + s2, = x s =, x x x 1 x = ± = xs · x s.

, | | | | x В этом случае целевая функция равна ±x s x + s x s, x + s =.

2 2s x + s x Докажем, что эти величины меньше целевой функции (18). Действительно, имеем 2 2 2 s2, 2s x + s max s x s + j · s x = max x x x j=± 2s x + s2 · + 2s x + s2.

x x Оценим теперь значение целевой функции для точек, в которых нарушается гладкость функции Лагранжа ( = ±(0, 0, 1)):

, x + s 2 2 2 + 2s x + s2.

|x3 | = x x x Таким образом, максимум целевой функции (16) определяется формулой (18). Следовательно, уравнение, задающее множество W, имеет вид + 2s x + s2 2.

x Нахождение опорной функции множества W свелось к задаче условной оптимизации:

CW () = max (19), x, 2 +2s x +s2 2 } {x: x причем, в силу положительной однородности опорной функции, достаточно ограничиться доказа тельством для S.

Отметим, что в выражении (19) целевая функция линейна, а ограничение выпукло. Поэтому, во первых, максимум (19) будет достигаться на W, т.е. при выполнении равенства в ограничении, во-вторых, указанная задача эквивалентна задаче минимизации функции, x по x W, в третьих, по теореме Куна—Таккера [2, 6] достаточно ограничиться положительным множителем в соответствующей функции Лагранжа.


Таким образом, функцию Лагранжа для задачи (19) можно записать в виде + 2s x + s2 2, L(x, ) = 2, x + 0.

x Эта функция дифференцируема при x = 0, т.е. всюду на W, кроме двух точек ±(0, 0, 2 s2 ) W. Отметим, что в этих точках целевая функция принимает значение 2 s2 · |3 |.

max, x = (20) xW x = Условием, определяющим экстремальные значения переменных в задаче (19) (всюду на W, кроме двух точек), будет равенство L x = 2x + 2s 2 = 0.

x x 174 А. А. ЧИКРИЙ, А. А. БЕЛОУСОВ Тогда последовательно получаем цепочку тождеств, которым должны удовлетворять подозритель ные на экстремум значения x и :

x s x = x + s = x 1 + =,,, x x x (21) s x = s x =,.

Если предположить, что s/, то x = s. Поэтому из (21) с учетом включения x W имеем 2 = x2 + 2s x + s2 = 2 2s + s2 + 2s s + s2 = 2.

Следовательно, экстремальное значение =, а соответствующее значение целевой функции x, = 2 s = s. (22) Укажем, что это значение целевой функции может достигаться лишь при выполнении предполо жения = s/. Отметим также, что функция из правой части равенства (22) больше соответствующей функции из равенства (20).

Если же предположить, что 0 s/, то x = s. Аналогично предыдущему имеем 2 = x2 + 2s x + s2 = 2 2s + s2 + 2s s + s2 = = 2 4s + 4s2 = 2s + 2 1.

В силу предположения выполняется неравенство 2s s, а значит, из предыдущего тож дества получаем 2 s 2.

1 Отсюда для целевой функции получаем оценку:

s x, = s = 2 + 2 s2 2 s2 2 2 s2 · |3 |.

0+ · 1 = 1 = 1 Это означает, что в этом случае целевая функция не может быть больше функции из равен ства (20).

Объединяя соотношения (20) и (22), мы получаем доказательство утверждения.

Замечание 1. Непосредственно можно убедиться, что CW () — дифференцируемая функция для любого R3, = 0. Известно [16], что в этом случае опорное множество к W в на правлении будет одноточечным множеством и s при s, CW () W () = = 0, 0, 2 s2 при s и 3 0, 0, 0, 2 s2 при s и 3 0.

Укажем, что вариант 3 = 0 охватывается неравенством s.

ИГРОВАЯ ЗАДАЧА О «МЯГКОЙ ПОСАДКЕ» 6. ОПТИМАЛЬНОЕ БЫСТРОДЕЙСТВИЕ ПРИ НУЛЕВОЙ НАЧАЛЬНОЙ СКОРОСТИ Вернемся к задаче быстродействия. Множество достижимости для системы (11), (9) в момент t имеет вид [8]:

t 1 et 0 1 e 3 3 M (t) = (, ) R R : = + + w(t )d, w(·)L1 ([0,t],W ) t = et 0 + e w(t )d, где объединение берется по всем измеримым функциям w( ), w( ) W. Это множество является выпуклым компактом [8], а его опорная функция t CM (t) (p, q) = 0, p + 0, (t) + max ( ), w(t ) d = w(·)L1 ([0,t],W ) (23) t = 0, p + 0, (t) + CW (( ))d, где 1 e p + e q R3, [0, t].

( ) = Из замечания 1 следует, что эта функция является дифференцируемой и t 1 et 0 1 e CM (t) (p, q) = 0 + + · W (( ))d, p (24) t CM (t) (p, q) = et 0 + e W (( ))d.

q Поэтому опорное множество к M (t) в направлении (p, q) будет просто вектором CM (t) (p, q) CM (t) (p, q) R3 R3.

, p q Тогда условие первого поглощения множеством M (t) терминальной точки (0, 0) будет эквивалентно нахождению минимального T 0 и вектора (p, q ) R3 R3 таких, что CM (t) (p, q ) CM (t) (p, q ) = (0, 0). (25), p q Это необходимое и достаточное условие решение задачи оптимального быстродействия (11), (8), (9), которое, по существу, является формулировкой принципа максимума Понтрягина для линейной задачи быстродействия [2, 14]. Оптимальное управление имеет вид w (t) = W (T t), t [0, T ], для соответствующих p и q.

Таким образом, решение задачи быстродействия (11), (8), (9) свелось к решению системы нели нейных уравнений (24), (25). Но решение этой весьма сложной системы уравнений, вообще говоря, можно получить лишь численно, реализуя подходящие итерационные алгоритмы. Более того, при выводе этих уравнений не учитывалось фазовое ограничение. Это еще больше осложняет задачу.

Однако в одном частном случае, когда оптимальное управление оказывается релейным, удается получить аналитическое (т.е. в виде явных соотношений) решение задачи оптимального быстро действия, учитывающее фазовое ограничение (7).

176 А. А. ЧИКРИЙ, А. А. БЕЛОУСОВ Теорема 2. Пусть 0 = 0, а 0 = произвольно. Введем положительное число 2 2 s2 |3 |2 s µ=.

Тогда время оптимального быстродействия в задаче (11), (7)–(9) равно 2 T = ln e /2µ e2 /µ 1, (26) а оптимальное управление является кусочно постоянным с одним переключением:

µ · при t 0, 1 T +, 2 µ w (t) = (27) µ · при t 1 T +, T.

2 µ Доказательство. В этом случае опорная функция CM (t) (p, q) является монотонно возрастающей по t. Значит, существует единственное значение T, удовлетворяющее (24), (25). Поэтому доста точно предъявить какое-либо решение (24), (25), которое и будет оптимальным решением задачи быстродействия (11), (8), (9).

Непосредственной подстановкой убеждаемся, что µ2 + 2sµ = 2 s2.

Отсюда, учитывая первую часть леммы 4, получаем, что µ W. Следовательно, существует ненулевой вектор p R3 такой, что опорное множество W (p) имеет вид W (p) = µ.

1 e Положим q = · p для некоторого 0. Тогда 1 e 1 e( ) p + e q = ( ) = p;

значит, вектор ( ) сонаправлен с p при и противоположно направлен при 0.

Поэтому, учитывая равенство опорных множеств для сонаправленных векторов и симметричность множества W, получаем W (p) = µ при, W (( )) = W (p) = W (p) = µ при.

Система уравнений (24), (25) примет вид T CM (T ) (p, q) CM (T ) (p, q) = + d d · µ = µ(T 2) · = 0, + p q 0 T CM (T ) (p, q) µ = e d e d µ = 2e eT 1 = 0.

q 0 Отсюда получаем уравнения для определения T и :

µ(T 2) = eT 2e + 1 = 0.

Поэтому 1 = T, 2 µ соответственно 2 /2µ eT 2e eT /2 + 1 = 0 (28) и, следовательно, 2 2 /2µ e2 /µ1.

T = e ИГРОВАЯ ЗАДАЧА О «МЯГКОЙ ПОСАДКЕ» Таким образом, указанные вектор (p, q) и момент T доставляют решение (24), (25), а потому и являются оптимальными. Соответствующее им оптимальное управление имеет вид при t [0, ], µ w (T t) = W ((t)) = µ при t (, T ].

Остается лишь показать, что порожденная этим управлением траектория не нарушит фазовое ограничение 3 (t) 0 для всех t [0, T ]. Действительно, если предположить противное и учесть, что 3 = 3 (0) 3 (T ) = 0, то должен бы существовать такой момент t [0, T ], что 3 (t ) 0.

Но прямое вычисление показывает, что t 1 et e(t ) d · (µ3 ) = 3 (t) = · (µ3 ) 0 при t [0, T ];

T t µ3 t 3 (t) = e(t ) d · µ3 = et (t ) e 1 2 e(T ) d + e 0 T µ3 T ete 2e /2µ eT /2 + 1 = 0 при t [T, T ], где в последнем равенстве учтено соотношение (28). Оба эти неравенства противоречат предполо жению, а значит фазовое ограничение не нарушается.

7. ИГРОВОЕ ВЫРАВНИВАНИЕ СКОРОСТЕЙ ОБЪЕКТОВ Теперь покажем как исходная игровая задача о «мягкой посадке» (1)–(4) может быть сведена к уже рассмотренному в теореме 2 частному случаю. Построим такое управление преследователя, которое гарантирует выравнивание скоростей объектов при любом допустимом противодействии противника: = x y = 0. В основе предлагаемой конструкции лежит правило экстремального прицеливания Н. Н. Красовского [7, 15].

Прежде всего отметим, что динамика обоих объектов (1), (2) не зависит от их координат x и y.

Не входят координаты и в терминальное условие задачи выравнивания скоростей x = y. Поэтому в контексте этой задачи скорости можно просто считать переменными X = x и Y = y. Для этих переменных игровая задача выравнивания скоростей примет вид задачи сближения:

X R3, u R3, u X = X + u, 1, 0, 0, (29) Y R3, v R3, v Y = Y + v, 1, 0, 0, терминальное множество — (X, Y ) R3 R3 : X = Y.

Предположим, что выполнено условие 1 на параметры игры. Тогда несложно показать, что и. Известно [13], что при этих условиях выполняется неравенство 1 et 1 et 0 при t 0. (30) Введем функцию 1 et 1 et et X et Y.

(t, X, Y ) = Эта функция непрерывна по совокупности переменных и непрерывно дифференцируема в области G = (t, X, Y ) R R3 R3 : et X = et Y.

Для нее выполняются следующие условия:

(1) (0, X, Y ) = X Y 0 при X = Y ;

(2) lim (t, X, Y ) = 0.

t 178 А. А. ЧИКРИЙ, А. А. БЕЛОУСОВ Поэтому, в силу непрерывности (·), существует момент T0 0 такой, что (T0, X(0), Y (0)) = 0.

Укажем индуктивный способ последовательного построения управления преследователя. Начнем с i = 0 и положим t0 = 0. Управление будем строить по формуле e(Ti t) X e(Ti t) Y u(t, X, Y ) = (31).

e(Ti t) X e(Ti t) Y Это непрерывно дифференцируемая функция в области Gi = (t, X, Y ) (ti, Ti ) R3 R3 : e(Ti t) X = e(Ti t) Y.

В паре с произвольной измеримой функцией v(t) они составляют систему дифференциальных уравнений (29), которая в области Gi удовлетворяет условиям существования и единственности [12], а значит, и определяют движение объектов X(t) и Y (t).

В силу ограниченности управлений ( u 1, v 1), решения системы дифференциальных уравнений (29) не могут уходить на бесконечность за конечное время. Поэтому (см. [12]), решение продолжимо до границы области Gi, т.е. на полуинтервал [ti, ti+1 ), где либо ti+1 = Ti, либо (t, X(t), Y (t)) Gi при t [ti, ti+1 ), и по непрерывности определены точки X(ti+1 ) и Y (ti+1 ), для которых e(Ti ti+1 ) X(ti+1 ) = e(Ti ti+1 ) Y (ti+1 ). (32) В первом случае построение управления преследователя на этом заканчивается. Во втором случае имеем Ti ti+1, X(ti+1 ), Y (ti+1 ) 0, 0, X(ti+1 ), Y (ti+1 ) 0;

следовательно, существует момент Ti+1, Ti+1 Ti, такой, что Ti+1 ti+1, X(ti+1 )Y (ti+1 ) = 0. (33) Если X(ti+1 ) = Y (ti+1 ), то построение управления преследователя продолжается по формуле (31) (уже для следующего i).

Таким образом, мы получим стягивающуюся систему интервалов [ti, Ti ]:

0 = t0 t1 · · · ti · · · Ti · · · T1 T0, (34) на каждом из которых определено управление (31), которое в паре с допустимым управлением v(·) задает движение преследователя на полуинтервалах [ti, ti+1 ), зависящих от управления v(·).

Теорема 3. Пусть выполнено условие 1. Тогда предложенная процедура построения управ ления преследователя гарантирует выравнивание скоростей объектов (1), (2) при любом до пустимом противодействии и для любых начальных состояний преследователя и убегающего:

x(T ) = y(T ) для некоторого T T0.

Доказательство. Продифференцируем в силу системы (29):

d (Ti t) X(t) = e(Ti t) X(t) + e(Ti t) X(t) = e(Ti t) u(t).

e dt Тогда, учитывая выбор управления u(t, X, Y ) в виде (31), имеем d Ti t, X(t), Y (t) = e(Ti t) + e(Ti t) dt e(Ti t) X(t) e(Ti t) Y (t), e(Ti t) u(t, X(t), Y (t)) e(Ti t) v(t) = (Ti t) X(t) e(Ti t) Y (t) e = e(Ti t) 1 u(t, X(t), Y (t)), v(t) 0.

Таким образом, (Ti t, X(t), Y (t)) — неубывающая функция на [ti, ti+1 ).

Поэтому если ti+1 = Ti, то (0, X(Ti ), Y (Ti )) 0 (см. (33));

следовательно, X(Ti ) = Y (Ti ), т.е.

в этом случае решение получается за конечное число шагов в момент Ti T0.

Если же ti+1 Ti для любого i, то потребуется бесконечное число шагов выбора управления (31).

Покажем, что и в этом случае гарантируется решение. Действительно, имеются две монотонные ИГРОВАЯ ЗАДАЧА О «МЯГКОЙ ПОСАДКЕ» и ограниченные последовательности чисел {ti } и {Ti } (34), для каждой из которых существуют пределы t и T. Тогда, поскольку функции X(t), Y (t) и (t, X, Y ) непрерывны, из равенств (32) и (33) следуют равенства t ) t ) e(T X(t ) = e(T Y (t ), T t, X(t ), Y (t ) = 0.

Учитывая (30), можно показать, что эти равенства выполняются одновременно лишь при t = T и X(t ) = Y (t ), т.е. сближение произойдет в момент t = T T 0 : x(t ) = y(t ).

Замечание 2. Хотя предложенная процедура гарантирует выравнивание скоростей, вообще го воря, за бесконечное число шагов, однако можно утверждать, что сколь угодно точное сближение произойдет за конечное число итераций.

Отметим также, что предложенная процедура не учитывает наличие фазового ограничения x3 (t) 0. Однако можно предложить прием, который обеспечит выполнение этого ограничения.

Для этого возьмем управление (13), которое уже использовалось в доказательстве леммы 2 при обнулении вертикальной скорости.

Пусть t — нижняя грань тех моментов времени, когда нарушается условие 2. Используем по стоянное управление u1 (t + ) = u2 (t + ) 0, u3 (t + ) 1 при [0, ], 1 ln 1 x3 (t ). Тогда, так же как и в доказательстве леммы 2, получим где = x3 (t + ) = x3 (t + ) = 0.

С этого момента начнем снова процедуру выравнивания скоростей, взяв реализовавшиеся на этот момент состояния преследователя и убегающего в качестве исходных. При этом, как видно из формулы (31), дальнейшее движение обоих объектов будет происходить уже в горизонтальной плоскости, т.е. без нарушения фазовых ограничений.

Таким образом, теорема 1 указывает те значения параметров игры и начальные состояния пре следователя, для которых возможно решение игровой задачи о «мягкой посадке» (1)–(4) при любом допустимом противодействии убегающего и для любых его начальных состояний. Теоремы 2 и предъявляют конкретное управление преследователя, которое решает эту задачу. При этом на первом этапе, используя управление (31), производим выравнивание скоростей объектов. На вто ром этапе, используя управление (10), (27), за время (26) непосредственно производим «мягкую посадку».

8. МОДЕЛИРОВАНИЕ «МЯГКОЙ ПРОЦЕССА ПОСАДКИ»

Предлагаемый подход к решению игровой задачи «мягкой посадки» программно реализован.

Программа позволяет пользователю в режиме реального времени моделировать процесс сближе ния, интерактивным образом управляя направлением и скоростью движения убегающего объекта.

Для разных значений параметров (,,, ) и начальных состояний преследователя и убегающего проведено моделирование.

Программа продемонстрировала высокую скорость и надежность работы. Это связано, в первую очередь, с простотой функциональных соотношений определяющих управление преследователя.

9. ЗАКЛЮЧЕНИЕ Таким образом, для игровой задачи о «мягкой посадке» (1)–(4) получены достаточные условия разрешимости (условия 1 и 2). При этом конструктивно процесс «мягкой посадки» состоит из двух этапов. На первом из них производится выравнивание скоростей за время первого поглощения [7, 18] для системы (29) (на основе правила экстремального прицеливания Н. Н. Красовского). На втором этапе решается соответствующая задача оптимального быстродействия (7)–(9), (11).

Заметим, что на каждом из этапов дается явный вид оптимального управления (31), (10), (27).

Последнее обстоятельство позволило программно реализовать процесс «мягкой посадки» и прове сти моделирование для различных исходных данных и параметров процесса.

180 А. А. ЧИКРИЙ, А. А. БЕЛОУСОВ Анализируя метод решения задачи (1)–(4), позволивший провести почти все вычисления до конца и получить управления преследователя, а иногда и время решения задачи, в аналитическом виде, можно сделать вывод о том, что он применим и в более общих ситуациях. Наиболее инте ресными из них являются задача о «мягкой посадке» при нелинейной зависимости коэффициентов трения от геометрических координат и скоростей.

СПИСОК ЛИТЕРАТУРЫ 1. Акуленко Л. Д., Шматков А. М. Синтез управления в задаче оптимального по быстродействию при ведения материальной точки в заданное положение с нулевой скоростью// Прикл. мат. мех. — 1998. — 62. — № 1. — С. 129–138.

2. Алексеев В. М., Тихомиров В. М., Фомин С. В. Оптимальное управление. — М.: Наука, 1979.

3. Атанс М., Фалб П. Оптимальное управление. — М.: Машиностроение, 1968.

4. Зонневенд Д. Об одном методе преследования// Докл. АН СССР. — 1972. — 204, № 6. — C. 1296–1299.

5. Зонневенд Д. Об одном типе превосходства игрока// Докл. АН СССР. — 1973. — 208, № 3. — C. 520– 523.

6. Иоффе А. Д., Тихомиров В. М. Теория экстремальных задач. — М.: Наука, 1974.

7. Красовский Н. Н., Субботин А. И. Позиционные дифференциальные игры. — М.: Наука, 1974.

8. Ли Э. Б., Маркус Л. Основы теории оптимального управления. — М.: Наука, 1972.

9. Мордухович Б. Ш. Методы аппроксимаций в задачах оптимизации и управления. — М.: Наука, 1988.

10. Никольский М. С. О применении первого прямого метода Понтрягина в играх преследования// Изв.

АН СССР. — 1972. — № 6. — C. 51–56.

11. Обен Ж.-П., Экланд И. Прикладной нелинейный анализ. — М.: Мир, 1988.

12. Петровский И. Г. Лекции по теории обыкновенных дифференциальных уравнений. — М.: Наука, 1970.

13. Понтрягин Л. С. Избранные научные труды. Т. 2. — М.: Наука, 1988.

14. Понтрягин Л. С., Болтянский В. Г., Гамкрелидзе Р. В., Мищенко Е. Ф. Математическая теория оптимальных процессов. — М.: Наука, 1983.

15. Пшеничный Б. Н. Линейные дифференциальные игры// Автомат. телемех. — 1968. — 1. — С. 65–78.

16. Рокафеллар Р. Выпуклый анализ. — М.: Мир, 1973.

17. Черноусько Ф. Л., Шматков А. М. Оптимальное по быстродействию управление в одной системе третьего порядка// Прикл. мат. мех. — 1997. — 61, № 5. — С. 723–731.

18. Чикрий А. А. Конфликтно управляемые процессы. — Киев: Наукова думка, 1992.

19. Albus J., Meystel A. The eagle snatch// Proc. Int. Multidisciplinary Conf. “Intelligent Systems: A Semiotic Perspective”/ NIST, 1996. — Gaithersburg, USA, 1996. — С. 1–7.

20. Albus J., Meystel A., Chikrii A. Soft landing of moving objects/ Report NIST. — Gaithersburg, USA, 1998.

21. Albus J., Meystel A., Chikrii A., Belousov A., Kozlov A. Analytic method for solving the game problem of soft landing for moving objects// Докл. НАН Украины. — 2001. — 8. С. 61–65.

22. Bennet F. V. Lunar descent and ascent trajectories// AIAA 8 Aerospace Sci. Meeting, New York, January 19–21, 1970.

23. Berkovitz L. Optimal control theory. — New York: Springer-Verlag, 1974.

24. Chikrii G. Ts. Game problems of control with delay of information// Proc. Int. Сonf. “Intelligent Systems and Semiotics”/ NIST, 1997. — Gaitherburg, USA, 1997. — С. 450–454.

25. Chikrii A. A. Game problem on soft landing for moving objects// Proc. Int. Сonf. “Intelligent Systems and Semiotics”/ NIST, 1997. — Gaitherburg, USA, 1997. — C. 443–449.

26. Eyles D. E. Apollo LM guidance and pilot-assistance during the final stage of lunar descent: software considerations// 4 IFAC Sympos on Automat. Control in Space, Dubrovnic, September 6–10, 1971.

27. Lessing H., Tummel P., Coate R. Lunar landing and long-range earth re-entry guidance by application of perturbation theory// J. Spacecraft Rockets. — 1964. — 1, № 2. — С. 112–126.

А. А. Чикрий, А. А. Белоусов Институт кибернетики им. В. М. Глушкова НАН Украины E-mail: dept165@insyg.kiev.ua

Pages:     | 1 |   ...   | 4 | 5 ||
 





 
© 2013 www.libed.ru - «Бесплатная библиотека научно-практических конференций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.