авторефераты диссертаций БЕСПЛАТНАЯ БИБЛИОТЕКА РОССИИ

КОНФЕРЕНЦИИ, КНИГИ, ПОСОБИЯ, НАУЧНЫЕ ИЗДАНИЯ

<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ


Pages:     | 1 |   ...   | 3 | 4 || 6 |

«ISSN 1512–1712 Академия Наук Грузии Институт Кибернетики СОВРЕМЕННАЯ МАТЕМАТИКА И ЕЕ ПРИЛОЖЕНИЯ Том 23 ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ...»

-- [ Страница 5 ] --

21. Зарх М. А., Пацко В. С. Позиционное управление второго игрока в линейной дифференциальной игре с фиксированным моментом окончания/ Деп. в ВИНИТИ, № 5756–85. — Свердловск, ИММ УНЦ АН СССР, 1985. — 84 с.

ПОВЕРХНОСТИ ПЕРЕКЛЮЧЕНИЯ В ЛИНЕЙНЫХ ДИФФЕРЕНЦИАЛЬНЫХ ИГРАХ 22. Зарх М. А., Пацко В. С. Построение управления второго игрока в линейной дифференциальной иг ре на основе свойства отталкивания// В сб.: Управление с гарантированным результатом/ Под ред.

Субботина А. И. и Ушакова В. Н. — Свердловск: ИММ УНЦ АН СССР. — 1987. — С. 37–70.

23. Иванов А. Г. Моделирование движения самолета на этапе посадки// В сб.: Проблемы управления с гарантированным результатом/ Под ред. Субботина А. И. и Брыкалова С. А. — Екатеринбург: ИММ УрО РАН, 1992. — C. 15–26.

24. Исакова Е. А., Логунова Г. В., Пацко В. С. Построение стабильных мостов в линейной диффе ренциальной игре с фиксированным моментом окончания// В сб.: Алгоритмы и программы решения линейных дифференциальных игр/ Под ред. Субботина А. И. и Пацко В. С. — Свердловск: ИММ УНЦ АН СССР. — 1984. — С. 127–158.

25. Кейн В. М. Оптимизация систем управления по минимаксному критерию. — М.: Наука, 1985.

26. Кейн В. М., Пацко В. С., Турова В. Л. Задача о посадке самолета в условиях сдвига ветра// В сб.:

Управление в динамических системах/ Под ред. Субботина А. И. и Ушакова В. Н. — Свердловск: ИММ УрО АН СССР. — 1990. — С. 52–64.

27. Кейн В. М., Пацко В. С., Турова В. Л. Управление самолетом при сдвиге ветра/ В кн.: Гагаринские научные чтения по космонавтике и авиации. — М.: Наука, 1990. — С. 53–56.

28. Красовский Н. Н. Игровые задачи о встрече движений. — М.: Наука, 1970.

29. Красовский Н. Н. Дифференциальные игры. Аппроксимационные и формальные модели// Мат. сб. — 1978. — 107, № 4. — С. 541–571.

30. Красовский Н. Н., Субботин А. И. Позиционные дифференциальные игры. — М.: Наука, 1974.

31. Пацко В. С. Поверхности переключения в линейных дифференциальных играх с фиксированным мо ментом окончания// Прикл. мат. мех. — 2004. — 68, № 4. — C. 653–666.

32. Пацко В. С. Поверхности переключения в линейных дифференциальных играх с фиксированным мо ментом окончания/ Препринт. — Екатеринбург: ИММ УрО РАН, 2004. — 80 с.

33. Соколов Б. Н., Турова В. Л. Оптимальное управление маятником в условиях неопределенных помех/ Препринт № 336. — М.: ИПМ АН СССР, 1988. — 38 c.

34. Соколов Б. Н., Турова В. Л. Синтез оптимального управления маятника при наличии активных помех// Изв. РАН. Мех. тв. тела. — 1988. — 23, № 5. — C. 14–23.

35. Субботина Н. Н. Универсальные оптимальные стратегии в позиционных дифференциальных играх// Диффер. уравн. — 1983. — 19, № 11. — С. 1890–1896.

36. Субботин А. И., Ченцов А. Г. Оптимизация гарантии в задачах управления. — М.: Наука, 1981.

37. Турова В. Л. Исследование задач взлета и прекращения посадки самолета при помощи численных методов теории дифференциальных игр/ Деп. в ВИНИТИ, № 2546–B–92. — Свердловск, 1992, 38 с.

38. Турова В. Л. Применение численных методов теории дифференциальных игр к задачам о взлете и прекращении посадки самолета// Тр. Ин-та мат. мех. УрО РАН. — 1992. — 2. — С. 188–201.

39. Botkin N. D., Kein V. M., Patsko V. S., Turova V. L. Aircraft landing control in the presence of windshear// Probl. Control Inform. Theory. — 1989. — 18, № 4. — С. 223–235.

40. Botkin N. D., Zarkh M. A., Patsko V. S. Numerical solution of linear differential games// In: Differential Games. Developments in Modelling and Computation/ Lect. Notes Control Inform. Sci. — Berlin–New York: Springer-Verlag, 1991. — 156. — С. 226–234.

41. Chen Y. H., Pandey S. Pobust control strategy for take-off performance in a windshear// Optim. Control Appl. Meth. — 1989. — 10, № 1. — С. 65–79.

42. Ivan M. A ring-vortex downburst model for real-time flight simulation of severe windshears// AIAA, Flight Simulation Technologies Conf., July 22–24, 1985. — St. Louis, Miss., 1985. — С. 57–61.

43. Krasovskii N. N., Subbotin A. I. Game-theoretical control problems. — New York–Berlin: Springer-Verlag, 1988.

44. Leitmann G., Pandey S. Aircraft control for flight in an uncertain environment: take-off in windshear// J. Optim. Theory Appl. — 1991. — 70, № 1. — С. 25–55.

45. Miele A., Wang T., Melvin W. W. Optimal take-off trajectories in the presence of windshear// J. Optim.

Theory Appl. — 1986. — 49, № 1. — С. 1–45.

46. Miele A., Wang T., Tzeng C. Y., Melvin W. W. Optimal abort landing trajectories in the presence of windshear// J. Optim. Theory Appl. — 1987. — 55, № 2. — С. 165–202.

47. Miele A., Wang T., Wang H., Melvin W. W. Optimal penetration landing trajectories in the presence of windshear// J. Optim. Theory Appl. — 1988. — 57, № 1. — С. 1–40.

48. Patsko V. S. Special aspects of convex hull constructing in linear differential games of small dimension/ Proc. 10th IFAC Workshop “Control Applications of Optimization”, December 19–21, 1995. Haifa, Israel. — L.: Pergamon Press, 1996. — С. 19–24.

122 В. С. ПАЦКО 49. Patsko V. S., Botkin N. D., Kein V. M., Turova V. L., Zarkh M. A. Control of an aircraft landing in windshear// J. Optim. Theory Appl. — 1994. — 83, № 2. — С. 237–267.

50. Turova V. L. Take-off control in a windshear/ Preprint. — Ekaterinburg: Inst. Math. and Mech., 1991. — 12 p.

51. Zhu S., Etkin B. Model of wind field in a downburst// J. Aircraft. — 1985. — 22, № 7. — С. 595–601.

В. С. Пацко Институт математики и механики УрО РАН, Екатеринбург, Россия E-mail: patsko@imm.uran.ru Современная математика и ее приложения. Том 23 (2005). С. 123– УДК 517.978. О ПРОЦЕДУРАХ ПОСТРОЕНИЯ РЕШЕНИЙ В ДИФФЕРЕНЦИАЛЬНЫХ ИГРАХ НА КОНЕЧНОМ ПРОМЕЖУТКЕ ВРЕМЕНИ c 2005 г. А. М. ТАРАСЬЕВ, Т. Б. ТОКМАНЦЕВ, А. А. УСПЕНСКИЙ, В. Н. УШАКОВ АННОТАЦИЯ. Многие задачи теории конфликтного управления могут быть сведены к дифференциаль ным играм сближения-уклонения с некоторым терминальным множеством. Один из основных под ходов к решению таких задач — это подход, предложенный Н. Н. Красовским [2], базирующийся на позиционных конструкциях, основу которых составляет принцип экстремального прицеливания на стабильные мосты [2]. В связи с этим важной является задача о построении максимального стабиль ного моста — множества всех позиций, из которых разрешима задача о наведении на терминальное множество, стоящая перед одним из игроков.

В статье рассматривается дифференциальная игра сближения-уклонения на конечном промежутке времени, в которой первому игроку требуется обеспечить попадание фазового вектора управляемой системы на терминальное множество на этом промежутке, а второму игроку требуется обеспечить уклонение от терминального множества. Основной предмет исследования — максимальный стабильный мост, представляющий собой множество позиционного поглощения в этой игре. Задача о точном построении множества позиционного поглощения поддается решению только в простых случаях, и более реально рассматривать и решать задачу о приближенном построении этого множества.

Предлагаются подходы к приближенному построению множества позиционного поглощения и функ ции цены дифференциальной игры, основанные на дискретизации временного промежутка игры и технике попятных конструкций, которая развивается в научной школе Н. Н. Красовского начиная с 1980-х гг.

СОДЕРЖАНИЕ 1. Постановка задачи........................................ 2. Оператор стабильного поглощения............................... 3. Аппроксимирующая система множеств и ее свойства.................... 4. Разностный оператор при построении функции цены дифференциальной игры на конеч ном промежутке времени.................................... Список литературы....................................... 1. ПОСТАНОВКА ЗАДАЧИ Пусть задана конфликтно-управляемая система, поведение которой на промежутке времени [t0, ] (t0 ) описывается уравнением x = f (t, x, u, v), x[t0 ] = x0, u P, v Q. (1.1) Здесь x — m-мерный фазовый вектор системы, u — управление первого игрока, v — управление второго игрока, P и Q — компакты в евклидовых пространствах Rp и Rq соответственно.

Предполагается, что выполнены следующие условия.

(A) Функция f (t, x, u, v) непрерывна по совокупности переменных t, x, u, v, и для любой огра ниченной и замкнутой области D [t0, ] Rm существует постоянная L = L(D) (0, ) Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований (проект № 02-01 00769), гранта Президента Российской Федерации по поддержке ведущих научных школ (проект НШ-791.2003.1).

c Ин-т кибернетики АН Грузии, ISSN 1512– 124 А. М. ТАРАСЬЕВ, Т. Б. ТОКМАНЦЕВ, А. А. УСПЕНСКИЙ, В. Н. УШАКОВ такая, что f (t, x(1), u, v) f (t, x(2), u, v) L x(1) x(2), (1.2) (t, x(i), u, v) D P Q, i = 1, 2.

Здесь символ f означает норму вектора f в евклидовом пространстве.

(B) Существует такая постоянная µ (0, ), что (t, x, u, v) Rm P Q.

f (t, x, u, v) µ(1 + x ), (1.3) Рассматриваемая здесь дифференциальная игра сближения-уклонения складывается из задачи о сближении и задачи об уклонении [2].

В задаче о сближении, стоящей перед первым игроком, требуется обеспечить попадание фазо вого вектора x[t] системы (1.1) не позже момента на ограниченное и замкнутое терминальное множество M в пространстве Rm. Решение задачи требуется обеспечить в классе позиционных стратегий U (t, x) или в классе позиционных процедур управления первого игрока [2].

В задаче об уклонении, стоящей перед вторым игроком, требуется обеспечить уклонение фазо вого вектора x[t] системы (1.1) от M на всем промежутке времени [t0, ]. Решение задачи требуется обеспечить в классе контрстратегий V (t, x, u) второго игрока или его контрпозиционных процедур управления поводырем [2].

Отметим, что рассматриваемая здесь дифференциальная игра сближения-уклонения на про межутке времени является более сложной, чем дифференциальная игра сближения-уклонения с фиксированным моментом окончания.

В этой игре, как и в игре с фиксированным моментом окончания, важно уметь вычислять мно жество позиционного поглощения W 0, которое представляет собой совокупность всех исходных позиций (t, x ), для каждой из которых существует позиционная стратегия U (t, x), обеспечиваю щая при любых допустимых помехах V (t, x, u) второго игрока выполнение включения x[ ] M в некоторый момент [t, ]. Момент, вообще говоря, свой для каждой помехи V (t, x, u).

Однако какое-либо эффективное аналитическое описание множества W 0, позволяющее вычис лять это множество, в общем случае отсутствует. В связи с этим актуальным является вопрос о приближенном построении W 0. В статье рассматриваются алгоритмы приближенного построения W 0, базирующиеся на попятных конструкциях и унификации (см. [2–5]).

Работа примыкает к исследованиям, посвященным унификации в дифференциальных играх [2–6] и попятным конструкциям приближенного построения W 0 [5–9]. Исследуются вопросы, связанные с вычислительными аспектами построения W 0. В разделе 2 определен оператор ста бильного поглощения. Его конструкция представляет собой достаточно общую схему и лежит в основе определения множества W 0. В разделе 3 приводятся условия, при которых дискретная аппроксимация множества W 0 сходится к нему, когда шаг дискретизации стремится к нулю. Вы писаны соотношения, на основе которых разработан алгоритм приближенного вычисления W 0 для некоторых классов управляемых систем на плоскости. В разделе 4 предлагается разностный опе ратор для построения функции цены дифференциальной игры. При его построении используется дискретная аппроксимация стабильного моста для расширенной динамической системы. Получен ный результат продолжает цикл работ [1, 10–12, 15]. Приведены примеры.

2. ОПЕРАТОР СТАБИЛЬНОГО ПОГЛОЩЕНИЯ В силу условий, наложенных на управляемую систему (1.1), можно выбрать настолько большую ограниченную и замкнутую область D [t0, ] Rm, что все рассматриваемые ниже конструкции (стабильные мосты, движения, окрестности терминального множества M ) содержатся в D. Ниже будем рассматривать именно такую область D.

Рассмотрим определение u-стабильного моста — множества позиций, на котором можно сохра нять движение выбором управления u. Это унификационное определение восходит к работам Н. Н. Красовского [3,4]. Важную роль в этом определении играет гамильтониан системы (1.1), т.е.

скалярная функция H(t, x, l) = max min l, f (t, x, u, v), l Rm, uP vQ ПОСТРОЕНИЕ РЕШЕНИЙ В ДИФФЕРЕНЦИАЛЬНЫХ ИГРАХ где l, f — скалярное произведение векторов l и f.

Пусть = {f Rm : f K } — шар в Rm, (t, x) D.

Пусть задано некоторое множество элементов, а также семейство отображений {F : D m 2R }, отвечающее множеству и удовлетворяющее следующим условиям:

(A1) для любых (t, x, ) D множество F (t, x) выпукло, замкнуто и F (t, x) ;

(A2) для любых (t, x, l) D S выполняется равенство min hF (t,x) (l) = H(t, x, l), где hF (l) = sup l, f при F Rm, S = {l Rm : l = 1};

f F (A3) существует такая функция () ( () 0 при 0 ), что d(F (t, x ), F (t, x )) (|t t | + x x ), (t, x ), (t, x ) D,, где d(F, F ) — хаусдорфово расстояние между F и F в пространстве Rm.

Таким образом, множества F (t, x),, при каждом фиксированном (t, x) D представляют собой систему выпуклых компактов, содержащихся в шаре пространства Rm, можно сказать, «плавающих» в шаре, но «плавающих» не произвольно, вне всяких ограничений, а подчинен ных условию связи с гамильтонианом H(t, x, l) из (A2). Подчеркнем, что в этом условии связь компактов F (t, x),, и гамильтониана H(t, x, l) учитывает все направления l S.

Полагая H Rm, введем обозначения: X (t;

t, x ) — множество всех точек x Rm, в которые в момент t [t, t ] приходят решения x(·) = (x( ) : t t ), x(t ) = x, дифференциального включения x F (t, x), t [t, t ), M, Mt (H) = t = t ;

M H, X (t ;

t, Mt (H)) = x Rm : X (t;

t, x ) Mt (H) =.

Приведем определение оператора стабильного поглощения в задаче сближения с M к фикси рованному моменту (см. [7, 8]).

Определение 2.1. Оператором стабильного поглощения в задаче сближения с M к моменту m m назовем отображение : 2R 2R, заданное соотношением (t ;

t, H) = X (t ;

t, Mt (H)), t[t,t ] где = {(t, t ) [t0, ] [t0, ] : t t }.

Определение 2.2. Замкнутое множество W D назовем u-стабильным мостом в задаче сбли жения с M к моменту, если W (t ) (t ;

t, W (t )) W () M, для любых (t, t ), где W (t) = {x Rm : (t, x) W }.

m Можно показать, что семейства {F : D 2R }, отвечающие различным множествам и удо влетворяющие условиям (A1)–(A3), эквивалентны в том смысле, что соответствующие операторы выделяют одни и те же u-стабильные мосты W в D.

3. АППРОКСИМИРУЮЩАЯ СИСТЕМА МНОЖЕСТВ И ЕЕ СВОЙСТВА m Пусть задано некоторое семейство {F : D 2R },, удовлетворяющее условиям (A1)–(A3).

Предположим, что это семейство удовлетворяет следующему условию.

126 А. М. ТАРАСЬЕВ, Т. Б. ТОКМАНЦЕВ, А. А. УСПЕНСКИЙ, В. Н. УШАКОВ (A4) Существует число (0, ) такое, что d(F (t, x ), F (t, x )) x x,, (t, x ), (t, x ) D.

Символом W 0 обозначим объединение всех u-стабильных мостов W, представляющее собой максимальный u-стабильный мост. Известно, что W 0 является множеством позиционного погло щения в рассматриваемой задаче.

В связи с вопросом приближенного построения множества W 0 сформулируем определение ап проксимирующей системы множеств. Понятие аппроксимирующей системы множеств связано с подменой непрерывного времени t [t0, ] разбиением = {t0, t1,..., tN = } и с заменой мно жеств достижимости X (t;

t, x ) из определения 2.1 множествами x + (t t )F (t, x ) = x Rm : x = x + (t t )f, f F (t, x ).

Определение 3.1. Аппроксимирующим оператором стабильного поглощения в задаче сбли m m жения с M к моменту назовем отображение : 2R 2R, заданное соотношением (t, t, H) = X (t ;

t, Mt (H)), 0.

t[t,t ] Здесь X (t ;

t, Mt (H)) = x Rm : Mt (H) X (t;

t, x ) =, t [t, t ], X (t;

t, x ) = x + (t t )F (t, x ), t [t, t ), M, Mt (H) = M H, t = t, где M — -окрестность множества M, H — множество из Rm.

Будем говорить, что вещественная скалярная функция (·) = ((), 0) есть бесконеч но малая величина (б.м.в.), если она неотрицательна, монотонно убывает к нулю при 0 и lim 1 () = 0.

Пусть задано разбиение n = {t0, t1,..., tN (n) = } промежутка [t0, ] и б.м.в. (·).

Положим 0 () 0, () = ((1 + K)), 0, (n) i = ti+1 ti, = max i, 0 i N (n) 0 = 0 = 0, i = i ((·)) = (i1 ) + (i1 ) + (1 + i1 )i1, 0 = i ( (·)) = (i1 ) + (1 + i1 )0, i = 1,..., N (n) 1.

i i Определение 3.2. -Аппроксимирующей системой множеств { W (n) (ti ) : ti n } назовем си стему множеств, заданную рекуррентными соотношениями (n) (n) (ti ) = i+1 (ti ;

ti+1, W (n) (ti+1 )), (tN (n) ) = MN (n), W W (3.1) i = N (n) 1, N (n) 2,..., 0.

Здесь отметим, что выполняются вложения Mi+1 W (n) (ti ), i = N (n) 1, N (n) 2,..., 0.

Замечание 3.1. Введенная в определении 3.2 система множеств зависит от величины i+1 = i+1 ((·)) и, следовательно, зависит от б.м.в. (·) как от параметра. Эта зависимость отражена в обозначении W (n) (ti ), хотя более аккуратно следовало бы писать (·) W (n) (ti ) (мы не делаем этого, стремясь избежать слишком громоздких обозначений).

Рассмотрим произвольную последовательность {n } разбиений отрезка [t0, ], для которой lim (n) = 0.

n ПОСТРОЕНИЕ РЕШЕНИЙ В ДИФФЕРЕНЦИАЛЬНЫХ ИГРАХ Определение 3.3. Символом W 0 обозначим множество всех (t, x ) D, для которых суще ствует последовательность (n, xn ) : n = tn (t ) [t0, ], xn W (n) (n ), lim xn = x, n min ti, t, t n tn (t ) = tii t t =.

t, Справедливо следующее утверждение.

Теорема 3.1. При выполнении условий (A1)–(A4) множества W 0 и W 0 совпадают, какова бы ни была б.м.в. (·).

Доказательство. Сначала докажем включение W 0 W 0. Фиксируем произвольные (t, x ) W, t (t, ],. Существует последовательность (n, xn ) : n = tn (t ) t, lim n = t, xn W (n) (n ), lim xn = x.

n n Согласно определению 3.2 система множеств (n) tn (t ), ti n (ti ) : tn (t ) W ti такова, что для точки xn существует абсолютно непрерывная вектор-функция x(n) = x(n) [t] на [tn (t ), tn (t )], удовлетворяющая дифференциальному включению (n) x [t] F (ti, x(n) [ti ]) почти всюду на [ti, ti+1 ), x(n) [tn (t )] = xn, tn (t ) tn (t ), и хотя бы одному из включений ti x(n) [t ] Mi + x(n) [tn (t )] W (n) (tn (t )), (3.2) n для некоторого tn из некоторого отрезка [ti, ti +1 ] разбиения n.

Не нарушая общности рассуждений, будем считать, что существует равномерный на [t, t ] предел lim x(n) [t].

n Введем обозначение x[t] = lim x(n) [t]. Учитывая (3.2), компактность множества M и предельное n i = lim N (n) = 0, получим, что вектор-функция x[t], t [t, t ], соотношение lim max n 1 i N (n) n удовлетворяет включению x F (t, x) почти всюду на [t, t ] и краевым условиям x[t ] = x W 0 (t ), x[t ] = x W 0 (t ), или условиям x[t ] = x W 0 (t ), x[t] M, где t — некоторый момент из [t, t ].

Учитывая, что приведенные рассуждения верны при произвольном, получаем, что (t, x ) удовлетворяют включению x X (t ;

t(), t() ), (3.3) где t() — некоторый элемент из [t, t ], а t() определяется равенством t() [t, t ), M, t() = M W 0 (t ), t() = t.

Из того факта, что точка x выбрана в W 0 (t ) произвольно, и из включения (3.3) следует (t ) (t ;

t, W 0 (t )). (3.4) W 128 А. М. ТАРАСЬЕВ, Т. Б. ТОКМАНЦЕВ, А. А. УСПЕНСКИЙ, В. Н. УШАКОВ Учитывая также соотношение lim N (n) = 0, получаем W 0 () M. Тем самым показано, n что W 0 есть u-стабильный мост и, следовательно, W 0 W 0, так как W 0 — максимальный u-стабильный мост.

Докажем обратное включение W 0 W 0. В разбиении n выберем произвольный момент ti и рассмотрим множества W 0 (ti ) и W 0 (ti+1 )(i ). Покажем, что эта пара множеств W 0 (ti ), W 0 (ti+1 )(i ) такова, что для любой точки x[ti ] W 0 (ti ) и любого выполняется хотя бы одно из соотношений W 0 (ti+1 )(i ) X (ti+1 ;

ti, x[ti ]) =, (3.5) M(i ) X (t;

ti, x[ti ]) = при некотором t [ti, ti+1 ]. (3.6) Для этого фиксируем произвольную точку x[ti ] W 0 (ti ) и. Каждая точка x [t], t [ti, ti+1 ], является значением в момент t некоторого решения x [ ], [ti, ti+1 ], дифференциального вклю чения x F (, x), [ti, ti+1 ], с начальным условием x [ti ] = x[ti ].

Справедливо равенство t x [t] = x[ti ] + f ( )d, ti где f ( ) F (, x [ ]) почти всюду на [ti, ti+1 ].

Выполняется также соотношение x [t] x[ti ] + (t ti )F (ti, x[ti ]) ((1+K)(tti )) = X (t;

ti, x[ti ])(tti ). (3.7) Из того факта, что (3.7) выполняется для любых и x [t] X (t;

ti, x[ti ]), вытекает включение X (t;

ti, x[ti ]) X (t;

ti, x[ti ])(tti ) при любых, t [ti, ti+1 ]. (3.8) Из включения x[ti ] W 0 (ti ) согласно свойству u-стабильности множества W 0 получаем, что выполняется хотя бы одно из условий W 0 (ti+1 ) X (ti+1 ;

ti, x[ti ]) =, (3.9) M X (t;

ti, x[ti ]) = при некотором t [ti, ti+1 ].

Из включения (3.8) и соотношений (3.9) вытекает справедливость (3.5) или (3.6). Показано, что для любых x[ti ] W 0 (ti ),, выполняется хотя бы одно из соотношений (3.5), (3.6).

Принимая это во внимание, построим систему множеств { W (n) (ti ) : ti n }, обладающую свойством (n) (ti ) i+1 (ti ;

ti+1, W (n) (ti+1 )), t0 ti, ti n, (3.10) W и удовлетворяющую включениям W 0 (ti ) W (n) (ti ), ti n. А именно, положим W (n) (ti ) = W 0 (ti )i, i 0, N (n).

Покажем, что W (n) (ti ), W (n) (ti+1 ) удовлетворяют включению (3.10). Для этого выберем произ вольные x[ti ] W n (ti ) и. Пусть x [ti ] — точка множества W 0 (ti ), ближайшая к точке x[ti ].

Справедливо неравенство x [ti ] x[ti ] i. Из включения x [ti ] W 0 (ti ) и того факта, что для 0 (t ) и любого выполняется хотя бы одно из соотношений (3.5), любой точки множества W i (3.6), вытекает, что или существует такая точка x [ti+1 ] = x [ti ] + i f [ti ], f [ti ] F (ti, x [ti ]), что x [ti+1 ] W 0 (ti+1 )(i ), (3.11) или существует такая точка x [t] = x [ti ] + (t ti )f [ti ], f [ti ] F (ti, x [ti ]), что x [t] M(i ). (3.12) ПОСТРОЕНИЕ РЕШЕНИЙ В ДИФФЕРЕНЦИАЛЬНЫХ ИГРАХ Принимая во внимание условие (A4), выберем вектор f [ti ] F (ti, x[ti ]), удовлетворяющий неравенству f [ti ] f [ti ] x[ti ] x [ti ] i или неравенству x[ti ] x [ti ] f [ti ] f [ti ] i в зависимости от того, какое из соотношений (3.11), (3.12) выполняется.

Тогда оказывается, что точка x[ti+1 ] = x[ti ] + i f [ti ] отстоит от точки x [ti+1 ] = x [ti ] + i f [ti ] в случае выполнения включения (3.11) не более, чем на величину x[ti ] x [ti ] + i f [ti ] f [ti ] (1 + i )i, и в случае выполнения включения (3.12) не более, чем на величину x[ti ] x [ti ] + i f [ti ] f [ti ] (1 + i )i.

Таким образом, если x[ti ] W (n) (ti ), то при любом выполняется либо соотношение W 0 (ti+1 )((i )+(1+i )i+1 ) X (ti+1 ;

ti, x[ti ]) =, либо соотношение Mi+1 X (t;

ti, x[ti ]) = при некотором t [ti, ti+1 ].

Тем самым доказано, что система множеств { W (n) (ti ) : ti n } удовлетворяет включению (3.10). Из определения систем множеств { W (n) (ti ) : ti n }, { W (n) (ti ) : ti n } вытекают соотношения (n) (ti ) W (n) (ti ), ti n. (3.13) W Докажем, что из соотношений (3.13) следует включение W 0 W 0. Для этого зафиксируем произвольную точку (t, x ) W 0 и. В случае t = выполняется включение W 0 (t ) W (t ).

t + (n). Из включения Рассмотрим случай t. Тогда верно неравенство t tn (t ) 0 (t ) следует, что могут представиться две возможности:

x W (1) существует бесконечная последовательность {tn (t )}, для которой W 0 (tn (t )) X (tn (t );

t, x ) = ;

(3.14) (2) существует лишь конечное число моментов tn (t ), для которых выполняется (3.14).

Пусть для точки (t, x ) реализовалась возможность (1). В этом случае существует бесконечная последовательность {x[tn (t )]} точек x[tn (t )], удовлетворяющих соотношениям x[tn (t )] W 0 (tn (t )), x[tn (t )] x K(tn (t ) t ).

Учитывая равенство lim (tn (t ) t ) = 0, получаем, что существует последовательность n {(tn (t ), x[tn (t )])} точек (tn (t ), x[tn (t )]), удовлетворяющих соотношениям x[tn (t )] W 0 (tn (t )) W (n) (tn (t )) W (n) (tn (t )), lim (tn (t ), x[tn (t )]) = (t, x ).

n Тем самым доказано включение (t, x ) W 0 в случае t, когда реализовалась возмож ность (1).

Пусть для точки (t, x ), t, реализовалась возможность (2). В этом случае существует бесконечная последовательность {x[t(n) ]}, t(n) [t, tn (t )], n = 1, 2,..., точек x[t(n) ], удовлетворя ющих соотношениям x[t(n) ] M, x[t(n) ] x K(t(n) t ).

130 А. М. ТАРАСЬЕВ, Т. Б. ТОКМАНЦЕВ, А. А. УСПЕНСКИЙ, В. Н. УШАКОВ Учитывая равенство lim (t(n) t ) = 0 и замкнутость множества M, а также включения n x[t(n) ] M, n = 1, 2,..., получаем x M. Очевидно, что если взять в качестве последова тельности {x[tn (t )]} стационарную последовательность {x[tn (t )] = x }, то получим x[tn (t )] M W 0 (tn (t )) W (n) (tn (t )), n = 1, 2,....

W Тем самым доказано включение (t, x ) в случае t, когда реализовалась возмож 0 W 0. Теорема 3.1 доказана.

ность (2). Вместе с тем установлено включение W В теореме 3.1 утверждается, что какова бы ни была б.м.в. (·), предел, который дают аппрокси мирующие системы множеств { W (n) (ti ) : ti n }, — один и тот же, множество W 0. Здесь предел понимается в смысле определения 3.3.

Полагаем 0 = 0 () 0, 0.

Нетрудно видеть, что две аппроксимирующие системы {0 W (n) (ti ) : ti n }, { W (n) (ti ) : ti n }, отвечающие разбиению n и функциям 0 = 0 (·), = (·), связаны соотношением (n) (ti ) W (n) (ti ), ti n. (3.15) 0W Однако обе эти аппроксимирующие системы множеств неудобны для вычислений, поскольку для вычисления, например, множества { W (n) (ti )} в Rm необходимо вычислить несчетное число множеств X (ti ;

t, Mt i+1 ( W (n) (ti+1 ))), t [ti, ti+1 ],.

(n) Рассмотрим вопрос о конструировании таких систем множеств {W (ti ) : ti n }, которые достаточно эффективно вычисляются и аппроксимируют мост W 0, т.е. в пределе при n, (n) 0 дают множество W 0. Эти множества будем строить так, чтобы они удовлетворяли включениям (n) (n) (ti ) W (ti ) W (n) (ti ), ti n. (3.16) 0W (n) Учитывая включения (3.16) и теорему 3.1, получаем, что система множеств {W (ti ) : ti n } в пределе при n, (n) 0 также дает множество W 0. Здесь предел понимается в том же смысле, что и для системы множеств { W (n) (ti ), ti n }.

Следуя [8], сначала исследуем один случай задачи о сближении, который характеризуется тем, что терминальное множество M представимо в виде объединения замкнутых шаров различных, вообще говоря, радиусов, ограниченных снизу некоторым положительным числом R.

Случай I. Пусть M — компакт в Rm, представимый в виде M = OR(x0 ) (x0 ), R(x0 ) R, x0 X X0 Rm, где OR(x0 ) (x0 ) = {x Rm : x x0 R(x0 )}.

(n) (t ), считая, что множество W (n) (t Рассмотрим задачу построения множества W i+1 ) уже по i (n) (t ) = W (n) (t ), i = 0, 1,..., N (n).

строено. Здесь для простоты введено обозначение W i 0 i Согласно определению 3.2 включение x[ti ] W (n) (ti ) справедливо тогда и только тогда, когда для любого X (ti+1 ;

ti, x[ti ]) W (n) (ti+1 ) = (3.17) или X (t ;

ti, x[ti ]) M0 = при некотором t [ti, ti+1 ]. (3.18) i+ Допустим, что при некотором выполняется (3.18). Относительно момента t, входящего в условие (3.18), представляются три возможности:

(1) t = ti, т.е. x[ti ] M0 ;

i+ (2) t = ti, t = ti+1, т.е. x[ti ] M0, X (ti+1, ti, x[ti ]) M0 = ;

i+1 i+ (3) t = ti, t = ti+1, т.е. x[ti ] M0, X (ti+1, ti, x[ti ]) M0 =.

i+1 i+ ПОСТРОЕНИЕ РЕШЕНИЙ В ДИФФЕРЕНЦИАЛЬНЫХ ИГРАХ РИС. В случае, когда реализовалась возможность (3), найдется точка x[ti+1 ] X (ti+1, ti, x[ti ]) такая, что отрезок X = [x[ti ], x[ti+1 ]] пересекается с M0 в точке x[t ] = x[ti ] + (t ti )f 0, где f 0 — i+ некоторый вектор из F (ti, x[ti ]). Отсюда следует, что существует такая точка x0 X0, что x[t ] OR (x0 ) = {x Rm : x x0 R}, где R = R(x0 ) + 0.

i+ радиуса R = R(x0 ) + Таким образом, найдется замкнутый шар OR (x0 ) M0 i+ i+ R + 0 0 с центром в некоторой точке x0 X0 Rm, пересекающийся с отрезком X и i+ не содержащий крайних точек x[ti ], x[ti+1 ] этого отрезка (см. рис. 1).

Из центра x0 шара OR (x0 ) проведем луч в сторону отрезка X, перпендикулярный этому отрезку.

Из точки x пересечения этого луча с границей шара OR (x0 ) проведем в сторону точки x[ti+1 ] отрезок [x, x ], конгруэнтный отрезку X, так что x x = x[ti+1 ] x[ti ].

x0 x и, следовательно, Нетрудно видеть, что x0 x[ti+1 ] (x, OR (x0 )), (x[ti+1 ], M0 ) (x[ti+1 ], OR (x0 )) (3.19) i+ где (x, U ) — расстояние в пространстве Rm от x до множества U.

Оценим сверху величину (x, OR (x0 )). Учитывая соотношения (x, OR (x0 )) = (R2 + x x 2 )1/2 R, x x Ki, (x, OR (x0 )) получаем для величины оценку сверху:

1 (x, OR (x0 )) (R2 + K 2 2 )1/2 R K i.

i 2R Учитывая эту оценку, из неравенства (3.19) находим K2 (x[ti+1 ], M0 ). (3.20) 2R i i+ Введем в рассмотрение функцию K2 = () =, 0. (3.21) 2R Таким образом, при выполнении для некоторого соотношения (3.18) в случае реализа ции возможности (3) найдется точка x[ti+1 ] X (ti+1 ;

ti, x[ti ]), удовлетворяющая неравенству (x[ti+1 ], M0 ) (i ).

i+ Отсюда вытекает, что выполнение при некотором соотношения (3.18) в случае реализации возможности (3) влечет соотношение X (ti+1 ;

ti, x[ti ]) =. (3.22) M i+1 +(i ) Заметим теперь, что i+1 0 = (i ) + (1 + i1 )(i 0 ), i = 0, 1,..., N (n) 1, i+1 i причем 0 = = 0.

132 А. М. ТАРАСЬЕВ, Т. Б. ТОКМАНЦЕВ, А. А. УСПЕНСКИЙ, В. Н. УШАКОВ Отсюда следует, что при любом i = 0, 1,..., N (n) 1 выполняется неравенство i 0 0.

i Принимая во внимание это неравенство, получаем 0 + (i ) i = 0, 1,..., N (n) 1.

i+1, i+ Из (3.22) и предыдущего неравенства следует Mi+1 X (ti+1 ;

ti, x[ti ]) =. (3.23) Итак, если при некотором выполняется (3.18), то выполняется x[ti ] Mi+1 или X (ti+1 ;

ti, x[ti ]) Mi+1 =.

Окончательно получаем, что если x[ti ] W (n) (ti ), то x[ti ] M0 Mi+1 (3.24) i+ или (W (n) (ti+1 ) Mi+1 ) X (ti+1 ;

ti, x[ti ]) = (3.25) для любого. Здесь в выражение i+1 = i+1 ((·)) подставлена функция (·), определяемая равенством (3.21).

(n) Зададим теперь систему множеств {W (ti ) : ti n } рекуррентными соотношениями (n) (tN (n) ) = W (n) (tN (n) ), W (3.26) (n) (n) (ti ) = Mi+1 (ti ;

ti+1, W (ti+1 ) Mi+1 ), i = 0, 1,..., N (n) 1, W где x[ti ] Rm : W X (ti+1 ;

ti, x[ti ]) =,.

(ti ;

ti+1, W ) = Нетрудно видеть, что справедливы включения (n) W (n) (tN (n) ) W (tN (n) ) W (n) (tN (n) ). (3.27) Докажем, что справедливы включения (n) W (n) (tN (n)1 ) W (tN (n)1 ) W (n) (tN (n)1 ). (3.28) Действительно, пусть x[tN (n)1 ] W (n) (tN (n)1 ). Тогда на основании соотношений (3.24), (3.25), в которых принято i = N (n) 1, получаем x[tN (n)1 ] MN (n) или x[tN (n)1 ] (tN (n)1 ;

tN (n), W (n) (tN (n) ) MN (n) ).

Значит, из включения x[tN (n)1 ] W (n) (tN (n)1 ) следует x[tN (n)1 ] MN (n) (3.29) или (n) x[tN (n)1 ] (tN (n)1 ;

tN (n), W (tN (n) ) MN (n) ). (3.30) (n) Включение W (n) (tN (n)1 ) W (tN (n)1 ) тем самым установлено.

(n) Пусть теперь x[tN (n)1 ] W (tN (n)1 ). Тогда выполняется (3.29) или (3.30).

Если x[tN (n)1 ] MN (n), то на основании включения MN (n) W (n) (tN (n)1 ) получаем x[tN (n)1 ] W (n) (tN (n)1 ).

(n) Если x[tN (n)1 ] (tN (n)1 ;

tN (n), W (tN (n) ) MN (n) ), то, учитывая включение (n) (n) (tN (n) ) MN (n) ) N (n) (tN (n)1 ;

tN (n), W (tN (n)1 ;

tN (n), W (tN (n) ) MN (n) ) и равенство (n) (tN (n) ) MN (n) = W (n) (tN (n) ) MN (n) = W (n) (tN (n) ), W ПОСТРОЕНИЕ РЕШЕНИЙ В ДИФФЕРЕНЦИАЛЬНЫХ ИГРАХ получаем x[tN (n)1 ] N (n) (tN (n)1 ;

tN (n), W (n) (tN (n) )) = W (n) (tN (n)1 ).

(n) Включение W (tN (n)1 ) W (n) (tN (n)1 ) вместе с тем установлено. Включения (3.28) доказаны.

Теперь докажем включения (n) W (n) (tN (n)2 ) W (tN (n)2 ) W (n) (tN (n)2 ). (3.31) Действительно, пусть x[tN (n)2 ] W (n) (tN (n)2 ). Тогда x[tN (n)2 ] MN (n) или x[tN (n)2 ] (tN (n)2 ;

tN (n)1, W (n) (tN (n)1 ) MN (n)1 ).

Отсюда, учитывая (3.28), получаем, что если x[tN (n)2 ] W (n) (tN (n)2 ), то x[tN (n)2 ] MN (n)1 (3.32) или (n) x[tN (n)2 ] (tN (n)2 ;

tN (n)1, W (tN (n)1 ) MN (n)1 ). (3.33) (n) Включение W (n) (tN (n)2 ) W (tN (n)2 ) установлено.

(n) Пусть теперь x[tN (n)2 ] W (tN (n)2 ). Тогда выполняется (3.32) или (3.33).

Если x[tN (n)2 ] MN (n)1, то на основании включения MN (n)1 W (n) (tN (n)2 ) получаем x[tN (n)2 ] W (n) (tN (n)2 ).

(n) Если x[tN (n)2 ] (tN (n)2 ;

tN (n)1, W (tN (n)1 ) MN (n)1 ), то, учитывая включения (n) (tN (n)1 ) MN (n)1 ) (tN (n)2 ;

tN (n)1, W (n) (tN (n)1 ) MN (n)1 ) (tN (n)2 ;

tN (n)1, W (tN (n)2 ;

tN (n)1, W (n) (tN (n)1 )) N (n)1 (tN (n)2 ;

tN (n)1, W (n) (tN (n)1 )) = W (n) (tN (n)2 ), получаем x[tN (n)2 ] W (n) (tN (n)2 ).

(n) Включение W (tN (n)2 ) W (n) (tN (n)2 ) вместе с тем доказано. Включения (3.31) доказаны.

Применяя рассуждения, аналогичные приведенным выше, нетрудно установить, что если при некотором i 1, N (n) 3 выполняются включения (n) W (n) (ti+1 ) W (ti+1 ) W (n) (ti+1 ), то (n) W (n) (ti ) W (ti ) W (n) (ti ). (3.34) Тогда, принимая во внимание последнее утверждение и включения (3.27), (3.28), (3.31), получаем, что (3.34) выполняется для всех i 0, N (n).

(n) Система множеств {W (ti ) : ti n }, определяемая равенствами (3.26), дает в пределе при n, (n) 0 множество W 0.

Из соотношений (3.26) следует, что (n) Mi W (ti ), i = 0, 1,..., N (n) 1, (n) и, кроме того, согласно определению множества W (tN (n) ), имеет место равенство MN (n) = (n) (tN (n) ). Поэтому справедливы равенства W (n) (n) (ti+1 ) Mi+1 = W (ti+1 ), i = 0, 1,..., N (n) 1, W 134 А. М. ТАРАСЬЕВ, Т. Б. ТОКМАНЦЕВ, А. А. УСПЕНСКИЙ, В. Н. УШАКОВ с помощью которых можно переписать соотношения (3.26) в более простом виде:

(n) (tN (n) ) = W (n) (tN (n) ), W (n) (n) (ti ) = Mi+1 (ti ;

ti+1, W (ti+1 )), i = 0, 1,..., N (n) 1.

W (n) Каждое из множеств W (ti ), ti n, представляет собой объединение некоторой окрестности (n) Mi+1 терминального множества M и множества стабильного поглощения (ti ;

ti+1, W (ti+1 )) в (n) аппроксимационной игре сближения-уклонения на [ti, ti+1 ] с целью W (ti+1 ). Это важное обсто ятельство значительно упрощает приближенное вычисление моста W 0. В рассмотренном случае I (n) вычисление множеств W (ti ) можно осуществить приближенно достаточно эффективно на ЭВМ для некоторых классов конфликтно-управляемых систем на плоскости, в частности, — для систем вида dx = f (t, x) + B(t, x) u + C(t, x) v, x R2, dt где u P, v Q, P и Q — выпуклые многоугольники в R2.

Рассмотрим теперь случай, когда множество конечно, а терминальное множество M не стес нено какими-либо ограничениями, кроме компактности.

Случай II. M — произвольный компакт в Rm. Полагаем, что задано некоторое семейство отобра m жений {F : D 2R }, отвечающее некоторому конечному множеств = { : = 1,..., } и удовлетворяющее условиям (A1)–(A4).

Предположим, что выбрано некоторое разбиение n = {t0, t1,..., tN (n) = } промежутка [t0, ].

(n) Как и в случае I, будем обозначать конструируемые множества символом W (ti ), i = 0, N (n).

Зафиксируем некоторый отрезок [ti, ti+1 ] разбиения n.

(n) (i) Считая, что множество W (ti+1 ) уже построено, осуществим разбиение n отрезка [ti, ti+1 ] N (n) (n) (i) моментами t0 = ti, t1,..., ti = ti+1 таким образом, чтобы диаметр i разбиения n удовле i i творял равенствам ti+1 ti (n) i = tk+1 tk = (3.35), i i N (n) (i) где k = 0, 1,..., N (n) 1, N (n) — число отрезков разбиения n. Таким образом, n — разбиение отрезка [ti, ti+1 ] на равные промежутки времени.

При всех i 0, N (n) 1 выполняется неравенство ti+1 ti (n) (n) i. (3.36) t Введем в рассмотрение функцию K(n) = () =, 0, (3.37) t а также множество (i) = (, tk ) : = 1, 2,..., ;

k = 0, 1,..., N (n) 1.

n i Постоянная K определена в разделе 1. Функция = (), 0, такова, что функция ((n) ) = K(n) есть бесконечно малая величина по сравнению с (n) 0 при n. Полагаем при этом t (i) X (ti ;

tk, Mi+1 ), (, tk ) n, i i,k (ti ) = W (n) X (ti ;

tk, Mi+1 W (ti+1 )), = 1, 2,...,, k = N (n).

i Здесь в выражение i+1 = i+1 ((·)) подставлена функция, определяемая равенством (3.37).

ПОСТРОЕНИЕ РЕШЕНИЙ В ДИФФЕРЕНЦИАЛЬНЫХ ИГРАХ (n) Зададим систему множеств {W (ti ) : ti n } рекуррентными соотношениями (n) (n) W,k (ti ).

(tN (n) ) = M0 (ti ) = (3.38) W, W N (n) 1 0 k N (n) Докажем, что выполняются включения (n) (n) (n) i+1 (ti ;

ti+1, W (ti ) i+1 (ti ;

ti+1, W (ti+1 )) W (ti+1 )). (3.39) (n) Допустим, что x[ti ] (ti ;

ti+1, W (ti+1 )). Тогда согласно определению множества i+ (n) (ti+1 )) для любого выполняется (ti ;

ti+1, W i+ (n) X (ti+1 ;

ti, x[ti ]) W (ti+1 ) = (3.40) или X (t ;

ti, x[ti ]) M0 = (3.41) i+ при некотором t [ti, ti+1 ].

Рассмотрим случай, когда для точки x[ti ] выполняется соотношение (3.41). Полагаем, что k, tk+1 ] — тот отрезок разбиения (i), которому принадлежит t.

[ti i n В силу (3.41) найдется вектор f F (ti, x[ti ]) такой, что x[ti ] + (t ti )f M0. (3.42) i+ Поскольку вектор x[ti ] + (t ti )f удовлетворяет (3.42), то вектор x[ti ] + (tk+1 ti )f = x[ti ] + (t ti )f + (tk+1 t )f i i удовлетворяет включению x[ti ] + (tk+1 ti )f M(0 M(0 M(0.

k+1 k+1 (n) tk )) i t )) i+1 +K(ti i+1 +K(ti i+1 +Ki ) i Учитывая, что K(n) (n) i = (i ), Ki t получаем окончательное включение x[ti ] + (tk+1 ti )f M(0 (3.43).

i+1 +(i )) i Так же как и в случае I, выполняется неравенство 0 + (i ) i = 0, 1,..., N (n) 1.

i+1, i+ Из (3.43) и этого неравенства следует x[ti ] + (tk+1 ti )f Mi+1, i т.е.

X (tk ;

ti, x[ti ]) Mi+1 =, (3.44) i где введено обозначение k = k + 1.

Таким образом, если (n) x[ti ] i+1 (ti ;

ti+1, W (ti+1 )), то для любого выполняется (n) x[ti ] X (ti ;

tk, Mi+1 ) 1 x[ti ] X (ti ;

ti+1, W (ti+1 )) или (3.45) i при некотором k 0, N (n).

Отсюда следует, что если (n) x[ti ] i+1 (ti ;

ti+1, W (ti+1 )), (n) то x[ti ] W (ti ).

136 А. М. ТАРАСЬЕВ, Т. Б. ТОКМАНЦЕВ, А. А. УСПЕНСКИЙ, В. Н. УШАКОВ (n) С другой стороны, согласно определению множества W (ti ) справедливо включение (n) (n) (ti ) i+1 (ti ;

ti+1, W (ti+1 )). (3.46) W Таким образом, включения (3.39) доказаны.

Докажем теперь справедливость включений (n) W (n) (ti ) W (ti ) W (n) (ti ), ti n. (3.47) Действительно, выполняются включения (n) W (n) (tN (n) ) W (tN (n) ) W (n) (tN (n) ). (3.48) Отсюда, учитывая (3.39) при i = N (n) 1, получаем соотношения 0 (n) W (n) (tN (n)1 ) = (tN (n)1 ;

tN (n), W (n) (tN (n) )) N (n) 0 (n) (tN (n)1 ;

tN (n), W (tN (n) )) N (3.49) (n) (n) N (n) W (tN (n)1 ) (tN (n)1 ;

tN (n), W (tN (n) )) N (n) (tN (n)1 ;

tN (n), W (n) (tN (n) )) = W (n) (tN (n)1 ).

Итак, при i = N (n) 1 включения (3.47) установлены. Докажем, что они выполняются при i = N (n) 2. Действительно, из (3.39), (3.49) следует 0 (n) W (n) (tN (n)2 ) = (tN (n)2 ;

tN (n)1, W (n) (tN (n)1 )) N (n) 0 (n) (tN (n)2 ;

tN (n)1, W (tN (n)1 )) N (n) (n) (tN (n)2 ) N (n)1 (tN (n)2 ;

tN (n)1, W W (tN (n)1 )) N (n)1 (n) (tN (n)1 )) = W (n) (tN (n)2 ).

(tN (n)2 ;

tN (n)1, W Включения (3.47) установлены для i = N (n) 2.

Используя рассуждения, аналогичные приведенным выше, получаем, что если соотношения (3.47) выполняются при некотором i 1, N (n) 2, то они выполняются при значении i, мень шем на единицу. Тогда, применяя метод математической индукции, заключаем, что соотношения (3.47) выполняются при любом i 0, N (n) 1.

Рассмотрим величину (n) = max i, где i = i ((·)). Для нее справедлива следующая i0, N (n) оценка сверху:

N (n) (t0 ) (n) = N (n) ((i ) + (i )) e i= N (n) K(n) (t0 ) (i ((1 + K)(n) ) + i ) = e t i= K(n) = e(t0 ) ( t0 ) ((1 + K)(n) ) +.

t Принимая во внимание эту оценку и теорему 3.1, получаем, что система множеств { W (n) (ti ) :

ti n } в пределе при n, (n) 0 дает, так же как и система {W (n) (ti ) : ti n }, мост W 0.

Из соотношений (3.47) и сходимости систем множеств {W (n) (ti ) : ti n } и { W (n) (ti ) : ti n } (n) к W 0 при n, (n) 0 получаем, что {W (ti ) : ti n } сходится к W 0.

(n) Так же как и система множеств {W (ti ) : ti n }, построенная в случае I, эта система может быть использована при приближенных вычислениях множества W 0.

ПОСТРОЕНИЕ РЕШЕНИЙ В ДИФФЕРЕНЦИАЛЬНЫХ ИГРАХ 4. РАЗНОСТНЫЙ ОПЕРАТОР ПРИ ПОСТРОЕНИИ ФУНКЦИИ ЦЕНЫ ДИФФЕРЕНЦИАЛЬНОЙ ИГРЫ НА КОНЕЧНОМ ПРОМЕЖУТКЕ ВРЕМЕНИ Изложим вывод разностного оператора, применяемого для приближенного построения функции цены дифференциальной игры сближения-уклонения на конечном промежутке времени.

Пусть поведение конфликтно-управляемой системы на отрезке времени описывается дифферен циальным уравнением вида dx = g(t, x) + A(t, x)u + B(t, x)v, (4.1) dt x Rm, u P Rp, v Q Rq, t [t0, ].

Здесь управляющий вектор u выбирается из выпуклого компакта P, управляющий вектор v — из выпуклого компакта Q. На правую часть f g(t, x) + A(t, x)u + B(t, x)v дифференциального урав нения (на вектор-функцию g и матрицы A и B), как и прежде, накладываются условия (A) и (B), обеспечивающие существование решения x = x[t], t [t0, ], динамической системы. Качество управляемого процесса оценивается функционалом (x[·]) = min (x[t]), (4.2) t[t0,] где = (x) — функция, удовлетворяющая локальному условию Липшица.

Игрок, распоряжающийся управлением u, стремится минимизировать функционал, второй игрок, распоряжающийся управлением v, стремится его максимизировать. Дифференциальная игра (4.1), (4.2) считается решенной, если построена ее функция цены = (t, x), (t, x) [t0, ]Rm (см. [2]).

Указанная здесь постановка игровой задачи является естественным обобщением и расширени ем постановки задачи, изложенной в разделе 1. Построение множества позиционного поглощения W 0 в задаче сближения с терминальным множеством M для динамической системы (4.1) означа ет построение множества уровня (множества Лебега) функции цены дифференциальной игры со специальным образом подобранной терминальной функцией = (x). Следует отметить и другую важную зависимость. Задача построения надграфика epi = {(t, x, ) Rm+2 : (t, x) [t0, ] Rm, (t, x)} эквивалентна задаче построения множества позиционного поглощения W 0 Rm+2 в игровой задаче сближения не позже момента t = с целевым множеством M = epi, т.е. с надграфиком терминальной функции, для расширенной динамической системы dx dxm+ = g(t, x) + A(t, x)u + B(t, x)v, = 0, (4.3) dt dt x Rm, u P Rp, v Q Rq, t [t0, ].

Здесь множества P и Q те же, что и в дифференциальной игре (4.1), (4.2). Нельзя обойти вни манием и тот факт, что функция цены = (t, x) дифференциальной игры (4.1), (4.2) является минимаксным решением уравнения в частных производных первого порядка типа Гамильтона— Якоби + H 0 (t, x, ) = 0, t удовлетворяющим неравенству (t, x) (x), x Rm. Здесь =,..., x1 xm — градиент функции = (t, x) по фазовым переменным, H 0 (t, x, l) = min max l, g(t, x) + A(t, x)u + B(t, x)v uP vQ — гамильтониан динамической системы (4.1), записанный для удобства дальнейших рассуждений в минимаксной форме. Подробно взаимосвязь конструкции теории позиционных дифференциальных игр и теории обобщенных решений уравнений в частных производных первого порядка изложена в [13].

138 А. М. ТАРАСЬЕВ, Т. Б. ТОКМАНЦЕВ, А. А. УСПЕНСКИЙ, В. Н. УШАКОВ Рассмотрим задачу построения надграфика функции цены дифференциальной игры (4.1), (4.2), или, что то же самое, задачу о построении множества позиционного поглощения для дифферен циальной игры сближения-уклонения на отрезке [t0, ] с целевым множеством M = epi для расширенной динамической системы (4.3). Для того чтобы удовлетворить условиям теоремы 3.1 о сходимости последовательности множеств, определяемой с помощью аппроксимирующего опера тора стабильного поглощения, приведенного в разделе 3, к множеству позиционного поглощения в задаче сближения для расширенной динамической системы (4.3), локализуем элементы разреша ющей конструкции.

Пусть произвольно взяты и зафиксированы x Rm, r 0. Шар Or () = {x Rm : x x r} x примем в качестве целевого множества в задаче сближения-уклонения не позже момента, ко гда динамика игры определяется дифференциальным уравнением (4.1). Множество позиционного поглощения для этой задачи обозначим D, D [t0, ] Rm. Будем полагать, что число r вы брано настолько большим, что сечение D(t) множества D в начальный момент t = t0 не пусто.

Построение множества D можно осуществить, опираясь на теорему 3.1, но в данном случае ва жен сам факт существования непустого компактного множества D из [t0, ] Rm. В дальнейшем сосредоточимся на построении надграфика epi D = {(t, x, ) Rm+2 : (t, x) D, (t, x)} сужения функции цены на множество D. Заметим, что epi D является множеством позиционного поглощения для расширенной динамической системы (4.3), когда целевое множество представляет собой надграфик M = epi Or () = (x, ) Rm+1 : x Or (), (4.4) x (x) x сужения целевой функции на шар Or ().

x Приняв = OK (0) Rm, где K = 2 sup g(t, x) + A(t, x)u + B(t, x)v : (t, x) D, u P, v Q, введем в рассмотрение многозначное отображение m (t, x, s) Fb (t, x, s) : D S 2R, (4.5) H 0 (t, x, s)} — сегменты шара.

где Fb (t, x, s) = {f : s, f Указанное отображение удовлетворяет условиям (A1b)–(A4b), которые аналогичны условиям (A1)–(A4):

(A1b) для любых (t, x, s) D S множество Fb (t, x, s) выпукло, замкнуто и вложено в ;

(A2b) для любых (t, x, s) D S выполняется равенство s, f = H 0 (t, x, s);

max min qS f Fb (t,x,s) (A3b) существует такая функция () ( () 0 при 0), что d Fb (t, x, s), Fb (t, x, s) |t t | + x x, (t, x ), (t где, x ) D, s S;

(A4b) существует константа F 0 такая, что d Fb (t, x, s), Fb (t, x, s) F x x для любых (t, x ), (t, x ) D и любого s S.

Аппроксимирующий оператор стабильного поглощения, отвечающий этому отображению, по строенный по правилам, изложенным в разделе 3, порождает систему множеств, аппроксимиру ющую множество позиционного поглощения в задаче сближения к моменту t = с замкнутым терминальным множеством M, когда динамика игры определяется уравнением (4.1).

Введем корректные (с точки зрения согласованности с имеющимися в теории позиционных дифференциальных игр теоремами) формы оператора стабильного поглощения для расширенной динамической системы (4.3).

ПОСТРОЕНИЕ РЕШЕНИЙ В ДИФФЕРЕНЦИАЛЬНЫХ ИГРАХ Пусть где x Rm, xm+1 R, z = (x, xm+1 ), f (t, z, u, v) = (f (t, x, u, v), 0), где f (t, x, u, v) = g(t, x) + A(t, x)u + B(t, x)v.

В принятых обозначениях дифференциальную игру (4.3), (4.4) запишем в краткой форме:

dz = f (t, z, u, v), t [t0, ], u P Rp, v Q Rq, (4.6) dt M = epi Or (). (4.7) x Введем следующие обозначения:

Sm+1 = {l Rm+1 : l = 1}, c = [c, c], параметр c 0.

c Rm+ По построению представляет собой m-мерный шар радиуса K в частном случае, когда параметр c = 0. В общем же случае, когда c 0, c — цилиндр высоты 2c, в основании которого лежит m-мерный шар радиуса K.

В пространстве переменных (t, z) выделим область D = D R, априори содержащую epi D.

Введем в рассмотрение параметризованную (по c 0) совокупность многозначных отображений m+ (t, z, l) Fc (t, z, l) : D Sm+1 2R (4.8), b где Fc (t, z, l) = f c : l, f H(t, z, l), b H(t, z, l) = min max l, f (t, z, u, v) — гамильтониан расширенной системы (4.6).

uP vQ Введем следующие обозначения:

если z = (x, xm+1 ) Rm R, pr z = x, если l = (s, sm+1 ) Rm R.

pr l = s, Рассмотрим многозначное отображение m (t, z, l) Fb (t, pr x, pr l) : D Rm+1 2R, (4.9) где Fb (t, pr z, pr l) = {f : (f, 0) Fc (t, z, l)}.

b Нетрудно видеть, что отображение (4.9) не зависит от параметра c 0 и при этом H 0 (t, pr z, pr l).

Fb (t, pr z, pr l) = {f : s, f Приняв x = pr z, s = pr l, учитывая положительную однородность гамильтониана по третьей переменной, получим, s = 0, Fb (t, pr z, pr l) = Fb (t, x, s), s = 0, где s = s/ s.

Таким образом, отображение (4.9) является полунепрерывным сверху продолжением по третьей переменной s отображения (4.5). Вследствие этого свойства любое многозначное отображение параметризованной совокупности (4.8) наследует условия вида (A1b)–(A4b) и, стало быть, инду цирует оператор стабильного поглощения. Именно, для любого значения параметра выполняются следующие условия:

(A1bc) для любых (t, z, l) D Sm+1 множество Fc (t, z, l) выпукло, замкнуто и вложено в c ;

b (A2bc) для любых (t, z, l) D Sm+1 выполняется равенство max min l, f = H(t, z, l);

qSm+1 f Fc (t,z,q) b (A3bc) существует такая функция c () (c () 0 при 0), что d Fc (t, z, l), Fc (t, z, l) c |t t | + pr z pr z b b при всех (t, z ), (t, z ) D и любом l Sm+1 ;

140 А. М. ТАРАСЬЕВ, Т. Б. ТОКМАНЦЕВ, А. А. УСПЕНСКИЙ, В. Н. УШАКОВ (A4bc) существует константа (c) 0 такая, что d Fc (t, z, l), Fc (t, z, l) (c) pr z pr z, b b где (t, z ), (t, z ) D, l Sm+1.


Полагая Z Rm+1, введем следующие обозначения: Zlc (t;

t, z ) — множество всех точек z Rm+1, в которые в момент t [t, t ] приходят решения z = z( ), [t, t ], z(t ) = z, дифференциального включения z Fc (t, z, l);

b t [t, t ), epi Or (), x Mt (Z) = epi Or () Z, t = t ;

x (Zlc )1 (t ;

t, Mt (Z)) = z Rm+1 : Zlc (t;

t, z ) Mt (Z) =.

Фиксируем значение параметра c 0.

Определение 4.1. Формой оператора стабильного поглощения для расширенной системы (4.6) назовем отображение m+1 m+ c : 2R 2R, заданное соотношением c (t ;

t, Z) = (Zlc )1 (t ;

t, Mt (Z)), lSm+1 t[t, t ] где = {(t, t ) [t0, ] [t0, ] : t t }.

Определение 4.2. Замкнутое множество W c D назовем u-стабильным мостом в задаче (4.6), (4.7), если W c () epi Or (), W c (t ) c (t ;

t, W c (t )), (t, t ).

x Поскольку каждое отображение параметризованной совокупности отображений (4.8) удовлетво ряет условиям (A1bc)–(A4bc), то формы оператора стабильного поглощения c, c 0, являются инвариантами, т.е. не зависят от параметра c. Введем в рассмотрение понятие аппроксимирующей формы оператора стабильного поглощения.

Определение 4.3. Аппроксимирующей формой оператора стабильного поглощения (АФОСП) в задаче сближения к моменту для расширенной системы (4.6) назовем отображение m+1 m+ c, : 2R 2R, заданное соотношением c, (t ;

t, Z) = (Zlc )1 t ;

t, Mt (Z), lSm+1 t[t,t ] где c 0, 0, (Zlc )1 (t ;

t, Mt (Z)) = z Rm+1 : Zlc (t;

t, z ) Mt (Z) =, Zlc (t;

t, z ) = z + (t t )Fc (t, z, l), t [t, t ], b t [t, t ), M, Mt (Z) = M Z, t = t, M — -окрестность множества M, Z Rm+1.

Пусть задано разбиение n = {t0,..., tN (n) = } отрезка [t0, ] и б.м.в. (·).

ПОСТРОЕНИЕ РЕШЕНИЙ В ДИФФЕРЕНЦИАЛЬНЫХ ИГРАХ Определение 4.4. -Аппроксимирующей системой множеств {c W (n) (ti ) : ti n }, c 0, в за даче сближения для расширенной дифференциальной игры (4.6), (4.7) назовем систему множеств, заданную рекуррентно соотношениями c (n) (tN (n) ) = epi Or () N (n), W x c (n) = c, (ti, ti+1, W (n) (ti+1 )), c (ti ) i = N (n) 1,..., 0.

W Здесь правило вычисления величин i то же, что и в определении 3.2.

Замечание 4.1. Введенная в определении 4.4 система множеств зависит не только от б.м.в.

(·), но и от значения параметра c 0. В общем случае при прочих одинаковых условиях разным значениям параметра c отвечают различные -аппроксимирующие системы множеств. Важно отме тить, что поскольку при всех c 0 выполняются условия (A1bc)–(A4bc), аналогичные условиям (A1)–(A4), то в силу теоремы 3.1 множество W 0, сконструированное из односторонних пределов (см. определение 3.3), совпадает с множеством позиционного поглощения W в задаче сближения к моменту t = для расширенной дифференциальной игры (4.6), (4.7). Таким образом, W = epi D.

Следовательно, посредством АФОСП c,, c 0, 0, можно конструировать аппроксимации функции цены дифференциальной игры (4.1), (4.2).

r Определим момент времени t00 = max t0, и введем в рассмотрение множество K D = (t, x) D : t [t00, ], x x + (t t00 ).

По построению D — сильно инвариантное множество относительно включения x, причем его сечения D(t) — шары с центром в точке x = x;

здесь t [t00, ].

Совокупности вида {c W (n) (ti ) : ti n }, где c 0, (·) — б.м.в., аппроксимируют надграфик epi D сужения функции цены на множество D. Поэтому нижние (по последней компоненте) огибающие этих множеств являются графиками аппроксимации c функции цены :

c (tN (n), x) = (x) N (n), x D(tN (n)1 ), c (ti, x) = inf : (x, ) c, (ti, ti+1, epi D(ti+1 ) epi c D(ti+1 ) (ti, ·)), x D(ti ), i = N (n) 1,..., 0, параметр c 0.

Укажем некоторые основные свойства АФОСП (см. [14]). Справедливо следующее утверждение.

Теорема 4.1. Пусть:

1) — достаточно малое положительное число такое, что t00 t t + ;

2) µ : D(t+) R — числовая функция, удовлетворяющая условию Липшица с константой µ 0;

3) параметр c удовлетворяет неравенству c 2µ K, где по-прежнему K = 2 sup{ g(t, x) + A(t, x)u + B(t, x)v : (t, x) D, u P, v Q}.

Тогда для любого x D(t) справедливо двойное равенство c, t, t +, epi µOK (x) = c, t, t +, epi co µOK (x) = 0, (t, t +, epi co µOK (x) ), где co µOK (x) (·) — выпуклая оболочка сужения функции µ на шар OK (x) с центром в точке x D(t) радиуса r = K:

m+ co µOK (x) (y) = inf i µ(yi ) : i 0, i = 1,..., m + 1;

i= m+1 m+ i = 1;

i yi = y, yi OK (x).

i=1 i= 142 А. М. ТАРАСЬЕВ, Т. Б. ТОКМАНЦЕВ, А. А. УСПЕНСКИЙ, В. Н. УШАКОВ РИС. 3. t = 0. РИС. 2. t = 0. Суть теоремы заключается в следующем. При достаточно больших значениях параметра c 0, на любом шаге разбиения, во-первых, результат действия АФОСП на надграфик липшицевой функции и на надграфик ее овыпукления один и тот же, во-вторых, этот же результат получается при применении к овыпуклению функции наиболее простой из АФОСП — той, которая отвечает значению параметра c = 0.

Опираясь на эту теорему и применяя конструкции выпуклого анализа, можно показать [14], что для всех значений параметра c, больших порогового значения c0 = 2K eF (3K+1)(t00 ), где — константа Липшица целевой функции на шаре Or (), отвечающие им аппроксимации c x функции цены, формируемые на фиксированном разбиении n = {t0,..., tN (n) = }, совпадают (по крайней мере совпадают на сильно инвариантном множестве D), причем при c c0 для c справедливо следующее представление:

аппроксимации (ti, x) = max min co (ti+1, x + i f ) lSm+1 f F (t,x,pr l) или, что тоже самое, H 0 (ti, x, s) + s, x y + co (ti+1, y).

(ti, x) = sup max (4.10) yOKi (x) s co (ti+1,y) Здесь x D(ti ), ti n, i = ti+1 ti, (y) = min{(y), (y)}, y OKi (x), co (ti+1, ·) — выпук лая оболочка функции (ti+1, ·) : OKi (x) R и co (ti+1, y) — субдифференциал выпуклой функции co (ti+1, ·), вычисленный в точке y int OKi (x).

Представление (4.10) удобно для численных реализаций. Оно лежит в основе сеточных процедур построения функции цены дифференциальной игры (4.1), (4.2). Приведем примеры динамических систем, промоделированных с помощью конечно-разностного аналога оператора (4.10).

Пример 1. Рассматривается дифференциальная игра с линейной динамикой:

dx1 dx = v, = u, dt dt управления u, v [1, 1], t [0, 1], функционал (x[·]) = min (x[t]), где целевая функция t[0,1] x2 ).

(x1, x2 ) =2 (x + На рисунках представлены сечения аппроксимации функции цены в моменты времени t = 0.95, t = 0.5, t = 0.25 и t = 0.0.

Пример 2. Рассматривается дифференциальная игра с нелинейной динамикой:

dx1 dx = x2 + u cos x1, = x1 + v sin x dt dt и управлениями u, v [1, 1], t [0, 1], область построения решения в момент t = 0 — квадрат [1, 1] [1, 1], функционал (x[·]) = min (x[t]), где целевая функция (x1, x2 ) = max{|x1 |, |x2 |}.

t[0,1] На рисунках представлены множества уровня функции, отвечающие значению уровня c = 0.1, в различные моменты времени.

ПОСТРОЕНИЕ РЕШЕНИЙ В ДИФФЕРЕНЦИАЛЬНЫХ ИГРАХ РИС. 5. t = 0. РИС. 4. t = 0. РИС. 7. t = 0. РИС. 6. t = 0. РИС. 8. t = 0.2 РИС. 9. t = 0. СПИСОК ЛИТЕРАТУРЫ 1. Григорьева С. В., Тарасьев А. М., Успенский А.А., Ушаков В. Н. Конструкции теории дифференци альных игр при решении уравнений Гамильтона—Якоби// Тр. Ин-та мат. мех. УрО РАН. — 2000. — 6, № 2. — С. 320–336.

2. Красовский Н. Н., Субботин А. И. Позиционные дифференциальные игры. — М.: Наука, 1974.

3. Красовский Н. Н. К задаче унификации дифференциальных игр// Докл. АН СССР. — 1976. — 226, № 6. — С. 1260–1263.

4. Красовский Н. Н. Унификация дифференциальных игр// Игровые задачи управления/ Тр. Ин-та ма тематики и механики. — Свердловск: УНЦ АН СССР, 1977. — 24. — С. 32–45.

5. Ушаков В. Н. К задаче построения стабильных мостов в дифференциальной игре сближения уклонения// Изв. АН СССР. Техн. киберн. — 1980. — 4. — С. 29–36.

6. Алексейчик М. И. Дальнейшая формализация основных элементов антагонистической дифференци альной игры// Мат. анал. прилож. — Ростов. гос. ун-т, 1975. — 7. — С. 191–199.

7. Тарасьев А. М., Ушаков В. Н., Хрипунов А. П. Об одном вычислительном алгоритме решения игровых задач управления// Прикл. мат. мех. — 1987. — 51, № 2. — С. 216–222.

8. Тарасьев А. М., Ушаков В. Н. О построении стабильных мостов в минимаксной игре сближения уклонения/ Деп. в ВИНИТИ, № 2454-83. — Свердловск, 1983. — 61 с.

9. Ушаков В. Н., Хрипунов А. П. О приближенном построении решений в игровых задачах управления// Прикл. мат. мех. — 1997. — 61, № 3. — С. 413–421.

144 А. М. ТАРАСЬЕВ, Т. Б. ТОКМАНЦЕВ, А. А. УСПЕНСКИЙ, В. Н. УШАКОВ 10. Тарасьев А. М., Успенский А. А., Ушаков В. Н. Конечно-разностный метод построения функции оптимального гарантированного результата// Гагаринские научные чтения по космонавтике авиации.

1991. — М.: Наука, 1992. — С. 166–172.

11. Тарасьев А. М., Успенский А. А., Ушаков В. Н. Аппроксимационные операторы и конечно-разностные схемы для построения обобщенных решений уравнений Гамильтона—Якоби// Изв. РАН. Техн. ки берн. — 1994. — № 3. — С. 173–185.

12. Папаков Г. В., Тарасьев А. М., Успенский А. А. Численные аппроксимации обобщенных решений уравнений Гамильтона—Якоби// Прикл. мат. мех. — 1996. — 60, № 4. — С. 570–581.

13. Субботин А. И. Обобщенные решения уравнений в частных производных первого порядка. Перспек тивы динамической оптимизации. — Москва–Ижевск: Институт компьютерных исследований, 2003. — 336 с.

14. Успенский А. А. Вычислительные процедуры для построения обобщенных решений уравнения Беллмана—Айзекса/ Дисс. канд. физ.-мат. наук. — Екатеринбург, 1993.

15. Grigorieva S. V., Uspenskii A. A., Ushakov V. N. Solution of differential games and Cauchy problem for Hamilton–Jacobi equation// Proc. 10 IFAC Symp. Dynamic Games And Applications, July 8–11, Saint Petersburg, Russia, 2002, Vol. 1/ Petrosjan L. A., Zenkevich N. A., eds. — St. Petersburg, 2002, С. 349– 352.


E-mail: Uspen@imm.uran.ru Современная математика и ее приложения. Том 23 (2005). С. 145– УДК 517.977.55, 517.977. ГЛОБАЛЬНО УПРАВЛЯЕМЫЕ ЛИНЕЙНЫЕ СИСТЕМЫ c 2005 г. Е. Л. ТОНКОВ АННОТАЦИЯ. В статье приведены основные результаты, относящиеся к достаточным и необходимым условиям глобальной управляемости нестационарны линейных систем, полученные в недавнем про шлом, и приведены некоторые обобщения этих результатов.

СОДЕРЖАНИЕ Введение............................................. 1. Основные обозначения..................................... 2. Динамическая система..................................... 3. Динамическая система сдвигов................................ 4. Семейство линейных систем дифференциальных уравнений................ 5. Канонический представитель линейной управляемой системы............... 6. Множество управляемости линейной управляемой системы................ 7. Глобальная управляемость................................... 8. Оценки опорной функции.................................... 9. Доказательство теоремы 12................................... 10. Вероятностные характеристики множества управляемости................. 11. Доказательство теоремы 15 и следствия 1.......................... Список литературы....................................... ВВЕДЕНИЕ Одним из основных вопросов математической теории управляемых процессов является вопрос о полной, локальной или глобальной управляемости динамической системы, поведение которой описывается системой обыкновенных дифференциальных уравнений. Впервые на задачу об управ ляемости как на самостоятельную математическую проблему, представляющую большой интерес в приложениях, обратил внимание Н. Н. Красовский в конце 1950-х гг. Им же получены фундамен тальные результаты в этой области [10, 11], относящиеся к линейным нестационарным системам.

Примерно в это же время ряд интересных результатов о полной управляемости линейной системы получил Р. Калман [6].

Задачи глобальной управляемости линейных систем при наличии геометрических ограничений на управления начали исследоваться сравнительно недавно. Линейная управляемая система с гео метрическими ограничениями на управляющие функции называется глобально управляемой, если ее пространство управляемости совпадает со всем фазовым пространством рассматриваемой си стемы. Необходимые и достаточные условия глобальной управляемости стационарной линейной системы хорошо известны (см., например, [12, с. 102]). Достаточные условия глобальной управ ляемости периодической системы получены А. К. Керимовым [8]. К настоящему моменту времени вопрос о необходимых и достаточных условиях глобальной управляемости произвольной нестаци онарной линейной системы остается открытым. Достаточно подробно исследован вопрос только для рекуррентных и почти периодических систем.

Работа выполнена при поддержке Российского фонда фундаментальных исследований (проект № 03–01–00014) и Конкурсного центра фундаментального естествознания (проект E02–1.0–100).

c Ин-т кибернетики АН Грузии, ISSN 1512– 146 Е. Л. ТОНКОВ В этой статье собраны основные результаты, относящиеся к достаточным и необходимым усло виям глобальной управляемости нестационарны линейных систем, полученные в недавнем про шлом [4, 5, 16–24], и приведены некоторые обобщения этих результатов.

1. ОСНОВНЫЕ ОБОЗНАЧЕНИЯ Пусть Rn — стандартное евклидово пространство размерности n;

скалярное произведение и нор ма в Rn определяются равенствами x y = x1 y1 + · · · + xn yn, |x| = x x, где означает операцию транспонирования. Пространство, сопряженное к Rn, мы отождествляем с Rn и (если не ого ворено иное) векторы-столбцы обозначаем латинскими буквами, а векторы-строки — греческими.

Таким образом, запись x означает скалярное произведение векторов и x в Rn (фактически Rn можно рассматривать как второй экземпляр пространства Rn, точками которого являются векторы-строки). Если x1,..., xk — произвольный набор векторов в Rn, то lin{x1,..., xk } — линей ная оболочка векторов x1,..., xk.

n.

Замкнутую -окрестность точки x Rn обозначим O (x) = {y Rn : |y x| }, O = O (0), n n n : |x| = 1}. Замыкание произвольного множества D в Rn будем единичную сферу — S = {x R обозначать cl D либо D, внутренность (относительно Rn ) — int D, границу — D, -окрестность — n.

n n O (D) = D + O = {x + y : x D, y O }.

Пространство M(n, m) линейных операторов из Rm в Rn будем отождествлять с пространством (n m)-матриц (если n = m, то пишем M(n)), а оператор A, сопряженный к A M(n, m) — с транспонированной матрицей. Если M M(n, m), то rank M — ранг, Ker M — ядро, Im M — область значений матрицы M.

Далее, |A| — норма A M(n, m), согласованная с евклидовой нормой вектора в Rn. Замкнутую -окрестность Q M(n, m) обозначим B (Q), B = B (0) (индексы m и n в обозначении B (Q), а также индекс n у единичной матрицы In будем опускать, если ясно, о каком пространстве идет речь).

Введем в рассмотрение пространства comp(Rn ) и conv(Rn ) непустых компактных подмножеств пространства Rn (соответственно, непустых выпуклых компактных подмножеств пространства Rn ) с метрикой Хаусдорфа n n dist(A, B) = min : A O (B), B O (A).

Тогда каждое из пространств comp(Rn ), conv(Rn ) является полным сепарабельным метрическим пространством. Для произвольного множества A Rn опорная функция h(, A) определяется равенством h(, A) = sup a (свойства опорной функции см. в [2]).

aA 2. ДИНАМИЧЕСКАЯ СИСТЕМА Ниже приводятся необходимые для дальнейшего сведения из теории динамических систем.

Подробное изложение см. [1, 7, 15].

Пусть (, f t ) — топологическая динамическая система, т.е. — полное метрическое простран ство, на котором задана однопараметрическая группа движений f t : (следовательно, f t |t=0 =, f t+s = f t f s, t, s R и функция (t, ) f t непрерывна на пространстве R с метрикой |t t0 | + (, 0 ), где — метрика в ). В этом случае называется фазовым про странством, {f t } — потоком на, функция t f t — движением (точки ), а множества..

orb() = f t : t R, orb+ () = f t : t [0, ) — соответственно траекторией и положительной полутраекторией точки.

Лемма 1. Всякое движение топологической динамической системы (, f t ) непрерывно зави сит от начальной точки равномерно относительно t на любом конечном отрезке времени: для любых 0 и 0 найдется 0 такое, что если (, 0 ), то (f t, f t 0 ) для всех |t|.

Точка 0 называется -предельной (-предельной) для точки, если найдется последо вательность {tk } такая, что tk (tk ) и f tk 0. Множество -предельных точек, ГЛОБАЛЬНО УПРАВЛЯЕМЫЕ ЛИНЕЙНЫЕ СИСТЕМЫ отвечающих точке, обозначим (). Далее, множество M называется инвариантным (от носительно потока {f t }), если orb() M для каждой точки M. Аналогично определяется положительно инвариантное множество (orb+ () M для каждой точки M ). Если M инвариантно, то f t M = M для всех t.

Теорема 1. Множество () инвариантно и замкнуто.

В дальнейшем расстояние (, 0 ) от точки до компактного множества 0 означает кратчайшее расстояние:

.

(, 0 ) = min (, 0 ) : 0 0.

Аналогично, расстояние между двумя компактными множествами 0 и 1 определяется равен ством (0, 1 ) = min (0, 1 ) : 0 0, 1 1, а замкнутая -окрестность O (0 ) компактного множества 0 — равенством O (0 ) = : (, 0 ), поэтому, если 0, то (0, 1 ) (, 1 ).

Теорема 2. Если замыкание положительной полутраектории orb+ () движения t f t компактно, то -предельное множество () непусто, компактно, связно и (f t, ()) при t.

Напомним, что множество M называется минимальным, если оно непустое, замкнутое, инвариантное относительно потока {f t } и не содержит собственного подмножества, обладающего этими свойствами.

Теорема 3. Всякое инвариантное компактное множество содержит компактное минималь ное подмножество.

Определение 1. Движение t f t называется рекуррентным (по Биркгофу), если для любого 0 множество.

() = (, ) = R : (f, ) (2.1) относительно плотно на числовой прямой R, т.е. найдется число = () 0 такое, что для каждого s R отрезок [s, s + ] имеет непустое пересечение с множеством (). Если движение t f t рекуррентно, то точка называется рекуррентной.

Теорема 4. Движение t f t рекуррентно в том и только том случае, если для любых 0, 0 множество.

(, ) = (,, ) = R : max (f t+, f t ) (2.2) |t| (, )-почти периодов относительно плотно на прямой R.

Из теоремы 4 следует, что всякая точка, лежащая на траектории рекуррентного движения, тоже рекуррентна. Более того, для каждого 0 множества (2.1) и (2.2) общие для всех точек траектории orb():

(, ) = (, f ), (,, ) = (,, f ).

Лемма 2. Замыкание траектории рекуррентного движения компактно.

Теорема 5. Всякая траектория минимального компактного множества рекуррентна. Да лее, если движение t f t рекуррентно, то множество orb() минимально и orb() = orb+ () = ().

148 Е. Л. ТОНКОВ Определение 2. Движение t f t называется почти периодическим (по Бору), если для любого 0 множество -почти периодов.

() = R : sup (f t+, f t ), t R t относительно плотно на R. Будем говорить также, что точка почти периодична.

Если почти периодична, то (согласно теореме 5) она рекуррентна и поэтому замыкание orb() траектории orb() минимально. Следовательно, orb() состоит из рекуррентных точек.

Теорема 6. Если движение t f t почти периодично и не совпадает с положением равно весия и периодическим движением, то для любой точки orb() движение t f t тоже почти периодично.

3. ДИНАМИЧЕСКАЯ СИСТЕМА СДВИГОВ В этом разделе мы опишем динамическую систему сдвигов А. А. Маркова [15, гл. 6, § 9], играющую существенную роль в дальнейших построениях.

Пусть X — линейное конечномерное пространство с нормой |x|, X — линейное пространство непрерывных функций, определенных на всей числовой прямой и принимающих значения в X.

Введем на пространстве X метрику (, ) = sup min |(t) (t)|, |t|1,, X. (3.1) tR Лемма 3. Пространство X (с метрикой (3.1)) является полным сепарабельным метрическим пространством. Топология, порождаемая метрикой (3.1), эквивалентна топологии равномер ной сходимости на отрезках.

.

Пусть X. Сдвиг функции на константу обозначим : (t) = ( + t), где t пробегает всю числовую прямую R. Поток на X определим равенством f =.

Лемма 4. Пара (X, f ) образует топологическую динамическую систему (динамическую си стему сдвигов).

Лемма 5. Для любой ограниченной и равномерно непрерывной на R функции X замыка.

ние orb() траектории orb() = {f t : t R} в метрике (3.1) компактно.

Из этой леммы и теоремы 1 следует, что если функция равномерно непрерывна и ограничена на числовой прямой R, то -предельное множество () непусто, компактно и связно. Если, кроме того, движение f рекуррентно, то, в силу теоремы 5, множество orb() минимально и () = orb() = orb+ ().

Если -предельное множество (), отвечающее функции X, содержит эту функцию ( ()), то найдется последовательность {i } моментов времени такая, что i и (i, ) 0.

Последнее означает, что для любых и 0 и любого t0 множество R : max | (t) (t)| |t| имеет непустое пересечение с полуинтервалом [t0, ). Функция, обладающая этим свойством, называется P + -устойчивой (устойчивой по Пуассону вправо). Аналогичным образом вводятся по нятия P -устойчивости и P -устойчивости. Таким образом, P + -устойчивость характеризует неко торое свойство «возвращаемости» траектории, отвечающей функции : существует беско нечно возрастающая последовательности сдвигов i, возвращающая эти сдвиги в -окрестность временн й длины 2. Рекуррентность и почти периодичность демонстрируют более сильные о свойства возвращаемости.

Определение 3. Ограниченная и равномерно непрерывная на R функция (t) со значениями в конечномерном пространстве X называется рекуррентной, если для любых и 0 множество.

(, ) = R : max | (t) (t)| |t| ГЛОБАЛЬНО УПРАВЛЯЕМЫЕ ЛИНЕЙНЫЕ СИСТЕМЫ (, )-почти периодов относительно плотно на R. Если же для всякого 0 относительно плотно множество.

() = R : sup | (t) (t)| tR -почти периодов, то функция (t) называется почти периодической (в смысле Бора).

Теорема 7. Пусть функция (t) ограничена и равномерно непрерывна на R. Движение f рекуррентно (определение 1) в том и только том случае, если функция (t) рекур рентна. Аналогично, движение f почти периодично (определение 2) в том и только том случае, если функция (t) почти периодична.

Рассмотрим линейную систему x = F (t)x, t R, (3.2) с равномерно непрерывной и ограниченной на R функцией t F (t) M(n). Как обычно, будем отождествлять систему (3.2) с задающей ее функцией F. Наряду с системой F рассмотрим се мейство X(F ) систем, полученных из F замыканием множества сдвигов F в компактно открытой топологии. Это означает, что G X(F ) в том и только том случае, если найдется последователь ность {i } такая, что (Fi, G) 0 при i, или, что эквивалентно, для любых 0 и найдется номер последовательности k такой, что max |Fi (t) G(t)| для всех i k.

|t| Снабдим пространство X(F ) метрикой (3.1) и определим поток {f } на X(F ) равенством.

G = G, G X(F ), R, где по-прежнему G (t) = G( + t). Тогда мы имеем возможность изу f чать семейство систем x = A(f t G)x, зависящих от параметра G. Здесь функция A : X(F ) M(n) определена равенством A(G) = G(t)|t=0. Отметим еще, что в силу условий на A, пространство X(F ) компактно и инвариантно и поэтому имеет непустые множества и -предельных точек (см. лемму 5 и теоремы 1 и 2). Вводя привычные обозначения = X(F ), = G, A : M(n), A() = (0) = G(0), полученное семейство можно записать в виде x = A(f t )x,, t R, (3.3) где — параметр, пробегающий пространство. Особенность системы (3.3) состоит в том, что она стационарна относительно потока. Тем самым, рассуждая формально, нестационарной системе (3.2) можно поставить в соответствие «стационарную систему» (3.3), а точнее, семейство систем (с параметром ) со стационарной относительно сдвигов правой частью.

Можно не фиксировать систему F, а рассматривать пространство X всех систем вида (3.2) с непрерывными функциями t F (t) M(n) (n фиксировано). Тогда, проводя аналогичные рас суждения, мы получим динамическую систему (X, f t ), содержащую все линейные системы диф ференциальных уравнений заданной размерности. Это очень «обширная» динамическая система и несмотря на то, что X — полное сепарабельное метрическое пространство, а поток {f t } устроен достаточно просто, надеяться на содержательную математическую теорию в такой ситуации не приходится. Но в X есть инвариантные компактные (а следовательно, и минимальные, см. тео рему 3) множества. На таких множествах можно вводить дополнительные структуры (например, инвариантные вероятностные меры), и поэтому сужение потока на такие множества уже приводит к содержательным результатам.

4. СЕМЕЙСТВО ЛИНЕЙНЫХ СИСТЕМ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ Пусть фиксирована динамическая система (, f t ). Рассмотрим (стационарную относительно по тока {f t }) линейную систему дифференциальных уравнений (3.3). Эту систему будем также на зывать параметризованным (с помощью параметра ) семейством линейных систем. Здесь функция A : M(n) непрерывна и ограничена на, а параметр пробегает все фазовое про странство динамической системы. Это семейство мы будем отождествлять с парой (A, ), а для фиксированной системы семейства (A, ) будем пользоваться обозначением (A, ).

Пусть t x(t, ) — произвольное решение системы (A, ). Напомним, что для любой фиксиро ванной точки (t, s) R2 оператором Коши (матрицей Коши) системы (A, ) называется функция 150 Е. Л. ТОНКОВ X(t, s, ) из Rn в Rn, определенная равенством x(t, ) = X(t, s, )x(s, ). (4.1) Непосредственно из равенства (4.1) следует, что при каждом фиксированном s функция t X(t, s, ) является решением задачи Коши для матричного уравнения X = A(f t )X, X(s) = I, t R, (4.2) и если — стационарная точка потока {f t }, т.е. f t =, то X(t, s, ) = exp (t s)A().

Введем в рассмотрение пространство A, элементами которого являются системы вида (3.3) с непрерывными и ограниченными на функциями A : M(n). Метрику в A определим равенством r(A, B) = sup |A() B()| :.

Тогда очевидно, что A — полное метрическое пространство. Доказательство следующих двух лемм мы опускаем (они легко доказываются с помощью леммы Гронуолла и Беллмана).

Лемма 6. Функция X(t, s, ) непрерывна в каждой точке 0 равномерно относи тельно (t, s) на любом компакте в R2.

Лемма 7. Функция A XA (t, s, ) непрерывна в каждой точке B A равномерно относи тельно ((t, s), ) на любом множестве K, где K — компакт в R2.

Теорема 8. Для всех t, s, имеет место равенство X(t +, s +, ) = X(t, s, f ).

Поэтому если движение f стационарно, или T -периодично, или почти периодично в смысле Бора, или рекуррентно, то функция X(t +, s +, ) переменной тоже стацио нарна, T -периодична, почти периодична в смысле Бора, или рекуррентна равномерно относи тельно (t, s) на любом компакте в R2.

Доказательство. Действительно, X(t, s, f ) является оператором Коши системы (A, f ). С другой стороны, непосредственной проверкой убеждаемся (см. (4.2)), что X(t +, s +, ) — тоже оператор Коши системы (A, f ). Следовательно, в силу единственности оператора Коши, X(t +, s +, ) = X(t, s, f ).

Пусть движение f рекуррентно. Покажем тогда, что функция X(t, s, f ) рекур рентна равномерно относительно (t, s) на любом компакте в R2. Действительно, если заданы и 0, то в силу леммы 6 для любого компакта K R2 найдется 0 такое, что для всех.

(,, f ) = : max f +, f, || и всех (t, s) K max X t, s, f + X t, s, f ||,.

Тем самым показано, что если (,, f ), то является (, )-почти периодом функции X(t, s, f ), общим для всех (t, s) K. Аналогично доказывается почти периодичность в смысле Бора функции X(t, s, f ), равномерная по (t, s) K.

Напомним, что показателем Ляпунова решения t x(t, ) системы (A, ) называется число ln |x(t, )| (x, ) = lim.

t t А. М. Ляпуновым доказано [3, с. 64], что в пространстве решений системы (A, ) существует так называемый нормальный базис x1 (t, ),..., xn (t, ), т.е. такой базис, что (x1, )... (xn, ) и сумма (x1, )+· · ·+(xn, ) минимальна относительно других базисов. Показатели минимального базиса называются показателями системы (A, ) и обозначаются 1 (A, ),..., n (A, ). Будем предполагать далее, что показатели упорядочены по возрастанию: 1 (A, )... n (A, ).

ГЛОБАЛЬНО УПРАВЛЯЕМЫЕ ЛИНЕЙНЫЕ СИСТЕМЫ Далее, функция t L(t) M(n) называется преобразованием Ляпунова, если она абсолютно непрерывна на R и sup |L(t)| + |L1 (t)| + |L(t)|. Система (A, ) называется приводимой t [3, § 18] (к системе y = F ()y с постоянной матрицей F ()), если существует преобразование Ляпунова t L(t, ) такое, что F () = (L(t, ) + L(t, )A(f t ))L1 (t, ) для всех t 0 (в этом случае пространства E(A, ) и E(F ()) решений систем (A, ) и F () связаны равенством E(F ()) = LE(A, ) и поэтому показатели Ляпунова этих систем совпадают).

Всякой системе (A, ) отвечает сопряженная система (A, ) вида = A(f t ). Показа тели сопяженной системы обозначим i (A, ), причем 1 (A, ) n (A, ). Система...

(A, ) называется правильной, если i (A, ) + n+1i (A, ) = 0, i = 1,..., n. Всякое приводимое уравнение является правильным [3, § 22], обратное неверно.



Pages:     | 1 |   ...   | 3 | 4 || 6 |
 





 
© 2013 www.libed.ru - «Бесплатная библиотека научно-практических конференций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.