авторефераты диссертаций БЕСПЛАТНАЯ БИБЛИОТЕКА РОССИИ

КОНФЕРЕНЦИИ, КНИГИ, ПОСОБИЯ, НАУЧНЫЕ ИЗДАНИЯ

<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ


Pages:     | 1 |   ...   | 4 | 5 ||

«Российская академия наук Российская ассоциация математического программирования Институт систем энергетики им. Л.А.Мелентьева СО РАН ...»

-- [ Страница 6 ] --

(i) границы есть "отражающие", то есть такие, В общем случае, если среди участков s для которых существуют номера j {1, 2,..., n} : zj ((i), t(i) ) 0, i N (, ),то каждую такую точку ( (i), t(i) ) следует рассматривать так же, как и точку (, ). Это приводит к дополнению s задачи (3.2) - (3.4) еще одним "блоком", который строится по описанной выше схеме. Тогда вариационный принцип максимума формулируется с помощью составной задачи оптимального управления, которая представляет собой совокупность блоков вида (3.2) - (3.4).

Список литературы [1] Срочко В.А. Принцип максимума для одного класса систем с распределенными параметрами // Вопросы устойчивости и оптимизации динамических систем. - Иркутск, 1983. - С.170 182.

[2] Васильев О.В., Срочко В.А., Терлецкий В.А. Методы опттимизации и их приложения. Ч.2.

Оптимальное управление. - Новосибирск: Наука, 1990. - 151 с.

[3] Аргучинцев А.В. Оптимальное управление начально-краевыми условиями гиперболических систем. - Иркутск: Изд-во Иркут. гос. ун-та, 2003. - 156 с.

[4] Терлецкий В.А. Вариационный принцип максимума в управляемых системах одномерных гиперболических уравнений // Известия вузов. Математика. - 1999. - № 12. - С.82-90.

[5] Рождественский Б.Л., Яненко Н.А. Системы квазилинейных уравнений и их приложения к газовой динамике. - М.: Наука, 1978. - 687с.

[6] Терлецкий В.А. Обобщенное решение одномерных полулинейных гиперболических систем со смешанными условиями // Известия вузов. Математика. - 2004. - № 12. - С.72 - 91.

VARIATIONAL MAXIMUM PRINCIPLE FOR SEMI-LINEAR HYPERBOLIC SYSTEMS WITH MIXED CONDITIONS V.A. Terletskii Institute of Mathematics and Economics of Irkutsk State University, Irkutsk Abstract. A problem of optimal control of hyperbolic system of semi-linear dierential equations with mixed boundary conditions is considered. On the bases of the increment method variational maximum principle is derived for controls distributed in the region as well as for the boundary stationed controls.

Key words: optimal control, hyperbolic systems, optimality conditions.

МЕТОД ФАЗОВОЙ ЛИНЕАРИЗАЦИИ В ЗАДАЧАХ ОПТИМАЛЬНОГО УПРАВ ЛЕНИЯ С ФУНКЦИОНАЛЬНЫМИ ОГРАНИЧЕНИЯМИ Д.О. Трунин Бурятский государственный университет, Улан-Удэ e-mail: hint@rambler.ru Аннотация. В статье рассматривается метод фазовой линеаризации для задач оптимального управления с дополнительными функциональными ограничениями. Метод базируется на фор мулах приращения, которые обеспечивают более высокий порядок аппроксимации по сравнению с формулами на основе игольчатых вариаций.

Ключевые слова: задача оптимального управления, метод фазовой линеаризации, функцио нальные ограничения.

Введение В монографии [1] рассматривается метод игольчатой линеаризации для задач оптимального управления с функциональными ограничениями. В настоящей работе предлагается метод численного решения таких задач на основе техники фазового варьирования.

1. Постановка задачи Рассмотрим управляемый процесс (u(t), x(t)), t T = [t0, t1 ], который описывается с помощью обыкновенной динамической системы x(t0 ) = x0. (1) x = f (x, u, t), Введем множество доступных управлений V = {u Lr (T ) : u(t) U, t T }.

и предположим, что множество U, определяющее прямые ограничения на управление, является компактным.

На множестве V определим набор функционалов i (u) = i (x(t1 )) + Fi (x, u, t)dt, i = 0,..., m T и поставим задачу оптимального управления 0 (u) min, u V. (2) i (u) = 0, i = 1,..., m, Будем полагать, что функции f (x, u, t), i (x), Fi (x, u, t), i = 0,..., m непрерывны по своим ар гументам вместе с частными производными по x.

Введем функционал, определяющий невязку выполнения функциональных ограничений в задаче (2) (u) = max | i (u) |.

1im Для каждого функционала введем функцию Понтрягина H i ( i, x, u, t) = i, f (x, u, t) Fi (x, u, t), i = 0,..., m.

Определим модифицированные сопряженные системы pi = Hx (pi, x(t, u), v, t), i pi (t1 ) = ix (x(t1, u)) (3) c решениями pi = pi (t, u, v) при u V, v V.

Цель состоит в последовательном уменьшении функционала (u) и функционала Лагранжа m L(u, ) = i i (u) i= с помощью решения специальных вспомогательных задач.

2. Метод фазовой линеаризации Пусть u(t), t T – доступное управление в задаче (2). Оформим процедуру его варьирования следующими соотношениями uv, (t) = u(t) + (t)(v(t) u(t)), t T, v V, X, [0, 1], X = { L (t) : (t) = 0 1, (t)dt = (t1 t0 )}.

T Соответствующие приращения функционалов представляются в виде i (uv, ) i (u) = i (u, v, ) + oi (), (4) i = 0,..., m.

Здесь i – фазовая вариация функционала i, которая, согласно [1], определяется по фор муле (t)v(t) H i (pi (t, u, v), x(t, u), u(t), t)dt, i = 0,..., m, i (u, v, ) = (5) T где pi (t, u, v), i = 0,..., m – решения модифицированных сопряженных систем (3).

Зафиксируем [0, 1] и перейдем к построению вспомогательной задачи в вариациях относи тельно параметров v V, X. В качестве целевого функционала этой задачи выберем вариа цию 0 (u, v, ). По части ограничений поставим задачу поиска параметров варьирования v, та ким образом, чтобы обеспечить уменьшение модуля каждого функционала i, i = 1,..., m(i = 0) на величину порядка. В формальном исполнении это требование имеет вид i (uv, ) = (1 )i (u) + oi (), i = 1,..., m.

Учитывая выражения для фазовых вариаций (5), представим задачу в интегральной форме (t)v(t) H 0 (p0 (t, u, v), x(t, u), u(t), t)dt max, v V, X, (6) T (t)v(t) H i (pi (t, u, v), x(t, u), u(t), t)dt = i (u), i = 1,..., m, T (t)dt = (t1 t0 ).

T Здесь X = { L (T ) : (t) = 0 1}.

Проведем декомпозицию общей задачи (6) на две подзадачи.

Полагая = 1((t) 1), получаем первую вспомогательную задачу на поиск управления v(t) v(t) H 0 (p0, x(t, u), u(t), t)dt max, v V, (7) T v(t) H i (pi, x(t, u), u(t), t)dt = i (u), i = 1,..., m.

T pi pi (t), i Здесь = = 0,..., m – неизвестные функции, играющие роль функциональных параметров.

Пусть u(p0,..., pm, t) – решение задачи (7), = (0,..., m )T – соответствующий вектор мно жителей с условием 0 = 0 1.

Согласно принципу максимума для задачи (7) m u(p0,..., pm, t) = arg max i v H i (pi, x(t, u), u(t), t) (8) vU i= Найдем решения pi = pi (t) модифицированных сопряженных систем pi = Hx (pi, x(t, u), u(p0,..., pm, t), t), i pi (t1 ) = ix (x(t1, u)) вместе с управлением u(t) = u(p0 (t),..., pm (t), t).

Образуем вспомогательные функции gi (t) = u(t) H i (pi (t, u, u), x(t, u), u(t), t), i = 0,..., m, m (9) g(t, ) = i gi (t).

i= и введем в рассмотрение величину 1 (u) = g(t, )dt.

T В силу (8) имеем 1 (u) 0. (10) С учетом ограничений задачи (7) gi (t)dt = i (u), i = 1,..., m.

T Сформулируем вторую вспомогательную задачу на поиск функции варьирования (t) (t)g(t, )dt max, (11) T (t)gi (t)dt = i (u), i = 1,..., m, T (t) = 0 1, (t)dt = (t1 t0 ).

T Пусть (t) – решение задачи (11). Сформируем – параметрическое семейство варьирован ных управлений u (t) = u(t) + (t)(u(t) u(t)), t T.

По аналогии с [1] можно показать, что в случае (u) 0 (управление u V не допустимо) управление u при достаточно малых 0 обеспечивает уменьшение функционала (u) (u ) (u) (u) + o().

Покажем, что управление u обеспечивает при малых 0 уменьшение функционала Лагранжа. Для этого рассмотрим приращение функционала Лагранжа на паре (u, u ).

Следуя [1] (следствие из теоремы Ляпунова), имеем L(u, ) L(u, ) = (t)g(t, )dt + o() (12) g(t, )dt + o().

T T Отсюда с учетом (10) заключаем, что управление u обеспечивает для малых уменьшение функционала Лагранжа при 1 (u) 0.

3. Решение вспомогательных задач.

Рассмотрим первую вспомогательную задачу метода фазовой линеаризации. Представим ин тегральную задачу (7) в динамической форме, введя новые переменные с учетом сопряженных систем (3) t v( ) H i (pi (, u, v), x(, u), u( ), )d, i = 0,..., m.

yi (t) = t В этом случае динамический вариант задачи (7) запишется в виде yi = v(t) H i (pi, x(t, u), u(t), t), pi = Hx (pi, x(t, u), v, t), i yi (t0 ) = 0, pi (t1 ) = ix (x(t1, u)), i = 0,..., m, y0 (t1 ) max, yj (t1 ) = j (u), j = 1,..., m, v(t) U, t T.

С учетом того факта, что функция Понтрягина и ее частные производные по x линейны относительно сопряженных переменных, получим следующую задачу оптимального управления специального вида yi = ai (v, t), pi + bi (v, t), pi = A(v, t)pi + b(v, t), yi (t0 ) = 0, pi (t1 ) = ix (x(t1, u)), (13) y0 (t1 ) max, yj (t1 ) = j (u), i = 0,..., m, j = 1,..., m, v(t) U, t T.

Здесь (y, p) – фазовые переменные, v(t) – управление.

Задача (13) является линейной по фазовому состоянию с линейными функционалами. К реше нию задачи (13) могут применяться различные методы. Наиболее простой является идея штрафов с последующим применением методов нелокального улучшения. При этом реализация процедуры нелокального улучшения существенно упрощается, поскольку правая часть управляемой системы в (13) не зависит от y.

Вторая вспомогательная задача метода фазовой линеаризации полностью совпадает с соот ветствующей вспомогательной задачей метода игольчатой линеаризации [1] и может быть решена в рамках метода параметризации.

Список литературы [1] В.А. Срочко Итерационные методы решения задач оптимального управления. - М.: Физ матлит, 2000. - 160 с.

A PHASE LINEARIZATION METHOD FOR SOLVING OPTIMAL CONTROL PROBLEMS WITH ADDITIONAL FUNCTIONAL CONSTRAINS D.O. Trunin Buryat State University, Ulan-Ude e-mail: hint@rambler.ru Abstract. This article is about phase linearization method for solving optimal control problems with additional functional constrains. The method is based on formulas of an increment which provide higher order of approximation in comparison with needle variations.

Key words: optimal control problem, phase linearization, functional constrains.

МНОГОМЕТОДНЫЙ АЛГОРИТМ ДЛЯ РЕШЕНИЯ КРАЕВОЙ ЗАДАЧИ ОПТИ МАЛЬНОГО УПРАВЛЕНИЯ А.И.Тятюшкин Институт динамики систем и теории управления СО РАН, Иркутск e-mail: tjat@.icc.ru Аннотация. Вычислительная технология для многометодного расчета оптимального управле ния реализуется в виде параллельных итерационных процессов оптимизации с последовательным выбором лучшего приближения после выполнения нескольких итераций всеми методами. В соответствии с этой технологией решение задачи находится мультиметодным алгоритмом, состоящим из последовательности шагов разных методов, подключаемых к процессу оптими зации с целью его ускорения. Такая технология позволяет учитывать особенности решаемой задачи на всех стадиях ее решения и повышает эффективность поиска оптимального управления.

Ключевые слова: оптимизация, оптимальное управление, параллельные вычисления, числен ные методы.

Введение.

В статье [1] была описана многометодная технология решения задач оптимального управ ления, которая реализуется в виде параллельных итерационных процессов оптимизации с выбором лучшего приближения. В соответствии с этой технологией решение задачи находит ся мультиметодным алгоритмом, состоящим из последовательности шагов разных методов, подключаемых к процессу оптимизации с целью ускорения поиска оптимального управления.

Эффективность технологии подтверждена вычислительными экспериментами и решением ряда прикладных задач оптимального управления. В данной статье рассматривается алгоритм решения нелинейной краевой задачи, состоящий из градиентного метода для поиска начального приближения и метода квазилинеаризации для получения точного решения.

1. Постановка задачи Рассмотрим применение многометодной технологии к поиску решения наиболее важной в технических приложениях задаче перевода нелинейного объекта из одного состояния в другое по некоторому заданному критерию качества:

t F (x, u, t)dt min, (1) I(u) = t x = f (x, u, t), x(t) Rn, u(t) Rr, t [t0, t1 ], (2) 0 (3) x(t0 ) = x, x(t1 ) = x.

2. Многометодный алгоритм решения краевой задачи Построение начального приближения градиентным методом.

Из принципа максимума найдем выражение для управления u(t) через (t), x(t), t и подста вим это выражение в систему (2) и в сопряженную систему = Hx (, x, u, t), где функция Hx (, x, u, t) следующего вида Hx (, x, u, t) = (t) f (x, u, t) F (x, u, t);

в результате получим краевую задачу:

x = X(x,, t), = (x,, t), x(t0 ) = x0, x(t1 ) = x1. (4) Для решения краевой задачи (4) методом квазилинеаризации, обеспечивающим высокую точ ность выполнения краевых условий, необходимо иметь достаточно близкое к оптимальному на чальное приближение для (t0 ).

Построим градиентную процедуру для улучшения заданного приближения, которая не тре бует хорошего начального приближения.

Введем функционал I1 (v) = 1 ||x(t1, v) x1 ||2, который является мерой уклонения решения системы (4) с начальными условиями x(t0 ) = x0, (t0 ) = v от заданного состояния x1 и поставим задачу поиска v = arg min I1 (v). Поскольку теперь будет решаться задача со свободным правым n vR концом, то решение сопряженной системы должно удовлетворять условию трансверсальности:

(t1 ) = x1 x(t1, v).

Построим функционал невязок I(v) = I1 (v) + ||(t1 ) + x(t, v) x1 ||2 (5) и будем рассматривать задачу минимизации функционала (5) на решениях системы (4) с началь ными условиями x(t0 ) = x0, (t0 ) = v.

Построим cопряженную к (4) систему, введя n-мерные вектор - функции (t), (t) :

= Xx (x,, t) x (x,, t), = X (x,, t) (x,, t), (6) (t1 ) = 2(x1 x(t1, v)) (t1 ), (t1 ) = x1 x(t1, v) (t1 ), Тогда градиент функционала (5) выражается через решение сопряженной системы (6):

I(v) = (t0 ). (7) Следовательно, для улучшения вектора k начальных условий для функции (t) в системе (4) можно применить градиентную процедуру, не требующую точного начального приближения для сходимости к локальному минимуму функционала (5):

1. при x(t0 ) = x0, (t0 ) = k интегрируется система (4) и в узлах интегрирования запоминается ее решение xk (t), k (t), t [t0, t1 ];

2. в обратном времени интегрируется система линейных дифференциальных уравнений (6), матрица коэффициентов которой вычисляется на решениях xk (t), k (t), t [t0, t1 ], при t = t будем иметь градиент (7);

3. процедурой одномерного поиска выбирается параметр k = arg min I(v k + (t0 )). При выборе k система (4) несколько раз интегрируется с разными начальными условиями:

x(t0 ) = x0, (t0 ) = v k + (t0 ), 0;

4. строится новое приближение v k+1 = v k + k (t0 );

5. если I(v k ) I(v k+1 ), то повторяются пункты 1 - 4, в противном случае итерации градиентного метода прекращаются и найденный вектор k берется в качестве начальных условий для сопряженной системы в (4). Градиентная процедура, как правило, не обеспечивает требуемую точность нахождения оптимального решения, поэтому для уточнения найденного приближенного значения вектора k необходимо использовать более точный метод, например, метод квазилинеаризации. Однако, сходимость этого метода обеспечивается хорошим начальным приближением, которое на первом этапе алгоритма [2],[3] находится градиентным методом.

Уточнение решения краевой задачи методом квазилинеаризации.

Метод квазилинеаризации [4] обеспечивает высокую точность выполнения краевых условий в задаче (4), что является основным требованием, например, в задачах управления маневром и стабилизацией космических аппаратов. Отличие этого метода от классического метода линеари зации состоит в том, что линеаризованная система, применяемая в методе квазилинеаризации, учитывает отклонения правых частей линеаризованной системы от правых частей нелинейной системы. На итерациях метода квазилинеаризации рассматривается следующая линейная систе ма:

xk+1 = Xx (xk, k, t)xk+1 + X (xk, k, t) k+1 + k (t), k+1 = x (xk, k, t)xk+1 + (xk, k, t) k+1 + k (t), (8) где k (t) = X(xk, k, t) Xx (xk, k, t)xk (t) X (xk, k, t) k (t), k (t) = (xk, k, t) x (xk, k, t)xk (t) (xk, k, t) k (t), k- номер итерации.

11 (t) 12 (t) Фундаментальная матрица линейной системы (8) (t) = удовлетворяет 21 (t) 22 (t) уравнению Xx (xk, k, t) X (xk, k, t) (9) =, (t0 ) = E.

x (xk, k, t) (xk, k, t) Пусть [k+1 (t), k+1 (t)]- решение линейной системы (8), полученное при нулевых начальных x условиях. Тогда решение системы (8) при произвольных начальных условиях с помощью фунда ментальной матрицы запишется в следующем виде:

xk+1 (t) = 11 (t)xk+1 (t0 ) + 12 (t) k+1 (t0 ) + xk+1 (t), (t) = 22 (t)x (t0 ) + 22 (t) (t0 ) + k+1 (t).

k+1 k+1 k+ (10) Подставим в (10) заданные краевые условия (3):

11 (t1 )x0 + 12 (t1 ) k+1 (t0 ) + xk+1 (t1 ) = x1.

Из полученного равенства найдем новое приближение для вектора начальных условий сопря женной системы:

k+1 (t0 ) = 1 (t1 )[x1 11 (t1 )x0 xk+1 (t1 )]. (11) Проинтегрировав систему (4) при начальных условиях x(t0 ) = x0 и (t0 ) = k+1 (t0 ), получим точку xk+1 (t1 ) более близкую к заданной точке x1 :

xk+1 (t1 ) x1 xk (t1 ) x1.

Таким образом, для выполнения шага метода квазилинеаризации необходимо:

1) решить матричное уравнение (9) на решении системы (4): xk (t), k (t) и найти (t1 );

2) по формуле (11) найти вектор k+1 (t0 );

3) проинтегрировать систему (4) при начальных условиях:x(t 0 ) = x0, (t0 ) = k+1 (t0 ) и найти в результате xk+1 (t), k+1 (t), t [t0, t1 ], которые заменяют xk (t), k (t).

Итерации метода (пункты 1)-3)) повторяются до выполнения заданной точности для краевых условий: xk+1 (t1 ) x1.

После решения краевой задачи при найденных начальных условиях для сопряженной системы проинтегрируем систему (4), найдем ее решение [x(t), (t)] и из принципа максимума вычислим оптимальное управление, переводящее систему из состояния x 0 в состояние x1 по минимуму функционала (1).

3. Оптимальное управление положением космического аппарата Для иллюстрации предложенной технологии решения нелинейной краевой задачи рассмотрим простую модель, описывающую вращательную динамику космического аппарата(КА), которая рассматривалась в статье [5]:

u2 (t) + u2 (t) + u2 (t) dt min, J (u) = 1 2 = k (1 1 2 2 2 3 ), = k (1 0 2 3 + 3 2 ), = k (1 3 + 2 0 3 1 ), = k (1 2 + 2 1 + 3 0 ), k = 0.5, 1 = I1 2 3 + u1 /I1, 2 = I2 1 3 + u2 /I2, 3 1 2 + u3 /I3, 3 = I где I1 = (I3 I2 ) /I1, I2 = (I1 I3 ) /I2, I3 = (I I1 ) /I3, (I1, I2, I3 ) моменты инерции кос мического аппарата;

(u1, u2, u3 ) компоненты управляющего вектора (вращающего момента);

(0, 1, 2, 3 ) параметры Эйлера, (1, 2, 3 ) компоненты угловой скорости.

Вектор удовлетворяет условию (t) 2 = const;

выбором начальных условий обеспечивается равенство (t) = 1.

Требуется найти управление, обеспечивающее минимум функционалу J (u) и переводящее КА из заданного начального положения в конечное состояние.

В статье [5] заданы следующие начальное и конечное состояния:

x0 = (1, 0, 0, 0, 0.01, 0.005, 0.001), x1 = (0.43047, 0.70106, 0.09230, 0.56098, 0, 0, 0), моменты инерции задавались следующими: I1 = 106, I2 = 833333, I3 = 916667, а начальное при ближение для управления, с которого метод квазилинеаризации начинал сходится к оптималь ному, в статье [5] находилось аналитически из механических свойств системы.

Управление, на котором достигается максимум функции Понтрягина H (, x, u, t) = 5 u1 /I1 + 6 u2 /I2 + 7 u3 /3 u2 u2 u2, определяется по формулам:

1 2 u1 = 5 / (2I1 ), u2 = 6 / (2I2 ), u3 = 7 / (2I3 ).

Краевая задача для данной системы принимает следующий вид:

= k (x5 x2 x6 x3 x7 x4 ), x = k (x5 x1 + x7 x3 x6 x4 ), x = k (x6 x1 x7 x2 + x5 x4 ), x = k (x7 x1 + x6 x2 x5 x3 ), x = 0.08333x6 x7 + 5 / 2I1, x 2, = 0.1x5 x7 + 6 / 2I x x = 0.18182x5 x6 + 7 / 2I3, 1 k (2 x5 + 3 x6 + 4 x7 ), 2 = k (1 x5 + 3 x7 4 x6 ), 3 = k (1 x6 2 x7 4 x5 ), 4 = k (1 x7 + 2 x6 3 x5 ), 5 = k (1 x2 2 x1 3 x4 + 4 x3 ) + 0.16 x7 0.181827 x6, 6 = k (1 x3 + 2 x4 3 x1 4 x2 ) + 0.083335 x6 0.181827 x5, 7 = k (1 x4 2 x3 + 3 x2 4 x2 ) + 0.083335 x6 + 0.16 x5.

Краевые условия были заданы такими же, как и в статье [5]. Максимальное нарушение кра евого условия на правом конце при нулевом управлении было равно 0.41622. Метод квазилине аризации с этого управления не сходился. Градиентный метод, начиная с v 0, соответствующего нулевому управлению, сократил невязку выполнения краевых условий на порядок, после чего с полученного v k метод квазилинеаризации стал сходиться и нарушение краевых условий уменьши лось до 109. Полученное при этом управление практически совпадает с управлением, найденным в [5].

Таким образом, многометодная схема, состоящая в данной задаче из 2-х методов, обеспечивает вычисление оптимального управления с требуемой точностью.

Список литературы [1] А.И.Тятюшкин Параллельные вычисленияв задачах оптимального управления.- Сиб. журн.

выч. матем. РАН, Новосибирск, 2000, т. 3, №. 2, c. 181-190.

[2] А.И.Тятюшкин Многометодная технология для расчета оптимального управления- Изв.

РАН. Теория и системы управления, 2003, N3. c. 59-67.

[3] А.И.Тятюшкин Численные методы и программные средства оптимизации управляемых си стем. Новосибирск: Наука,1992, 193 с.

[4] Э.П.Сейдж, Ч.С.Ш.Уайт Оптимальное управление системами.М.: Радио и связь, 1982,c.

450.

[5] I.L. Junkins, I.D. Turner Optimal continuous torgue attitude maneuvers- AIAA/AAS Astrodynamics conference, Palo Alto, Calif, 1978, pp. 78.

MULTIMETHOD’S ALGORITHM FOR SOLVING BOUNDARY VALUE PROBLEMS OF OPTIMAL CONTROL A.I. Tyatyushkin Institute of System Dynamics & Control Theory of SB RAS, Irkutsk e-mail: tjat@icc.ru Abstract. Multimethod’s technology for solving optimal control problems is implemented under the form of parallel optimization processes with the choice of a best approximation. Corresponding to this technology the solution is found by a multimethods algorithm consisting of a sequence of steps of dierent methods applied to the optimization process in order to accelerate it. Such a technology allow to take into account some particularities of problem of interest at all stages of its solving and improve the eciency of optimal control search.

Key words: optimization, optimal control, parallel computing, numerical methods АППРОКСИМАЦИЯ, РЕЛАКСАЦИЯ И СТАБИЛИЗАЦИЯ В СИСТЕМАХ С МОНОТОННЫМИ ХАРАКТЕРИСТИКАМИ И.А. Финогенко Институт динамики систем и теории управления СО РАН, Иркутск e-mail: n@icc.ru Аннотация. Исследуются свойства одного класса систем управления при разного типа усло виях монотонности их правых частей. Для многозначных и разрывных нелинейностей строятся непрерывные однозначные аппроксимации Иосиды и изучаются соотношения между множе ствами решений исходной и аппроксимирующей систем. Приводятся теоремы о релаксации и асимптотической устойчивости.

Ключевые слова: аппроксимация Иосиды, разрывная нелинейность, монотонный многознач ный оператор, релаксация, множество достижимости, стабилизация.

Введение В работе исследуются дифференциальные включения вида P (t, x(t))x(t) F (t, x(t)) + u(t), u(t) U (t, x(t)). (1) Здесь x = (x1,..., xn ), F : (, ) Rn и U : (, ) Rn многозначные отобра симметричная, положительно определенная n n матрица, (, ) жения, P (t, x) конечный или бесконечный интервал на числовой прямой, R n конечномерное евклидово пространство с евклидовой нормой ·, Rn некоторая область.

Задача (1) изучается в рамках следующих предположений:

1) Для любых (t, x), (t, y), v F (t, x) и w F (t, y) выполняется неравенство v w, x y l1 (t) x y 2. (2) 2) Для любых (t, x), (t, y), v U (t, x) существует w U (t, y) такое, что выполняется неравен ство v w, x y l2 (t) x y 2, (3) где ·, · обозначает скалярное произведение, l1 (t) и l2 (t) некоторые функции. Неравенства (2) (3) обычно называют односторонними условиями Липшица. Неравенство (2) обобщает обычное условие Липшица для случая однозначной функции F, а неравенство (3) условие Липшица по переменной x в метрике Хаусдорфа dist(·, ·) для многозначной функции U с компактными значениями:

dist(U (t, x), U (t, y)) l2 (t) x y. (4) Неравенство (2) является также более общим по отношению к условию монотонности многознач ного отображения F (t, x) по переменной x.

К системе вида (1) приводится широкий класс уравнений движения механических систем в форме Лагранжа второго рода:

A(t, q) = g(t, q, q) + QA (t, q, q) + B(t, q)u (5) q Работа выполнена при поддержке РФФИ (грант N 03-01-00203) и Программы Президиума РАН по фундаментальным исследованиям N 19 (проект 2.5).

с управлениями u = (u1,..., un ) с ограничениями |ui | H(t, x), i = 1,..., n. Уравнениями (5) описывается, в частности, динамика многозвенных манипуляционных роботов, синтез управления которых осуществляется на принципе декомпозиции (см. [1], [2]). В абстрактной форме система (5) может быть записана в виде P (t, x)x = f (t, x) + u. При наличии в системе (5) сил сухого трения функция f будет разрывной по переменной x, и тогда при доопределении уравнения (5) по Филиппову [3] оно запишется в форме включения (1).

Неравенства вида (2)-(3) широко используются при изучении разрывных систем и дифферен циальных включений. Неравенство (2) обеспечивает правую единственность решений, важную с точки зрения зрения обеспечения сходимости разностных схем (см. [4] и др). и др. В рамках неравенств (3) и (4) доказываются теоремы о релаксации для дифференциальных включений [5], [6] и др.

В настоящей работе исследуются некоторые другие свойства дифференциальных включений, вытекающие из неравенств (2)-(4). Устанавливается существование непрерывных однозначных аппроксимаций F (t, x) для многозначных отображений F (t, x), построенных по типу аппрокси маций Иосиды (см. [7]), и записывается система вида P (t, x(t))x(t) = F (t, x(t)) + u(t), u(t) U (t, x(t)) (6) с параметром 0. Изучаются соотношения между множеством решений H(t0, x0 ) включения (1) и множеством решений H(t0, x0, ) системы (6) в пространстве непрерывных функций.

Последнее важно с точки зрения оценки множества достижимости системы (1), а в приложениях системы (5). Применение непрерывных аппроксимаций позволяет также получить теоремы о релаксации для задачи (1). Отметим, что в такой постановке эта задача ранее не изучалась. Для нее изучаются также вопросы слабой асимптотической устойчивости, которая обеспечивается структурой уравнений и односторонними условиями Липшица без привлечения дополнительных предположений, что применительно к задачам теории управления означает стабилизируемость системы (1).

1. Непрерывные аппроксимации.

Следуя [7], введем некоторые определения. Многозначное отображение B : R n Rn называ ется монотонным, если x y, u v 0 (7) для любых x, y Rn, u B(x), v B(y), и максимально монотонным, если не существует другого монотонного многозначного отображения, график которого строго содержит график B.

Пусть B максимально монотонное многозначное отображение и 0 некоторое число.

1 называется резольвентой, а отображение B = (I J )/ Отображение J = (I + B) тождественный оператор на R n.

аппроксимацией Иосиды для отображения B, где I Известно, что резольвента J однозначное, нерастягивающее отображение, а аппрокси мация Иосиды B однозначное, монотонное, липшицевое с константой 1/ отображение и B (x) m(B(x)) при 0, где m(B(x)) ближайшая к началу координат точка из мно жества B(x).

Предположим, что в неравенстве (2) многозначная функция F не зависит от t и определена на всем пространстве Rn, а l1 (t) 0. Положим B(x) = F (x). Тогда это неравенство может быть записано в виде (7) и, следовательно, многозначное отображение F (x) монотонное. В соответствии с теоремой Минти (см. [7, с. 370]) для его максимальной монотонности достаточно установить, что отображение x x F (x) сюрьективно. Это будет иметь место, если для любого фиксированного x Rn существует решение включения y x + F (y). Последнее вытекает из теоремы Какутани о неподвижных точках многозначных отображений, если отображение F (x) ограничено, имеет замкнутый график и выпуклые значения. В указанном случае для многознач ного отображения B(x) = F (x) может быть построена аппроксимация Иосиды.

В определении полунепрерывности сверху и непрерывности многозначных отображений мы следуем [8]. Наша цель построить аппроксимации Иосиды для многозначного отображения F (t, x) в рамках следующих предположений:

A1. Многозначное отображение F : (, ) Rn полунепрерывно сверху и принимает выпуклые, компактные значения.

A2. Для любых t (, ), x, y, v F (t, x), w F (t, y) выполняется неравенство (2) с ограниченной на каждом конечном отрезке функцией l1 (t).

Для каждых фиксированных (t, x) и 0 через z = J (t, x) обозначим решение включения z x + F (t, z) (8) и пусть F (t, x) = (J (t, x) x)/. Отметим, что формально J (t, x) и F (t, x) представляют со бой резольвенту и, соответственно, аппроксимацию Иосиды для отображения x F (t, x) при каждом фиксированном t. Однако резольвента y = J (x) максимально монотонного многозначно го оператора B : Rn Rn определяется из включения x y +B(y) и ее существование вытекает, по сути дела, из упомянутой выше теоремы Минти: монотонное отображение B максимально то гда и только тогда, когда отображение y y + B(y) сюръективно. Однозначная определенность отображений J (t, x) и F (t, x) в рамках условий A1, A2 требует иного обоснования.

Для произвольного множества и числа 0 через будем обозначать -окрестность множества.

Утверждение 1. Пусть для многозначного отображения F : (, ) R n выполняются условия A1, A2. Тогда для любого отрезка [a, b] (, ), для любого компактного множества и числа 0 такого, что существует число 0 такое, что:

1. Для любых [0, ] и (t, x) [a, b] существует единственное решение z = J (t, x) включения (8), принадлежащее ;

2. Отображение (, t, x) J (t, x) ограничено, непрерывно на множестве [0, ] [a, b] и липшицево по x с некоторой константой LJ.

3. Отображение (, t, x) F (t, x) ограничено, непрерывно на множестве (0, ] [a, b] и липшицево по x с константой L = 1/.

4. Для любых (t, x), (t, y) [a, b] и (0, ], выполняется неравенство:

x y, F (t, x) F (t, y) l(t) x y 2.

5. Для любой фиксированной точки (t, x) [a, b] при +0 выполняется:

F (t, x) m(F (t, x)), где m(F (t, x)) ближайшая к началу координат точка множества F (t, x);

J (t, x) x равномерно по (t, x) [a, b].

6. Существуют константы l и L такие, что для любых (t, x), (t, y) [a, b], v F (t, x) и (0, ] выполняется неравенство x y, F (t, x) v l x y + L.

Теперь можем рассмотреть однопараметрическое семейство управляемых систем (6) при всех достаточно малых 0.

Теорема 1. Пусть выполняются условия A1, A2, матрица P (t, x) непрерывно дифферен цируема, симметрична и положительно определена, многозначное отображение U (t, x) непре рывно, компактнозначно и удовлетворяет неравенству (4). Тогда для любых начальных данных (t0, x0 ) (, ) на некотором промежутке [t0, t1 ] определены множество решений H(t0, x0 ) решений включения (1) и множество H(, t0, x0 ) решений уравнений (6) для всех (0, ] и су ществует константа K 0 такая, что справедливо утверждение: для любого x(·) H(t 0, x0 ) существует x (·) H(, t0, x0 ) такое, что выполняется неравенство x (t) x(t) K (9) для всех t [t0, t1 ] и наоборот для любого x (·) H(, t0, x0 ) существует x(·) H(t0, x0 ) такое, что выполняется (9).

2. Теорема о релаксации.

Наряду с включением (1) и уравнением (6) рассмотрим овыпукленные задачи:

P (t, x(t))x(t) F (t, x(t)) + u(t), u(t) coU (t, x(t)), (10) P (t, x(t))x(t) = F (t, x(t)) + u(t), u(t) coU (t, x(t)), (11) где co означает переход к выпуклой оболочке множества U (t, x) в каждой точке (t, x). Через Hco (t0, x0 ) и Hco (, t0, x0 ) обозначим соответственно множества всех определенных на отрезке [t0, t1 ] решений задач Коши для (10) и (11).

Теорема 2. Пусть выполняются все предположения теоремы 1. Тогда H(, t 0, x0 ) = Hco (, t0, x0 ) и H(t0, x0 ) = Hco (t0, x0 ), где черта сверху означает замыкание множества в пространстве C([t0, t1 ], Rn ) непрерывных на отрезке [t0, t1 ] функций с топологией равномерной сходимости.

3. Асимптотическая устойчивость Будем рассматривать дифференциальное включение P (t, x(t))x(t) (t, x(t)) (12) с многозначным отображением (t, x), определенным для всех t, x при условии, что множество является открытой окрестностью точки 0 R n. Через int (t, 0) обозначается внут ренность множества (t, 0) для каждого фиксированного t.

Многозначное отображение t (t, 0) назовем квазиоткрытым в точке t0, если int (t0, 0) = и если для для любого y int (t0, 0) найдутся 0 и 0 такие, что S (y) (t, 0) для всех t, удовлетворяющих неравенству |t t0 |, где S (y) = {x : y x }.

Всюду в этом разделе предполагается, что (t, x) полунепрерывное сверху многозначное отображение с выпуклыми, компактными значениями и 0 (t, 0) для всех t.

Лемма 1. Предположим, что v w, x l(t) x (13) для всех x, v (t, x), w (t, 0) и t, где l(t) интегрируемая на каждом отрезке [a, b] (, +) функция. Тогда x(t) 0 единственное справа на промежутке (, +) решение дифференциального включения (12).

Утверждение 2. Пусть выполняется неравенство (13) с функцией l(t), ограниченной на каждом конечном отрезке из (, +), t0, 0 int (t0, 0) и отображение t (t, 0) квази открыто в точке t0. Тогда для любого 0 существуют числа 0 и (0, ) такие, что для любого решения x(t) дифференциального включения (12) с начальным условием x(t 0 ) = x0, удовлетворяющим неравенству x0, выполняется x0 x(t) для всех t t0 и x(t) = для всех t t0 +.

Теорема 3. Пусть для дифференциального включения (12) с правой частью (t, x), опреде ленной на множестве (, +), выполняется неравенство (2) с ограниченной на каждом конечном отрезке функцией l1 (t), 0 int (t, 0) для всех t и отображение t (t, 0) квази открыто в каждой точке t. Тогда положение равновесия x(t) 0 дифференциального включения (12) асимптотически устойчиво так, что справедливо следующее: для любых 0, t 0 и 0 найдутся числа 0 и (0, ) такие, что для любого решения x(t) включения (12) с начальными условиями x(t0 ) = x0, x0 выполняется x(t) для всех t t0 и x(t) = для всех t t0 +.

Теорема 4. Пусть в предположениях теоремы 3 вместо неравенства (2) выполняется нера венство (3) с ограниченной на каждом конечном отрезке функцией l 2 (t). Тогда положение рав новесия x(t) 0 дифференциального включения (12) слабо асимптотически устойчиво в сле дующем смысле: для любых 0, t0 и 0 найдутся числа 0 и (0, ) такие, что для любого x0, удовлетворяющего x0, существует решение x(t) включения (12) с начальными условиями x(t0 ) = x0, для которого выполняется x(t) для всех t t0 и x(t) = 0 для всех t t0 +.

В заключение отметим:

1. Полученные в первом разделе оценки близости для множеств решений аппроксимирую щих и исходных управляемых систем показывают, что множество достижимости системы (1) с разрывной (или многозначной) нелинейностью может быть аппроксимировано множествами до стижимости системы (6) с точностью O( ). Численная оценка множеств достижимости для аппроксимирующих систем с использованием однозначных непрерывных аппроксимаций может быть произведена с помощью хорошо разработанных методов.

2. Если в разделе 3 многозначное отображение (t, x) = F (t, x) + U (t, x), то неравенство (3) для него будет выполняться, например, если для отображения F выполняется (2), а для отображения U выполняется (3) или (4). Наконец отметим, любое решения x(t) управляемой системы (1) может быть реализовано на измеримом управлении u(t) U (t, x(t)), а слабая асимптотическая устойчивость в теореме 4 означает ее стабилизацию.

Список литературы [1] Пятницкий Е.С. Синтез систем управления механическими и электромеханическими объ ектами на принципе декомпозиции. 1,2 // АиТ. 1989. N1. С.87-98, N2. С.57-70.

[2] Финогенко И.А. О правосторонних решениях одного класса разрывных систем. 1,2 // АиТ.

2001. N9. С. 149-158, N11. С. 95-108.

[3] Филиппов А.Ф. Дифференциальные уравнения с разрывной правой частью. М.:Наука, 1985.

224 с.

[4] Dontchev A., Lempio F. Dierence methods for dierential inclusions: a survey // SIAM Review.

1992. Vol. 34. N2, pp. 263-294.

[5] Толстоногов А.А., Финогенко И.А. О решениях дифференциального включения с полунепре рывной снизу невыпуклой правой частью в банаховом пространстве // Мат. сб., 1984. Т.125.

N2. С. 199-230.

[6] Donchev T. Semicontinuous dierential inclusions // Rend. Sem. Mat. Univ. Padova. 1999. Vol.

101. 147-160.

[7] Обен Ж.-П., Экланд И. Прикладной нелинейный анализ. М.:Мир, 1988, 510 с.

[8] Куратовский К. Топология, т.1. М.:Мир, 1966. 594 с.

APPROXIMATION, RELAXATION AND STABILIZATION FOR SYSTEMS WITH MONOTONE CHARACTERISTICS I.A. Finogenko Institute of Systems Dynamics and Control Theory, Siberian Branch, Russian Academy of Sciences, Irkutsk e-mail: n@icc.ru Abstract. Properties a class of control system under dierent kind conditions of monotonicity are investigated. For many-valued and discontinuous nonlinearity the continuous one-valued Iosida approximatons are constructed and relations between of solution sets original and approximating systems are studied. Theorems on relaxation and asymptotical stability are stated.

Key words: Iosida approximation, discontinuous nonlinearity, monotone many-valued operator, relaxation, set of attainability, stabilization АЛГОРИТМ ЧИСЛЕННОГО РЕШЕНИЯ НЕЛИНЕЙНОЙ ЗАДАЧИ ОПТИМАЛЬ НОГО БЫСТРОДЕЙСТВИЯ СПЕЦИАЛЬНОГО ВИДА Г.В. Шевченко Институт математики им. С.Л. Соболева СО РАН, Новосибирск e-mail: shevch@math.nsc.ru Аннотация. Предлагается алгоритм численного решения задачи оптимального быстродействия, нелинейной по состоянию и линейной по управлению. При построении предлагаемого алгоритма используются последовательности смежных симплексов, входящих в симплексные покрытия областей достижимости управляемой системы. Доказана конечная сходимость алгоритма к -оптимальному решению.

Ключевые слова: допустимое управление, оптимальное управление, симплекс, смежный симплекс, симплексное покрытие.

Введение В настоящей статье рассматриваются задачи быстродействия, у которых правая часть системы управления может быть представлена в виде суммы двух членов: вектор–функции, зависящей только от фазового состояния, и линейной вектор–функции, зависящей только от управления. Для таких задач область достижимости управляемой системы R(T ) за время T при достаточно общих предположениях относительно области управления является компактным телом и R(T ) локально выпукла в окрестности начала координат фазового пространства при T близких к оптимальному времени Tопт. Это позволяет использовать для них симплексные покрытия, введенные в [1], и дает возможность модифицировать алгоритм из [1] для решения таких нелинейных задач. Доказана конечная сходимость предлагаемого алгоритма к -решению.


Условимся называть аналогично [1] -решением любую пару {T, u(·)}, составленную из времени Tопт и допустимого управления u(t), (t [0, T ]), под воздействием которого система T переходит из начального состояния в -окрестность начала координат за время T.

1. Постановка задачи и геометрическая интерпретация Пусть управляемый объект описывается системой обыкновенных дифференциальных урав нений вида x(t) = f (x) + B(t)u(t), x(0) = x0, (1) где x Rn фазовый вектор состояния объекта, f (x) = (f1 (x1,..., xn ),..., fn (x1,..., xn )) непрерывно дифференцируемая вектор-функция, f (0) = 0, B(t) непрерывная матрица размера n s, u Rs измеримое управление, стесненное ограничением u(t) U. (2) выпуклый телесный компакт из Rs, содержащий внутри начало координат.

Здесь U Предполагается, что система (1) управляема в начало координат.

Задача. Требуется найти допустимое управление u0 (t) (t [0, T ]), переводящее систему (1) из начального состояния x(0) = x0 в начало координат за минимально возможное время T = Tопт.

Поставленная задача эквивалентна следующей задаче: найти минимальное время T = Tопт, при котором граница области достижимости R(T ) будет содержать начало ко ординат. Здесь и далее через R(T ) обозначается область достижимости системы (1) за время T, т. е. множество точек фазового пространства Rn, в которые может попасть управляемый объект из начального состояния x0 за время T 0 при допустимых управлениях. Известно, что множество R(T ) замкнуто и ограничено при любом конечном T 0, если выпукло и компактно множество B(t)U при любом t [0, T ]. Кроме того, так как по предположению система (1) управляема в начало координат, область достижимости R(T ) есть тело в R n. Таким образом, R(T ) компактное тело в Rn.

Для компактных тел в Rn справедливо обобщение теоремы о симплексном покрытии из [1].

Теорема 1 (о симплексном покрытии). Внутренность выпуклой оболочки любого компактно го тела в Rn можно покрыть семейством таких n-мерных симплексов с вершинами на границе, что пересечение любых двух симплексов из покрытия не является n-мерным симплексом.

Будем называть такое покрытие симплексным покрытием тела и обозначать его. Сле дует отметить, что в случае линейной системы имеет место соотношение. Тогда как в данном случае. Обозначим через int A, co A и A внутренность, линейную выпуклую оболочку и границу множества A соответственно.

Следствие 1. Пусть компактное тело из Rn и z 0 int(co ). Тогда для любого ее покрытия = существуют такое конечное k0 0 и такой n-мерный симплекс k=0 Sk Sk0, что z 0.

Следствие 2. Пусть компактное тело из Rn и z 0 co. Тогда для любого покрытия существуют такое конечное k0 0 и по меньшей мере один такой n-мерный = k=0 Sk симплекс Sk0, что в некоторой его вершине опорная к гиперплоскость строго отделяет от начала координат.

Здесь через Sk обозначено множество, элементами которого являются симплексы, входящие в k-ый слой симплексного покрытия. В работе [1] описана схема построения симплексного покрытия. Дадим здесь ее краткое описание.

Пусть каким-либо образом задан симплекс 0, вершины которого лежат на границе множества, 0-го слоя S0 покрытия (S0 = 0 ). По его граням максимальной размерности строятся смежные ему симплексы, имеющие с 0 пересечение только по соответствующей грани, такие, что все его вершины лежат на границе множества. Эти симплексы составляют 1-й слой S 1.

Для каждого симплекса k-го слоя (k 1) по его граням, не являющимися общими с гранями симплексов (k 1)-го слоя, аналогично симплексам k-го слоя строятся смежные им симплексы, входящие в (k + 1)-й слой Sk+1.

Области достижимости R(T ) для любого конечного T 0, как было сказано выше, явля ются компактными телами в Rn. Следовательно, для них справедливы теорема о симплексном покрытии.

Пусть T 0 фиксировано. Тогда при построении покрытия области R(T ) n-мерными сим плексами R(T ) в силу следствий 1 и 2 через конечное число итераций l 1 (под итерацией здесь понимается построение очередного симплекса) получаем либо симплекс с вершиной, опорная ги перплоскость в которой является строго отделяющей R(T ) от начала координат, либо симплекс, содержащий начало координат.

В первом случае необходимо увеличить текущее значение T. Во втором случае имеет место включение 0 co R(T ) и либо 0 R(T ), либо нет. Если 0 R(T ), то следует увеличить текущее значение T. В противном случае T Tопт, поскольку f (0) = 0.

Пусть симплекс = [z 1,..., z n+1 ] Sl с вершинами z i R(T ), 1 n + 1, такой, что i i (t) (t [0, T ]) экстремальные управления, под действием которых 0. Обозначим через u система (1) переходит из начального состояния в точки z i, 1 i n + 1.

Предположим, что T Tопт. Тогда, если 0 внутренняя точка симплекса, в силу непре рывности отображения : U R(T ), заданного системой (1), T Tопт и найдутся та n+ кие неотрицательные действительные числа i i = 1, что под действием управления 0, i= n+ i ui (t) (t [0, T ]) система (1) перейдет в начало координат. Если 0 не является u = u (t) = i= внутренней точкой симплекса, то T = Tопт и 0 совпадает с одной из вершин симплекса.

Пусть 0 co R(T ) и 0 R(T ). Тогда точка z R(T ), имеющая минимальную норму, при надлежит внутренности симплекса. Поэтому найдутся такие неотрицательные действительные n+1 n+ i ui (t) (t [0, T ]) система числа i i = 1, что под действием управления u = u (t) = 0, i=1 i= (1) перейдет в точку z.

Однако, построения всех симплексов всех слоев до некоторого k0 l не требуется. Как будет показано ниже, достаточно ограничиться построением конечной последовательности смежных n-мерныx симплексов { k }, k Sk (k = 0, l 1), обладающих свойством ( k ) ( k+1 ), где ( k ) расстояние от начала координат до n-мерного симплекса k.

Основываясь на вышеизложенном, предлагается алгоритм решения нелинейной задачи оптимального быстродействия, дающий -оптимальное решение за конечное число итераций.

Формальное описание алгоритма сделано в следующем разделе.

2. Алгоритм решения задачи k-ое приближение оптимального времени Tопт ;

через c(k) Обозначим через Tk k-ое при ближение оптимального значения начального условия сопряженной системы n fj (x) i = j (t), i = 1, n;

(3) xi j= через x(Tk, uп ) – решение системы (1) в момент времени t = Tk при экстремальном управлении uп = uп (t) (t [0, Tk ]), т. е. управлении, удовлетворяющем принципу максимума Понтрягина [2]:

uп (t) = arg max( п (t), B(t)u), (4) uU решение сопряженной системы (3) с начальным условием (0) = c(k) ;

через TL и TR где п правый и левый конец отрезка локализации оптимального времени T опт ;

k номер итерации.

Алгоритм (k) := c := x ;

p := 0;

T := 0;

T := M, где M Шаг 1. k := 0;

Tk := 0;

c достаточно L R x большое число.

Шаг 2. k := k + 1. Интегрируя совместно системы (1), (3) с начальными условиями x(0) = x0, (0) = c(k1) при экстремальном управлении uп, находим x(Tk1, uп ) и п (Tk1 ). Если (c, x(Tk1, uп )) 0, то полагаем Tk := Tk1 и переходим к шагу 4. В противном случае пола p (t) := uп (t)(t [0, T p p п п гаем p := p + 1;

u k1 ]), c := (Tk1 ), z := x(Tk1, u ) и i) Шаг 3. Если хотя бы для одного i, 1 p имеем (c, z 0, то полагаем Tk := Tk1 и i переходим к шагу 5. Интегрируем совместно системы (1), (3) с начальными условиями x(T k1 ) = z i, (Tk1 ) = ci при экстремальных управлениях ui (t) = arg max( i (t), B(t)u) (t [Tk1, Tk ]), uU TR, при котором выполнено хотя бы одно равенство (c, x(, ui )) = до момента времени t = p. Если такое найдется, то полагаем Tk =, иначе Tk := TR. Затем полагаем 0, 1 i i := x(T, ui );


ci := i (T ) (i = 1, p) и переходим к шагу 5.

z k k Шаг 4. p := p + 1;

up (t) := uп (t)(t [0, Tk ]), cp := п (Tk ), z p := x(Tk, uп ).

Шаг 5. Если z p, где 0 – требуемая точность попадания в начало координат, то -оптимальное время, up (t) (t [0, Tk ]) -оптимальное управление.

задача решена и Tk Шаг 6. Если p n и система линейных алгебраических уравнений (c, z i ) = 1 (i = 1, p) (5) совместна, то находим её решение c и переходим к шагу 10.

Шаг 7. Находим решение 0 = (0,..., 0 ) системы линейных алгебраических уравнений p p p i z i = 0, i = 1. (6) i=1 i= Если мощность множества индексов = {i : 0 0} равна 1, то полагаем i0 = i и переходим i к шагу 9. Если =, то переходим к шагу 11.

Шаг 8. Находим решение = (1,..., p ) задачи квадратичного программирования с линей ными ограничениями p 1 i min i z. (7) p i= i =1, i i= Берем любой индекс i0 {i : i = 0} {i : 0 0}.

i i0 := z p1 ;

z p1 := z p ;

ci0 := cp1 ;

cp1 := cp ;

ui0 (t) := up1 (t), Шаг 9. Полагаем z up1 (t) := up (t) (t [0, Tk ]), p := p 1 и переходим к шагу 6.

Шаг 10. Интегрируем совместно системы (1), (3) в обратном времени от Tk до 0 с граничными условиями x(Tk ) = z p, (Tk ) = c при управлении u = up. Полагаем c(k) := (0) и переходим к шагу 2.

Шаг 11. Полагаем y i := z i, v i (t) := ui (t) (t [0, Tk ]), 1 i n + 1, z := z n+1.

n+ Шаг 12. Полагаем v = v (t) = 0 v i (t). Интегрируем систему (1) при управлении u = v i i= от 0 до Tk и полагаем z = x(Tk, v ).

Шаг 13. Если z, то полагаем TR := Tk, Tk := 0.5(TL + TR ) и, проинтегрировав сов местно системы (1), (3) с конечными условиями x(TR ) = z i, (TR ) = ci в обратном времени при соответствующих экстремальных управлениях до момента времени Tk, получим z i = x(Tk, ui ), ci = (Tk ), 1 i n + 1. Затем переходим к шагу 7. В противном случае n+ ci 0 i и переходим к & z z Шаг 14. Если z, то полагаем TL := Tk, c := i c i= шагу 10.

Шаг 15. Находим решение,..., системы линейных алгебраических уравнений 1 n+ n+1 n+ i i y = z, i = 1. (9) i=1 i= Если все то полагаем 0, i = 1, n + 1, i 0 /, := 00 /0, в противном случае переходим к шагу 16. Да i0 := arg min i i i i {i=1,n+1: 0} i полагая y i0 := z, 0 :=, i = 1, n + 1 и i = i0, 00 :=, v i0 (t) := v (t) (t [0, Tk ]), лее, i i i i z, перeходим к шагу 12.

z := Шаг 16. Находим минимальное такое число, 0 1, что для каждого 0 + (1 ) := 0 + (1 ), i = 1, n + 1, 0. Далее, полагаем i i = 1, n + 1: i i i i 0 /, y i0 := z, z := z. Затем находим решение (0,..., 0 ) системы i0 := arg min 1 n+ i i {i=1,n+1: 0} i уравнений (9) при z = 0 и переходим к шагу 12.

3. Доказательство сходимости Пусть = [z 1,..., z p ] есть (p 1)-мерный симплекс, где z i Rn (i = 1, p ;

p n + 1).

Лемма 1 [1]. Система линейных алгебраических уравнений (5) несовместна тогда и только тогда, когда совместна система линейных алгебраических уравнений (6).

Лемма 2 [1]. Пусть (0,..., 0 ) решение системы (6), причем 00 0, p 1 i i0 и 0 лежат в разных полупространствах относительно любой (i0 {1,..., p}). Тогда точки z гиперплоскости вида (c, x) = 1, проходящей через точки z i, (i = i0 ;

i = 1, p).

p Лемма 3 [1]. Пусть () x, x [z 1,..., z p ], x i z i, = = = i= p 0, и пусть (0,..., 0 ) решение системы (6), причем 01,..., 0l 0. Тогда i = 1, i p 1 i i i= среди чисел i1,..., il найдется по крайней мере одно число, равное нулю.

Лемма 4. Пусть 0 int = [z 1,..., z n+1 ], где n-мерный симплекс, и z = 0 про n. Тогда среди вершин симплекса найдется такой набор z i1,..., z in, что извольная точка из R 0 = [z i1,..., z in, z ].

Лемма 1 обеспечивает корректность перехода от шага 6 к шагу 7 алгоритма. В силу шага 8, шага 9 алгоритма и леммы 2 сохраняется монотонность расстояния от симплекса до начала координат и совместность системы (5), так как 00 0 (см. лемму 1). Лемма 3 обеспечивает i сохранение монотонности указанного выше расстояния после шага 7 в случае, когда только одна компонента решения системы (6) отрицательна, и совместность системы (5). Лемма 4 гарантирует принадлежность начала координат симплексам, получаемым на шагах 12–16 алгоритма.

Теорема 2 (о сходимости). Для любого 0 алгоритм сходится за конечное число итераций к -оптимальному решению.

Список литературы [1] Шевченко Г.В. Численный алгоритм решения линейной задачи оптимального быcтродей ствия. Ж. вычисл. матем. и матем. физ. 2002, т. 42, № 8, с. 1184–1196.

[2] Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая тео рия оптимальных процессов. М.: Наука, 1969.

NUMERICAL ALGORITHM FOR SOLVING NONLINEAR TIME OPTIMAL CONTROL PROBLEM OF THE SPECIAL FORM G.V. Shevchenko Sobolev Institute of mathematics, Siberian Branch of the Russian Academy Sciences e-mail: shevch@math.nsc.ru Abstract. Nonlinear time-optimal control problems, whose the right part is divided by state and control with the linear control, are considered. An iterative numerical algorithm for its solving has been proposed. The convergence of the algorithm has been proved Key words: admissible control, optimal control, simplex, adjacent simplex, simplex overlapping.

УПРАВЛЯЕМОСТЬ И НАБЛЮДАЕМОСТЬ ВЫРОЖДЕННЫХ ЛИНЕЙНЫХ ГИБРИДНЫХ СИСТЕМ A.A. Щеглова Институт динамики систем и теории управления СО РАН, Иркутск Аннотация. Рассматривается линейная система уравнений с непрерывно-дискретным временем с постоянными матрицами коэффициентов, неразрешенная относительно производной непрерыв ной составляющей искомой вектор-функции. В терминах входных данных получено необходимое и достаточное условие разрешимости начальной задачи, а также обоснованы алгебраические критерии полной наблюдаемости и управляемости такой системы. Доказан аналог теоремы дуальности Калмана.

Ключевые слова: гибридная система, алгебро-дифференциальная система, разрешимость, наблюдаемость, управляемость, система с непрерывно-дискретным временем Введение В данной статье рассматривается система уравнений с непрерывно-дискретным временем Ax (t) = Bx(t) + Ck yk + Kk uk (t), t Tk = [tk, tk+1 ), k = 0, m;

(1) k yk = Dk1 x(tk1 ) + Gk1,i yi + Hk vk, k = 1, m;

(2) i= zk (t) = Uk x(t) + Vk yk, t Tk, k = 0, m, (3) с заданными начальными условиями x(t0 ) = a, y0 = b. (4) Здесь t0 t1... tm+1 ;

(n n)-матрицы A, B и матрицы Ck, Dk, Gk,i, Kk, Hk, Uk, Vk размеров соответственно ns, sn, np, sp, ln, ls известны;

x(t) – n-мерная функция непрерывной составляющей, yk Rs – дискретная составляющая вектора состояния системы;

a Rn и b Rs – заданные векторы;

uk (t), vk – p-мерные векторы управления;

zk (t) – выход. Гибридная система (1), (2) названа вырожденной, поскольку предполагается, что определитель матрицы A равен нулю: det A = 0.

Основой для анализа послужила теория левых регуляризирующих операторов (ЛРО), раз витая для линейных систем дифференциальных уравнений, неразрешенных относительно произ водных [1], называемых алгебро-дифференциальными системами (АДС).

Для управляемых линейных АДС с постоянными и переменными матрицами коэффициентов алгебраические критерии полной управляемости и наблюдаемости, а также аналог теоремы дуальности Калмана были получены в [2], [3].

1. Существование решения Все результаты, о которых речь пойдет далее, доказаны в предположении, что для соответ ствующей системы Ax (t) = Bx(t) + f (t), t T = [t0, tm+1 ], (5) Работа выполнена при поддержке программы Президиума РАН №19 (проект 2.5) (f (t) – достаточно гладкая на T вектор-функция) на T определен ЛРО. Под ЛРО для АДС (5) следует понимать оператор r dj L= Lj, (6) dt j= ( где Lj – (n n)-матрицы ) такой, что L [Ax (t) Bx(t)] = x (t) Bx(t) x(t) Cr+1 (T ). Необхо димым и достаточным условием наличия у АДС с постоянными коэффициентами ЛРО является регулярность пучка матриц A B [1].

О п р е д е л е н и е 1. Решением задачи (1), (2), (4) будем называть набор векторов y0, y1,..., ym Rs и n- мерную вектор-функцию x(t) C1 (Tk ), k = 0, m, которые удовлетво ряют уравнениям (1), (2) при любых t Tk, k = 0, m, а также условиям (4). При этом для x(t) справедливо представление 1 (t) x(t) = Q(t) = Q, 2 (t) в котором Q – невырожденная (n n)-матрица, d-мерная вектор-функция 1 (t) непрерывна на T = [t0, tm+1 ], d – размерность пространства решений соответствующей системы (5).

Т е о р е м а 1. Пусть пучок матриц A B регулярен, Kk = O, Hk = O, k = 0, m. Реше ние задачи (1), (2), (4) существует и единственно тогда и только тогда, когда выполняются равенства a (AL0 E)Ba = (AL0 E)C0 b, E (1 ;

2 ) = O, (7) b где L0 – первый коэффициент ЛРО (6) для АДС (5), – любая полуобратная матрица для матрицы B O... O O C2 R2,1 O B... O = diag{AL0 E;

... ;

AL0 E}. ;

....

.....

.....

Cm Rm,1 Cm Rm,2... Cm Rm,m1 B 1 = diag{AL0 E;

... ;

AL0 E} diag{C1 ;

C2 ;

... ;

Cm } colon{R1,0 ;

R2,0 ;

... ;

Rm,0 }, 2 = diag{AL0 E;

... ;

AL0 E} diag{C1 ;

C2 ;

... ;

Cm } colon{S1 ;

S2 ;

... ;

Sm };

k S0 = E s, Sk = Gk1,j Sj, Rk,k1 = Dk1, k = 1, m;

j= k Gk1,j Rj,i, k = 2, m, i = 0, k 2.

Rk,i = j=i+ 2. Управляемость и наблюдаемость О п р е д е л е н и е 2. Система (1)-(3) называется полностью наблюдаемой на отрезке T = [t0, tm+1 ], если существуют такие значения k : 0 k m + 1 и t : tk t tk+1, k = 0, m, что k k векторы начальных состояний x(t0 ) и y0 можно единственным образом определить по известным на отрезках [tk ;

t ], k = 0, k, выходам (3).

k О п р е д е л е н и е 3. Система (1),(2) называется полностью управляемой на отрезке [t 0, t ] T (t Tk, 0 k m), если для любых значений a, a Rn и b, Rs найдутся управления vk и b достаточно гладкие управления uk (t) (k = 0, k ) такие, что существует решение задачи (1),(2),(4), удовлетворяющее условиям x(t ) = a, yk = b.

Т е о р е м а 2. Пусть пучок матриц AB регулярен и существуют векторы a Rn, b Rs, удовлетворяющие равенствам (7). Для полной наблюдаемости на отрезке T системы (1) - (3) достаточно выполнения условия rank (Hn ;

Kn ) = (m + 1)n + s, где для любого натурального U +V R VS U ( B + C R) UCS U B (B + C R ) U BCS H =, K =,..

..

..

U B 1 (B + C R) U B 1 C S O O... O O R1,0 O O... O R2,0 R2,1 O.

... O R=..

..

....

....

...

Rm,0 Rm,1... Rm,m1 O B = diag{L0 B;

... ;

L0 B}, C = diag{L0 C0 ;

L0 C1 ;

... ;

L0 Cm }, S = colon{S0 ;

S1 ;

... ;

Sm }.

Т е о р е м а 3. Пусть выполнены условия теоремы 2. Для того чтобы система (1) - (3) была полностью наблюдаема на T, необходимо и достаточно выполнения равенства rank Hn (t);

Kn (t) = n + s хотя бы для одного набора значений tk [tk, tk+1 ], k = 0, m. Здесь V U UC UB H (t) = X(t) G + (t) C R G + S + U B C RG + S,...

...

UB U B 1 C V U UC U B (t) = X(t) (E + (t) C R) + R G, K U BC......

UB U B 1 C 1 G = diag{E;

E X G X} diag{O;

} C S, 1 G = diag{E;

E X G X} colon{E;

F }, Xk (t) = exp (L0 B(t tk )), k = 0, m, X(t) = diag{X0 (t);

X1 (t);

... ;

Xm (t)}, t t t 1 1 (t) = diag X0 ( )d ;

X1 ( )d ;

... ;

Xm ( )d, t0 t1 tm O O... O O En O... O O G2 R2,1 En... O O G=,....

....

....

...

Gm1 Rm1,1 Gm1 Rm1,2... En O tk+ Xk ( )d L0 Ck, k = 2, m 1, Gk = tk F = colon{En ;

L0 C1 R1,0 ;

... ;

L0 Cm1 Rm1,0 }, X = diag{X0 (t1 );

X1 (t2 );

... ;

Xm1 (tm )}, t1 t2 tm 1 1 = diag X0 ( )d ;

X1 ( )d ;

... ;

Xm1 ( )d, t0 t1 tm t2 tm 1 = diag En ;

X1 ( )d ;

... ;

Xm1 ( )d.

t1 tm Теорема о существовании и единственности решения также как и достаточный критерий пол ной наблюдаемости сформулированы в терминах коэффициентов ЛРО. Вычисление последних по трудоемкости эквивалентно нахождению любой полуобратной (в частности, псевдообратной) матрицы для некоторой матрицы, определяемой входными данными системы, что является с вы числительной точки зрения вполне конструктивной процедурой. Несмотря на то, что в составе матриц, фигурирующих в необходимом и достаточном критерии наблюдаемости, присутствуют матричные экспоненты, их не так сложно найти. Любой пакет типа MAPLE содержит программы вычисления матричных экспонент и интегралов от них.

Исследована также управляемость вырожденной гибридной системы (1)-(2). Показано, что система (1)-(2) эквивалентна в смысле управляемости некоторой невырожденной гибридной системе. Этот факт позволил обосновать достаточный и необходимый и достаточный критерии полной управляемости системы (1),(2). Соответствующие утверждения сформулированы в том же ключе, что и теоремы 1 и 2. При этом, если в уравнениях (1)-(2) отсутствует дискретная составляющая, то достаточный критерий полной управляемости переходит в известный критерий Калмана.

3. Теорема дуальности О п р е д е л е н и е 3. Вырожденная гибридная система AT x (t) = B T x(t) Ck yk+1 + Uk uk, t Tk = [tk, tk+1 ), k = 0, m;

T T (8) m T GT yi+1 + VkT vk, k = 0, m yk = Dk1 x(tk+1 ) + (9) i,k i=mk называется сопряженной по отношению к системе (1)–(3), если в последней K k = O, Hk = O, k = 0, m.

T e o р e м а 4. Пусть выполнены все предположения теоремы 2. Система (1)-(3) полностью наблюдаема на отрезке T = [t0, tm+1 ] тогда и только тогда, когда на этом отрезке полностью управляема сопряженная система (8),(9).

Список литературы [1] В.Ф. Чистяков Алгебро-дифференциальные операторы с конечномерным ядром. Новоси бирск: Наука, 1996, 279 с.

[2] В.Ф. Чистяков, А.А.Щеглова Управляемость линейных алгебро-дифференциальных систем.

- АиТ, 2002, № 3, с. 62-75.

[3] А.А. Щеглова Наблюдаемость линейных алгебро-дифференциальных систем. - Оптимиза ция, управление, интеллект, 2002, № 6, с. 135-148.

СONTROLLABILITY AND OBSERVABILITY OF SINGULAR LINEAR HYBRID SYSTEMS A.A. Shcheglova Institute of System Dynamics & Control Theory SB RAS, Irkutsk e-mail: shchegl@icc.ru Abstract. The linear system of discrete-continuous time equations with constant coecients is considered under the assumption that it is unsolved with respect to the derivative of a continuous component part of the desired vector-function. In terms of input data the necessary and sucient solvability condition of the initial value problem is obtained. Algebraic criteria of total observability and controllability for such a system are also substantiated. The analog of Kalman’s duality theorem is proved.

Key words: hybrid system, dierential-algebraic equations, solvability, observability, controllability, discrete-continuous time system ТРУДЫ 13-й Байкальской международной школы-семинара Методы оптимизации и их приложения Том Оптимальное управление 2–8 июля 2005 г.

Иркутск, Байкал Утверждено к печати Институтом систем энергетики им. Л.А. Мелентьева СО РАН Подписано к печати 18 мая 2005 г. Формат 70108 1/16 Уч.-изд.л. - 13. Заказ № Тираж 100 экз.

Отпечатано полиграфическим участком ИСЭМ СО РАН 664033, Иркутск, ул. Лермонтова,

Pages:     | 1 |   ...   | 4 | 5 ||
 





 
© 2013 www.libed.ru - «Бесплатная библиотека научно-практических конференций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.