авторефераты диссертаций БЕСПЛАТНАЯ БИБЛИОТЕКА РОССИИ

КОНФЕРЕНЦИИ, КНИГИ, ПОСОБИЯ, НАУЧНЫЕ ИЗДАНИЯ

<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ


Pages:     | 1 || 3 | 4 |   ...   | 6 |

«Институт проблем управления им. В.А. Трапезникова РАН УПРАВЛЕНИЕ БОЛЬШИМИ СИСТЕМАМИ Выпуск 39 СБОРНИК ...»

-- [ Страница 2 ] --

По-видимому, первым, кто попытался выделить эти две группы, был К.Б. Норкин [24], затем А.О. Егоршин [9] и Л. Глезер [38].

Данные ими определения были скорее интуитивными, мотиви рованными желанием найти «наиболее правильные» 3 постанов ки задач идентификации. Методы первой группы («прямые») в вычислительном отношении более просты, но с ними связан ряд проблем, описанных ниже. Этим вызвано внимание к более слож ным «непрямым» методам.

В статье далее делается попытка уточнить смысл понятия «правильной постановки» задачи идентификации с точки зрения экстремальных свойств целевых функций. В рамках этой про граммы предлагается (по-видимому, впервые) точное определе ние для второй группы («непрямых») методов, и на основании исследования экстремальных свойств устанавливаются частные случаи, в которых «непрямые» методы имеют преимущества по сравнению с методами первой группы.

Кратко опишем особенности «прямых» методов. Для этой группы, насколько известно, точного определения пока не дано.

Имеется следующее описание, данное А. А. Красовским [28, раз дел 5.3]: «Прямыми методами параметрической идентификации»

называются те, в которых «неизвестные параметры... модели определяются на основе того или иного способа (обычно при ближенного) решения системы уравнений, получающихся путем [прямой] подстановки (выделено мной — А. Л.) в оператор мо дели последовательности значений входных и выходных величин Приблизительная формулировка.

Управление большими системами. Выпуск реального объекта». Согласно этому нестрогому определению, к «прямым» относятся методы, основанные на минимизации нор мы «ошибки прогноза» (PEM, «prediction error methods») и их многочисленные модификации, включающие в себя рекуррент ные методы наименьших квадратов по невязке уравнения и их варианты типа алгоритмов стохастической аппроксимации и ал горитмов Качмажа [11, 23, 25, 29, 28, 35, 52], а также методы типа инструментальных переменных [51, глава 8]. Прямые ме тоды идентификации повсеместно употребляются при решении задач адаптивного управления [1, 32]. Для линейных моделей со структурой общего вида B(s) C(s) A(s)[k] = y u[k] + [k] (2) F (s) D(s) (где s — оператор сдвига, и y, u — наблюдаемые перемен ные) целевые функции прямых методов строятся исходя из нор C(s) мы оценки невязки уравнения D(s) [k] или ошибки прогноза C(s) A(s)D(s) [k][23].

Заметим, что идея прямой подстановки измерений в урав нение системы восходит к ставшим уже классическими работам А.Н. Колмогорова [12] и Н. Винера [54]. В этой связи уместно назвать и работу К. Гаусса по методу наименьших квадратов [5].

В применении к идентификации динамических систем пря мые методы при сравнительной простоте вычислительных алго ритмов имеют ограничения: 1) система должна быть управляе мой;

2) длина N интервала наблюдения должна быть большой в сравнении с длительностью переходных процессов в системе [35].

Кроме того, И. И. Перельманом было показано [26], что для прямых методов при конечных N существует проблема боль шого числа локальных экстремумов целевой функции. Наличие локальных экстремумов отмечалось также в [33, 50]. Приведем простейший пример [26]:

y[k] = ay[k 1] + u[k], y [k] = y[k] + [k], u[k] = u[k].

Математическая теория управления Уравнение для ошибки прогноза имеет вид.

[k] = y [k] u[k] a[k 1] + a[k 1] = y.

= [k] + a[k 1], где [k] — измерения. Принимая в качестве целевой функции квадрат нормы ошибки прогноза на конце траектории, получаем.

2 [N ] = aN 1 [1] + aN 2 [1] +... + [N ] = J(a).

Локальные экстремумы определяются из уравнения J = 0, ко a торое может иметь до (2N 3) действительных корней. Оче видно, число корней растет с ростом N, и все они должны рас сматриваться как претенденты на точки глобального минимума.

Этот факт, как пишет И. И. Перельман, «приводит к обоснован ным сомнениям относительно практической разрешимости» по ставленной простейшей задачи идентификации. Трудности толь ко усугубляются, если рассмотреть системы с контурами обрат ной связи, т. е. системы с несколькими уравнениями.

В пределе N вероятность большого числа экстремаль ных точек стремится к нулю [3]. Однако этот факт не снимает от меченных трудностей идентификации «прямыми» методами по конечному множеству наблюдений.

2. Вариационные (непрямые) оценки Решение проблемы локальных экстремумов может быть най дено при переходе к вариационной постановке задачи идентифи кации. В одном частном случае это было показано М. Левиным [42] и М. Аоки, П. Ю [31], которые рассматривали системы (1) из одного уравнения ( r = 1 ) с простой параметризацией. Для идентификации параметров они применяли метод ортогональ ной регрессии [48], целевая функция которого имеет вид отно шения квадратичных форм (22), и как следствие, число экстре мумов ограничивается сверху размерностью вектора параметров (см. раздел 2.1).

Управление большими системами. Выпуск Термины «вариационный метод», «вариационная постановка задачи идентификации» были предложены А.О. Егоршиным [10], который сконструировал один из наиболее эффективных с точки зрения приложений «замкнутый» метод идентификции [9]. Пояс ним примером. Пусть дано наблюдение z RN (r+m). Оценка вектора параметров системы (1) может быть получена миними зацией по функции J() = J(, z ) = z zopt () 2, (3) где zopt () — проекция вектора z на множество всех про цессов системы (1). Величина J() играет роль квадрата рас стояния от «точки» z до множества процессов (1). Функция z () = arg min J(, z ) является примером вариационной (непря мой) оценки. Эффективные алгоритмы ее вычисления были пред ложены в [9, 10].

В этом разделе определим новый класс «вариационных» оценок. Он будет включать в себя большинство известных в лите ратуре непрямых оценок: оценки ортогональной регрессии [48], модифицированные оценки М. Аоки, П. Ю [31], оценки по мето ду вариационной идентификации А.О. Егоршина [9, 10], оценки по модифицированному методу Прони [37, 47], оценки STLS [45] и ряд других, в том числе новых оценок. Общим свойством для всего класса будет независимость следа матрицы ядра целевой функции от оцениваемого параметра. В частности, это свойство позволяет доказывать состоятельность в пределе L по од ной и той же схеме, предложенной в [15]. Одним из полезных побочных результатов будет также описание различных предста вителей класса вариационных методов в единых обозначениях (см. разделы 2.1–2.5).

Перейдем к определениям. Введем матричную запись урав Название не является устоявшимся.

Математическая теория управления нения (1):

G z = 0, (4) 0 1... p 0 1... p G =.........

0 0 1... p R(N p)rN (r+m),.

i = i, = (i,, i, ) Rr(r+m).

. Тогда zopt () = (I ) z, где = G G G G есть матрица проектора ( 2 = ) на ортогональное дополнение к линейному многообразию решений системы (1). С учетом этого обозначения целевая функция (3) принимает вид J() = z z.

(5) Матрицу будем называть ядром целевой функции J().

Пусть — некоторое неизвестное «истинное» значение па раметра системы (1).

Определение 1. Вариационной оценкой параметра по наблюдению z = z +, где z — истинный процесс, — возмущение, называем результат минимизации квадратичной целевой функции.

J(, z ) = z (1, +... + M, ) z, (6) z = () = arg min J(, z ), (7) где все матрицы j = j, 0 являются неотрицательно опре деленными, симметричными, проективными ( 2 = j ) и таки j ми, что верно соотношение (G z = 0) (j, z = 0). Целе вую функцию J(, z ) (6) также называем вариационной.

Можно сказать, что целевые функции, ядра которых есть сумма проекторов, являются вариационными (или проективны ми).

Приведем еще ряд определений, расширяющих понятие ва риационной оценки. Пусть возмущения (1),..., (L) RN (r+m) Управление большими системами. Выпуск являются независимыми одинаково распределенными случайны ми векторами с нулевыми математическими ожиданиями и ска лярной матрицей вторых моментов:

M (i) = 0, M (i) (i) = I.

(8) Тогда имеет смысл следующее определение.

Определение 2. Вариационной оценкой L параметра по множеству наблюдений z(i) = z(i) + (i), i 1, L, где z(i) — истинные процессы, (i) — возмущения (8), называем ре зультат минимизации квадратичной целевой функции L.

JL (, z(1),..., z(L) ) = L z(i) (1, +... + M, ) z(i), (9) i= z L = ((1),..., z(L) ) = arg min JL (, z(1),..., z(L) ), (10) где все матрицы j = j, 0 являются неотрицательно опре деленными, симметричными, проективными ( 2 = j ) и таки- j ми, что верно соотношение (G z = 0) (j, z = 0).

Пусть теперь возмущения (1),..., (L) RN (r+m) являют ся независимыми одинаково распределенными случайными век торами со свойствами M (i) = 0, M (i) (i) =, (11) N (r+m)n — матрица с линейно независимыми столб где R цами.

Определение 3. Вариационной оценкой L параметра по множеству наблюдений z(i) = z(i) + (i), i 1, L, где z(i) — истинные процессы, (i) — возмущения (11), называем результат минимизации целевой функции.

J,L (, z(1),..., z(L) ) = (12) L.

= L1 z(i) (W1, +... + WM, ) z(i), i= z L = ((1),..., z(L) ) = arg min J,L (, z(1),..., z(L) ), (13) где все матрицы Wj, 0 неотрицательно определены, сим метричны и таковы, что верно соотношение (G z = 0) (Wj, z = 0), а произведения Wj = j являются проек тивными матрицами со свойством 2 = j.

j Математическая теория управления В следующем заключительном (наиболее общем) определе нии уже не будем опираться на проективность матриц, а возьмем за основу более общее свойство независимости следа матрицы от оцениваемого параметра. Полученные таким образом оценки уже не обязательно имеют ядро целевой функции в виде суммы проекторов, но доказательство их состоятельности осуществля ется по той же схеме, что и для оценок из определений 2–3 (для оценок с целевой функцией (9) см. в [15]).

Определение 4. Обобщенной вариационной оцен L кой параметра по множеству наблюдений z(i) = z(i) + (i), i 1, L, где z(i) — истинные процес сы, (i) — возмущения (11), называем результат минимизации целевой функции L.

J,L (, z(1),..., z(L) ) = L z(i) U z(i), i= z L = ((1),..., z(L) ) = arg min J,L (, z(1),..., z(L) ), где матрица U 0 неотрицательно определена, симметрична и такова, что верно соотношение (G z = 0) (U z = 0), а след произведения U не зависит от :

Sp U const().

В итоге, определяющим свойством для введенного в этом разделе класса вариационных оценок является независимость следа матрицы ядра целевой функции от оцениваемого парамет ра. Заметим, что все известные нам примеры вариационных оце нок ограничены оценками из определений 2–3, т. е. с проектив ными ядрами.

Определения 2 и 3 по существу не вносят новых идей в поня тие вариационной оценки по сравнению с определением 1. Что бы продемонстрировать конструктивность данных определений, покажем, что ряд известных в литературе оценок являются част ными случаями вариационных из определения 1 ( L = 1 ), а также построим новые оценки.

Управление большими системами. Выпуск Введем обозначения. Из матриц i Rr(r+m) (4) составим матрицу.

= 0 1... p Rr(r+m)(p+1).

(14) Пусть vect — вектор, полученный последовательным выстра иванием транспонированных строк матрицы. Будем предпо лагать, что матрица (14) зависит от вектора параметров аффинным образом:

.

vect = d + D = D, (15) где матрица D Rr(r+m)(p+1)v и вектор d Rr(r+m)(p+1) за.

даны, столбцы составной матрицы D = (d, D) линейно незави.

симы, = 1.

Система уравнений (4) всегда может быть записана в виде G z V vect V D = 0, (16) где знак « » обозначает равенство для всех z RN (r+m), V = V (z) — клеточно-ганкелевая матрица из элементов векто ра z :

Ir v(1)..

.

.

V (z) =, v(i) = z[i]... z[i + p].

(17).

Ir v(N p) Символ обозначает кронекерово произведение матриц, Ir — единичная матрица r r.

Дополнительно предположим:

(А) для всех каноническая форма многочленной мат рицы.

(s) = p, sp + p1, sp1 +... + 0, не имеет тождественно нулевых строк;

это условие при N 2 (p + 1), p 0 равносильно линейной независимости строк числовой матрицы G (4) [14, предложение 4.1];

(Б) степень определителя многочленной матрицы знаменате ля (s) не зависит от параметра :

deg det (s) const,.

(s) = p, sp + p1, sp1 +... + 0, ;

Математическая теория управления (В) степень каждой строки многочленной матрицы знамена теля (s) не меньше степени соответствующей строки много членной матрицы числителя.

(s) = p, sp + p1, sp1 +... + 0, (условие причинности);

степенью строки многочленной матрицы называется наибольшая степень среди образующих эту строку многочленов.

Заметим, что на систему (4) не налагаются условия управля емости и устойчивости. Последнее возможно благодаря конечно сти N.

Ввиду равенства G z = 0 условие j, z = 0 из определе ния 1 позволяет выразить проекторы j, через линейные ком бинации строк матрицы G :

1.

j, = j, j, j, j, = j, Cj, j,, (18) Pj Rnj (N p)r, j, = Pj G, где строки матриц Pj (составленные из коэффициентов линей ных комбинаций) линейно независимы. Последнее вместе с усло вием (А) гарантирует строгую положительную определенность.

матриц j, j, gt;

0 и Cj, = j, j, gt;

0.

Проективная целевая функция (6) с учетом параметризации (15) и тождества (16) принимает вид.

J(, z ) = z (1, +... + M, ) z = (19) M = D V () z Pj Cj, Pj V ()D.

z j= Аналогичное выражение получается для целевой функции J,L (12): по лемме 2 (из приложения) Wj, = G Pj Pj G G Pj Pj G, C,j, Управление большими системами. Выпуск тогда по аналогии с (19) имеем (20) L M J,L = L1 D V ((i) ) z Pj C,j, Pj V ((i) )D.

z i=1 j= Выражения (19), (20) служат основой для построения вычис лительных алгоритмов минимизации (ниже).

2.1. ОЦЕНКИ ОРТОГОНАЛЬНОЙ РЕГРЕССИИ (ОР ) Для идентификации параметров динамических систем (1) М. Левин [42] предложил использовать метод ортогональной ре грессии [48]. Покажем, что возникающая здесь целевая функция будет проективной из определения 1. В принятых выше обозна чениях оценка М. Левина получается заменой матрицы G си стемы (1), (4) на матрицу 0... p 0... p GOR, = =..

.

0 0... p = IM 0 1... p.

Матрица GOR, получена из G вычеркиванием части строк (для простоты обозначений положим, что N кратно p + 1 ). М. Левин рассматривал случай r = 1. Ядро целевой функции (6) принима ет вид 1, +... + M, = (21) 0 0 0 = + +... =....

..

0 0 0 Математическая теория управления 0 = = =....

..

0 0 1.

= GOR, GOR, GOR, GOR, =.

Несложно убедиться, что каждое слагаемое в сумме (21) явля ется проектором ввиду равенств = =. Также =. Поэтому оценка проектором является вся сумма (21): М. Левина принадлежит классу вариационных.

В оценке М. Левина каждая матрица Pj из (19) являет ся строкой из нулей и одной единицы на месте с номером N (j 1) (p + 1) + 1, j 1, M, M = p+1 :

Pj = ( 0... 0 1 0... 0 ).

(j1)(p+1) N p Запись (19) принимает вид:

M D V () z j=1 Pj Pj V ()D z J(, z ) = = D VOR () VOR ()D z z =, (22) D D где матрица VOR () получена прореживанием ганкелевой матри z цы V () (17) — удаляются строки, содержащие элементы, име z ющиеся в других строках.

Устойчивость оценок с целевой функцией вида (22) исследо вали Г. Голуб и Ч. Ван Лоан [39], назвав их оценками TLS (Total Least Squares estimates). Тождественное совпадение оценок TLS Г. Голуба и Ч. Ван Лоана с классическими оценками ортогональ ной регрессии [48] было отмечено в [36].

Управление большими системами. Выпуск 2.2. МОДИФИЦИРОВАННЫЕ ОЦЕНКИ ОРТОГОНАЛЬНОЙ РЕГРЕССИИ (ОРМ ) М. Аоки и П. Ю предложили модифицированный вариант (ОРМ) оценки М. Левина, имеющий локально меньший разброс [31]. В наших обозначениях ядро целевой функции модифициро ванной оценки принимает вид суммы проекторов:

1, +... + N p, = (23) 0 0 = + +...

....

..

0 0 0 0 0..

... +.

.

0 Поэтому модифицированная оценка принадлежит классу вариа ционных. Нули на диагонали есть числа, а клетки имеют размерность (p + 1) (p + 1). Данная сумма уже не является проектором. Число слагаемых N p здесь больше, чем в методе ОР.

Каждая матрица Pj, j 1, N p в оценке ОРМ является j -й строкой единичной матрицы IN p :

Pj = (0... 0 1 0... 0 ).

(24) (j1) N p Выражение (19) принимает вид D V () V ()D z z J(, z ) =.

(25) D D Введенные обозначения позволяют достаточно просто по строить оценку ОРМ для случая нескольких уравнений r 1.

Математическая теория управления Такие многомерные оценки в литературе ранее не встречались.

Ядро целевой функции:

1, +... + N p, = 0 0 0 = + +...

....

..

0 0 0 0 0... +,..

.

0.

R(r+m)(p+1)(r+m)(p+1), = j, R(r+m)(N p)(r+m)(N p).

0 R(r+m)(r+m), Матрицы Pj (24) клеточные:

Pj = (0... 0 1 0... 0 ) Ir+m.

(26) (j1) N p Целевая функция (19) записывается следующим образом:

N p J(, z ) = D Vj () z Vj () D = z j= = D V () CM, V ()D, z z (27).

= IN p CM,.

2.3. ОЦЕНКИ ПО МЕТОДУ ВАРИАЦИОННОЙ ИДЕНТИФИКАЦИИ (ВИ ) И ПО МЕТОДУ GTLS Более сложным в вычислительном отношении является ме тод вариационной идентификации А. О. Егоршина [9];

его мно гомерный вариант при r 1 изложен в [10]. С точки зрения Управление большими системами. Выпуск разброса оценок при случайных возмущениях этот метод лучше ОР и ОРМ [19]. Целевая функция метода ВИ при L = 1 есть (9) с ядром.

1, =... = M, = = G G G G.

Формально M = 1, P1 = I, (28).

C1, = C = G G.

Тогда (19) принимает вид J(, z ) = D V () C V ()D.

z z (29) Следует упомянуть также метод идентификации GTLS (Global Total Least Squares), предложенный позже Б. Роордой и К. Хейджем [49]. По целевой функции этот метод совпадает с методом ВИ, поэтому также принадлежит классу вариационных.

2.4. ОЦЕНКИ STLS Оценки STLS (Structured TLS) были предложены Б. Де Му ром [45] как модификация оценок ОР (TLS), учитывающая спе циальную структуру матрицы наблюдений V (z) (17). В случае L = 1, M = 1 эта структура клеточно-ганкелевая. Оценки ОР, модифицированные ОР, оценки метода ВИ являются частными случаями STLS. Нас будет интересовать вопрос, совпадает ли класс оценок STLS с классом вариационных оценок из опреде ления 3.

Задача STLS может быть сформулирована следующим об разом [40]. Пусть матрица V (z) аффинно зависит от элементов вектора z Rn :

z = (z1 ;

... ;

zn ), V (z) = V0 + V1 z1 +... + Vn zn, (30) где матрицы V0,..., Vn заранее известны и фиксированы. Пусть z Rn есть вектор наблюдений с матрицей ковариации RR.

Математическая теория управления Найти минимум min v R1 ( z) z V (z)g() = 0, (31) при условии n zR, R где g() — матрица, аффинно зависящая от Rv :

g() = g0 + g1 1 +... + gv v.

(32) С начала 1990-х гг. задачи STLS активно исследуются за ру бежом. Широкий круг приложений обсуждался в [45]. В [41] установлена тождественность между оценками STLS и оценками по методу CTLS (Constrained TLS) Т. Абатзоглу и Дж. Менделя [30]. Что касается свойств оценок STLS, то авторами [40] дока зана состоятельность многомерных оценок STLS ( g() Rrv ) в предельном случае N для клеточно-ганкелевых матриц V (z). Ниже мы установим состоятельность вариационных оце нок в случае L, и доказав равносильность классов STLS и вариационных, распространим тем самым новое утверждение о состоятельности и на оценки STLS.

Как было отмечено, при L = 1, M = 1 вариационная оценка (7) является оценкой STLS. Покажем, что в общем случае это отношение сохраняется, более того, имеет место совпадение обоих классов оценок. Этот новый результат устанавливает связь между свойствами оценок вариационных и STLS, исследованных независимо разными авторами [7, 9, 15, 22, 31, 37, 40, 45, 46].

Теорема 1. Оценка STLS (30)–(32) является вариационной оценкой (13). И наоборот, вариационная оценка (13) всегда мо жет быть получена как решение некоторой задачи STLS (30)– (32).

Доказательство. См. приложение.

Как следствие этой теоремы, оценки STLS допускают но вые проективные формы записи (12), (20) для целевой функции (31), и все полученные ниже результаты о свойствах вариаци онных оценок — условия единственности, устойчивости, состоя тельности при L и конечных N (теоремы 2–6 далее) — распространяются и на оценки STLS. Необходимые переобозна чения приведены в приложении в доказательстве теоремы 1.

Управление большими системами. Выпуск 2.5. СКАЛЯРНЫЕ ОЦЕНКИ ОРТОГОНАЛЬНОЙ РЕГРЕССИИ ДЛЯ СИСТЕМ ИЗ НЕСКОЛЬКИХ УРАВНЕНИЙ (ОРС ) Введем еще один тип вариационных оценок параметров си стемы (1) из нескольких уравнений ( r 1 ), ранее неизвестный в литературе. По свойствам целевой функции эти оценки наиболее близки к оценкам наиболее простого скалярного ( r = 1 ) метода ОРМ. Назовем эти оценки ОРС, обозначим S. Идея состоит в том, чтобы по одному измерению z идентифицировать парамет ры уравнения с матрицей (14) из r строк так, как бы иден тифицировалась каждая из этих строк по отдельности скалярным методом ОРМ из раздела 2.2. Существенно, что в оценках ОРС учитывается зависимость коэффициентов разных уравнений от общего параметра.

Введем обозначения. В случае r 1 матрица V (z) (17) перестановкой строк приводится к виду V.. V (z) = Ir V,.

0 V v(1)..

где V =. (N p)(p+1)(r+m) R (33).

v(N p) совпадает с матрицей V (z) (17) с r = 1. Обозначим.i ii i 0 1... p = i -ю строку матрицы (14). Тогда соотно шение (15) запишется в виде 1 d1 + D vect =. =.

.. =..

r dr + Dr d1 D1 D. 1 =. = D.

..

.

=...

...

dr Dr Dr Математическая теория управления Оценки ОРС определяются соотношением S = arg min JS (, z ), (34) z z z z. D1 V () V ()D1 Dr V () V ()Dr JS (, z ) = +... +.

Dr Dr D1 D Несложно установить равенство JS (, z ) = D V () CS, V ()D, z z (35)...

CS, = IN p.

. rr 0 Выражение (35) получается из (27) занулением недиагональных элементов матрицы.

Матрицы Pj остаются теми же, что и в методе ОРМ (26).

Убедимся, что оценки ОРС принадлежат классу вариацион ных. Действительно, ввиду соотношений (23), (25), (34) ядро це левой функции JS (, z ) есть сумма проекторов (1) (1) (r) (r) 1, +... + N p, +... + 1, +... + N p,, (i) где проекторы j, получаются из проекторов j, (23) заменой i на строку. Далее см. определение 2.

3. Свойства вариационных оценок Установим условия единственности вариационных оценок (7), (13). Воспользуемся представлениями (18), (19), (20) для це левых функций (6), (12).

Теорема 2. Необходимым и достаточным условием един ственности вариационной оценки (7) параметра системы (4) по невозмущенному наблюдению z = z, G z = 0, является строгая положительная определенность матрицы M.

QM = D Vj (z) Vj (z) D 0, j=.

где Vj (z) = Pj V (z), и матрицы Pj определены в (18).

Управление большими системами. Выпуск Доказательство. Единственность равносильна соотноше нию Rv J( +, z) J(, z).

Из (19) следует равенство J( +, z) J(, z) = M = D Vj (z) Cj,+ Vj (z) D.

j= Здесь учтено равенство Vj (z) (D + d) = 0. Имеет место строгая положительная определенность матриц Cj,+ 0. Поэтому неравенство J( +, z) J(, z) имеет место тогда и только тогда, когда строго положительно определена матрица M D Vj (z) Vj (z) D 0.

j= Теорема доказана.

Теорема 3. Необходимым и достаточным условием един ственности вариационной оценки (13) параметра системы (4) по набору невозмущенных решений z(1) = z(1),..., z(L) = z(L), G z(i) = 0, является строгая положительная определенность матрицы L M.

Q(L),M = L1 D Vj (z(i) ) Vj (z(i) ) D 0.

(36) i=1 j= Доказательство этой теоремы опирается на соотношение (20) и аналогично доказательству теоремы 2.

3.1. УСЛОВИЯ КОРРЕКТНОСТИ ПАРАМЕТРИЗАЦИИ Выясним, как зависит выполнение условия единственности (36) от устроения матрицы D. Согласно (15), матрица D ис пользуется для задания параметризации G.

Математическая теория управления Определение 5 [43]. Пусть Z = z(1),..., z(L) — множе ство наблюдений z(i) таких, что G z(i) = 0. Отождествим множество Z с матрицей z(1)... z(L), тогда G Z = 0.

Параметризация G называется корректной на множе стве наблюдений Z, если для каждого значения параметра \ {} имеет место неравенство G Z = 0.

Дадим обобщение этого определения на случай набора мат.

риц (18) j, = Pj G, j 1, M. Введем обозначения 1, P....

=. =. G = P G.

(37)..

M, PM P Определение 6. Параметризация называется кор ректной на множестве наблюдений Z, если для каждого зна чения параметра \ {} имеет место неравенство.

Z = P G Z = 0.

Предложение 1. Условие единственности (36) выполнено тогда и только тогда, когда параметризация коррект на на множестве наблюдений Z = z(1),..., z(L).

Доказательство. Согласно определению (16), неравенство Z = 0 равносильно неравенству P V (z(1) ).

.

. (D + d) = W (D + d) = 0.

.

P V (z(L) ) W Учитывая соотношения Z = 0, W (D + d) = 0, получаем:

W (D + d) W (D + d) = W D ( ) = 0.

Ввиду произвольности последнее означает, что столбцы мат рицы W D линейно независимы. Следовательно, строго положи Управление большими системами. Выпуск тельно определена матрица L M.

Q(L),M = L1 D Vj (z(i) ) Vj (z(i) ) D = i=1 j= = L1 D W W D 0.

Обратное тоже верно. Предложение доказано.

.

Определение 7. Пусть Z = {z : G z = 0} — линейное многообразие всех решений системы (4). И пусть H — мат рица, столбцы которой образуют фундаментальную систему решений (4) (базис Z ). Параметризация G (или ) называется корректной, если она корректна на множестве Z = H.

Заметим, что параметризация G полностью определя ется системой (4), а параметризация зависит еще и от метода идентификации (ОР, ОРМ, ВИ, ОРС,...), т. е. от набора матриц Pj (37).

Из корректности параметризации следует коррект ность параметризации G. Обратное, вообще говоря, невер но. Установим условия, при которых корректность G рав носильна корректности. В этом случае условия един ственности оценок не будут зависеть от метода идентификации (от набора матриц Pj ).

Z = Определение 8 [15]. Множество наблюдений z(1),..., z(L) Z называем полным, если оно содержит базис многообразия Z.

Покажем, что для оценок ОРМ, ВИ, ОРС условия коррект ности параметризаций G и совпадают. Другими словами, имеет место следующая теорема.

Теорема 4. При полном множестве наблюдений Z = z(1),..., z(L) Z единственность оценок ОРМ, ВИ, ОРС имеет место тогда и только тогда, когда корректна парамет ризация G.

Доказательство. Согласно предложению 1, единственность любой оценки вида (13) равносильна корректности параметриза Математическая теория управления ции, т. е. когда для всех значений параметров \{} имеет место неравенство H = 0. Заметим, что для каждой из P.

оценок ОРМ, ВИ, ОРС соответствующие матрицы P =.

.

PM (26), (28) все имеют линейно независимые столбцы. Поэтому со отношения H = P G H = 0 и G H = 0 для этого случая равносильны. Теорема доказана.

Важно, что условия корректности параметризации G допускают равносильную формулировку в виде ограничений на ранги специальных подматриц из элементов «малой» матрицы (14) [16, 17, 18].

Определение 9 [17]. Если все ненулевые строки матрицы D образуют единичную подматрицу, то параметризация назы вается простой (или правильной ).

В литературе это наиболее часто встречающийся тип пара метризаций.

Замечание 1. Ввиду того, что свойство максимальности ранга устойчиво по отношению к малым изменениям элементов матрицы, для простых параметризаций корректность оказыва ется в пространстве параметров свойством общего положения (этот факт следует из теоремы 4 статьи [17]).

К этому замечанию мы вернемся ниже при обсуждении со стоятельности.

3.2. УСТОЙЧИВОСТЬ z Устойчивость вариационной оценки () (7) прямо следует из результатов статьи [21]. Сформулируем утверждение.

Теорема 5. Пусть выполнено условие единственности из.. теоремы 2, = z z = () (z) = z ), z (, M.

R0 = D Vj (z) Cj, Vj (z) D (38) j= и min (R0 ) — наименьшее собственное число. Тогда + O( 2 ).

min (R0 ) Управление большими системами. Выпуск Верхняя граница для величины остаточного члена O( 2 ) также получена в [21]. Она имеет сложный вид и здесь не приво дится.

Для оценки (13) утверждение об устойчивости аналогично теореме 5. Ввиду соотношения (20) нужно наложить условие единственности из теоремы 3 и заменить матрицу R0 (38) на матрицу L M.

R,0 = L1 D Vj (z(i) ) C,j, Vj (z(i) ) D.

(39) i=1 j= На основании теоремы 5 можно предложить количественные критерии идентифицируемости параметров уравнения (1), осно ванные на вычислении минимального собственного числа матри цы R0 (38) (или R,0 (39)). На практике матрица R0 может быть заменена оценкой R0, получаемой заменой неизвестных истинных значений, z на оценки, zopt [22].

3.3. СОСТОЯТЕЛЬНОСТЬ Прежде изучения свойств оценки на конечных выборках сле дует убедиться в ее состоятельности. В статье [40] была установ лена состоятельность оценок STLS в пределе N по наблю дению одного процесса ( L = 1 ). Здесь рассмотрим предельный случай L наблюдений большого числа процессов конеч ных длин N с независимыми начальными условиями (подлежа щими оцениванию совместно с параметрами уравнения). В этом.

z z случае оценка () (7) переходит в оценку ((1),..., z(L) ) = L (10) или (13), и сильная состоятельность означает сходимость L п. н. в пределе L, где L — одна из точек локаль ного минимума целевой функции. Сформулируем утверждение.

Теорема 6. Пусть выполнено предположение о возмущениях (11). Если (и только если) выполнено условие.

Q(),M = lim Q(L),M 0, (40) L где матрица Q(L),M определена в (36), то вариационная оценка L (13) сильно состоятельна по L, где под L понимает ся одна из точек локального минимума целевой функции (12).

Математическая теория управления Доказательство близко по идее к доказательству теоремы из [15] и полностью будет опубликовано в другой статье.

В ряде случаев оказывается возможным заменить целевую функцию на более простую. Необходимым условием является со хранение состоятельности оценок.

Определение 10. При возмущениях (11) две оценки вида (13) с различающимися наборами матриц..

W1 = {W11,..., WM1 }, W2 = {W12,..., WM2 } называются равносильными по состоятельности, если усло вия (40) для соответствующих наборов W1 и W2 равно сильны. При отсутствии возмущений оценки вида (13) рав носильны по состоятельности в детерминированном смысле, если для них при любых одинаковых множествах невозму щенных наблюдений z(1) = z(1),..., z(L) = z(L) равносильны условия (36).

Заметим, что из равносильности по состоятельности в детер минированном смысле всегда следует равносильность по состоя тельности.

Равносильные по состоятельности оценки могут отличаться асимптотическими свойствами.

Теорема 7. Вариационные оценки ВИ, ОРМ, ОРС (с целевы ми функциями соответственно (29), (27) и (35)) равносильны по состоятельности в детерминированном смысле.

Доказательство. Достаточно заметить, что перечисленные оценки отличаются только матрицами C, CM,, CS, в ядрах целевых функций (29), (27) и (35). Эти матрицы не участвуют в формулировке условий единственности (36).

3.4. СОСТОЯТЕЛЬНОСТЬ И ИДЕНТИФИЦИРУЕМОСТЬ КАК СВОЙСТВА НЕОБЩЕГО ПОЛОЖЕНИЯ Из теорем 4, 6 следует, что при «естественных» предположе ниях о распределении процессов z(i) и возмущений (i) для со стоятельности оценок ОРМ, ВИ, ОРС необходимо и достаточно Управление большими системами. Выпуск выполнить условия корректности параметризации G. По этому, согласно замечанию 1, для простых параметризаций состо ятельность оказывается свойством общего положения. Подобный факт был установлен ранее П. Стойкой, который исследовал пря мые оценки, получаемые методами типа инструментальных пере менных (МИП), и ввел понятие состоятельности в общем поло жении (generic consistency) [51, с. 266]. Оно означает отсутствие состоятельности в точках множества меры ноль в пространстве параметров. Причиной является вырождение матрицы ковариа ции наблюдений [51, с. 272]. В таких точках бесконечно растет и разброс оценок МИП [51, с. 273].

Заметим, что если использовать количественные показатели разброса оценок (например, через детерминант или сингулярные числа матрицы ковариации), то понятие состоятельности в общем положении теряет смысл. Например, пусть считается неприемле мым разброс оценок больше заданного уровня E, тогда отсут ствие состоятельности (идентифицируемости) будет происходить уже на множестве меры 0 (эта мера будет зависеть от E ).

Нарушение корректности параметризации также происходит на множестве меры ноль (см. замечание 1). Введение количе ственных показателей идентифицируемости (раздел 3.2) делает множество неидентифицируемых систем множеством меры 0, и идентифицируемость перестает быть свойством общего поло жения.

3.5. МИНИМИЗАЦИЯ ПРОЕКТИВНЫХ ЦЕЛЕВЫХ ФУНКЦИЙ Минимизация J(, z ) (22) по осуществляется итерациями с обратной матрицей:

.

= A1 B(k),.

(k) =, (41) (k+1) = (10...0), (k)..

A = D VOR () VOR ()D, z z B = D D.

Запись (10...0) означает нормирование вектора с приведе нием первого элемента к единице. Этот алгоритм является мо Математическая теория управления дификацией стандартного способа поиска минимального (соот ветствующего минимальному собственному числу) собственного вектора симметричной матрицы [8, с. 421].

Целевая функция метода ВИ (29) имеет сложный характер изоповерхностей [6, 13]. Применение универсальных алгоритмов минимизации типа Ньютона крайне затруднено из-за их малого радиуса сходимости [44]. Тем не менее, в [9, 10] был найден эф фективный вычислительный метод, основанный на модификации алгоритма (41):

.

= A1 B(k),. (k) (k) =, (42) (k) (k+1) = (10...0),..

A(k) = D V () C(k) V ()D, z z B = D D.

Итерации типа (42) в частном случае однородных систем (1) независимо от А. О. Егоршина использовал М. Осборн [46] и поз же переоткрыл Б. Де Мур [45], применяя их для решения зада чи STLS (см. раздел 2.4). Особенностью итераций Егоршина— Осборна является высокая скорость сходимости в 2–4 итерации в малую окрестность глобального минимума при слабой зависимо сти от начального приближения. Примеры расчетов приведены в [15, 20, 22]. Локальную сходимость итерационной процедуры (42) исследовал В. Г. Демиденко [7].

В методе ОРМ минимизация целевой функции (27) может быть осуществлена итерациями (42) с заменой C = G G на CM, (27) (результаты экспериментальной проверки этого фак та здесь не приводим).

3.6. ЧИСЛО ЭКСТРЕМУМОВ ЦЕЛЕВОЙ ФУНКЦИИ ОРС Для вариационной идентификации параметров систем (1) оценки ОРС оказываются одними из наиболее простых и в то же время состоятельными (теорема 7), с хорошими экстремальными свойствами.

Теорема 8. Число локальных экстремумов целевой функции ОРС JS (, z ) (34) не превосходит r(p + 1)(r + m).

Управление большими системами. Выпуск Доказательство. Из выражения (34) получаем уравнение на.

критические точки функции JS () = JS (, z ) :

r Di V V Di JS () Di V V Di = 2 2 Di Di = 0.

Di Di Di D i i= Обозначим..

ai () = Di V V Di, A i = Di V V D i,..

bi () = Di Di, Bi = Di Di,. ai () Ji () =.

bi () Уравнение на критические точки запишем в виде r 1 V V Ji ()I Di = 0.

D bi () i i= В матричной записи D1... Dr (43) (V V J1 ()I ) D b1 ()..

. =..

..

(V V Jr ()I ) Dr 0 br () W1..

..

=D D = D W D = 0.

.

0 Wr Несложно проверить тождество D W D = 0. Оно показывает, что производная J перпендикулярна направле S () нию, т. е. JS () не зависит от нормы.

Как следует из принятых обозначений, матрица W симмет ричная. Ввиду линейной независимости столбцов матрицы D условие (43) при = 0 означает, что матрица W вырожде на. Отсюда следует необходимое условие существования экстре мальной точки:

i 1, r det V V Ji ()I = 0.

Математическая теория управления Следовательно, число экстремальных точек не превосходит числа rt, где t = (p + 1)(r + m) есть размерность матрицы V V (см. (33)). Теорема доказана.

Будем говорить, что разные уравнения системы (1) парамет ризованы аффинно и независимо, если матрица D из условия (15) имеет клеточно-диагональный вид D11..

D=, (44).

0 Drr r Dii R(p+1)(r+m)vi, vi = v + 1, i= а вектор параметров = (1;

) распадается на r подвекторов i = 1;

i, i 1, r, так что каждая из строк i в матрице (14) системы (1), (4) зависит только от i -го подвектора парамет ров i.

Теорема 9. Пусть разные уравнения системы (1) парамет ризованы аффинно и независимо. Тогда число экстремальных то чек целевой функции ОРС (34) не превосходит r(v + 1), а оценка ОРС S, минимизирующая (34), имеет вид S = 1 ;

... ;

r, S S где каждый из подвекторов i является решением скалярной S ( r = 1 ) задачи ОРМ вида (25):

i = arg min Ji (), S Dii V V Dii.

Ji () =.

(45) Dii Dii Доказательство. В случае независимой параметризации уравнений из выражения (35) ввиду (44) и (33) получаем JS () = JS (1,..., r ) = 1 D11 V V D11 1 r Drr V V Drr r = +... +.

r Drr Drr r 1 D11 D11 Управление большими системами. Выпуск Целевая функция (45) имеет ровно v + 1 критических точек, где v + 1 — размерность вектора, поскольку все такие точ ки являются собственными векторами регулярного пучка матриц Dii V V µI Dii [4, гл.X, п.6]. Отсюда сразу следует утвер ждение теоремы.

4. Заключение После работ А.Н. Колмогорова и Н. Винера [12, 54] в об ласти приложений методов идентификации возобладал подход, основанный на вычислении корреляционных функций наблюда емых сигналов. Это направление со временем стало магистраль ным [1, 23, 29, 32, 35, 51], во многом благодаря ранним работам К. Острема с коллегами [25]. Несмотря на простоту, корреляци онные («прямые») методы идентификации на конечных выборках наблюдений нередко приводили к трудностям в интерпретации результатов ввиду большого числа локальных экстремумов у це левой функции.

Известная работа Я. Виллемса [2] послужила толчком для развития направления, основанного более на идеях аппроксима ции наблюдений, чем на вычислении коэффициентов корреля ций. Эту группу методов мы называем вариационными («непря мыми»). Первые существенные результаты в этой области бы ли получены значительно раньше А.О. Егоршиным [9, 10] и М. Осборном [46]. Развитие этого направления связано с имена ми Г. Голуба, Ч. Ван Лоана [39], Б. Де Мура [45], С. Ван Хуффель, Дж. Вандевалле [53] и мн. др. Непрямые методы идентификации более сложны с точки зрения числа арифметических операций.

В данной статье впервые предложено точное определение для всего класса вариационных методов и рассмотрены их экс тремальные свойства. Показано, что в ряде существенных слу чаев увеличение числа арифметических операций приводит не к усложнению процедуры идентификации, а в конечном счете, на оборот, к ее упрощению, ввиду значительного уменьшения чис ла локальных экстремумов, и как следствие, улучшения свойств сходимости итерационных процедур.

Математическая теория управления Автор благодарит рецензентов за конструктивные замечания, способствовавшие улучшению текста статьи.

Приложение. Доказательство теоремы Первое утверждение теоремы сформулируем более конкрет но. Пусть S, zS — решение задачи (30)–(32). Тогда можно ука.

зать целевую функцию JS (, x) = x WS, x, x = (1;

z ), с яд ром таким, что произведение WS, = S,, = 0 R, есть проективная матрица S, = S,, и при этом S = = arg min JS (, z ). Докажем это утверждение.

Условие V (z)g() = 0 равносильно уравнению [I g()] vect V (z) = 0.

Ввиду соотношения (30) имеем vect V (z) = f + F z, где вектор f и матрица F вычисляются по матрицам V0,..., Vn. Также из (32) следует представление I g() =, = 0 + 1 1 +... + v v, где матрицы 0,..., v вычисляются по матрицам g0,..., gv.

Задачу (31) запишем в виде R1 ( z) min z (f + F z) = 0.

при условии zRn, Rv.1.

Определим векторы x(z) = ( z ) Rn+1, x = x() и матрицы z. 00.

= 0 R, G = f F. Тогда G x = 0, R1 ( z) = z = + ( x), где + = 0 R x — обощенная обратная Мура—Пенроуза [27, 1.b.5.(IV)]. В новых обозначениях задача (31) принимает вид + ( x) min x xRn+1, Rv при условиях G x = 0, (1, 0,..., 0)x = 1.

Управление большими системами. Выпуск Минимизация по x приводит к безусловной задаче минимизации min x G G G G x, v R WS, xopt = I G G G G x.

Матрица WS, является проектором. Поэтому оценка STLS = arg min x WS, x есть вариационная согласно определению 3. Первая часть теоре мы доказана.

Прежде доказательства второй части установим три леммы.

.

Лемма 1. Пусть F XF = = 0 — неотрицательно определенная симметричная матрица со свойством проектора:

2 =. И пусть матрица X неособенная, и столбцы матрицы F линейно независимы. Тогда X = F F.

F XF F XF = Доказательство. Из равенства F XF следует F F XF F XF F = F F XF F, отку да сразу получаем XF F X = X. Учитывая неособенность X, приходим к соотношению F F X = I, т. е. X = F F.

Лемма 2. Пусть W = W 0 — неотрицательно опре деленная симметричная матрица со свойством (Gz = 0) (W z = 0), где G — заданная матрица с линейно независимыми строками. И пусть для заданной матрицы с линейно неза.

висимыми столбцами выполняется соотношение W =, 2 =. Тогда W = G P P G G P P G, где P — некоторая матрица с линейно независимыми строками.

Доказательство. Из симметричности W и свойства (Gz = 0) (W z = 0) следует W = G P XP G, где X — некоторая неособенная матрица. По условию, W W = W.

Математическая теория управления.

После переобозначения P G = F получаем равенство F XF F XF = F XF. По лемме 1 X = F F, тогда W =G P P G G P P G.

Лемма доказана.

Лемма 3. Задача минимизации J = min 1 ( z) z Hz = при условии n zR имеет единственное решение J = zH H H H z, I H zopt = H H H z.

Доказательство. Введем функцию Лагранжа J (z, ) = 1 ( z) z + Hz.

Необходимое условие минимума J = 0, Jz = 0 :

H 2 1 ( z) = 0.

Hz = 0, z Левым умножением последнего уравнения на H получаем = 2 H H H z.

Подставляя в условие минимума, вычисляем zopt = I H H H H z.

Подстановка zopt в J приводит к выражению J =z H H H H z.

Управление большими системами. Выпуск Лемма доказана.

Докажем вторую часть теоремы. Для упрощения обозначе ний положим L = 1, M = 1. В случае L 1, M 1 ход рассуждений остается тем же.

Пусть (12), т. е. J(, z ) = z W z. Матрица W удовлетво ряет условиям леммы 2, поэтому имеет место выражение W = G P P G G P P G для некоторой матрицы P с линейно независимыми строками.

.

Обозначим H = P G, тогда J(, z ) = z H H H H z.

По лемме J(, z ) = min 1 ( z) z H z = 0.

при условии n zR Используя определения (16), (17), всегда можно построить мат рицу V (z) с аффинной параметризацией (30) такую, что верно соотношение H z V (z)vect V (z)D = 0. Осталось заме тить, что для матрицы (из одного столбца).

g() = vect = D = d + D выполнено условие (32). Мы получили, что оценка (13) есть оценка STLS (30)–(32). Теорема доказана.

Литература 1. БУНИЧ А. Л., БАХТАДЗЕ Н. Н. Синтез и применение дис кретных систем управления с идентификатором. – М.:

Наука, 2003. – 232 с.

2. ВИЛЛЕМС Я. От временного ряда к линейной системе // Теория систем. Математические методы и моделирование.

– М.: Мир, 1989. – С. 8–191.

Математическая теория управления 3. ВОРЧИК Б. Г. Единственность оценок максимального правдоподобия параметров стохастических систем (про блема локальных экстремумов) // Автоматика и телемеха ника. – 1984. – № 6. – С. 47–55.

4. ГАНТМАХЕР Ф. Р. Теория матриц. – М.: Наука, 1966. – 576 с.

5. ГАУСС К. Ф. Избранные геодезические сочинения. – Т. 1.

М.: Геодезиздат, 1957. – С. 59–87.

6. ДЕМИДЕНКО В. Г. Разработка и программная реализа ция метода оценки параметров линейных моделей генных сетей. – Магистерская диссертация. Новосибирск: Ново сибирский гос. университет, 2007.

7. ДЕМИДЕНКО В. Г. Восстановление коэффициентов си стем линейных разностных уравнений // Вестник НГУ (Серия: математика, механика, информатика). – 2010. – Т. 10. Вып. 2. – С. 45–53.

8. ДЕМИДОВИЧ Б. П., МАРОН И. А. Основы вычислитель ной математики. – М.: Наука, 1966. – 664 с.

9. ЕГОРШИН А. О. Вычислительные замкнутые методы идентификации линейных объектов // Оптимальные и самонастраивающиеся системы. – Новосибирск, 1971. – С. 40–53.

10. ЕГОРШИН А. О. Метод наименьших квадратов и «быст рые» алгоритмы в вариационных задачах идентификации и фильтрации (метод ВИ) // Автометрия. – 1988. – № 1. – С. 30–42.

11. КАШЬЯП Р. Л., РАО А. Р. Построение динамических сто хастических моделей по экспериментальным данным. – М.: Наука, 1983. – 384 с.

12. КОЛМОГОРОВ А. Н. Интерполирование и экстраполиро вание стационарных случайных последовательностей // Изв. АН СССР. Сер. мат. – 1941. – Т. 5. – С. 3–14. (В кн.:

Колмогоров А. Н. Теория вероятностей и математиче ская статистика. – М.: Наука, 1986. – С. 255–263.) 13. КОСТИН В. И. О точках экстремума одной функции // Управление большими системами. Выпуск Управляемые системы. – Новосибирск: ИМ СО АН СССР, 1984. Т. 24. – С. 35–42.

14. ЛОМОВ А. А. Минимальные описания стационарных ли нейных моделей // Труды Института математики СО РАН.

Модели и методы оптимизации. – Новосибирск: ИМ СО РАН, 1994. Т. 28, – С. 91–117.

15. ЛОМОВ А. А. Идентификация линейных динамических систем по коротким участкам переходных процессов при аддитивных измерительных возмущениях // Известия РАН ТСУ. – 1997. – № 3. – С. 20–26.

16. ЛОМОВ А.А. Параметрическая идентифицируемость линейных стохастических систем по наблюдениям ко ротких отрезков траекторий // Известия РАН ТСУ. – 2002. – № 2. – С. 53–58.

17. ЛОМОВ А. А. Условия различимости стационарных ли нейных систем // Дифференц. уравнения. – 2003. – Т. 39.

№ 2. – С. 261–266.

18. ЛОМОВ А.А. О различимости стационарных линейных систем с коэффициентами, зависящими от параметра // Cибирский журнал индустриальной математики. – 2003. – Т. 6. № 4(16). – С. 60–66.

19. ЛОМОВ А. А. Сравнение методов оценивания парамет ров линейных динамических систем по измерениям корот ких участков переходных процессов // Автоматика и теле механика. – 2005. – № 3. – С. 39–47.

20. ЛОМОВ А. А. Оценка трендов и идентификация динами ки временных рядов на коротких интервалах наблюдения // Известия РАН ТСУ. – 2009. – № 1. – С. 25–37.

21. ЛОМОВ А. А. О локальной устойчивости в задаче иден тификации коэффициентов линейного разностного урав нения // Вестник НГУ. Серия: Математика, механика, ин форматика. – 2010. – Т. 10, вып. 4. – C. 81–103.

22. ЛОМОВ А. А. О количественных априорных показателях идентифицируемости коэффициентов линейных динами ческих систем // Известия РАН ТСУ. – 2011. – № 1. – С. 3– Математическая теория управления 15.

23. ЛЬЮНГ Л. Идентификация систем. – М.: Наука, 1991. – 432 с.

24. НОРКИН К.Б. Поисковые методы настройки управляе мых моделей в задачах настройки параметров объектов // Автоматика и телемеханика. – 1968. – № 11. – С. 61–67.

25. ОСТРЕМ К., БОЛИН Т. Цифровая идентификация линей ных динамических систем на основе данных о нормальном режиме работы // Теория самонастраивающихся систем управления: Труды II Международного конгресса IFAC.

М.: Наука, 1969. – С. 99–116.

26. ПЕРЕЛЬМАН И. И. Методы состоятельного оценивания параметров линейных динамических объектов и пробле матичность их реализации на конечных выборках // Авто матика и телемеханика. – 1981. – № 3. – С. 49–55.

27. РАО С. Р. Линейные статистические методы и их приме нение. – М.: Наука, 1968. – 548 с.

28. Справочник по теории автоматического управления / Под. ред. А. А. Красовского. – М.: Наука, 1987. – 712 с.

29. ЦЫПКИН Я. З. Основы информационной теории иденти фикации. – М.: Наука, 1984. – 336 с.

30. ABATZOGLU T. J., MENDEL J. M. Constrained Total Least Squares // Proc. 1987 IEEE ICASSP (Dallas). 1987. – P. 1485–1488.

31. AOKI M., YUE P. C. On A Priori Error Estimates of Some Identification Methods // IEEE Trans. on Automat. Control.

V. AC-15. 1970. – P. 541–548.

32. ASTROM K. J., WITTENMARK B. Adaptive Control. – 2nd ed. Mineola, New York: Dover Publ. Inc. 2008. – 580 p.

33. BOHLIN T. On the Problem of Ambiguities in Maximum Like lihood Identification // Automatica. – 1971. – V. 7. – P. 137– 146.

34. BROCKETT R. Finite Dimensional Linear Systems. – New York: Wiley, 1970. – 129 p.

35. CHEN H.-F. Recursive Identification of EIV ARMA Processes Управление большими системами. Выпуск // Proceedings of the 17th World Congress IFAC. Seoul, Korea, July 6–11, 2008. – P. 1366–1371.

36. CHENG C.-L., VAN NESS J. W. Statistical Regression with Measurement Error // Kendall’s Library of Statistics, 6, Arnold, – London. 1999. – 262 p.

37. DUPUIS P., SELS T., DRIESEN T., BELMANS R.


Exponential Parameters Measurement Using a Modified Prony Method // Proc. Instrumentation and Measurement Technology Conference. Como, Italy, 18–20 May. 2004. – P. 1590–1594.

38. GLESER L. J. Improvements of the Naive Approach to Estimation in Nonlinear Errors-in-Variables Regression Models // Contemporary Mathematics. V. 112. Statistical Analysis of Measurement Error Models and Applications.

Providence, Rhode Island: AMS, 1990. – P. 99–114.

39. GOLUB G. H., VAN LOAN C. F. An Analysis of the Total Least Squares Problem // SIAM J. Numer. Anal. – 1980. – V. 17, – P. 883–893.

40. KUKUSH A., MARKOVSKY I., VAN HUFFEL S. Consis tency of the Structured Total Least Squares Estimator in a Multivariate Errors-in-variables Model // Journal of Statist ical Planning and Inference. – 2005. – V. 133. No. 2. – P. 315– 358.

41. LEMMERLING PH., MOOR DE B., VANHUFFEL S. On the Equivalence of Constrained Total Least Squares and Structured Total Least Squares // IEEE Trans. on Signal Processing. – 1996. V. 44. No. 11. – P. 2908–2911.

42. LEVIN M. J. Estimation of a System Pulse Transfer Function in the Presence of Noise // IEEE Trans. on Automatic Control.

– 1964. – V. AC-9. – P. 229–235.

43. LOMOV A.A. Correct Parametrizations of Linear Models // Siberian Advances in Mathematics. – 1994. V. 4. – P. 95–113.

44. MAINE R. E., ILIFF K. W. Formulation and Implementation of a Practical Algoritheorem for Parameter Estimation with Process and Measurement Noise // SIAM Journal on Applied Математическая теория управления Mathematics. – 1981. V. 41. No. 3. – P. 558–579.

MOOR DE B. Structured Total Least Squares and L 45.

Approximation Problems // Linear Algebra Appl. – 1993.

V. 188–189. – P. 163–207.

46. OSBORNE M. R. A Class of Nonlinear Regression Problems // Data Representation / Eds. R. S. Anderssen and M. R. Osborne. St. Lucia: University of Queensland Press, 1970. – P. 94–101.

47. OSBORNE M.R., SMYTH G.K. A modified Prony algorithm for fitting functions defined by difference equations // SIAM J. Sci. Statist. Comput. – 1991. – V. 12. – P. 362–382.

48. PEARSON K. On Lines and Planes of Closest Fit to Systems of Points in Space // Phil. Mag. – 1901. – VI. No. 2. – P. 559– 572.

49. ROORDA B., HEIJ C. Global Total Least Squares Modelling of Multivariable Time Series // IEEE Trans. on Automatic Control. – 1995. – V. AC-40. – P. 50–63.

50. SODERSTROM T. On the Uniqueness of Maximum Like lihood Identification // Automatica. – 1975. – V. 11. – P. 193– 197.

51. SODERSTROM T., STOICA P. System Identification. – London: Prentice-Hall, 1989. – 613 p.

52. SODERSTROM T. Errors-in-variables Methods in System Identification // 14th IFAC Symposium on System Identification, Newcastle, Australia, 2006. – P. 1–19.

53. VAN HUFFEL S., VANDEWALLE J. The total least squares problem. – SIAM, Philadelphia, 1991. – 300 p.

54. WIENER N. Extrapolation, Interpolation, and Smoothing of Stationary Time Series with Engineering Applications. NDRC Report to the Services 370, February 1, 1942. – Cambridge:

MIT Press, 1949. – 176 p.

Управление большими системами. Выпуск VARIATIONAL IDENTIFICATION METHODS FOR LINEAR DYNAMIC SYSTEMS AND THE LOCAL EXTREMA PROBLEM Andrei Lomov, Sobolev Institute of Mathematics of the Siberian Branch of RAS, Novosibirsk State University, Novosibirsk;

Cand.Sc., assistant professor (lomov@math.nsc.ru).

Abstract: The problem of a large number of local extrema is considered. This problem arises when using «direct» methods to identify parameters of linear dynamical systems with finite-sample observations. A new class of variational («indirect») parameter estimators is defined by the projectivity property of matrix kernels in the objective function. The variational objective functions are constructed having the number of local extrema not greater than the number of elements in system matrices. We obtain conditions for consistency of variational estimates in the limit of large number of observations of independent finite-length trajectories.

Keywords: parameter identification, difference equations, dynamic systems.

Статья представлена к публикации членом редакционной коллегии Н. Н. Бахтадзе Математическая теория управления УДК 681.5.013;

681.514;

681.511.22;

681.516.42;

681.516. ББК 32.965.4.32.965. CИНТЕЗ АНИЗОТРОПИЙНЫХ СУБОПТИМАЛЬНЫХ РЕГУЛЯТОРОВ ЗАДАННОГО ПОРЯДКА НА ОСНОВЕ ПОЛУОПРЕДЕЛЕННОГО ПРОГРАММИРОВАНИЯ И АЛГОРИТМА ПОИСКА ВЗАИМНООБРАТНЫХ МАТРИЦ Чайковский М.М. (ФГБУН Институт проблем управления им. В.А. Трапезникова РАН, Москва) Рассматривается задача подавления внешних возмущений для линейной дискретной стационарной системы под воздействи ем случайных возмущений с неточно известными распределени ями. Синтезируемый анизотропийный субоптимальный регуля тор представляет собой динамический компенсатор заданного порядка, стабилизирующий замкнутую систему и сохраняющий ее анизотропийную норму ниже заданного порогового значения.

Предлагаемый подход к синтезу анизотропийных регуляторов является новым.

Ключевые слова: дискретные линейные стационарные системы, случайные возмущения, статистическая неопределенность, нор ма, анизотропия, полуопределенное программирование, линей ные матричные неравенства, взаимнообратные матрицы.

Введение Статистическая неопределенность случайных возмущений, рассматриваемая как различие между неточно известным распре делением реального шума измерений и его номинальной модели, Работа выполнена при поддержке РФФИ (грант №11-08-00714-a) и Программы №14 ОЭММПУ РАН.

Чайковский Михаил Михайлович, кандидат физико-математиче ских наук (mmtchaikovsky@hotmail.com).

Управление большими системами. Выпуск может значительно ухудшить качество работы системы управле ния, если применяемая процедура синтеза регулятора основана на определенном законе распределения возмущения и предполо жении, что этот закон известен точно. Подобные ситуации могут также возникать из природного непостоянства условий рабочей среды системы управления. Так, H2 - и H -регуляторы являют ся полностью эффективными лишь при достаточно точном вы полнении базовых гипотез о природе внешних возмущений. Из вестно, что H2 - (или линейно-квадратичный гауссовский) регуля тор может оказаться недостаточно эффективным в случае, если внешнее возмущение представляет собой сильно коррелирован ный шум [23], в то время как H -регулятор, проектируемый для наихудшего случая детереминированного возмущения [24], про являет излишний консерватизм и требует избыточных энергети ческих затрат на управление, если внешнее возмущение пред ставляет собой белый или слабо коррелированный случайный сигнал.

Одна из первых идей, направленных на преодоление указан ного недостатка линейно-квадратичного гауссовского регулятора в случае, когда внешнее возмущение не является гауссовским бе лым шумом, была представлена в работе [39], посвященной неко торой модификации критерия качества. Эта идея привела к раз витию целого класса задач в теории управления — управление системами, чувствительными к рискам [68, 69].

Идеи построения регуляторов, которые сочетали бы поло жительные качества линейно-квадратичных гауссовских (H2 -) и H -регуляторов (т.е. минимизировали линейно-квадратичный критерий качества и были бы достаточно робастны) возникли в начале 1990-х годов. В частности, можно выделить подход, связанный с минимизацией H2 -нормы замкнутой системы при ограничениях на ее H -норму [17], и подход, связанный с мини мизацией функционала H -энтропии при ограничениях на H норму замкнутой системы [49].

Как показано в [29], задача синтеза регулятора, минимизи рующего функционал H -энтропии, до известной степени эк Математическая теория управления вивалентна задаче синтеза оптимального регулятора, чувстви тельного к риску. Множество работ посвящено задачам, связан ным с минимизацией функционала H -энтропии, см. напри мер [26, 34, 36, 50, 70].

Идеи смешанного H2 /H управления, впервые представ ленные в [17], были расширены в [57, 71] на основе разделе ния внешних возмущений на сигналы с ограниченным спектром и ограниченной мощностью и применения смешанного H2 /H критерия качества. Решение задачи стохастического смешанного H2 /H управления для дискретных систем получено в [48].

Во всех перечисленных выше работах применяются методи ки, основанные на решении уравнений Риккати определенного вида, иногда перекрестно связанных. В [40] смешанная H2 /H задача была рассмотрена в терминах неравенств (а не уравне ний) Риккати и решена с помощью выпуклой оптимизации. С тех пор как были разработаны эффективные алгоритмы внутрен ней точки для решения задач выпуклой оптимизации [18, 51, 52], выпуклая оптимизация стала стандартной стратегией анализа и синтеза систем управления. Методы линейных матричных нера венств (ЛМН) зарекомендовали себя, как мощная и гибкая мето дика формулирования проектных требований к разрабатываемой системе и синтеза регуляторов, применимая к широкому спектру линейных задач теории управления [19]. После того как решение задачи синтеза H -регулятора с помощью ЛМН было получено в [27, 35], полуопределенное программирование успешно приме няется для получения эффективных решений многокритериаль ных H2 /H задач управления [13, 15, 20, 33, 46, 54, 58, 60, 62].

Подход к подавлению неопределенных случайных возмуще ний на основе минимаксного управления был предложен в сере дине 1990-х годов С.В. Гусевым в [30]–[32] и впоследствии рас пространен на случай многомерных систем и синтез регуляторов с заданной структурой методами ЛМН в [59]. Вместо точного знания коэффициентов ковариации возмущения, при применении данного подхода требуется лишь, чтобы коэффициенты ковари ации принадлежали известному множеству. Синтезируемый ре Управление большими системами. Выпуск гулятор минимизирует наихудшую возможную асимптотическую дисперсию выхода для всех таких возмущений. Рассматриваемая задача является промежуточной между экстремальными H2 - и H -сценариями синтеза и сводится к задаче робастного управ ления с неопределеностью в сигнале внешнего возмущения [59].


В то же время, другой многообещающий подход на осно ве стохастического минимакса возник из идей И.Г. Владимиро ва, разработавшего анизотропийную теорию стохастического ро бастного управления, представленную в ряде работ [5, 6, 61, 66].

В свете этого подхода, робастность в стохастическом управле нии достигается с помощью явного включения различных сце нариев распределения шума в единый показатель качества, под лежащий оптимизации;

статистическая неопределенность изме ряется в терминах энтропии, и показатель робастного качества можно выбрать так, чтобы количественно охарактеризовать воз можности системы по подавлению наихудшего внешнего возму щения. Главными понятиями анизотропийной теории стохастиче ского робастного управления являются анизотропия случайного вектора и анизотропийная норма системы.

Функционал анизотропии, введенный И.Г. Владимировым, является энтропийной мерой отклонения вероятностного распре деления в евклидовом пространстве от гауссовских распределе ний с нулевым средним и скалярными ковариационными матри цами. Средняя анизотропия стационарной случайной последова тельности определяется как интенсивность анизотропии на еди ницу времени для достаточно длинных сегментов последователь ности. Применительно к случайным возмущениям, действующим на систему, средняя анизотропия характеризует величину ста тистической неопределенности, понимаемой как несоответствие между неточно известным фактическим распределением шума и семейством номинальных моделей возмущения в виде стацио нарного дискретного гауссовского белого шума со скалярной ко вариационной матрицей [22, 66].

Вторым базовым понятием теории И.Г. Владимирова явля ется a-анизотропийная норма дискретной линейной стационар Математическая теория управления ной системы (ДЛСС), количественно определяющая возможно сти системы по подавлению возмущений наибольшим отноше нием мощностной нормы выхода системы к мощностной норме ее входа при условии, что средняя анизотропия входного сигна ла не превышает заданного неотрицательного уровня a [22, 66].

Обобщение анизотропийного анализа робастного качества на ко нечный интервал времени было сделано в [4].

В контексте стохастического робастного управления, направ ленного на подавление потенциально неблагоприятного воздей ствия статистической неопределенности, анизотропийный под ход предлагает важную альтернативу методам синтеза управле ния, основанным на точном знании закона распределения случай ного внешнего возмущения. Минимизация анизотропийной нор мы замкнутой системы в критерии качества приводит к стаби лизирующему регулятору по выходу, который проявляет мень ший консерватизм по сравнению с H -регулятором и являет ся более эффективным при подавлении коррелированных воз мущений, чем H2 -регулятор [22]. Решение задачи синтеза ани зотропийного оптимального регулятора в пространстве состоя ний, полученное И.Г. Владимировым в [67], основано на реше нии трех перекрестно связанных алгебраических уравнений Рик кати, алгебраического уравнения Ляпунова и уравнения отно сительно логарифма детерминанта положительно определенной матрицы. Получаемый в результате решения задачи синтеза оце нивающий регулятор полного порядка (центральный регулятор) является единственным. Расширение этих результатов на класс объектов с параметрической неопределенностью было получено в [7, 42]. Но решение сложных систем перекрестно связанных уравнений требует разработки и применения специальных вы числительных алгоритмов на основе метода гомотопий [21]. Вме сте с тем, применяемая процедура синтеза на основе решения уравнений не направлена на синтез анизотропийных регуляторов пониженного или заданного порядка (а также децентрализован ных и многокритериальных регуляторов, регуляторов с заданной структурой), задачи синтеза которых до недавнего времени были Управление большими системами. Выпуск открыты.

Синтез анизотропийных субоптимальных регуляторов яв ляется естественным продолжением подхода, предложенного И.Г. Владимировым в [67]. Вместо минимизации анизотропий ной нормы системы субоптимальный регулятор стабилизирует замкнутую систему и обеспечивает ограниченность ее анизотро пийной нормы заданным значением, т.е. гарантирует подавление случайных внешних возмущений, средняя анизотропия которых не превосходит известного уровня, с качеством не хуже заданно го. В отличие от синтеза оптимального анизотропийного регуля тора, решение субоптимальных задач синтеза приводит к неко торому семейству регуляторов, таким образом предоставляя до полнительные степени свободы для определения некоторых до полнительных требований к замкнутой системе с целью дости жения желаемого качества управления, например, требования за данного расположения полюсов замкнутой системы для достиже ния желаемого качества переходных процессов. Для решения за дачи синтеза анизотропийного субоптимального регулятора тре буется критерий проверки ограниченности анизотропийной нор мы системы заданным значением. Частотная теорема для ани зотропийной нормы, представленная в [43], является стохасти ческим аналогом известной частотной теоремы для H -нормы ДЛСС под воздействием статистически неопределенных стаци онарных гауссовских возмущений с ограниченной средней ани зотропией. Полученный критерий сформулирован в виде нера венства относительно логарифма детерминанта матрицы, выра женной из решения алгебраического уравнения Риккати, завися щего от скалярного параметра. Аналогичный критерий для дис кретных линейных нестационарных систем (ДЛНС), сформули рованный в виде неравенства, зависящего от дискретного време ни, и разностного уравнения Риккати, получен в [47]. Достаточ ная версия частотной теоремы для анизотропийной нормы была сформулирована в [11, 64, 65] как задача выпуклой оптимиза ции при ограничениях в виде строгого неравенства относительно детерминанта положительно определенной матрицы и ЛМН. Бы Математическая теория управления ло показано, что ограничение на детерминант линейно зависит от квадрата порогового значения анизотропийной нормы, мини мизация которого на выпуклом множестве позволяет вычислять a-анизотропийную норму ДЛСС из решения задачи выпуклой оптимизации [11, 65]. Разработанная процедура анализа являет ся привлекательной с вычислительной точки зрения и легко ре ализуется средствами некоммерческого программного обеспече ния со свободным доступом для выпуклой оптимизации [45, 63].

Предлагаемая вниманию читателя работа направлена на приме нение современной методологии выпуклой оптимизации и по луопределенного программирования к синтезу анизотропийных субоптимальных регуляторов заданного порядка. Анизотропий ные регуляторы являются привлекательной и перспективной аль тернативой H2 - и H -регуляторам в задачах подавления случай ных внешних возмущений с неточно известными распределени ями. В сравнении с решением задачи синтеза анизотропийного оптимального регулятора в пространстве состояний, полученным ранее в [67], новый подход на основе численной оптимизации яв ляется не требует разработки и применения специальных вычис лительных алгоритмов на основе метода гомотопий [21].

Структура работы следующая. В разделе 1 изложена поста новка общей задачи синтеза анизотропийного субоптимального регулятора заданного порядка. В разделе 2 представлено общее решение задачи синтеза. В разделе 3 рассматривается ряд вычис лительных примеров. Заключительные замечания и выводы даны в разделе 4.

ОБОЗНАЧЕНИЯ Множество вещественных чисел обозначается R, множество (n m)-матриц — Rnm. Для комплексной матрицы M = [mij ], M обозначает эрмитово сопряжение этой матрицы M := [m ].

ji Для вещественной матрицы M = [mij ], M T обозначает транс понирование: M T := [mji ]. Для вещественных симметричных N означает, что матрица M N положительно матриц M определена. В блочно-симметричных матрицах символ заме няет блоки, вид которых определяется симметрией. Спектраль Управление большими системами. Выпуск ный радиус матрицы M обозначается (M ) := maxk |k (M )|, где k (M ) — k-е собственное значение матрицы M. Максималь ное сингулярное значение комплексной матрицы M обозначается (M ) := max (M M ). In обозначает единичную матрицу раз мерности (nn), 0nm — нулевую (nm)-матрицу. Размерности нулевых матриц в случаях, когда их нетрудно понять из контек ста, указываться не будут.

Угловое граничное значение матричной передаточной функ ции F (z), аналитической в единичном диске комплексной плос кости |z| 1, обозначается F () := F (ei ).

pm pm H2 и H обозначают пространства Харди (p m) матричных передаточных функций F (z) комплексной перемен ной z, аналитических в единичном диске |z| 1, с ограниченной H2 - и H -нормой соответственно:

1/ tr(F ()F ())d +, F 2 := F := sup (F (z)) = ess sup (F ()) +.

|z| 1. Постановка задачи синтеза Объект управления представлен дискретной линейной ста ционарной моделью P (z) с nx -мерным состоянием X, mw мерным входом возмущения W, mu -мерным входом управления U, pz -мерным управляемым выходом Z и py -мерным измеряе мым выходом Y. Предполагается, что все сигналы представляют собой двусторонние бесконечные векторные дискретные после довательности, связанные уравнениями xk+1 A Bw Bu xk P (z) : zk = Cz Dzw Dzu wk, (1) yk Cy Dyw 0 uk где размерности всех матриц согласованы, pz mw, пара матриц (A, Bu ) является стабилизируемой, а пара (A, Cy ) — детектируе мой.

Математическая теория управления Предполагается, что внешнее возмущение W = (wk )k+ является стационарной последовательностью случайных векторов wk с нулевым средним Ewk = 0, неизвест T ной ковариационной матрицей Ewk wk = W 0 и гауссовской плотностью распределения вероятности p(wk ) := (2)m1 /2 (det W )1/2 exp wk, 2 W где wk 1 = wk 1 wk и E обозначает математическое ожи T W W дание. Обозначим пространство стационарных в узком смысле последовательностей интегрируемых с квадратом случайных век торов [7] через m = {W = (wk )k+ : wk Lm W +}, P P где мощностная норма последовательности случайных векторов W = (wk )k+ определяется как [7, 71] 1/ N 1 E|wk | W := lim P N 2N + k=N и может быть вычислена через спектральную плотность S() этой последовательности:

1/ W = tr S()d.

P 2 Обозначим множество входных сигналов с ограниченной средней анизотропией через m Wa := {W P: A(W ) a}, где 1 mw S() A(W ) = ln det d W 4 P Управление большими системами. Выпуск — функционал средней анизотропии [22, 66].

Задача синтеза — найти регулятор заданного порядка по из меряемому выходу в форме динамического компенсатора k+1 Ac Bc k K(z) : = (2) uk Cc Dc yk с n -мерным состоянием = (k )k+, стабилизирующий замкнутую систему (рис. 1) и гарантирующий некоторый желае мый уровень робастного качества подавления внешних возмуще ний.

Рис. 1. Замкнутая система Известно (см. например [35]), что задачу синтеза динами ческого регулятора заданного порядка можно представить в виде задачи синтеза статического регулятора по выходу, дополнив век тор состояния объекта управления состояниями регулятора:

A 0 Bw 0 Bu A Bw Bu 0 0 0 In Cz Dzw Dzu := Cz 0 Dzw 0 Dzu.

(3) Cy Dyw 0 0 In 0 0 Cy 0 Dyw 0 Реализация замкнутой системы с расширенным объектом управ ления (3) имеет вид AB A Bw Bu Cy Dyw = + K = CD Cz Dzw Dzu A + Bu KCy Bw + Bu KDzw =, Cz + Dzw KCy Dzw + Dzu KDyw где матрица K включает матрицы параметров регулятора:

Ac Bc K :=.

(4) Cc Dc Математическая теория управления Поэтому в дальнейшем мы будем предполагать, что модель объ екта управления (1) представляет собой расширенную реализа цию (3) с n-мерным вектором состояния, и искать анизотропий ный субоптимальный регулятор в виде статической обратной свя зи по выходу (4).

Предполагается, что для расширенного объекта управле ния (3) и регулятора (4) выполняется условие Кимуры [41] ну левого порядка n mu py 0, где в общем случае n = nx + n. Выполнение этого условия гарантирует существование стабилизирующего статического ре гулятора по выходу для расширенной реализации (3).

Пусть Tzw (z) — матричная передаточная функция замкнутой системы от возмущения W к управляемому выходу Z, заданная нижним дробно-линейным преобразованием пары (P, K) :

Tzw (z) = Fl (P, K) = Pzw + Pzu K(Ipy Pyu K)1 Pyw, (5) где A Bw A Bu (6) Pzw (z), Pzu (z), Cz Dzw Cz Dzu A Bw A Bu Pyw (z), Pyu (z).

Cy Dyw Cy Напомним, что a-анизотропийная норма передаточной функции Tzw (z) Hmw количественно характеризует возможности за pz мкнутой системы по подавлению внешних возмущений наиболь шим отношением мощностной нормы выхода этой системы к мощностной норме входа при условии, что средняя анизотропия возмущения не превосходит уровня a [7, 22, 66]:

ZP |||Tzw |||a := sup.

(7) W Wa W P Из [22, 66] известно, что a-анизотропийная норма заданной си стемы F Hmw является неубывающей функцией уровня pz средней анизотропии a, удовлетворяющей неравенству Tzw 2 = |||Tzw |||0 lim |||Tzw |||a = Tzw.

(8) mw a+ Управление большими системами. Выпуск Эти выражения показывают, что H2 - и H -нормы являются пре дельными случаями a-анизотропийной нормы при a 0, +, соответственно.

Общая постановка задачи синтеза анизотропийного субопти мального регулятора заданного порядка следующая.

Задача синтеза. Для заданных объекта управления P с мо делью в пространстве состояний (1), уровня средней анизотро пии a 0 входного возмущения W и некоторого желаемого по рогового значения 0 найти регулятор в виде статической обратной связи по измеряемому выходу uk = Kyk, (9) стабилизирующий замкнутую систему и гарантирующий, что ее a-анизотропийная норма не превосходит порогового значения :

|||Tzw |||a.

(10) 2. Решение задачи синтеза В этом разделе приводится решение общей задачи синтеза регулятора заданного порядка. Для решения задачи синтеза при меняется критерий проверки условия ограниченности анизотро пийной нормы системы заданным пороговым значением для мо дели в пространстве состояний. Этот критерий, называемый ча стотной теоремой для анизотропийной нормы, был недавно пред ставлен в [11, 64]. Чтобы применить данный критерий к задаче синтеза, его требуется переформулировать.

2.1. ЧАСТОТНАЯ ТЕОРЕМА ДЛЯ АНИЗОТРОПИЙНОЙ НОРМЫ В ЗАДАЧЕ СИНТЕЗА Для объекта управления P и регулятора K, определенных выше, реализация замкнутой системы имеет вид AB k+1 k Tzw (z) : =, (11) CD zk wk где k Rn, n = nx + n, AB A + Bu KCy Bw + Bu KDyw =.

(12) CD Cz + Dzu KCy Dzw + Dzu KDyw Математическая теория управления В [64, 65] показано, что для заданных a 0, 0 нера венство (10) выполняется, если существует 2, такое что неравенство (e2a det (Imw BT B DT D))1/mw (13) выполняется для некоторой вещественной (n n)-матрицы = T 0, удовлетворяющей ЛМН AT A + CT C AT B + CT D 0.

(14) BT A + DT C BT B + DT D Imw Условия (13), (14) частотной теоремы для анизотропийной нор мы [64, 65] невозможно непосредственно применить для решения поставленной задачи синтеза из-за перекрестных произведений неизвестной матрицы Ляпунова и матриц реализации замкну той системы (A, B, C, D), аффинно зависящих от K, которые так же возникают в (13).

Преодолеть указанную трудность позволяет введение вспо могательной переменной, вещественной (mw mw )-матрицы = T 0, удовлетворяющей неравенствам (15) (e2a det )1/mw 2, Imw BT B DT D, что эквивалентно (13). Чтобы избавиться от произведений мат риц, B и D, перепишем последнее неравенство в (15) в виде B 1 BT DT Imw 0, D Ipz 1 0, что эквивалентно где Ipz BT DT Imw B 1 (16) D Ipz в силу леммы Шура (см. например [19]).

Чтобы избавиться от перекрестных произведений матриц, A, and B в (14), представим это неравенство в виде + CT C CT D AT (1 )1 AB 0, DT C Imw + DT D BT Управление большими системами. Выпуск где 1 0. В силу леммы Шура, предыдущее неравенство эквивалентно + CT C CT D AT DT C DT D Imw BT 0.

(17) A B Чтобы избавиться от перекрестных произведений матриц C и D, представим неравенство (17) в виде AT C T T DT (I )1 C D B 0 Imw pz A B 1 где Ipz 0. Повторное применение леммы Шура к предыдуще му неравенству и обозначение := 1 приводят к следующей формулировке частотной теоремы для анизотропийной нормы в терминах взаимнообратных матриц.

Лемма 1. Пусть Tzw Hmw — матричная передаточ pz ная функция системы с реализацией (11), где (A) 1. Анизо тропийная норма (7) системы Tzw строго ограничена заданным пороговым значением 0, т.е. |||Tzw |||a, если система нера венств (e2a det )1/mw 2, (18) Imw BT DT B 0 0, (19) D 0 Ipz AT CT 0 Imw BT DT 0, (20) A B C D 0 Ipz 2, 0, 0, (21) разрешима относительно скалярной переменной, веществен ных (mw mw )-матрицы и двух взаимнообратных (n n) матриц,, удовлетворяющих условию = In.

(22) Математическая теория управления Замечание 1. Неравенство (18) представляет собой выпук лое ограничение относительно вспомогательной переменной.

Известно, что 1. Функция (det )p (m m)-матрицы = T 0 является вогнутой по своему аргументу для любого 0 p m [16].

2. Функция (det )1/m (m m)-матрицы = T 0 есть не что иное как среднее геометрическое собственных значений этой матрицы 1/m 1 ()... m ().

3. В [16, c. 105] было показано, что подграфик геометриче ского среднего двух неотрицательных величин, множество (1, 2, t) R3 | x1, x2 0, t 1 представимо в виде конуса второго порядка 1 + (1, 2, t) | : t ;

0,, 1 2 а подграфик геометрического среднего 2l неотрицательных вели чин, множество (1,..., 2l, t) R2l+1 | l 0, i = 1,..., 2l, t (1 2... 2l )1/ i также представимо в виде пересечения конечного числа конусов второго порядка.

4. В [16, c. 147] было показано, что если p — рациональное 1 p m, то выпуклая функция (det ) (m m) число, 0 p T матрицы = 0 представима в виде ЛМН. А именно, мно жество (, t) | = T 0, t (det )p представимо в виде (, t) | = T (1... m )p, 0, 0, t T diag Управление большими системами. Выпуск где — нижняя треугольная (m m)-матрица, составленная из вспомогательных переменных с диагональными элементами i.

(1... m )p представим в Подграфик вогнутого одночлена t виде конуса второго порядка [16, c. 108] и, следовательно, в виде ЛМН.

Замечание 2. Систему неравенств (18)–(21) леммы 1 можно решить с помощью доступных свободно распространяемых про граммных пакетов для решения задач выпуклой оптимизации, позволяющих использовать выпуклую функцию (det())1/m (m m)-матрицы 0 не только в качестве целевой функ ции, но и в качестве ограничения. Такими программными сред ствами являются, например, интерфейс YALMIP [45] в сочета нии с программой-решателем SeDuMi [63] для систем Matlab и Scilab. В интерфейсе YALMIP функции (det())1/m соот ветствует команда geomean, возвращающая среднее геометри ческое собственных чисел положительно-определенной матри цы [45].

Замечание 3. Проверка выполнения условия |||Tzw |||a сводится к поиску положительной скалярной величины и двух взаимнообратных матриц 0, 0, = In, удовлетворя ющих ЛМН (19), (20) и выпуклому ограничению (18). Для чис ленного решения такой задачи могут применяться известные ал горитмы, разработанные в [1, 12, 14, 25, 28, 38, 53, 55, 56] для поиска взаимнообратных матриц, удовлетворяющих выпуклым ограничениям.

2.2. АЛГОРИТМ ПОИСКА ВЗАИМНООБРАТНЫХ МАТРИЦ НА ОСНОВЕ МЕТОДА УСЛОВНОГО ГРАДИЕНТА Взаимнообратные матрицы = T 0, = T 0, = I, удовлетворяющие ЛМН (19), (20) и выпуклому ограни чению (18), можно найти с помощью алгоритма на основе метода условного градиента [8, 14, 55], согласно которому задача (18)– (22) рассматривается как задача минимизации вогнутой целевой Математическая теория управления функции tr ( 1 ) min на множестве,,,, (23) удовлетворяющих ограничениям (18)–(21) и I 0.

(24) I Целевая функция f (, ) = tr( 1 ) является вогнутой по и, ее градиент определяется выражениями [55] = 2.

f (, ) = I, f (, ) Алгоритм состоит из следующих шагов:

Алгоритм 1.



Pages:     | 1 || 3 | 4 |   ...   | 6 |
 





 
© 2013 www.libed.ru - «Бесплатная библиотека научно-практических конференций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.