авторефераты диссертаций БЕСПЛАТНАЯ БИБЛИОТЕКА РОССИИ

КОНФЕРЕНЦИИ, КНИГИ, ПОСОБИЯ, НАУЧНЫЕ ИЗДАНИЯ

<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ


Pages:     | 1 |   ...   | 4 | 5 || 7 | 8 |   ...   | 11 |

«УДК 004 ББК 32.81 М34 Рекомендовано Редакционно-издательским советом ГрГУ им. Я. Купалы. Ред а к ц и он н а я ...»

-- [ Страница 6 ] --

4. Смайт, В. Электростатика и электродинамика / В. Смайт. // М.: Издательство иностранной литера туры, 1954. – 604 с.

Чеб Елена Сергеевна, доцент кафедры математической физики Белорусского государственного уни верситета, кандидат физико-математических наук, доцент Левчук Елена Александровна, студентка 5 курса факультета прикладной математики и информатики Белорусского государственного университета, fpm.levchukEA@bsu.by УДК 517. А. В. МЕТЕЛЬСКИЙ, В. В. КАРПУК АЛГОРИТМЫ СПЕКТРАЛЬНОГО ПРИВЕДЕНИЯ ДИФФЕРЕНЦИАЛЬНОЙ СИСТЕМЫ С ЗАПАЗДЫВАНИЕМ Для линейной автономной системы с соизмеримыми запаздываниями предложены алгорит мы построения динамического дифференциально-разностного регулятора, обеспечивающего замкнутой системе конечный спектр. Обоснован запаздывающий тип замкнутой системы.

Отдельно рассмотрен регулярный случай, когда коэффициенты системы удовлетворяют условию поточечной управляемости. Результаты проиллюстрированы примерами.

1. Постановка задачи Будем изучать линейную автономную дифференциально-разностную систему m Ai x(t ih) + bu(t), x(t) = t 0, (1) i= x(t) = (t), t [mh, 0].

Здесь x n-вектор-столбец решения системы (1) (n 2);

0 h постоянное запаздывание;

постоянные n n-матрицы (i = 0, m);

b постоянный n-вектор;

начальная кусочно Ai непрерывная функция;

u скалярное управление. Векторные величины полагаем записанными в столбец, штрих далее обозначает операцию транспонирования.

Не умаляя общности рассуждений, считаем, что в уравнении (1) b = en = [0;

... ;

0;

1], и что последнее уравнение системы (1) имеет вид xn (t) = u(t). Этого всегда можно достичь невырож денным преобразованием переменных x = T x (T b = en ) и выбором управления в виде m T Ai T 1 x(t ih) + u(t), t 0, u(t) = en i= где u новое управление.

Пусть A() = A0 + A1 +... + Am m ( C множеству комплексных чисел), En единичная матрица n-го порядка, W (p, eph ) = pEn A(eph ) характеристическая матрица (p C), w(p, eph ) = |W (p, eph )| характеристический квазиполином системы (1). Здесь и далее |W | определитель произвольной квадратной матрицы W.

Множество корней = {p C|w(p, eph ) = 0} характеристического уравнения называют [1] спектром системы (1). Поскольку коэффициенты характеристического квазиполинома w(p, eph ) действительны, то комплексные числа входят в сопряженными парами: самосопряженный спектр. Считаем, что спектр исходной системы (1) бесконечен. Возможно ли обратной связью по состоянию систему (1) привести к системе с конечным спектром? Если эта задача разрешима, то систему (1) называют [1] спектрально приводимой.

Основополагающей в проблематике управления спектром системы (1) является работа [2], где сформулирована задача назначения конечного спектра (FSA): требуется регулятором по типу обратной связи обеспечить замкнутой системе произвольный самосопряженный конечный спектр.

Исследования в данном направлении были инспирированы работой [3], в которой задача стаби лизации системы (1) сводится к задаче управления ее собственными движениями (модами) [4]. В работе [2] доказано, что для разрешимости задачи FSA в классе регуляторов с распределенным запаздыванием необходимо, чтобы система (1) была спектрально управляема [4] rank pEn (A0 + A1 eph +... + Am epmh ), b = n p C. (2) Далее было установлено [5], что условие (2) и достаточно для разрешимости задачи FSA в классе регуляторов с распределенным запаздыванием. Численная реализация такого регулятора сложна, поэтому возникает вопрос: каковы возможности управления спектром системы (1) в классе дифференциально-разностных регуляторов?

Задача спектральной приводимости системы (1) в классе дифференциально-разностных ре гуляторов изучалась в [1], где условие (2) достаточно для спектральной приводимости системы (1). Нетрудно видеть [6], что условие (2) не является необходимым для спектральной приводимо сти системы (1). Общий подход к построению регулятора спектральной приводимости предложен в [6]. В частности, там доказано, что для спектрально приводимой системы (1) с одним запазды ванием (m = 1) такой регулятор имеется в классе дифференциальных регуляторов.

Необходимое условие спектральной приводимости системы (1) в классе дифференциально разностных регуляторов обосновано в [1]: равенство (2) может нарушаться только в конечном числе точек, т. е.

множество чисел P = {pi C, i = 1, n1 |rank[W (pi, epi h ), b] n} конечно. (3) Проверка этого условия может быть выполнена [7] посредством вычисления рангов полино миальных матриц, выражаемых через матрицы системы (1).

В работе [1] также показано, что для системы (1) с соизмеримыми запаздываниями условие (3) обеспечивает существование дифференциально-разностного регулятора, приводящего систе му (1) к системе с конечным спектром, но замкнутая система может оказаться нейтрального или опережающего типа. В настоящей работе при наличии условия (3) строится регулятор, приводя щий систему (1) к системе запаздывающего типа с конечным спектром.

Пусть D = d/dt оператор дифференцирования, D оператор сдвига: Di k f (t) = f (i) (t D kh). Замкнем систему (1) динамическим дифференциально-разностным регулятором n u(t) = i (D, D )xi (t) (n (D, D ) D)xn (t), t 0, (4) i= где i (D, D ), i = 1, n, полиномы, подлежащие определению.

Пусть W (p, ) = pEn A() характеристическая матрица, d(p, ) = |W (p, )| харак теристический квазиполином замкнутой системы (1), (4) ( = e ph ). Для системы (1) считаем выполненным условие спектральной приводимости (3).

Задача. Указать схему получения полиномов i (p, ), i = 1, n, при которых замкнутая си стема (1), (4) имеет некоторый конечный спектр и остается системой запаздывающего типа, т. е., будучи записаной в нормальной форме, имеет вид однородной системы (1). Полиномы i (p, ), i = 1, n, требуется выбрать в (4) такими, чтобы d(p, ) = d(p) = (p p1 )... (p pN ), где {pi C, i = 1, N } самосопряженный спектр.

Укажем две схемы приведения системы (1) к системе конечного спектра посредством дифференциально-разностного регулятора.

2. Достаточность условия (3) для спектральной приводимости системы (1) в классе дифференциально-разностных регуляторов (4) Пусть mi (p, ) (i = 1, n) миноры, полученные из первых n 1 строк характеристической матрицы W (p, ) = pEn A() вычеркиванием i-го столбца, тогда w(p, ) = mn (p, )p харак теристический квазиполином ( = eph ) системы (1). Столбец алгебраических дополнений к эле ментам последней строки характеристической матрицы W (p, ) обозначим M (p, ) = W V (p, )b, где W V (p, ) = W 1 (p, )w(p, ) матрица присоединенная к W (p, ). Пусть M (p, ) = [M1 (p, ),..., Mn (p, )], Mi (p, ) = (1)n+i mi (p, ), i = 1, n. (5) Теорема 1. Если выполнено условие (3), то существует векторный полином (p, ) = [1 (p, ),..., n (p, )], обеспечивающий замкнутой системе (1), (4) конечный спектр.

Доказательство. Разлагая характеристический определитель замкнутой системы (1), (4) по последней строке, получаем d(p, ) = 1 (p, )M1 (p, ) +... + n (p, )Mn (p, ). (6) Пусть P1 = {p C, k = 1, µ1 } множество различных чисел таких, что при некотором k k C (точнее: k см. лемму 4 работы [8]) пара (p, k ) решение системы k Mi (p, ) = 0, i = 1, n. (7) Набор P1 содержит инвариантные [8] спектральные значения, которые не ”убираются” дифференциально-разностным регулятором. Это следует из разложения характеристического определителя замкнутой системы по n 1 первым строкам на основании теоремы Лапласа.

Ввиду условия (3) полиномы Mi (p, ), i = 1, n, не имеют [1] общего множителя, зависящего от, поэтому множество P1 конечно. Согласно теореме Гильберта о нулях найдется векторный полином (p, ) такой, что 1 (p, )M1 (p, ) +... + n (p, )Mn (p, ) = d1 (p). (8) Полином µ (p p )lk d1 (p) = k k= имеет корнями все числа P1, найденные из системы (7).

p k Разложение (8) может быть получено с помощью алгоритма Евклида. Рассматривая полино мы Mi (p, ), i = 1, n, как полиномы от с дробно-рациональными коэффициентами, зависящими от p, найдем векторный полином (p, ) с дробно-рациональными коэффициентами от p такой, что (p, )M (p, ) = 1.

Пусть z1 (p) общий знаменатель коэффициентов вектора (p, ). Если степень µ полинома z1 (p) окажется меньше, чем n, то обе части последнего равенства умножим на z(p) = z1 (p)z2 (p), где z2 (p) произвольный полином с действительными коэффициентами степени n µ. В результате получаем 1 (p, )M1 (p, ) +... + n (p, )Mn (p, ) = z(p), (9) где i (p, ) = i (p, )z(p) (i = 1, n) полиномы от p,, z(p) некоторый полином, зависящий только от p, степень которого не меньше, чем n. В силу (6) d(p, ) = z(p), т. е. система (1) спек трально приводима в классе дифференциально-разностных регуляторов (4). Теорема доказана.

Пусть degp ((p, )) наибольшая степень p в полиномах i (p, ), i = 1, n. Ниже (теорема 2) доказано, чтобы замкнутая система (1), (4) имела запаздывающий тип, достаточно в разложении (9) обеспечить неравенство degp ((p, )) deg(z(p)). (10) Неравенство (10) всегда можно обеспечить следующим образом. Так как deg(z(p)) n, то неравенство (10) будет выполнено, если degp ((p, )) n 1. Если степень переменной p полинома i (p, ), i = 1, n 1, в (9) не меньше, чем n 1, то представим его в виде i (p, ) = i (p, )mn (p, ) + i (p, ), где i (p, ), i (p, ) полиномы. Это возможно, т. к. по лином Mn (p, ) = mn (p, ) имеет старший член вида p n1. После указанных преобразований степени полиномов i (p, ), i = 1, n 1, в разложении 1 (p, )M1 (p, ) +... + n (p, )Mn (p, ) = z(p), (11) полученном из (9), относительно p будут не больше, чем n 2. Поскольку n1 = deg(z(p)) n, а полиномы Mi (p, ), i = 1, n 1, относительно p имеют степень не выше n 2, то degp (n (p, )) = n1 n + 1, если n1 2n 3, и degp (n (p, )) n 3, если n1 2n 3, т. е. неравенство (10), где i (p, ) = i (p, ), i = 1, n, выполнено. В результате динамический дифференциально-разностный регулятор n u(t) = i (D, D )xi (t) (n (D, D ) D)xn (t), t 0, (12) i= обеспечивает замкнутой системе (1), (12) характеристический полином z(p).

Замечание 1. Полином z(p) помимо алгоритма Евклида может быть получен через построение базиса Гребнера для системы полиномов Mi (p, ), i = 1, n. Зная полином z(p), полиномы i (p, ), i = 1, n, в (11) с учетом полученных оценок их степеней можно искать методом неопределенных коэффициентов. Далее полагаем, что для соотношения (9) неравенство (10) выполнено.

3. Обоснование запаздывающего типа замкнутой системы (1), (4) Рассмотрим систему (1) с одним запаздыванием (m = 1). В этом случае векторный полином (5) имеет [6] вид M (p, ) = M0 (p) + M1 (p) +... + Mn1 (p)n1.

В работе [6] установлено, что если система (1) (m = 1) спектрально приводима, то найдется векторный полином (p) = [1 (p),..., n (p)] такой, что характеристический полином замкнутой системы (1), (4) имеет вид d(p) = (p)M (p, ) = (p)M0 (p) = z(p). (13) Там же доказано, что замкнутая система (1), (4), записанная в нормальной форме, запазды вающего типа. Таким образом, в данном случае существует динамический дифференциальный регулятор спектрального приведения.

Пусть m 1. Для того чтобы доказать, что замкнутая система (1), (4), записанная в нор мальной форме, запаздывающего типа, приведем некоторые вспомогательные результаты.

Рассмотрим матрицу pEn A0 и присоединенную к ней матрицу B(p):

B(p)(pEn A0 ) = (pEn A0 )B(p) = (p)En, где (p) = det(pEn A0 ) = pn + r1 pn1 +... + rn, p C. Из теории матриц известно [9, с. 94], что B(p) = B0 pn1 + B1 pn2 + · · · + Bn1, B0 = En, rk = k 1 Sp(A0 Bk1 ), Bk = Ak + r1 Ak1 + · · · + rk En, k = 1, n 1, 0 где SpM след матрицы M.

Пусть F (p, ) = B(p)(A1 +... + Am m ). Считая начальную функцию и управление u достаточно гладкими, из уравнения (1) имеем [10] (D)x(t) = F (D, D )x(t) + B(D)bu(t), t 0. (14) Применим оператор (D) к уравнению (14) n 1 раз и получим следующее дифференциальное соотношение для исходной системы управления n n (D)x(t) = F n (D, D )x(t) + F ni (D, D )i1 (D)B(D)bu(t), t (n 1)mh. (15) i= Замечание 2. Конечность спектра системы запаздывающего типа (1) равносильна конеч номерности пространства состояний, начиная с t nmh. Поэтому достаточно обеспечить конеч номерность пространства состояний замкнутой системы для достаточно больших t. Поскольку гладкость решения x однородной системы (1) с возрастанием времени повышается, то предполо жение о достаточной гладкости управления u как функции от x не является ограничительным.

Обозначим V (p) = B(p)b. Чтобы указать в (4) вектор (p, ), обеспечивающий замкнутой системе (1), (4) конечный спектр и характеристический полином z(p), приведем одно утверждение [6].

Лемма 1. Для системы (1) справедливо соотношение n n F ni (p, )i1 (p)V (p) = n (p)M (p, ) p, C.

F (p, )M (p, ) + w(p, ) (16) i= Наряду с замкнутой системой (1), (4) рассмотрим систему (1), замкнутую регулятором u(t) = n (D)1 (D, D )x1 (t)... (n (D)n (D, D ) D)xn (t), (17) где i (D, D ), i = 1, n, полиномы, удовлетворяющие соотношениям (9), (10). Характеристиче ская матрица замкнутой системы (1), (17) такова p a11 () a1n ()...

.........

pEn A() =.

an1,1 () an1,n ()...

n (p)1 (p, )... n (p)n (p, ) Поэтому характеристические квазиполиномы систем (1), (17) и (1), (4) связаны соотношением d(p, ) = |pEn A()| = n (p)d(p, ).

Очевидно, что системы (1), (4) и (1), (17) могут иметь запаздывающий тип только одновременно.

Выясним условия, при которых система (1), (17) имеет запаздывающий тип.

Ввиду (15) в замкнутой системе (1), (17) последнее уравнение можно записать в виде n n (D, D )F ni (D, D )i1 (D)V (D)u(t) = 0, (D, D )F (D, D )x(t) + t 0, (18) i= где (D, D ) = [1 (D, D ),..., n (D, D )].

В силу системы (1) Dk x(t) = Ak (D )x(t) + Ak1 (D )bu(t) + Ak2 (D )Dbu(t) +... + Dk1 bu(t). (19) Обозначим (p, )F n (p, ) = n (g0 () + g1 ()p +... + gµ ()pµ ), (20) n-векторы (i = 0, µ), gµ () = 0. В последнем уравнении замкнутой системы (1), (18) (см.

gi () (18)) (D, D )F n (D, D )x(t) = n (g0 (D ) + g1 (D )D +... + gµ (D )Dµ )x(t), D поэтому с учетом (19) µ µ µ (D, D )F n (D, D )x(t) = gi (D )Ai (D )n x(t) + gj (D )Aji (D )bDi1 n u(t).

D D i=0 i=1 j=i Обозначим µ µ n gj ()Aji ()bpi1 n, (p, ) = (p, )F ni (p, )i1 (p)V (p).

G(p, ) = i=1 j=i i= Применяя к последнему уравнению замкнутой системы (1), (18) (см. (18)) преобразование (19), получаем µ gi (D )Ai (D )n x(t) + (G(D, D ) + (D, D )) u(t) = 0. (21) D i= Чтобы обосновать запаздывающий тип замкнутой системы (1), (18), выясним, когда уравне ние (21) имеет запаздывающий тип. Из (16) получаем (p, )F n (p, )M (p, ) + w(p, )(p, ) = n (p)z(p) p, C. (22) В полиноме G(p, ) степени p могут присутствовать только с коэффициентом вида ()n (() полином). Ввиду (20), (22) в полиноме (p, ) степени p могут присутствовать с числовым коэффициентом и с коэффициентом вида ()n. Полагая = 0 в (22), получаем, что старшая степень p с числовым коэффициентом (т. е. не зависящим от ) в полиноме (p, ) равна n0 = n(n 1) + n1, где n1 = deg( (p, 0)V (p)) = deg(z(p)). Напомним, что z(p) характеристический полином замкнутой системы (1), (4) (deg(z(p)) n).

Теорема 2. Если выполнено условие (3), то существует векторный полином (p, ), обес печивающий спектрально приведенной системе (1), (4) запаздывающий тип.

Доказательство. Замкнутая система (1), (4) имеет запаздывающий тип одновременно с си стемой (1), (17), которая равносильна системе (1), (18). Чтобы замкнутая система (1), (18) имела запаздывающий тип, достаточно в разложении (9) обеспечить неравенство (10), как это показано в разд. 2. Докажем этот факт.

Следуя доказательству леммы 5 работы [6], можно обосновать, что при выполнениии условия (3) старшая степень p с коэффициентом вида ()n в полиноме (p, ) не превосходит старшую степень p с коэффициентом вида () n в полиноме G(p, ) ((), () полиномы). Отсюда, чтобы (21) последнее уравнение системы (1), (18) имело запаздывающий тип, необходимо и достаточно, чтобы в этом уравнении старшая степень p с коэффициентом вида ()n, равная µ 1 или µ k0 2, была меньше, чем n0 = deg(z(p)) + n(n 1) старшая степень p с числовым коэффициентом (т. е. не зависящим от ).

Поскольку µ k0 2 µ 1, то для этого достаточно, чтобы выполнялось неравенство µ 1 deg(z(p)) + n(n 1).

Ввиду (20) µ degp ((p, )) + n(n 1), поэтому последнее неравенство будет выполнено, если имеет место (10). Таким образом, в уравнении (21) дифференциально-разностный оператор, применяемый к u(t), запаздывающего типа. Записав замкнутую систему (1), (18) в нормальной форме, получим систему дифференциально-разностных уравнений запаздывающего типа с характеристическим полиномом d(p) = z(p)n (p). В результате динамический дифферен циально-разностный регулятор (4) обеспечивает замкнутой системе (1), (4) запаздывающий тип с характеристическим полиномом z(p). Теорема доказана.

4. Приведение системы (1) к системе конечного спектра в регулярном случае Вначале изложим некоторые вспомогательные результаты. Рассмотрим матрицу a11 ()... a1n ().........

C() = [b, A()b,..., An1 ()b], где A() = an1,1 ()... an1,n () 0... матрица системы (1).

В работе [11] показано, что для выполнения (2) необходимо, чтобы rank[b, A()b,..., An1 ()b] = n C. (23) Ввиду (23) () = |C()| = 0 C. Под регулярным случаем системы (1) будем понимать выполнение условия (23). Условие регулярности (23), как необходимое, присутствует [2, 11] в критериях для многих видов управляемости системы (1). В частности, оно необходимо для спек тральной [4] и полной [11] управляемости системы (1), является критерием ее поточечной управ ляемости [11]. Если имеет место (23), то условие (3) также выполняется [10], т. е. система (1) спектрально приводима.

Множество корней полинома () обозначим = {i C, i = 1, µ |(i ) = 0}, i их алгебраические кратности.

Запишем матрицу размеров N N (N = n + r, r 0) a11 ()... a1n () 0.....................

an1,1 ()... an1,n () 0... 0... 0 1... 0.

A() =..................

0... 0 0... 0... 0 0... Вычисляя алгебраические дополнения к элементам последней строки матрицы pEN A(), получаем M (p, ) = [M1 (p, ),..., MN (p, )] = [(1)N +1 m1 (p, ),..., (1)2N mN (p, )], где mi (p, ), i = 1, N, миноры к элементам (начиная с первого) последней строки матрицы pEN A().

Легко видеть, что mi (p, ) = (1)r mi (p, ), i = 1, n;

mn+i (p, ) = (1)ri mn (p, )pi, i = 1, r.

Поэтому M (p, ) = [M1 (p, ),..., Mn (p, ), Mn (p, )p,..., Mn (p, )pr ].

Обозначим i (), i = 0, n, коэффициенты характеристического полинома |pEn A()| = 0 ()pn + 1 ()pn1 +... + n ().

Тогда |pEN A()| = 0 ()pN + 1 ()pN 1 +... + N (), где i () = 0, i = n, N.

Пусть 0 1... 0 0... C() = [eN, A()eN,..., AN 1 ()eN ], где A() =.............

0 0... N () N 1 ()... 1 () Обозначим eN = [0;

... ;

0;

1] N -вектор-столбец, C() = [eN, A()eN,..., AN 1 ()eN ].

Нетрудно видеть, что в силу (23) rank eN, A()eN,..., AN 1 ()eN = N C.

Рассмотрим матрицу S() = C()C 1 ().

Учитывая вид [8] этой матрицы, имеем равенство M (p, ) = S()[1, p,..., pN 1 ].

Далее понадобится матрица S 1 () = C()C 1 ().

(24) Замечание 3. Первые n строк и первые n столбцов матрицы S 1 () содержат [8] матрицу 1 (), отвечающую случаю, когда N = n (r = 0), т. е. записанную для матрицы A() = A().

S Матрица S 1 () определена кроме, то есть кроме, возможно, конечного множества зна чений.

Замкнем систему (1) регулятором u(t) = xn+1 (t), xn+1 (t) = xn+2 (t),..., xn+r1 (t) = xn+r (t), (25) xn+r (t) = v (D )x(t) + v (D )(t), t 0.

x Здесь x(t) = [xn+1 (t),..., xn+r (t)] вспомогательные переменные (r 1);

v (D ) = [1 (D ),..., vn (D )], v (D ) = [n+1 (D ),..., vn+r (D )] векторные полиномы, подлежащие опре v v делению. Если r = 1, то уравнения xn+1 (t) = xn+2 (t),..., xn+r1 (t) = xn+r (t) отсутствуют. Если r = 0, то u(t) = v (D )x(t). Таким образом, замкнутая система, как и исходная система (1), запаздывающего типа.

Векторные полиномы v (), v () могут быть получены следующим способом. Рассмотрим наименьшее общее кратное µ ( i )i () = LCM{q11 (),..., q1,n1 ()} = i= знаменателей (общий знаменатель) элементов s11 ()|S()|1,..., s1,n1 ()|S()|1 первой строки 1 ()]1 матрицы S 1 (). Заметим, что строка [S 1 ()]1 равна алгебраическим дополнениям [S к элементам последнего столбца матрицы C(), деленным на () = |C()| (см. формулу (24).

Обозначим = {i C, i = 1, µ |(i ) = 0} множество различных корней полинома ().

Пусть i (p) = p минимальный полином матрицы A(i ), i, Ni + pNi 1 +... + i1 iNi i = 1, µ. Напомним, что i (p) можно найти [9, с. 100] по формуле i (p) = |pEn A(i )|/Gn1 (p, i ), где Gn1 (p, i ) наибольший общий делитель миноров порядка n 1 матрицы pEn A(i ).

Комплексные i входят в сопряженными парами, поэтому полином d0 (p) = LCM{i (p), i = 1, µ} = pn + 1 pn1 +... + n i наименьшее общее кратное полиномов {i (p), i = 1, µ} имеет действительные коэффициенты.

i Если степень n полинома d0 (p) меньше, чем n, то домножим его на полином d(p) с действи тельными коэффициентами степени n n. В частности, можно увеличить кратности i корней i :

d0 (p) = d(p)d0 (p) = pN + 1 pN 1 +... + N, N n.

(26) В работе [8] для регулярного случая системы (1) доказано утверждение.

Теорема 3. Для того чтобы замкнутая система (1), (25) имела характеристический по лином d0 (p) достаточно в регуляторе (25) положить [v (), v ()] = [N () N,..., 1 () 1 ]S 1 () = [S 1 ()]1 d0 (A()), (27) здесь [S 1 ()]1 первая строка матрицы S 1 ().

Полином d0 (p) строится таким образом, чтобы элементы строки (27) были полиномами. Как видно из доказательства леммы 7 в работе [8] для этого достаточно, чтобы полиномами были элементы [S 1 ()]1 d0 (A()). Поэтому если N n, проверяем, нельзя ли уменьшить кратности корней полинома (26) так, чтобы его коэффициенты были действительны и чтобы элементы строки [S 1 ()]1 d0 (A()) оставались полиномами.

5. Примеры Пример 1. Рассмотрим систему управления третьего порядка с соизмеримыми запаздыва ниями 2 2 A() = 2 + 4 1 2 + 2 4, b = 0, h 0. (28) 0 0 Находим характеристический квазиполином ( eph ): w(p, ) = = p(1 + 2 /4, следовательно, задана система с бесконечным спектром.

2p) 1 + 2p + 8 Находим миноры второго порядка, расположенные в первых двух строках характеристи ческой матрицы pE3 A(): m1 (p, ) = (1 + 2p), m2 (p, ) = 2(1 + 2p), m3 (p, ) = (1 + 2p) 1 + 2p + 8 22 /4. Решая систему mi (p, eph ) = 0, i = 1, 3, получаем p = 1/2, т. е. условие (3) спектральной приводимости выполнено. Заметим, что рассматриваемая система не является спектрально управляемой, поскольку условие (23), а значит [11], и условие (2) нарушаются. По изложенной в разд. 2 схеме приведем систему (28) к системе конечного спектра.

Согласно (5) M (p, ) = (1 + 2p)[, 2, 1 + 2p + 8 /4]. Пользуясь алгоритмом Ев клида и учитывая требование deg(z(p)) 3, находим, что в (9) (p, ) = (p p1 )[/2, 1, 1], p произвольное действительное число. Значит, последнее уравнение замкнутой системы (1), (4) с матрицами (28) имеет вид x3 (t) = 1/2(D p1 )D x1 (t) (D p1 )x2 (t) + p1 x3 (t), d(p, ) = (1 + 2p)(1 + 2p)(p p1 ) = z(p) ее характеристический полином (см. (6)). Неравенство (10) здесь выполнено, поэтому замкну тая система имеет запаздывающий тип. Заменяя x(t) согласно (19), получаем последнее уравнение замкнутой системы в виде 1 x3 (t) = (815D +2p1 D +42 )x1 (t)+ (2+4p1 +8D 62 +3 )x2 (t)+(p1 +4D 2 )x3 (t).

D D D D 4 Окончательно, характеристическая матрица замкнутой системы такова 1 p + 2 (1 + 4) 2 (2 + ) p + 2 1 + 4 2(1 + 2) 4.

1 2 ) 1 (2 4p 8 + 62 3 ) p p 4 + 4 (8 + 15 2p1 4 1 Замечание 4. Рассмотренный пример показывает, что условие (3) может иметь место [10] и тогда, когда условие (23) нарушается: () 0.

Пример 2. Рассмотрим систему управления третьего порядка (2 + )2 (2 )3 (1 + ) 1, b = 0, h 0.

1 5+ A() = 0 0 0 Ее характеристический квазиполином ( = eph ):

w(p, ) = p p2 + p 1 5 + 2 + (2 + )2 3 4 + 2, значит, система имеет бесконечный спектр. Миноры второго порядка характеристической мат рицы pE3 A(): m1 (p, ) = (2 + )3 (1 + ), m2 (p, ) = 4 + p 4 + 2, m3 (p, ) = 12 p + p2 4 5p + 172 + p2 83 + 4. Для заданной системы () = |C()| = (2 + )3 (1 + ), т. е. имеет место регулярный случай (23). Поэтому регулятор спектрального приведения можно искать как в виде (4), так и в виде (25). Воспользуемся алгоритмом разд. 4.

Из формулы (24) получаем, что строка [S 1 ()]1 образована алгебраическими дополнениями к элементам последнего столбца матрицы C(), деленными на () = |C()| = (2 + )3 (1 + ).

Поэтому [S 1 ()]1 =, 0, 0 () = (2 + )3 (1 + ).

(2 + )3 (1 + ) Для корней 1 = 1, 2 = 2 полинома () вычисляем минимальные полиномы i (p) матриц A(i ), i = 1, 2. Они соответственно равны {p(6 + p)(1 + p), (7 + p)p}. Отсюда согласно (26) находим характеристический полином замкнутой системы d0 (p) = (6 + p)(1 + p)((7 + p)p)3. (29) Получается, что замкнутая система имеет восьмой порядок, однако опытным путем можно проверить, нельзя ли уменьшить кратности спектральных значений в (29)? Как видно из до казательства леммы 7 в работе [8], для этого достаточно, чтобы полиномами были элементы [S 1 ()]1 d0 (A()). В результате получаем, что замкнутая система может быть третьего порядка с характеристическим полиномом d0 (p) = (1 + p)p2.

Таким образом, в регуляторе спектрального приведения (25) достаточно положить (в данном случае S 1 () = S 1 ()) [v (), v ()] = [3 () 3, 2 () 2, 1 () 1 ]S 1 () = = 4 + 4 2, 14 + 19 + 52 23, 2 5 + 2.

Матрица замкнутой системы (1), (25) имеет вид (2 + )2 (2 + )3 (1 + ) 1.

1 5+ 2 14 + 19 + 52 23 2 5 + 4 + Пример 3. Рассмотрим систему управления третьего порядка с одним запаздыванием 3 5 + 3 3 +, b = 0, h 0.

A() = 0 (30) 0 0 0 Характеристический квазиполином ( = eph ): w(p, ) = (3 + p)p(3 + p + ), значит это система с бесконечным спектром. Находим дополнительные миноры второго порядка m1 (p, ) = 15 5p + p 2, m2 (p, ) = (3 + )(3 + p + ), m3 (p, ) = (3 + p)(3 + p + ) к элементам последней строки матрицы W (p, ) = pE3 A().

0 5 + (3 + )(5 + 2) Матрица C() = [b, A()b, A2 ()b] = 0 3 + 3(3 + ), () = det C() = 1 0 2(3 + )(4 + ). Следовательно, условие (23) и ввиду [10] условие (3) выполняются, поэтому система (1) спектрально приводима. Воспользуемся алгоритмом разд. 2.

Согласно (5) M (p, ) = [15 5p + p 2, (3 )(3 + p + ), (3 + p)(3 + p + )]. По алгоритму Евклида находим [(2 p )/2, (4 + p )/2, 0]M (p, ) = (3 + p)(1 + p).

Поскольку должно быть deg(z(p)) 3, то характеристический полином системы (1), (4) с коэф фициентами (30) возьмем таким d(p) = (3 + p)(1 + p)(p p1 ) = z(p), где p1 произвольное действительное число. В замыкании (4) можно положить (D, D ) = (D p1 )[(2 D D )/2, (4 + D D )/2, 0].

С другой стороны, поскольку данная система с одним запаздыванием, то можно выбрать дифференциальную обратную связь. Из (13) (M0 (p) = (p 3)[5, 3, p 3] ) находим (p) = (p p1 )[1/2, 1/2, 1]. Значит, последнее уравнение замкнутой системы x3 (t) = 1/2(D p1 )x1 (t) + 1/2(D p1 )x2 (t) + p1 x3 (t).

В силу неравенства (10) замкнутая система имеет запаздывающий тип. Заменяя [1/2, 1/2, 0]x(t) согласно (19), получаем последнее уравнение замкнутой системы в виде x3 (t) = (3 p1 D )/2x1 (t) + (3 p1 D )/2x2 (t) + (D 4 + p1 )x3 (t).

Окончательно характеристическая матрица замкнутой системы такова p3+ p3 0.

(3 + p1 + )/2 (3 + p1 + )/2 p + 4 p 6. Заключение В настоящей работе предложены два алгоритма спектрального приведения для системы (1):

в общем случае (см. разд. 2), когда выполняется условие (3), и в регулярном случае (см. разд. 4), когда имеет место условие (23). Условие регулярности (23), как необходимое, присутствует [2, 11] в критериях для многих видов управляемости системы (1). Как видно из алгоритмов спектрального приведения, коэффициенты регуляторов (12), (25) не зависят от значения запаздывания h.

Замкнув систему (1) регулятором (12) или (25), сохраняющим запаздывающий тип замкну той системы, можно полагать, что изучается система управления с конечным спектром. Системы с конечным спектром по сути конечномерные системы, поэтому решение задач анализа и синте за для таких систем упрощается. В частности, для полностью управляемой системы c конечным спектром успокаивающие управления можно строить в классах простейших функций.

Спектр приведенной системы (1), (25) непременно содержит инвариантные значения, если таковые имеются (см. следствие 2 из работы [8]). Для замены инвариантных значений в регулятор следует добавить [2, 5] интегральные члены.

Список литературы 1. Булатов, В. И. Спектральная приводимость систем с запаздываниями / В. И. Булатов // Вестник БГУ, сер.1. – 1979. – № 3. – С. 78–80.

2. Manitius, A. Z. Finite Spectrum Assignment Problem for Systems with Delays / A. Z. Manitius, A. W.

Olbrot // IEEE Transactions on Autom. Control. – 1979. – AC-24, No. 4. – P. 541–553.

3. Осипов, Ю. С. О стабилизации управляемых систем с запаздыванием / Ю. С. Осипов // Дифференц.

уравнения. – 1965. – Т. 1, № 5. – С. 605–618.

4. Bhat, K. P. Modal characterization of controllability and observability of time-delay systems / K. P. Bhat, H. N. Koivo // IEEE Transactions on Autom. Control. – 1976. – AC-21, No. 2. – P. 292–293.

5. Watanabe, K. Finite spectrum assignment problem for systems with multiple commensurate delays in state variables / K. Watanabe, M. Ito, M. Kaneko // Int. J. Contr. – 1983. – Vol. 38, No. 5. – P. 913–926.

6. Метельский, А. В. Спектральная приводимость дифференциальных систем с запаздыванием с помо щью динамического регулятора / А. В. Метельский // Дифференц. уравнения. – 2011. – Т. 47, № 11.

– С. 1621–1637.

7. Метельский, А. В. Задача идентификации в факторизованном пространстве состояний для дифференциально-разностной системы с соизмеримыми запаздываниями / А. В. Метельский // Диф ференц. уравнения. – 1995. – Т. 31, № 8. – С. 1353–1360.

8. Метельский, А. В. Спектральное приведение дифференциальных систем с запаздыванием в регуляр ном случае / А. В. Метельский // Известия РАН. Теория и системы управления. – 2012. – № 6. – С. 3–14.

9. Гантмахер, Ф. Р. Теория матриц / Ф. Р. Гантмахер. – М.: Наука. – 1988.

10. Метельский, А. В. Выделение идентифицируемой и управляемой компонент состояния динамической системы с запаздыванием / А. В. Метельский // Дифференц. уравнения. – 1992. – Т. 28, № 6. – С. 972–984.

11. Марченко, В. М. К теории управляемости и наблюдаемости линейных систем с запаздывающим ар гументом // Проблемы оптимального управлениям / В. М. Марченко. – Минск: Наука и техника. – 1981. – C. 124–147.

Метельский Анатолий Владимирович, профессор кафедры высшей математики № 1 Бело русского национального технического университета, доктор физико-математических наук, профессор, ametelski@bntu.by.

Карпук Василий Васильевич, доцент кафедры высшей математики № 2 Белорусского национального технического университета, кандидат физико-математических наук, доцент, mathematics1@bntu.by.

УДК 51- Л. В. МИХАЙЛОВСКАЯ, О. Б. ПЛЮЩ, Е. В. ДОЛГИН НЕЙРОСЕТЕВОЕ МОДЕЛИРОВАНИЕ РЕФЛЕКСИВНОГО ВЗАИМОДЕЙСТВИЯ С ИСПОЛЬЗОВАНИЕМ ЯЗЫКА R Разработан подход к моделированию рефлексивного взаимодействия, отличающийся от су ществующих тем, что в его основу положена идея взаимодействия нейросетевых агентов, обучающихся в процессе игры и адаптирующихся к изменяющимся условиям внешней среды.

Обоснована теоретическая возможность применения нейронных сетей для модели рования поведения взаимодействующих агентов. Показана возможность программной реализации модели рефлексивной игры с использованием языка R.

Одним из наиболее перспективных направлений, позволяющих решить проблему выбора стратегии поведения субъектом в экономике, является рефлексивный подход, появившийся на стыке психологии и экономики, который дает возможность в ходе управления учитывать особен ности мышления контрагентов и тем самым влиять на линию их поведения [1].

Перспективным и весьма многообещающим является направление использования нейросетей не просто в качестве инструмента анализа данных, а в качестве средства моделирования пове дения агента-покупателя. Обработка данных маркетинговых исследований позволяет разделить покупателей на различные типы, и затем провести обучение нейронных сетей, моделирующих по требительский выбор покупателей каждого типа. На следующем этапе именно эти обученные сети и будут являться объектом анализа. Далее на входы нейросетей подаются различные парамет ры товаров либо рекламной политики, а они моделируют отклик потребителей. По результатам модельных исследований можно судить о возможной реальной ситуации.

Для описания коллективного поведения агентов недостаточно определить их предпочте ния и правила индивидуального рационального выбора по отдельности. В случае, когда агентов несколько, необходимо учитывать их взаимное влияние: в этом случае возникает игра – взаимо действие, в котором выигрыш каждого агента зависит как от его собственного действия, так и от действий других агентов.

Для выбора оптимального действия на каждом этапе игры каждый из агентов должен со ставить предполагаемую картину действий оппонентов на основании своих представлений об их поведении. Подобные представления формируются в сознании агента на основании некоторых из вестных ему сведений о специфике самой игры, а также действий игроков на предыдущих этапах взаимодействия. Также у агента должны иметься обоснованные предположения относительно того, какой результат будет им получен при том или ином варианте поведения. Иными словами, собственная целевая функция полезности не задана для каждого участника априори однозначно, она также формируется агентами только в процессе игры, и может неоднократно и значительно изменяться для различных участников с течением времени при изменении стратегий поведения одного или нескольких их оппонентов.

Таким образом, перед каждым агентом в рефлексивном взаимодействии стоят как минимум следующие задачи:

- правильно определить для себя целевую функцию полезности;

- уметь распознать стратегии поведения оппонентов;

- на основании собственных представлений и предпочтений формировать адекватное действие – наилучший ответ;

- иметь возможность своевременно адаптироваться к изменениям условий в игре.

Первый и второй пункты, выраженные в терминах анализа данных, представляют собой задачи прогнозирования. Нейронные сети как инструмент прогнозирования используются очень широко и давно зарекомендовали себя как эффективное средство для решения данной задачи в тех слу чаях, когда не имеется четкой сформированной модели для описания системы [2]. Экономические системы относятся к классу сложных систем, для которых построение такой модели может быть весьма трудоемким интеллектуальным процессом. В то же время обучение нейросети на основе исторических данных – значительно более удобный для реализации метод в подобных ситуациях.

Также очень важной характеристикой поведения агента является его адаптивность – воз можность распознавать изменения в условиях взаимодействия и корректировать свои решения в зависимости от этого. Очевидно, что агенты, которым присуща инертность в действиях, будут уступать тем агентам, которые быстро реагируют на модифицирующееся поведение оппонентов или обновление состояния внешней среды. Данный принцип весьма логичен, и подтверждается практикой не только для экономических систем, но и для практически любой сферы человеческой деятельности. В данном случае применение нейронных сетей для имитации поведения агентов в рефлексивных играх также имеет большой потенциал, т.к. нейросети легко переобучаются при получении новых дополнительных сведений в процессе игры, и поэтому решения, построенные на их основе, будут отличаться высокой адаптивностью, в отличие от такого варианта, когда действия формируются на основе заранее детерминированных принципов, пусть даже и состав ляющих весьма сложную систему стратегий – т.к. любая подобная система имеет ограниченную сферу применимости, и, следовательно, не может иметь той же гибкости, как и поведение, не имеющее подобных ограничений. Таким образом, можно заключить, что моделирование рефлек сивных взаимодействий при помощи нейросетевых технологий хорошо соответствует специфике данных взаимодействий и обоснованно может служить эффективным инструментом для их ис следования.

Для изучения эффективности моделирования рефлексивных взаимодействий при помощи нейроагентов была разработана следующая модель рефлексивной игры.

Рассмотрим N фирм, действующих на рынке. На каждом этапе взаимодействия каждая из фирм может вкладывать имеющиеся у нее ресурсы в собственное развитие, а также в проти водействие каждой из фирм-конкурентов. Ресурсы фирм на каждом этапе ограничены. Также имеется ограничение на вложения в собственное развитие.

На каждом этапе взаимодействия фирмы пытаются предпринять действия, обеспечивающие им наилучший результат с целью получить наибольшую суммарную прибыль по окончании игры.

Для компьютерной реализации нейроагентного моделирования разработанной рефлексивной игры был выбран свободно распространяемый статистический пакет R, котрый является одно временно языком и средой разработки [3]. Он представляет собой интегрированный пакет про граммных средств для обработки данных, проведения расчетов и графического представления результатов.

В программной реализации игры предусматривались 4 типа агентов.

Первый тип (стационарный агент) – участник, совершающий постоянно одни и те же дей ствия на каждом этапе. Для программной имитации деятельности такого агента не требуется специальной функции, т.к. он характеризуется неизменным вектором действий.

Второй тип (случайный агент) – участник, принимающий случайные решения.

Третий тип (регрессионный) – агент, чья целевая функция при выборе действия характери зуется регрессионной моделью. Вектор действия такого агента формируется после вычисления им предполагаемых действий оппонентов.

Четвертый тип моделируемых агентов – нейросетевой агент. В основе действий нейроагента лежат две основные функции, реализованные при помощи аппарата нейронных сетей – предполо жение о действиях оппонентов и функция прогноза получаемого результата. Первая из функций реализована как нейронная сеть, предсказывающая значения вектора действий отдельного оппо нента, когда последовательность его векторов действий на всех предыдущих этапах рассматри вается как временной ряд для многомерной величины. На вход для обучения формируемой сети подаются значения каждого компонента векторов действий за предварительно выбранное число n последовательных этапов взаимодействия, на выход – значение вектора действий прогнозируе мого агента на этапе n +1. В результате испытаний было обнаружено, что если сеть имеет больше 2-х скрытых слоев, то ее отклик для различных ситуаций становится практически одинаковым и близок по значению к некоторому среднему значению результата. При использовании одного скрытого слоя прогноз сети становится слишком неточным. В конечном итоге была выбрана сеть, содержащая два скрытых слоя.

Для исследования качеств поведения агентов обычно использовались имитации игры про должительностью 50 этапов взаимодействия, т.к. такое количество оказывается достаточным для того, чтобы явно определить преимущество одного агента перед другим, и в то же время занимает относительно небольшое время (порядка 3 мин).

При принятии решения об оптимальном действии агент может руководствоваться сообра жениями максимизации функции получаемого им результата на каждом этапе взаимодействия.

С другой стороны, агент может считать более благоприятной ситуацию, когда он получает не максимальный возможный результат, но максимизирует величину разности между собственным результатом, и результатами оппонентов. Для исследования рассматриваемой модели рефлек сивной игры были программно реализованы и тот, и другой варианты выбора агентом своего действия на каждом этапе. На основании полученных результатов можно заключить, что для данной игры разницы в стратегии выбора агентом своих действий, по сути, нет.

Когда в игре участвуют подготовленные агенты, суммарные результаты всех игроков замет но превышают ситуацию взаимодействия трех случайных агентов. Это связано с тем, что такие агенты, в отличие от неподготовленных, могут весьма хорошо предсказывать получаемый резуль тат при выборе того или иного действия, и с первых же этапов игры делают гораздо большие вложения ресурсов в собственное развитие, чем обучающиеся в процессе игры. Однако, как было упомянуто выше, для подготовки агентов была использована выборка, содержащая результаты имитаций почти 10000 различных игровых этапов, а получить аналогичный объем исторических данных в реальности практически невозможно, т.е. реальности больше соответствует случай вза имодействия неподготовленных агентов.

Также следует отметить, что на самом деле более разумной была бы стратегия, подразу мевающая относительно часто вкладывать в собственное развитие не максимальное количество ресурсов, а меньшую величину, тем самым оставляя противников, постоянно ожидающих макси мального вложения, с меньшим результатом. Агенты не проявляют такого поведения в первую очередь от того, что недостаточно точно аппроксимируют функцию получаемого результата, од нако добиться такого поведения от агентов возможно.

Вот возможные пути решения этой проблемы:

- значительно увеличить объем выборки для подготовки агентов;

- использовать более сложные регрессионную и нейросетевую модели для предсказания функ ции результата;

- программно задать агентам определенные условия и соответствующие алгоритмы поведения с помощью операторов ветвления.

Таким образом, подводя общие итоги результативности для всех четырех типов агентов, можно сказать, что последним среди них является стационарный агент. Хотя он может иметь преиму щество перед случайными агентами в некоторых случаях, но, если при этом в игре присутствуют регрессионный или нейроагент, для них его действия сразу становятся легко предсказуемы.

Далее следует случайный агент, главное преимущество которого состоит в том, что его дей ствия невозможно предсказать. Стохастический характер поведения на каждом этапе игры поз воляет ему до определенного этапа показывать результаты, сравнимые с результатами неподго товленных нейросетевых и регрессионных агентов. В продолжительных играх а также против подготовленных агентов он уступает в результативности.

Против стационарных и случайных агентов как регрессионный, так и нейросетевой демон стрируют весьма эффективное поведение. Тем не менее, по итогам имитаций с участием обоих типов агентов можно видеть, что результаты нейроагента всегда несколько лучше, чем регрес сионного, поэтому можно заключить, что именно нейросетевой агент имеет наилучший из всех рассмотренных типов агентов показатель результативности.

Прогноз значения целевой функции регрессионными агентами с полиномиальной регрессией, построенной на основании исторических данных (результатов предыдущих имитаций) оказывает ся несколько точнее, чем у нейросетевого агента, подготовленного на тех же данных, тем не менее, в процессе игры нейросетевые агенты имеют некоторое преимущество над регрессионными, т.к.

лучше предсказывают действия своих оппонентов.

Исследование не выявило значительной разницы в результатах агентов, использующих в ка честве целевой функции максимизацию собственного результата или же максимизацию отрыва от оппонентов – величины разности между собственным результатом, и результатом ближайшего преследователя.

Метод нахождения оптимального вектора действия путем перебора на сокращенном множе стве возможных вариантов оказывается эффективнее метода градиентного подъема по целевой функции. Это связано с тем, что целевая функция результата в действительности имеет крайне сложный многомерный характер со множеством локальных экстремумов, причем ее параметры непостоянны, и зависят от действий самих игроков, и как регрессионная модель, так и нейросе тевая не могут в полной мере аппроксимировать данную функцию.

В целом, подводя итоги работы, можно сделать вывод о высокой степени целесообразности применения нейросетевых агентов для моделирования рефлексивного взаимодействия в эконо мических системах.

Подобные агенты способны весьма правдоподобно предсказывать действия оппонентов, что является ключевым моментом для качественного моделирования рефлексии.

При помощи модификации алгоритма использования обученных нейронных сетей, положен ных в основу нейроагента, возможно наделить его любым необходимым рангом рефлексии.

Значительное преимущество имитационного моделирования с использованием нейросетевых агентов в быстродействии перед моделированием на основании регрессионных моделей является весомым доводом в пользу нейроагентов, т.к. в перспективе с их помощью возможно моделиро вать весьма сложные системы с большим числом участников взаимодействия, причем действия каждого из участников будут не простейшими, а в значительной степени осмысленными и реалистичными.

Список литературы 1. 1. Лефевр, В.А. Элементы логики рефлексивных игр / В.А. Лефевр // Проблемы инженерной психо логии. – 1966 – Вып. 4 – С. 273 – 299.

2. 2. Хайкин, С. Нейронные сети. Полный курс / С. Хайкин – М.: ООО И. Д. Вильямс, 2006. – 1104 с.

3. 3. Наглядная статистика. Используем R! / А. Шипунов [и др.] ;

под общ.ред. А. Шипунова – М.: ДМК.

– Михайловская Людмила Вячеславовна, доцент кафедры высшей математики и физики Учреждения образования Военная академия Республики Беларусь, кандидат физико-математических наук, доцент, ludmila_mi@mail.ru.

Плющ Олег Борисович, доцент кафедры экономико-математических методов управления Академии управления при Президенте Республики Беларусь, кандидат физико-математических наук, доцент, pl oleg@tut.by.

Долгин Евгений Владимирович, аспирант кафедры экономико-математических методов управления Академии управления при Президенте Республики Беларусь, inscaven@gmail.com.

УДК 303.094. Л. В. МИХАЙЛОВСКАЯ, О. Б. ПЛЮЩ, И. А. ТРОЩЕНКО ПРИМЕНЕНИЕ МЕТОДА ИМИТАЦИОННОГО МОДЕЛИРОВАНИЯ ДЛЯ ОЦЕНКИ ЭФФЕКТИВНОСТИ ПРОЕКТА РЕИНЖИНИРИНГА БИЗНЕС-ПРОЦЕССОВ ПРЕДПРИЯТИЯ В статье описывается новый подход к оценке результатов реинжиниринга бизнес процессов путем моделирования их функциональной эффективности до и после реинжини ринга. Построение линейной модели оценки эффективности выбранного бизнес-процесса и ее анализ выполнены с использованием пакета Anylogic.

Введение Проблема оценки экономической эффективности инновационных проектов в сфере инфор мационных технологий является особенно актуальной из-за высокой динамичности процессов, а также уникальности и малого жизненного цикла проектов. Это, пожалуй, основные причины, по которым применение традиционных методов решения этой проблемы является затруднительным.

Кроме того, устоявшиеся методы разрабатывались на основе стабильных экономических показа телей крупных компаний и для малых инновационных предприятий корректность применения этих методик сомнительна и сопряжена с высокими рисками. В то же время с необходимостью решения этой проблемы сталкивается каждый студент в ходе работы над дипломным проектом.

И в подавляющем большинстве случаев экономическое обоснование проекта проводится после его выполнения и апробации.

Методы предварительной экспертизы инновационных IT проектов являются предметом ак тивно ведущихся исследований. Одним из наиболее экономных и надежных способов оценки прибыльности внедрения тех или иных изменений в производственный процесс является имита ционное моделирование.

В работе показано применение методики, использующей технологии имитационного линейно го моделирования для оценки эффективности проекта реинжиниринга бизнес-процесса на этапе предварительной экспертизы. Сам бизнес-процесс при моделировании представляется как сеть массового обслуживания, где подпроцесс является каналом обслуживания с потоком заявок (до кументов, потоков работ) на входе в блок, который моделируется как очередь поступающих на выполнение заданий и задержек, имитирующих выполнение задания.

В настоящее время создан широкий спектр программных продуктов, позволяющих строить и исследовать имитационные модели. В тех случаях, когда эти исследования являются второ степенной задачей, программный продукт не должен требовать много времени на освоение ос новных навыков работы. В качестве инструмента, объединяющего методы системной динамики, "процессного"дискретно-событийного и агентного моделирования в одном языке и одной среде разработки моделей, был выбран пакет AnyLogic. Гибкость AnyLogic позволяет отражать дина мику сложных и разнородных экономических и социальных систем на любом желаемом уровне абстракции. AnyLogic включает набор примитивов и объектов библиотек для эффективного моде лирования производства и логистики, бизнес-процессов и персонала, финансов, потребительского рынка, а также окружающей инфраструктуры в их естественном взаимодействии. Объектно ориентированный подход, предлагаемый AnyLogic, облегчает итеративное поэтапное построение больших моделей.

Построение линейной модели оценки эффективности бизнес-процесса Процесс моделирования предполагает осуществление четырех основных этапов: построение модели, её запуск, далее анализ полученных показателей эффективности и оценка альтернатив ных сценариев.


Целями проведения имитационных экспериментов могут быть:

- Сравнения средних и дисперсий различных альтернатив процессов при одинаковых исходных данных (один сценарий на несколько моделей).

- Отыскание оптимальных значений переменных на некотором множестве возможных значе ний (несколько сценариев на одну модель).

- Определение зависимостей между различными факторами процессов и последующим дис персионным и регрессионным.

Для выявления зависимости между параметрами функциональной устойчивости бизнес-процесса (ФУБП) и параметрами его реального выполнения необходимо провести имитационное модели рование выбранного бизнес-процесса. Для каждого параметра ФУБП (или группы параметров) в рамках выбранного бизнес-процесса строится от¬дельная модель. Для того чтобы провести оценку моделирования ФУБП, нужно:

- построить информационную модель бизнес-процесса с подробной детализацией;

- определить основные параметры ФУБП и критерии их оценки;

- разработать имитационную модель ФУБП;

- сформулировать и обосновать мероприятия по реинжинирингу бизнес-процесса с точки зре ния повышения его устойчивости.

Базовая финансовая модель бизнес-процесса состоит из трех взаимосвязанных компонент [1]:

- ФМ1 – модель финансового состояния, - ФМ2 – модель движения ресурсов и прав собственности, - ФМ3 – модель эффективности продаж.

Информация собирается на каждом из локальных уровней (отдельных подразделений, взаимоот ношений с отдельными контрагентами в процессе обмена ресурсами, отдельных видов продукции, отдельных хранилищ каждого вида ресурсов и т.д.) и в итоге может быть последовательно агре гирована до максимально свернутого (нулевого иерархического) уровня. Базовая финансовая модель бизнес-процесса и представляет собой финансовую модель бизнес-процесса на нулевом иерархическом уровне.

Модель ФМ1 является, в принципе, статической: она определяет состояние бизнес-процесса в финансовом аспекте на любой рассматриваемый момент. Такое состояние объективно суще ствует в каждый текущий момент независимо от того, определяется оно или нет (в этот момент) методами финансового или управленческого учета.

Модели ФМ2 и ФМ3 можно рассматривать как в динамическом (вплоть до мониторинга в режиме реального времени), так и в квазистатическом (за рассматриваемый период в целом или на отдельных интервалах времени этого периода) смысле.

Базовая финансовая модель бизнес-процессов тесно взаимосвязана в таким понятием, как функциональная эффективность бизнес-процесса, или способность процессов сохранять и вос станавливать свои функции при условии неопределенности, различных негативных факторов.

Функциональная эффективность бизнес-процесса (ФЭБП) включает в себя организацион ные, структурные и юридические группы параметров [2]. Для выявления зависимости между параметрами ФЭБП и параметрами реального выполнения бизнес-процесса необходимо провести имитационное моделирование выбранного бизнес-процесса как системы массового обслуживания.

Для каждого параметра (или группы параметров) в рамках выбранного бизнес-процесса строится отдельная модель.

Модель ФЭБП (functional eciency) выглядит следующим образом [3]:

F E = (Str, Org, L) где - Str (structure) – вектор структурных параметров функциональной эффективности бизнес процесса, определяющих информационно-структурную открытость бизнес-процесса по отноше нию к его внешнему окружению;

- Org (organization) – вектор организационных параметров функциональной эффективности бизнес-процесса, определяющих функционирование управленческих структур в условиях нечет кого человеческого поведения и неопределенности внешней среды;

- L (legal) – вектор юридических параметров функциональной эффективности бизнес процесса, определяющих стабильность бизнес-процесса с точки зрения законодательства и фи нансовой отчетности:.

Рисунок 1 – Карта функциональной устойчивости Разработка имитационной модели и ее исследование предполагает выполнение следующих шагов:

- устанавливаются значения параметров модели - интерпретируются полученные показатели эффективности модели - проводится анализ временных показателей при различных значениях параметров.

Суть моделирования заключается в варьировании уровней каждого параметра функциональной устойчивости. В качестве показателей реального выполнения бизнес-процесса выбраны следую щие характеристики:

средняя длина очереди;

количество необслуженных заявок;

коэффициент использования блока;

среднее время заявки в системе.

Выявив зависимости между параметрами выполнения и параметрами ФУБП, получим характер влияния параметров ФУБП на реальное выполнение бизнес-процесса. Исследование исходной имитационной модели “as is” позволяет найти ее оптимальные параметры, выявить актуальные проблемы существующей схемы бизнес-процесса и сформировать комплекс мероприятий по ре инжинирингу. Исследование имитационной модели “to be” после проведения комплекса меропри ятий позволяет не только оптимизировать ФУБП, но и оценить степень повышения ее уровня.

Выводы В данной работе был создан новый подход к оценке результатов реинжиниринга бизнес процессов путем моделирования их функциональной эффективности до и после реинжиниринга.

Было проведено имитационное моделирование оценки функциональной эффективности несколь ких типовых проектов реинжиниринга бизнес-процессов. При моделировании бизнес-процесс представляется как сеть массового обслуживания, где подпроцесс является каналом обслу живания с потоком заявок на входе в блок, который моделируется как очередь поступающих на выполнение заданий и задержек, имитирующих выполнение задания. Суть моделирования заключается в варьировании уровней каждого параметра функциональной эффективности.

Список литературы 1. Абутидзе, З. С. Управление качеством и реинжиниринг организации: Учебное пособие / З. С. Абутидзе – М.: Логос, 2007. – 328с.

2. Мильнер, Б. З. Теория организации / Б. З. Мильнер. -– М.: Инфра-М, 2008. 360с.

3. Уткин, Э. А. Бизнес-реинжиниринг. Обновление бизнеса / Э. А. Уткин -– М.: Экмос, 2007. -– 210с..

Михайловская Людмила Вячеславовна, доцент кафедры высшей математики и физики Учреждения образования Военная академия Республики Беларусь, кандидат физико-математических наук, доцент, ludmila_mi@mail.ru.

Плющ Олег Борисович, доцент кафедры экономико-математических методов управления Академии управления при Президенте Республики Беларусь, кандидат физико-математических наук, доцент, pl oleg@tut.by.

Трощенко Ирина Александровна, студентка 5 курса факультета инновационной подготовки Института управленческих кадров Академии управления при Президенте Республики Беларусь, troschenko.irina@yandex.by.

УДК 004.932.2:519. В. В. МОРОЗ, Е. С. ЧУБАЧ ПРОСТРАНСТВЕННО-ВРЕМЕННАЯ ИНТЕРПОЛЯЦИОННАЯ МОДЕЛЬ ОПТИЧЕСКОГО ПОТОКА В данной статье предлагается модификация метода оптического потока на основе пространственно-временной интерполяционной модели. За счет уменьшения простран ственного разрешения кадров в видео последовательности снижается вычислительная сложность метода, что позволяет применять его для передачи потокового видео.

Введение В настоящее время большинство приложений, выполняющих обработку видеосигналов, сталкивается с проблемой преобразования частоты кадров. Например, при передаче потоко вого видео используется временная децимация. На выходе системы необходимо восстановить исходную частоту, то есть воспроизвести пропущенные кадры. Также задача изменения частоты кадров возникает при переходе от одного стандарта видео к другому и при восстановлении кад ров, испорченных во время передачи. Как следствие, актуальной является задача предсказания информации о пропущенном кадре в момент времени t на основе информации, содержащейся в соседнем кадре. Большинство современных методов цифровой обработки видео для систем хранения и передачи информации основано на концепции оценки видимого движения в по следовательности изображений. Оценка видимого движения производится путем вычисления оптического потока (ОП), который представляется в виде поля векторов движения между соседними кадрами. ОП используется для дальнейшей обработки видеопоследовательности с целью компенсации движения. Точность компенсации движения влияет на качество восприятия видео. Так как приложения на основе видео имеют широкий спектр практического применения в различных сферах жизни человека (телемедицина, военная индустрия, видеонаблюдение и т.п.), то точность и вычислительная сложность методов определения ОП является актуальной проблемой.

Математическая модель оптического потока Оптический поток вычисляется для элементов пространственной дискретизации, как дви жение между последовательными кадрами, взятыми в момент времени t и t. Предположим, что оптический поток вычисляется для каждого элемента – пикселя. Тогда пиксель в позиции (x, y, t) первого кадра с интенсивностью I(x, y, t) за время t будет смещен на x, y. Следова тельно, справедливо следующее выражение:

I(x, y, t) = I(x + x, y + y, t + t) (1) Так как смещение пикселей в последовательных кадрах мало, используем ряд Тейлора для правой части уравнения (1):

I I I I(x + x, y + y, t + t) I(x, y, t) + x + y + t (2) x y t Из равенств (1) и (2) следует:

I I I x + y + t = x y t или I x I y I t + + = x t y t t t Отсюда получаем, что I I I Vx + Vy + = x y t где Vx, Vy компоненты скорости оптического потока в I(x, y, t). x, y, I частные производные I I t яркости пикселя, показывающие изменение светового потока в соответствующих направлениях и за время смены соседних кадров. Таким образом, можно записать:

I I I Vy = Vx + x y t или I T · V = It Полученное уравнение содержит две неизвестных и не может быть однозначно разрешено.

Данная проблема известна как проблема апертуры. Для ее решения применяют процедуру регуляризации, заключающуюся в наложения дополнительных ограничений.


Интерполяционный подход Методы вычисления ОП в зависимости от области поиска движения можно разделить на две группы: локальные дифференциальные и глобальные дифференциальные. Методы первой группы используют для анализа разности светового потока в соседних кадрах ограниченную окрестность элементов дискретной сетки. Методы второй группы выполняют поиск либо по всей области кадра, либо в окрестности, размер которой не больше длины глобального вектора дви жения. И локальные, и глобальные методы имеют свои преимущества и недостатки. Локальные методы характеризуются низкой вычислительной сложностью, однако погрешность вычисления поля векторов движения является высокой. Для уточнения вычисленного поля векторов дви жения используется либо наиболее популярная на сегодняшний день медианная фильтрация, либо глобальные методы, которые имеют ограничение на вычислительную сложность, поэтому не могут быть использованы в тех приложениях, где необходимым условием является потоковая передача видео и анализ видеопоследовательности в режиме реального времени.

Для решения данной дилеммы предлагается использовать пространственно-временную ин терполяцию последовательности изображений:

1. Временная децимация последовательности, в результате которой количество кадров умень шается в два раза.

2. Пространственная децимация кадров, в результате которой количество дискретных отсчетов на кадр уменьшается в (1 kr1kc ), где kr, kc – коэффициенты децимации по строкам и по столбцам соответственно.

3. Вычисление поля векторов движения для каждой соседней пары кадров.

В зависимости от области применения, восстановленная видеопоследовательность может быть получена двумя способами:

1. Интерполяция поля векторов движения, вычисленного для уменьшенных кадров, с последу ющей временной интерполяцией последовательности изображений.

2. Временная интерполяция последовательности изображений с использованием поля векторов движения, вычисленного для уменьшенных кадров, с последующей пространственной интерпо ляцией.

При интерполяции поля векторов движения учитывалась его гладкость, а для восстановления размеров кадров использовался разработанный метод пространственной интерполяции. Данный метод основан на теореме Парсеваля и использует спектральную плотность энергии изображения в качестве распределения последовательности энергии как функции, зависящей от частоты.

Выводы Анализ полученных результатов показал, что предложенный подход дает меньшую вычис лительную сложность при определении поля векторов по сравнению с существующими методами, основанными на сопоставлении блоков. Также кадры, полученные с использованием поля ОП, вычисленного для изображений, уменьшенных в 2 раза по горизонтали и по вертикали, визуаль но не сильно отличаются от кадров, предсказанных с использованием поля ОП, вычисленного для кадров исходных размеров. Уменьшение размеров изображений дает возможность сократить время вычисления поля векторов движения в 4 раза, что позволяет использовать предложенный подход для решения задач в реальных приложениях обработки видео. Вдобавок, первый подход дает визуально лучший результат – предсказанное изображение, полученное после его примене ния, является более качественным и четким по сравнению со вторым подходом.

Однако, анализ результатов тестов на различных типах движения показал, что в видео последовательностях со смешанным сложным движением предложенный, данный подход дает весомую погрешность ОП, которая приводит к заметным визуальным искажениям. Поэтому данный подход имеет преимущество по сравнению с существующими на малодинамичных сценах в таких областях, как телемедицина, видеонаблюдение, видеоконференции и т.п. Для высокодинамичных сцен со сложным комбинированным движением необходима более точная аппроксимация децимированных ОП.

Рисунок 1 Слева – поле ОП, вычисленное для кадров исходной размерности, справа – поле ОП, вычисленное для кадров, уменьшенных в 2 раза по горизонтали и по вертикали.

Рисунок 2 Слева - кадр, выкинутый из видеопоследовательности в результате временной децимации, справа – восстановленный кадр с использованием интерполированного поля векторов движения, вычисленного для кадров, уменьшенных в 2 раза по горизонтали и по вертикали.

Список литературы 1. Гласман К. Преобразователи стандартов // 625.–М.:Издательство 625.–2005.–№6.–С.5- 2. Yu Liu, King Ngi Ngan Fast multiresolution motion estimation algorithms for wavelet-based scalable video coding // Signal Processing: Image Communication.– Volume 22.– Issue 5/–June 2007/–P448- 3. Shou-Yi Tseng, Motion estimation using a frame-based adaptive thresholding approach // Real-Time Imaging.– Vol. 10.– Issue 1.– February 2004.– P. 1-7.

4. Park HW, Kim HS Motion estimation using low-band-shift method for wavelet-based moving-picture coding // IEEE Trans. Image Proc.– vol.9.– №4.– April 2000.– P.577-587.

Мороз Владимир Владимирович, профессор кафедры вычислительной математики Одесского нацио нального университета имени И. И. Мечникова, кандидат технических наук, доцент, v.moroz@onu.edu.ua.

Чубач Елена Станиславовна, аспирант кафедры вычислительной математики Одесского националь ного университета имени И. И. Мечникова, elenachubach@gmail.com.

УДК 517.977. З. Н. МУРЗАБЕКОВ, Ш. А. АЙПАНОВ АЛГОРИТМ ПОСТРОЕНИЯ ОПТИМАЛЬНОГО СИНТЕЗИРУЮЩЕГО УПРАВЛЕНИЯ В ЛИНЕЙНО-КВАДРАТИЧНОЙ ЗАДАЧЕ С ОГРАНИЧЕНИЯМИ НА ЗНАЧЕНИЯ УПРАВЛЕНИЯ В работе предлагается метод решения задачи оптимального управления для линейных систем с квадратичным функционалом при наличии ограничений на значения управления.

Использование множителей Лагранжа специального вида позволяет сконструировать синтезирующее управление, зависящее от состояния системы и времени, а также обеспечить выполнение ограничений на значения управления и точный перевод системы в начало координат за заданный интервал времени. Предлагаемый метод представлен в виде алгоритма, удобного для реализации на компьютере.

Введение На практике часто встречаются задачи оптимального управления динамическими системами с закрепленными концами траекторий. Это, например, задачи управления космическими аппара тами, самолетами, роботами-манипуляторами и т.д. В этих задачах требуется обеспечить перевод системы из заданного начального состояния в желаемое конечное состояние за конечный интер вал времени, минимизируя при этом затраты топлива или энергии.

Различные математические постановки задач оптимального управления и практические при меры приведены в [1, 2]. Обстоятельный обзор моделей и методов, используемых в современной теории оптимального управления содержится в [3]. Задача оптимального управления для дина мических систем может быть сформулирована как задача нахождения программного управления u(t) или как задача конструирования синтезирующего управления u(x, t), т.е. управления с обрат ной связью, зависящего от вектора состояния системы x и текущего времени t. В первом случае задача может быть решена с использованием принципа максимума Понтрягина [4], во втором слу чае для решения задачи можно использовать метод динамического программирования Беллмана [5] или достаточные условия оптимальности Кротова [6].

Отметим, что особенностью рассматриваемой задачи является то, что траектории системы должны проходить через фиксированные точки в начальный и конечный моменты времени, т.е.

левые и правые концы траекторий являются закрепленными. Приведенный в данной работе ме тод решения задачи оптимального управления основан на использовании множителей Лагранжа [7], причем предлагается использовать множители специального вида [8], которые позволяют по строить синтезирующее управление и обеспечивают приведение системы к желаемому состоянию в конечный момент времени.

Постановка задачи Рассматривается система управления, описываемая дифференциальным уравнением вида (t0 t T ), x(t) = A(t)x(t) + B(t)u(t) + f (t), (1) с заданным начальным условием x(t0 ) = x0 (2) и конечным условием x(T ) = 0n, (3) с ограничением на значения управления u(t) U (t) = {u E m | 0.5 u D(t)u d 0}, (t0 t T ).

d 0, (4) Здесь x(t) – n-вектор состояния объекта;

u(t) – m-вектор кусочно-непрерывных управляющих воздействий;

A(t), B(t) – матрицы размерностей (n n), (n m) соответственно (элементы этих матриц являются непрерывными функциями);

f (t) – n-вектор непрерывных функций;

D(t) – по ложительно определенная (m m)-матрица;

0n – нулевой n-вектор;

штрих ( ) означает операцию транспонирования. Динамика системы рассматривается в интервале времени [t0, T ], где t0 и T – заданные начальный и конечный моменты времени.

Качество управления описывается функционалом T J(u) = [0.5 x (t)Q(t)x(t) + 0.5 u (t)R(t)u(t)] dt, (5) t где Q(t) – положительно полуопределенная (n n)-матрица, R(t) – положительно определенная (m m)-матрица.

Ставится задача: найти синтезирующее управление u(t) = u(x(t), t), которое удовлетворяет ограничению (4) и переводит систему (1) из заданного начального состояния (2) в конечное состояние (3) (в начало координат) за фиксированный интервал времени [t0, T ], минимизируя при этом функционал (5).

Алгоритм решения задачи Предлагаемый метод решения задачи основан на достаточных условиях оптимальности, по лученных в [8]. Для снятия ограничения в виде дифференциальной связи (1) используется мно житель Лагранжа 0 (t) = 0 (x(t), t) = K(t)x(t)+q(t), где K(t) – симметрическая (nn)-матрица, q(t) – n-вектор-функция, подлежащие определению. А другой множитель Лагранжа (t) 0 вы бирается таким образом, чтобы обеспечить выполнение ограничения (4) на значения управлений.

Обозначим через W (t, T ) симметрическую (n n)-матрицу вида T W (t, T ) = (t, )S(t) (t, ) d.

t Здесь S(t) = B(t)R1 (t)B (t) – симметрическая (n n)-матрица;

(t, ) = (t)1 ( ) – матрица размерности (n n);

(t) – фундаментальная матрица решений дифференциального уравнения вида y(t) = [A(t) S(t)K(t)]y(t).

Оптимальная траектория движения системы и оптимальное управление в задаче (1)–(5) мо гут быть найдены с использованием следующего алгоритма:

1) Проинтегрировать в интервале [t0, T ] систему дифференциальных уравнений K(t) = A (t)K(t) K(t)A(t) + K(t)S(t)K(t) Q(t), K(T ) = KT, (6) W (t, T ) = [A(t) S(t)K(t)]W (t, T ) + W (t, T )[A(t) S(t)K(t)] S(t), W (T, T ) = On, где KT – положительно полуопределенная симметрическая (nn)-матрица;

On – нулевая (nn) матрица. В результате интегрирования системы (6) определяются матрицы K0 = K(t0 ) и W0 = = W (t0, T ) (интегрирование производится в обратном направлении изменения времени).

2) Проинтегрировать в интервале [t0, T ] систему дифференциальных уравнений K(t) = A (t)K(t) K(t)A(t) + K(t)S(t)K(t) Q(t), K(t0 ) = K0, 0, t) = (t0, t)[A(t) S(t)K(t)], (t0, t0 ) = In, (t (7) (t) = [A(t) S(t)K(t)](t) S(t)(t) + f (t), (t0 ) = x0, (t) = [A(t) S(t)K(t)] (t) K(t)f (t), (t0 ) = 0n, где (t), (t) – вспомогательные n-векторы;

In – единичная (nn)-матрица. В результате интегри рования системы (7) определяются матрица (t0, T ) и вектор (T ), тем самым можно вычислить вектор q0 = W 1 (t0, T )(t0, T )(T ) (8) (предполагается, что матрица W (t0, T ) невырождена).

3) Проинтегрировать в интервале [t0, T ] систему дифференциальных уравнений K(t) = A (t)K(t) K(t)A(t) + K(t)S(t)K(t) Q(t), K(t0 ) = K0, W (t, T ) = [A(t) S(t)K(t)]W (t, T ) + W (t, T )[A(t) S(t)K(t)] S(t), W (t0, T ) = W0, (9) x(t) = [A(t) S(t)K(t)]x(t) + B(t)(x(t), t) S(t)q(t) + f (t), x(t0 ) = x0, q(t) = [A(t) S(t)K(t)] q(t) + W 1 (t, T )B(t)(x(t), t) K(t)f (t), q(t0 ) = q0.

Здесь выбор вектора q0 в начальном условии q(t0 ) = q0 в виде (8) обеспечивает прохождение траектории системы через начало координат в момент времени T, т.е. выполнение конечного условия x(T ) = 0n. Полученное из (9) решение x(t), (t0 t T ) соответствует искомой опти мальной траектории движения системы. В процессе интегрирования системы (9) вычисляется оптимальное управление по формуле u(x(t), t) = [R(t) + (t)D(t)]1 B (t)[K(t)x(t) + q(t)] = (10) = (x(t), t) + (x(t), t), (t0 t T ), где (x(t), t) = R1 (t)B (t)[K(t)x(t) + q(t)], (11) (x(t), t) = {[Im + (t)R1 (t)D(t)]1 Im }(x(t), t);

Im – единичная (m m)-матрица.

В формулах (10), (11) множитель Лагранжа (t) 0 следует выбрать так, чтобы обеспечить выполнение ограничения (4) на значения управлений. Если в момент времени t выполняется неравенство 0.5 (x(t), t)D(t)(x(t), t) d 0, то можно принять (t) = 0;

в противном случае = (t) выбирается из условия () = 0.5 u (x(t), t)D(t)u(x(t), t) d = 0. (12) Можно показать, что существует единственный корень 0 уравнения () = 0, который может быть найден с использованием известных численных методов (например, метода дихотомии [9]).

Пример Рассматривается система, динамика которой в интервале времени [t0, T ] = [0, 3] описывается дифференциальными уравнениями x1 (t) = 2 x1 (t) + 3 x2 (t) + u1 (t) + sin t, (13) x2 (t) = 4 x1 (t) ln(t + 1)x2 (t) + u2 (t) с начальными условиями x1 (t0 ) = 7 и x2 (t0 ) = 2. Управления u1 и u2 могут принимать значения из эллипса 5 u2 6 u1 u2 +5 u2 8 0. Требуется перевести систему в начало координат, т.е. обеспечить 1 выполнение конечных условий x1 (T ) = 0 и x2 (T ) = 0, минимизируя при этом функционал T J(u) = [0.5 (et + 1)x2 (t) x1 (t)x2 (t) + 0.5 x2 (t)+ 1 (14) t +0.5 u2 (t) 1)u2 (t)] dt inf.

+ 0.5 (t + 1 2 u Результаты численных расчетов, полученные с использованием алгоритма, приведенного в предыдущем разделе, показаны на рис. 1 и 2. Найденные управления обеспечивают достаточ но точный перевод системы из начального состояния (7, 2) в начало координат (0, 0) за интер вал времени [t0, T ] = [0, 3] (в численных расчетах получены значения x1 (T ) 0.26 · 1012 и x2 (T ) 0.52 · 1012 ).

Рисунок 1 – Фазовые переменные x1 (t) и x2 (t) Рисунок 2 – Управления u1 и u2 (A – в начальный момент t0 ;

B – в момент переключения управления t1 ;

C – в конечный момент T ) Как видно из рис. 2, оптимальные управления в интервале времени [t0, t1 ] принимают значения, расположенные на границе эллипса (участок AB), а в интервале (t1, T ] значения управления соответствуют внутренним точкам эллипса (участок BC). Переключение управления происходит в момент времени t1 0.4298.

Заключение В работе рассмотрена линейно-квадратичная задача оптимального управления, где допус тимые значения входа принимают значения из заданного множества в виде гиперэллипсоида. Осо бенностью задачи является то, что левые и правые концы траекторий являются закрепленными, требуется перевести систему из начального состояния x(t0 ) = x0 в начало координат x(T ) = 0n за заданный интервал времени [t0, T ], минимизируя при этом квадратичный функционал (5).

Рассматриваемая задача оптимального управления решена здесь с использованием мно жителя Лагранжа специального вида. Множитель 0 (t) выбирается в виде функции 0 (t) = = 0 (x(t), t) = K(t)x(t) + q(t), что позволяет сконструировать синтезирующее оптимальное управление u(x(t), t). Матрица K(t) и вектор q(t) находятся в результате решения некоторых дифференциальных уравнений в интервале [t0, T ], причем для вектора q(t) условие q(t0 ) = q0 вы бирается так, чтобы обеспечить выполнение конечного условия x(T ) = 0n для вектора состояния системы.

За счет выбора другого множителя Лагранжа = (t) обеспечивается выполнение огра ничения (4) на значения управлений. В случае, когда управление является внутренней точкой множества U (t), имеем = 0. Если же управление лежит на границе множества U (t), то соот ветствующее значение 0 определяется как корень уравнения () = 0 (см. формулу (12)).

Рассмотренный пример (13), (14) показывает применимость предлагаемого алгоритма для нестационарных линейных систем с квадратичным функционалом качества, где подинтегральная функция также может явно зависеть от времени.

Работа выполнена при финансовой поддержке Комитета науки Министерства образования и науки Республики Казахстан (грант № 0704 / ГФ2).

Список литературы 1. Брайсон, А. Прикладная теория оптимального управления / А. Брайсон, Ю-ши Хо. – М.: Мир, 1972. – 544 с.

2. Атанс, М. Оптимальное управление: введение в теорию и приложения / М. Атанс, П. Фалб. – М.:

Машиностр., 1968. – 764 с.

3. Куржанский, А. Б. Дифференциальные уравнения в задачах синтеза управлений. I. Обыкновенные системы / А. Б. Куржанский // Диф. уравн. – 2005. – Т. 41, № 1. – С. 12–22.

4. Понтрягин, Л. С. Математическая теория оптимальных процессов / Л. С. Понтрягин [и др.]. – М.:

Наука, 1976. – 392 с.

5. Беллман, Р. Динамическое программирование и современная теория управления / Р. Беллман, Р. Ка лаба. – М.: Наука, 1968. – 446 с.

6. Кротов, В. Ф. Методы и задачи оптимального управления / В. Ф. Кротов, В. И. Гурман. – М.: Наука, 1973. – 446 с.

7. Алексеев, В. М. Оптимальное управление / В. М. Алексеев [и др.]. – М.: Наука, 1979. – 432 с.

8. Мурзабеков, З. Н. Достаточные условия оптимальности динамических систем с закрепленными кон цами / З. Н. Мурзабеков // Матем. журн. – 2004. – Т. 4, № 2(12). – С. 52–59.

9. Васильев, Ф. П. Методы оптимизации / Ф. П. Васильев. – М.: Факториал пресс, 2002. – 824 с.

Мурзабеков Зайнел Нугманович, профессор кафедры информационных систем Казахского нацио нального университета им. аль-Фараби, доктор технических наук, murzabekov-zein@mail.ru.

Айпанов Шамши Абилович, ведущий научный сотрудник лаборатории интеллектуальных информа ционных систем НИИ Математки и механики Казахского национального университета им. аль-Фараби, кандидат физико-математических наук, доцент, aipanov@mail.ru.

УДК 681.3. Е. А. САКСОНОВ, Р. В. ШЕРЕДИН ОСОБЕННОСТИ ОБРАБОТКИ ОБЕЗЛИЧЕННЫХ ПЕРСОНАЛЬНЫХ ДАННЫХ Обработка персональных данных граждан сопряжена с необходимостью выполнения требований к их защите от несанкционированного доступа, что приводит к достаточно высоким затратам на организацию обработки, которые часто не в состоянии обеспечить малобюджетные организации. Здесь предлагается проводить обработку с предваритель ным обезличиванием персональных данных, сводя к минимуму затраты на обеспечение безопасности.

Введение Персональные данные это данные, относящиеся к их владельцу или позволяющие определить владельца – физическое лицо (субъект персональных данных). Это самостоятельный тип данных, работа с которыми регламентируется рядом международных и государственных законодательных и правоустанавливающих документов [1 - 5].

Организации или частные лица, занимающиеся обработкой персональных данных – опера торы персональных данных.

Отличительными особенностями работы с персональными данными являются:

- строго определенный владелец данных;

- возможность обработки с согласия владельца;

- конфиденциальность;

- разделение на категории в зависимости от содержания;

- особые правила обработки;

- ответственность операторов за нарушение правил обработки;

- наличие регулятора, устанавливающего правила обработки и осуществляющего контроль их выполнения;

- необходимость регистрации операторов;

- выделение в отдельный класс информационных систем персональных данных;

- возможность владельца влиять на процедуры обработки;

- необходимость применения различных методов защиты в зависимости от категории персо нальных данных;

- необходимость согласования методов защиты и обработки различными операторами.

Перечисленные особенности приводят к необходимости создания дорогостоящих информа ционных систем обработки персональных данных, требования к которым могут меняться в зави симости от объемов данных и их содержания, изменений в законодательстве.



Pages:     | 1 |   ...   | 4 | 5 || 7 | 8 |   ...   | 11 |
 





 
© 2013 www.libed.ru - «Бесплатная библиотека научно-практических конференций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.