авторефераты диссертаций БЕСПЛАТНАЯ БИБЛИОТЕКА РОССИИ

КОНФЕРЕНЦИИ, КНИГИ, ПОСОБИЯ, НАУЧНЫЕ ИЗДАНИЯ

<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ


Pages:     | 1 || 3 |

«В.Г. МАТВЕЙКИН, Д.Ю. МУРОМЦЕВ ТЕОРЕТИЧЕСКИЕ ОСНОВЫ энергосберегающего управления динамическими режимами установок ПРОИЗВОДСТВЕННО-ТЕХНИЧЕСКОГО ...»

-- [ Страница 2 ] --

(3.12) – структура модели динамики, отражающая число стадий к и виды моделей для каждой стадии M j ( A j, B j ), j = 1, к, т.е.

M (к ) = ( M 1 ( A1, B1 ), t [t 0, t п1 ) ;

M 2 ( A2, B2 ), t [t п1, t п 2 ) ;

...;

M к ( Aк, Bк ), t [t п, к 1, t к ]);

(3.13) – требования к адекватности модели по величине абсолютной погрешности ~ i 0;

n : yi = yi y i y доп (3.14) и величине разрыва производной в точках "переключения" стадий ~ ~ j = 1, к 1 : y (t пj 0) y (t пj + 0) y доп, (3.15) & & & ~ где tпj – время переключения модели M j на M j +1 ;

y, ~, y – регистрируемые, рассчитанные по модели значения контро y& ~ ~ лируемой фазовой координаты и ее производной;

y (t пj 0), y (t пj + 0) – значения производных в момент стыковки tпj по & & моделям M j и M j +1, соответственно;

y доп, y доп – допустимые значения ошибки расчета y и разрыва ее производной, & заметим, что значения yдоп для различных частных моделей M j могут отличаться.

Требуется определить параметры A j, B j частных моделей M j, j = 1;

к и моменты переключений tпj, j = 1;

к 1, при которых выполняются ограничения (3.14), (3.15) и достигает минимума критерий 2 n n ~ ~ 1 к Q = yi y i ( A1, B1 ) +... + yi y i ( Aк, Bк ) + i =0 i = nк 1 к ~ ~ + c y (t пj 0 ) y (t пj + 0 ) min, (3.16) & & A j, B j, tп j j = где c – весовой коэффициент, n j, j = 1, к – номера регистрации выходной переменной y (ti ), соответствующие моментам времени tпj.

З а д а ч а 3.4. По измеренным значениям входов и выходов x (ti ), y (ti ), i = 1, n, а также заданном числе зон требуется определить виды моделей M 1, M 2,..., M к, границы переключения зон Yп и рассчитать массивы параметров моделей A1, A2,..., Aк, при этом критерий, учитывающий разницу между экспериментальными и расчетными значениями y, должен достигать минимального значения, а вид моделей принадлежать множеству моделей, содержащихся в базе знаний. Матема тически данная задача записывается в следующем виде:

µ 4 : X Y T M 1 M 2... M к Yп A 1 A 2... A к, (3.17) Q ( )) ( ~ Q Y, Y M i, Ai, i = 1, к;

Yп min. (3.18) M i M бз, Ai A, Yп З а д а ч а 3.4а. Эта задача формулируется аналогично задаче 3.4, но вместо минимизации критерия (3.18) на него на кладывается ограничение на величину допустимой погрешности, т.е.

( ) ~ Q Y, Y ( Ai, i = Yп ) Qдоп. (3.19) З а д а ч а 3.4б. Данная задача отличается от задач 3.4 и 3.4а тем, что время получения экспериментальных данных ог раничено, т.е. должно выполняться ограничение (3.4).

З а д а ч а 3.4в. В данной задаче отсутствует ограничение на то, что виды моделей в каждой зоне M 1, M 2,..., M к должны содержаться в базе знаний.

З а д а ч а 3.4г. В данной задаче в отличие от задач 3.4, 3.4а, 3.4б и 3.4в число зон и их границы заранее не заданы, а определяются в процессе идентификации, т.е.

µ 4 : X Y T M1 M 2... M к Yп A 1 A 2... A к K, (3.20) Q ( )) ( ~ Q Y, Y M i, Ai, i = 1, к;

Yп min, (3.21) M i M бз, Ai A, Yп Yп,кK здесь K – множество числа зон.

Задачи идентификации 3.4, 3.4а, 3.4б, 3.4в, 3.4г являются наиболее сложными, особенности их решения излагаются в следующем разделе 3.2.

3.2. ОСОБЕННОСТИ ИДЕНТИФИКАЦИИ МОДЕЛЕЙ ДИНАМИКИ НА МНОЖЕСТВЕ СОСТОЯНИЙ ФУНКЦИОНИРОВАНИЯ К моделям динамики, используемым для анализа и синтеза оптимального управления, предъявляются высокие требова ния по их адекватности на множестве состояний функционирования. Известные аналитические и статистические методы построения моделей не позволяют добиться требуемой точности в различных состояниях функционирования [78, 93, 94].

Модель динамики на множестве состояний функционирования H в обобщенном виде может быть записана следующим образом z = f h ( z, u, t;

h ), h H, (3.22) & где z – n-вектор фазовых координат;

u – m-вектор управления;

h – массив параметров модели в состоянии h.

Модель (3.22) должна удовлетворять следующим требованиям: 1) пригодность для решения задач оптимального управ ления в реальном времени, фазовые координаты z должны соответствовать непосредственной цели управления;

2) возмож ность "быстрой" идентификации модели в задачах совмещенного синтеза ОУ при изменяющихся состояниях функциониро вания;

3) высокая точность с учетом возможных значений h в процессе эксплуатации объекта.

Основные трудности при идентификации модели (3.22) обусловлены нелинейностью и нестационарностью объекта, на личием ошибок измерения и невозможностью получить всю необходимую информацию. В основе разрабатываемых алго ритмов идентификации на множестве H лежат следующие предположения: 1) структура модели соответствует реальным физическим и другим процессам, протекающим в объекте управления;

2) данные процессы описываются известными зави симостями, например, балансно-кинетическими уравнениями тепломассопереноса и т.п.;

3) в ходе направленного изменения вектора z процессы протекают с разной интенсивностью, это позволяет выделить зоны или состояния функционирования, в которых отдельными процессами можно пренебречь, подобное разбиение на зоны назовем динамической декомпозицией;

4) границы зон можно определить по характерным точкам (экстремумы, нули) траекторий zi (o ) фазовых координат и их про изводных;

5) между фазовыми координатами составных частей системы существуют уравнения связи, позволяющие пони жать размерность вектора z. На основе высказанных предположений структура модели (3.22) может быть представлена в виде обыкновенных дифференциальных уравнений с "переключаемой" правой частью [27], т.е.

A1 ( z, u ) z (t ) + B1 ( z, u ) u (t ), h = h1 ;

z= (3.23) & L A ( z, u ) z (t ) + B ( z, u ) u (t ), h = hк, к к где A j, B j – матрицы параметров, которые в общем случае зависят от z, u.

Модель в форме (3.23) будем называть общей, а отдельные правые части для различных состояний функционирования – частными. Получение модели (3.23) выполняется в два этапа. На первом разрабатывается ее структура на основе рассмотре ния протекающих в объекте процессов, определяется число зон (стадий) и виды частных моделей. На втором этапе оценива ются параметры, границы зон частных моделей и проверяется адекватность.

П р и м е р 3.1. Большой класс тепловых объектов содержит три основные части: управляемый источник тепла (нагре ватель) 1, нагреваемое тело 2, оболочка (корпус) 3, отделяющая тело от окружающей среды. Для получения модели прини маются следующие допущения: 1) температуры частей объекта T1, T2, T3 равны их средним по объемам значениям;

2) для нагревателя и стенки корпуса используются усредненные по объемам плотности (1, 3 ) и удельные теплоемкости (c1, c3 ) ;

3) температура внутренней поверхности корпуса равна температуре нагреваемого тела;

4) между частями объекта и внешней средой имеет место конвективный теплообмен. При этих допущениях состояние объекта в основном определяется значения ми четырех температур T1, T2, T3, T4 ( T4 – температура среды). В предположении, что нагревается жидкость, можно запи сать балансно-кинетическую модель в виде уравнений dT 1c1V1 (T ) = U (t ) I (t ) 1 F1 (T1 (t ) T2 (t )) ;

dt dT 2c2V2 (T2 ) = 1F1 (T1 (t ) T2 (t )) 3 F3 (T2 (t ) T3 (t )) ;

dt dT 3c3V3 (T3 ) = 3 F3 (T ) (T2 (t ) T3 (t )) F3(T ) (T3 (t ) T4 (t )), dt где V1, V2, V3 – объемы нагревателя, жидкости и корпуса;

F1 – наружная поверхность нагревателя;

F3, F3 – внутренняя и наружные поверхности корпуса;

1, 3, – коэффициенты теплоотдачи нагревателя и стенок корпуса (изнутри и снаружи);

U, I – электрические напряжения и ток нагревателя.

Используя динамическую декомпозицию, введем следующие состояния функционирования, соответствующие различ ным стадиям (зонам) нагрева. Состояние h1 характеризуется интенсивным повышением температуры нагревателя, при этом изменения температуры корпуса незначительны, потери тепла в окружающую среду отсутствуют. В этом состоянии частная модель имеет вид F F dT1 dT U (t )I (t ) 1 1 (T1 (t ) T (t )), = 1 1 (T1 (t ) T2 (t )) = dt 1c1V1 1c1V1 2c2V dt или z1 = z 2 ( t ), z 2 = a 21) z 2 ( t ) + b (1) u ( t ), z1 = T2, z2 = dT (, (3.24) & & dt 1 F 1 a21) = 1F (, b (1)u (t ) = U (t ) I (t ).

+ 1c1V1 2 c2V2 1c1V1 2 c2V В состоянии h2 частная модель учитывает нагрев стенок корпуса 3 аппарата, т.е.

z1 = z 2 ( t ), z 2 = a1 2 ) z1 ( t ) + a 22 ) z 2 ( t ) + b ( 2 ) u ( t ), ( ( (3.25) & & 1 F1 3 F3 T3 (t ) 1 F a1 2 ) = ( (2), b u (t ) = U (t )I (t ), 1c1V1 2 c2V2 T (t ) 1c1V1 2 c2V T3 (t ) & 1 3 F a22 ) = 1 F ( T (t ).

+ + & 1c1V1 2 c2V2 2 c2V Для последующих состояний функционирования учитываются потери тепла в окружающую среду, частные модели имеют вид, аналогичный (3.25).

В результате общая модель для четырех состояний функционирования имеет следующую структуру z1 = z 2 ( t ), & [ ) a 21) z 2 ( t ) + b (1) u ( t ), ( o п z1 z1, z1 ;

(2) z1 [z1, z1 ) ;

(2) (2) a (t ) z1 ( t ) + a 2 (t ) z 2 ( t ) + b u ( t ), п1 п &2 = 1 (3.26) z z1 [z1, z1 ) ;

(3) (3) (3) a1 (t ) z1 ( t ) + a 2 (t ) z 2 ( t ) + b u ( t ), п2 п z1 [z1, z1 ], (4) (4) (4) a1 z1 ( t ) + a 2 z 2 ( t ) + b u ( t ), п3 п где z1 j – температуры "переключений" состояний функционирования.

п Верификация полученной структуры модели осуществляется по экспериментальным данным z1 (t ). На втором этапе идентификации оцениваются параметры и границы зон частных моделей. Оценка границ производится с использованием сигналов z 2 (ti ) и z 2 (ti ). В результате получена общая модель, которая удовлетворяет требованиям точно & сти как по величине абсолютной погрешности, так и величине разрыва z 2 в точках "переключения" зон. Оценка параметров предварительно производилась для отдельных стадий, затем они уточнялись минимизацией критерия к к ( ) ( ) Q = q j z1max ai( j ), b ( j ), z1 j + p j z 2 max ai( j ), b ( j ), z1 j ;

( j) ( j) п п j =1 j = [ ] ( ) ( ) z1max = max z1 (ti ) ~1 (ti ), ti t п1, t п, z 2 j ) = z 2 t п 0 ~2 t п + 0, ( ( j) j z zj j j где q j, p j – весовые коэффициенты;

~1, ~2 – значения z1, z2, рассчитанные по модели;

t п – моменты времени переключе zz j ния частных моделей.

Полученная модель использована при создании математического обеспечения контроллера, управляющего процессом нагрева жидкости с минимумом затрат энергии.

3.3. ИДЕНТИФИКАЦИЯ МОДЕЛЕЙ ПРИ ОПЕРАТИВНОМ СИНТЕЗЕ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ В задачах совмещенного синтеза ОУ, решаемых при изменении состояния функционирования, идентификация модели должна производиться в жестко ограниченном временном интервале, это отражено в постановке задачи 3.1б (см. разд. 3.1).

Вместе с тем, получаемая модель должна иметь достаточную точность. Требования сокращения времени на идентификацию и повышение точности являются противоречивыми. Для учета данного обстоятельства алгоритмы идентификации при со вмещенном синтезе ОУ должны, во-первых, иметь высокую скорость оценки параметров модели с использованием простых расчетных формул, во-вторых, обладать свойством предсказания вида модели по небольшим участкам траекторий y () и u (). Наиболее предпочтительны в вычислительном отношении алгоритмы оценки параметров, использующие конечные формулы и не содержащие поисковых процедур.

П р и м е р 3.2. Рассмотрим получение расчетных формул для оперативной оценки по минимальному числу измерен ных значений фазовых координат z и управления u параметров модели вида реальный двойной интегратор (РДИ), т.е.

z1 = z 2 (t ), & z 2 = az 2 (t ) + bu (t ).

& Так как для данной модели 1 (e a (t to ) 1) / a e A( t t o ) =, 0 e a (t to ) то в предположении, что на временном интервале [t0, t ] управление u (t ) = u = const, можно записать e a ( t t0 ) 1 bu e a (t t0 ) 1 z1 (t ) = z1 (t 0 ) + z 2 (t 0 ) + (t t 0 ) ;

a a a ( ).

bu a (t t0 ) z 2 (t ) = e a (t t0 ) z 2 (t 0 ) + e a Для временного шага дискретизации t = ti +1 ti разностная форма записи модели принимает вид z1 (i + 1) = 1 z 2 (i ) + 2 u (i ) ;

z 2 (i + 1) = 1 z 2 (i ) + 2 u (i ). (3.27) здесь z1 (i + 1) = z1 (i + 1) z1 (i ), z j (i ) = z j (ti ), j = 1, 2;

u (i ) = u (ti ), ( ) 1 = e at 1 / a, 1 = e at, ( ) 2 = b (1 t ) / a, 2 = b e at 1 / a.

Решая систему уравнений (3.27) для измеренных значений z1 (i ), z1 (i + 1), z2 (i ), z2 (i + 1), u (i ), сначала оцениваются значения промежуточных параметров 1, 2, 1, 2, а затем находятся параметры модели объекта по формулам a = ln 1 / t, b = 2 / 1.

Аналогично определяются формулы для оценки параметров других видов моделей. Например, для определения пара метров модели в виде дифференциального уравнения первого порядка (апериодическое звено) сначала по трем измеренным значениям z (i 1), z (i ), z (i + 1) и двум значениям вычисляются промежуточные величины c (i ) и d (i ) по формулам z (i ) u (i ) z (i + 1) u (i 1) c(i ) = ;

z (i 1) u (i ) z (i ) u (i 1) z (i + 1) z (i 1) z 2 (i ) d (i ) =, z (i 1) u (i ) z (i ) u (i 1) затем оцениваются параметры модели для момента времени ti :

d (i ) a(i ) a (i ) = ln c (i ) ;

b (i ) =.

c (i ) t Если имеется нескольких значений с (i ), d (i ) для ti, i =1, n, то используется их усреднение, т.е.

n 1 n d a 1 1 c= c (i ) ;

d = d (i );

a = ln c ;

b =.

n 2 i=2 n 2 i=2 t c а) б) г) в) Рис. 3.1. Формы траекторий изменения выходной переменной при скачкообразном изменении управляющего воздействия для моделей динамики в виде дифференциальных уравнений первого (а) и второго (ДИ – б, РДИ – в, ДА – г) порядков Следует заметить, что в формулах для моделей второго порядка предполагается возможность оценки фазовой коорди наты z 2. Если ее значения не известны, то формулы усложняются. Например, для объекта двойного интегрирования одно временная оценка b (i ) и z2 (i ) может производиться решением системы двух линейных уравнений:

uij (t j ti ) z 2 (ti ) + (t j ti )2 b = y (t j ) y (ti ) ;

u iк (t к ti )z 2 (ti ) + (t к ti )2 b = y (tк ) y (ti ) ;

i j к, где uij, u i к – усредненные управляющие воздействия соответственно на временных интервалах [ti, t j ], [ti, t к ].

На рис. 3.1 приведен качественный характер изменения выходной переменной y = z1 для рассмотренных моделей при ступенчатом изменении управления. Как видно из графиков, измеренные значения y (i ), i = 0, 1, 2,... на начальном участке траекторий y () не позволяют с достаточной точностью предсказать, какой вид имеет модель динамики объекта. Для реше ния данной проблемы необходимо на основе дополнительных замеров определять тенденцию изменения оценок показате лей, характеризующих вид модели.

3.4. ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ ДЛЯ ИДЕНТИФИКАЦИИ МОДЕЛЕЙ Для решения задач идентификации модели динамики объекта в основном применяются два класса информационных технологий. К первому классу относятся программные продукты широкого назначения типа пакетов прикладных программ, ко второму классу – специализированные программы, входящие отдельными модулями в различные информационные сис темы. Из числа пакетов прикладных программ наиболее широкое распространение находят система MATLAB, EXCEL и др.

[82, 102 – 104].

Программный комплекс MATLAB фирмы Wath Works включает два пакета для идентификации моделей – System Identification Toolbox и Frequency Domain Identification. Пакет System Identification Toolbox (или просто System Identification) содержит средства для создания математических моделей линейных динамических объектов (систем) на основе результатов наблюдения входных и выходных переменных. Пакет имеет удобный графический интерфейс, помогающий в диалоговом режиме располагать экспериментальные данные и получать соответствующие модели. Методы идентификации, входящие в пакет, применимы для решения широкого класса задач – от проектирования систем управления и обработки сигналов до анализа временных рядов. К основным достоинствам пакета относятся: возможность предварительной обработки данных, включая фильтрацию, удаление трендов и смещений;

выбор диапазона используемых данных;

применение эффективных методов авторегрессии;

возможности моделирования динамических свойств системы как во временной, так и частотной об ластях и др.

Для облегчения работы с разнообразными моделями в пакете они разбиты на группы: линейные, нелинейные, стацио нарные, нестационарные, непрерывные, дискретные, с сосредоточенными параметрами, с распределенными параметрами и т.д. При оценивании параметров модели заданной структуры в качестве критерия адекватности модели обычно используют ся средний квадрат рассогласования между экспериментальными данными на выходе и рассчитанными по модели.

В качестве примера информационной технологии второго класса рассмотрим программные модули экспертной системы "Энергосберегающее управление динамическими объектами", предназначенные для идентификации моделей. Эти модули позволяют в автоматизированном режиме выполнять следующие работы.

1. Планировать проведение экспериментов и производить их первичную обработку. Основными целями данного этапа являются: получение исходных данных для идентификации модели динамики объекта;

предварительное оценивание воз можного эффекта от энергосберегающего оптимального управления;

"эскизная" формализация возможного решения задачи оптимального управления.

2. Производить выбор вида (структуры) модели и оценку ее параметров. При этом возможны решения ряда задач иденти фикации, различающихся степенью изученности объекта, например структура модели известна и требуется оценить лишь пара метры дифференциальных уравнений или идентифицировать структуру и др. Особенностями решаемых задач идентификации являются следующие. Во-первых, получаемые модели должны годиться для оперативного решения ЗОУ, т.е. для них нужны со ответствующие фреймы в базе знаний экспертной системы [78, 81, 105, 106]. Во-вторых, модели должны удовлетворять требо ваниям адекватности при различных значениях управляющих воздействий, во всем диапазоне изменения фазовых координат и состояний функционирования. В-третьих, значения параметров моделей не должны противоречить протекающим физическим процессам при динамических режимах. В-четвертых, должны соблюдаться ограничения на допустимость разрывов фазовых координат и их производных. Как уже отмечалось, этим требованиям удовлетворяют модели в виде дифференциальных урав нений с разрывной правой частью при ограничении на разрывы производных в моменты "переключения" правых частей [27].

Выводы по третьей главе Определены следующие требования, предъявляемые к моделям: 1) пригодность для решения задач оптимального управления в реальном времени, фазовые координаты z должны соответствовать непосредственной цели управления;

2) возможность "быстрой" идентификации модели в задачах совмещенного синтеза ОУ;

3) высокая точность.

Приведены постановки задач идентификации моделей динамики объектов. Сформулированные задачи относятся как к моделям в виде одной системы дифференциальных уравнений, так и к дифференциальным уравнениям с разрывной правой частью. Это позволяет определить модели для широкого класса энергоемких объектов, в том числе нелинейных.

Рассмотрены алгоритмы идентификации моделей динамики на множестве состояний функционирования и использова ние информационных технологий при решении задач идентификации моделей.

4. МЕТОДОЛОГИЯ ПОЛНОГО АНАЛИЗА ЗАДАЧ ЭНЕРГОСБЕРЕГАЮЩЕГО УПРАВЛЕНИЯ Анализ оптимального управления охватывает широкий круг задач, связанных с исследованиями вопросов существова ния решения, устойчивости, определения возможных видов функций оптимального управления и др. В настоящем разделе для решения задач анализа будет использован в основном математический аппарат принципа максимума и метода синтези рующих переменных [45, 50, 51, 107].

4.1. Метод синтезирующих переменных и существование решения задачи оптимального управления Метод синтезирующих переменных предполагает введение некоторого синтезирующего вектора, размерность которого значительно меньше размерности массива исходных данных для численного решения ЗОУ, который однозначно определяет вид и параметры функции оптимального управления.

Пусть для линейного объекта, динамика которого описывается моделью z = Az (t ) + Bu (t ), z = ( z1, z 2,..., z n ) т B = (0;

...;

0;

b ) т, (4.1) & решается ЗОУ, заключающаяся в переводе объекта на заданном интервале времени [t 0, t к ] из начального состояния z 0 в конечное z к, т.е.

z (t0 ) = z 0 z (tк ) = z к, (4.2) при ограничении на управление t [t 0 ;

t к ] : u (t ) = [u н ;

u в ], (4.3) минимуме функционала tк f o ( z, u, t ) dt min I ( z (), u ()) = (4.4) u t и исходных данных, образующих массив реквизитов ( ) R = A, B, u н, u в, z 0, z к, t 0, t к. (4.5) u (t / d ) и Большое значение для оперативного решения ЗОУ имеет установление соответствия между функцией ОУ j массивом данных R, т.е. определения вида j и массива параметров d функции ОУ по значениям компонентов массива R.

Для получения такого соответствия вводится понятие синтезирующих переменных и синтезирующих параметров, которые образуют синтезирующий вектор l и зависят от компонентов массива реквизитов R. Значение вектора l изменяется на временном интервале управления [t 0, t к ] с изменением значений z (t ) и остаточного времени tк t. Вместе с тем значения компонентов l могут скачкообразно изменяться в моменты времени смены состояний функционирования [108, 109].

Определение 4.1. Вектор l называется синтезирующим, если его значение однозначно определяет вид и параметры ОУ задачи (4.1) – (4.4) для заданного массива реквизитов (4.5), пространство значений вектора l называется синтезирующим пространством. Компоненты вектора l, зависящие только от значений параметров матрицы A модели объекта, будем назы вать параметрами и обозначать.

Пусть для конкретного функционала (4.4) имеется v видов функций ОУ. Функции ui (t ) и u (t ), i, j {1,..., v} могут j различаться числом интервалов непрерывности (моментов переключения) и т.д.

Определение 4.2. Область значений вектора l, для которых задача (4.1) – (4.4) имеет решение при функции управления u j (t ), называется областью существования ОУ j-го вида и обозначим K j, j = 1, v. Объединение областей K j образует об v ласть K c существования решения задачи (4.1) – (4.4), т.е. K c = U K j. Области, соответствующие областям K c и K j в син j = тезирующем пространстве для фиксированных значений, обозначим K c и K ;

таким образом, области K c и K j строят j ся в пространстве компонент синтезирующего вектора l, а K c и K являются их сечениями.

j Области K c и K c представляют собой разновидности множеств достижимости [18, 110]. Граничные поверхности об ластей K c и K c обозначим соответственно Pc и Pc. В основе метода синтезирующих переменных лежат следующие ут верждения [107].

Утверждение 4.1. Если в ЗОУ (4.1) – (4.4) а) собственные значения матрицы A вещественные, б) для рассматриваемо го функционала (4.4) управление u () (в случае его существования) единственно, то n-вектор ( ) 1к z e A(tк t1 ) z 0, l = (l1 ;

...;

l n ) т = (4.6) b и массив параметров = (1,..., m ), m n собственных значений матрицы A являются синтезирующими, при этом по верхность Pc задается уравнениями (ln 1 ) 2 (l n 1 ) n,n (tк t ) dt +...

n, n (t к t ) dt + u н ln = uв (ln 1 ) t0 tк (t к t ) dt ;

... + u гр n, n (4.7) n 1 (l n 1 ) 1 (l n 1 ) tк n, n (t к t ) dt +... + u гр (t к t ) dt ;

ln = uн n, n (4.8) n 1 (l n 1 ) t l n 1 = (l1 ;

...;

l n 1 ;

) ;

(4.9) [ ] li liн (l ), liв (l ), (4.10) причем значениям l Pc K c (за исключением значений l, принадлежащих (4.7) и (4.8) одновременно с учетом границ (4.10)) соответствуют управления вида оптимального быстродействия, т.е.

[ ) u, t t ;

' ;

в 0 u н при n четном;

[ ) u б (t ) = u н, t 1 ;

1 ;

' ' u гр = (4.11) u в при n нечетном,...

[ ) ' u гр, t 1n 1 ;

t к ;

или uн, t [t0 ;

1) ;

u при n четном;

uб (t ) = uв, t [1;

2 ) ;

uгр = в (4.11а) uн при n нечетном,...

uгр, t [n 1;

tк ) ;

где 1 (ln 1), 1 (ln 1) – функции значений массива ( Ln 1), определяемые из уравнений (4.11), (4.11а);

n, n (t к t ) – эле мент матрицы exp [ A (t к t )] ;

li н(в ) (l ) – границы изменения li в уравнениях (4.7) и (4.8). Конкретное использование соотно шений (4.7), (4.8) приведено в примере 4.1.

Действительно, вектор l, определяемый (4.6), легко преобразуется в вектор tк V (t к t 0 ) = e At b u (t ) dt, (4.12) t используемый при определении множества достижимости в фазовом пространстве [110]. Для этого достаточно положить Atк. Таким образом, с помощью l можно задавать множество значений z (t 0 ) = z 0, t 0 = 0, z iк = 0, i = 1, n и умножить l на be из которых достигаются z (t к ) = z к за время управления tк t0.

Заметим, что при выполнении условия а) имеет место (см., например, [111]) s mк t i e к t кi, e At = к =1 i = где к, к =1, s – различные собственные значения матрицы A ;

mк – кратность к как нуля минимального многочлена A ;

кi – матрица с постоянными элементами, зависящими только от A.

~ Предположим, что некоторому значению l K соответствуют два управления u1 () и u2 (), обеспечивающих перевод из z0 в zк за время (tк t0 ) и различающихся видом функции ui () или значениями ее параметров. Однако в силу условия б) для конкретного функционала I это невозможно, поэтому вектор l и массив с учетом (4.12) являются синтезирующими, т.е. l = (l ;

).

Существование ОУ видов (4.11), (4.11а) для задачи (4.1) – (4.4) известно [18, 60, 112].

Справедливость (4.7), (4.8) для уравнений (4.11), (4.11а) можно показать, записав уравнение Коши для первых (n 1) компонент вектора z. В этом случае для управления (4.11) получаем следующую систему (n 1) уравнений:

1 li = u в Ф i,1 (t к s ) ds + u н Ф i,1 (t к s ) ds +...

t tк Ф i,1 (tк s ) ds, i =1, n 1.

... + u гр (4.13) n Решая данные уравнения относительно i, i = 1, n 1, получаем i = f i (l1,..., l n 1 ;

), i = 1, n 1. (4.14) Подставив (4.14) с учетом (4.9) в уравнение вида (4.13) при i = n, приходим к (4.7). Аналогично, с использованием уравнения (4.11а) получаем уравнение (4.8).

Интервалы (4.10) изменения li, i = 1, n получаются подстановкой пределов изменения i в функции (4.14).

То, что поверхность Pc, задаваемая уравнениями (4.7), (4.8), является поверхностью области K c, можно показать, ис пользуя прием, с помощью которого доказывается теорема о n интервалах [112]. В соответствии с этим приемом, если зна чению l соответствует управление uб () (см. (4.11) или (4.11а), то для того же или меньшего времени tк t0 и равенства других компонентов R не существует другого вида управления, обеспечивающего перевод объекта из z 0 в z к. Из (4.6), (4.12) видно, что с увеличением tк t0 при прочих равных условиях значения компонент вектора l уменьшаются. Следова тельно, на поверхности Pc может иметь место лишь управление вида uб (). Полученный результат о поверхности P следует также из леммы о границе области достижимости [110].

Следствие 4.1.1. Область K c, ограниченная поверхностью Pc, выпукла, симметрична относительно начала коорди нат, замкнута и "растет" с увеличением временного интервала tк t0 и параметра b, а также расширением границ управле ния.

Данные свойства вытекают из "подобия" области K c и множества достижимости [18,110]. Выпуклость K c легко пока зать, рассматривая линейную комбинацию значений l, т.е. если l, l K c, то и [ µ l + (1 µ ) l ] K c, µ [0,1]. Для симмет ричности K c должно выполняться условие: если l K c, то и l K c. Это свойство наглядно проявляется при рассмотре нии примера 4.1. Замкнутость K c и K c показывается аналогично замкнутости множества достижимости [18, 110]. Послед нее свойство понимается в том случае, что если tк t0 t t0, то K c (tк ) K c (tк ) и т.д.

Следствие 4.1.2. Вектор l и массив однозначно определяют вид и параметры ОУ при следующих наиболее распро страненных в практических задачах энергосберегающего управления функционалах tк tк u(t ) dt I э = u 2 (t ) dt min, Iт = min;

t0 t tк n I кв = ci zi2 (t ) + cu 2 (t ) dt min;

(4.15) t 0 i =1 tк u(t ) dt I б = t к t 0 min, I бт = c(t к t 0 ) + min.

t Для функционалов I т, I бт следствие 4.1.2 справедливо в областях K j, где оптимальное управление единственно;

для областей, в которых управление не единственно, l и задают параметры одного из возможных видов оптимального управ ления.

Доказательства существования и единственности ОУ при функционалах I э, I, I кв, I б, I бт для некоторых объектов приведены в работах [18, 19, 60, 112].

Практическое значение результатов утверждения 4.1 состоит в том, что без определения вида ОУ с помощью уравнений (4.7), (4.8) и соотношений (4.10), (4.14) можно непосредственно по значениям массива реквизитов R проверить, существует ли решение задачи (4.1) – (4.4) для любого из функционалов (4.15) или нет. Основная трудность здесь заключается в получе нии соотношений (4.7), (4.8), (4.10), (4.14) для каждого нового вида объекта управления, кроме того, поверхность Pc изменя ется при смене значений массива R. С целью устранения последнего обстоятельства целесообразно перейти к рассмотрению базовой задачи [26, 45], для которой поверхность Pc инвариантна к изменению компонентов R.

Определение 4.3. Базовой или нормированной для множества исходных задач (4.1) – (4.4), определяемого возможными значениями реквизитов R, называется следующая задача:

T [0;

Tк ];

Z = A Z (T ) + B U (T ) + B0, & B = (0;

..., 0, b ), B0 = (0;

..., 0, b0 ) т т ;

Z (0 ) = z Z (Tк ) = z, U (T ) U гр ;

0 к, (4.16) Tк I ( Z (), U ()) = F0 ( Z,U, T ) dt min, соответствующие области существования для которой обозначим через L c, L i, L, L, i =1,.

c i Задача (4.16) характеризуется нормированием границ управления и временного интервала. Нетрудно показать, что лю бую задачу ОУ вида (4.1) – (4.4) можно свести к задаче (4.16), используя простые соотношения. Например, при Tк = 2, U гр = 1 (4.17) расчет параметров и переменных задачи (4.16) производится по формулам t t A = 0,5 (t к t 0 ) A, B = 0,25 (u в u н )(t к t 0 ) B, T = 2, tк t 2u u в u н B0 = 0,26 (u в + u н )(t к t 0 ) B, U= (4.18), uв uн F0 ( Z, U, T ) = f 0 ( z, u, t ).

tк t Переход от ОУ U (T ) задачи (4.16), (4.17) к реальному управлению производится с использованием простых соотно шений [ ] u = 0,5 U (u в u н ) + u в + u н, t = t 0 + 0,5 T (t к t 0 ). (4.19) Утверждение 4.2. Если в задаче (4.1) – (4.4) с функционалами I э, I т, I кв выполняется первое условие утверждения 4.1, а также значения tк t0, z 0, z к конечны, причем t к t 0, z к z 0, то существуют синтезирующий п-вектор L и массив пара метров, для которых области существования L c, L и L обладают следующими свойствами:

c i – области L c, L и L, i =1, v инвариантны изменениям реквизитов задачи z 0, z к, t 0, t к, B, u н, u в, а области c i L c, L не зависят от вида функционала;

c – область L c в пространстве синтезирующего вектора L = ( L, ) для каждого вида функционала (4.15) изоморфна (в смысле расположения областей L i, i = 1, v ) области K c в пространстве значений l, при этом между значениями L и l имеет место однозначное соответствие.

Для доказательства свойства инвариантности достаточно показать, что оно выполняется для базовой задачи (4.16). Так как у базовой задачи временной интервал и границы для управления постоянны, а именно эти реквизиты определяют разме ры областей существования ОУ, то для задачи (4.16) области L c, L, L j, j =1, v постоянны. Действительно, для задачи c (4.16), используя формулу Коши, можно записать к n Фi, j (2) zi b0 Фi, n (2 T ) dT = z i b j =1 = Фi, n (2 T )U (T ) dT, i = 1, n, (4.20) где Фi, j (T ) – компонент матрицы e A T.

На основании (4.12) и (4.20) можно получить систему уравнений, связывающих компоненты L, и U (T ) задачи (4.16), например, в виде iT Li = e U (T ) dT, i = 1, n, (4.21) здесь предполагается, что характеристические числа i матрицы A различные.

С помощью уравнений (4.18) задача (4.1) – (4.4) при любых реквизитах может быть преобразована к базовой. Незави симость областей L c, L от вида функционала следует непосредственно из (4.20), (4.21).

c Одинаковое число областей L j, L для конкретного вида функционала вытекает из соответствия сопряженной системы j уравнений принципа максимума для задачи (4.1) – (4.4) и задачи (4.16). При этом, если характеристическое уравнение для матрицы A имеет только действительные корни (условие а) утверждения 4.1), то это сохраняется и для соответствующих корней базовой задачи, а следовательно, и для корней сопряженных систем с переменными i (t ) и i (t ), i = 1, n принципа максимума применительно к задачам (4.1) – (4.4) и (4.16) (см., например, [60]). Следовательно, n n i (t ) = ci e, i (t ) = ci e t T, i = 1, n, =1 = здесь постоянные ci и ci определяются решением соответствующих граничных задач и выражаются через значения ком понент векторов l и L. Выражая u (t ) и U (t ) через i (t ) и i (t ), i = 1, n для конкретного вида функционала, нетрудно j j убедиться в изоморфности областей L c и K c.

Однозначное соответствие между l и L нетрудно показать, выразив вектор L непосредственно через компоненты массива R с использованием равенств (4.18).

Следствие 4.2.1. Поверхности Gc, Pc областей L c и K c применительно к задачам (4.1) – (4.4) и (4.16) не зависят от вида функционала, т.е. сохраняются неизменными для функционалов I э, I т, I кв.

Следствие 4.2.2. Область L c есть объединение непересекающихся областей L j, j = 1, v, при этом v зависит только от вида функционала и значений компонентов матрицы A, а границы областей L j определяются значениями L,.

Следствие 4.2.3. Вид и параметры ОУ задачи (4.1) – (4.4) однозначно определяются значениями вектора L и массива, в свою очередь, рассчитываемыми по реквизитам R.

Следствие 4.2.4. Область L, ограниченная поверхностью Gc, обладает свойствами выпуклости, симметричности от c носительно начала координат и замкнутости, отмеченными следствием 4.1.1.

На основе результатов утверждения 4.2 можно построить области L c, L и L, j =1, v, не зависящие от значений c j z 0, z к, t 0, t к, B, u н, u в, и использовать эти области для анализа и синтеза ОУ задачи (4.1) – (4.4) при любых реквизитах R.

Это позволяет области L держать в памяти управляющих ЭВМ или контроллеров, что открывает широкие возможности j для решения задач анализа и синтеза ОУ в реальном времени.

П р и м е р 4.1. В качестве примера введения вектора синтезирующих переменных и использования утверждений 4.1, 4.2 рассмотрим модель ЗОУ АИ, Э, Пр, О. Здесь динамика объекта управления описывается линейным дифференцирован ным уравнением второго порядка с матрицами 0 1 A=, B =, (4.22) 0 a2 b минимизируемый функционал – затраты энергии I э, стратегия реализации ОУ – программная (Пр), управление (скалярное) ограничено, концы фазовой траектории закреплены, временной интервал t [t0, tк ] фиксирован (О).

Объект с такими матрицами A, B называют интегратором с апериодическим звеном (АИ) или реальным двойным инте гратором (РДИ) [18, 113]. Для рассматриваемого объекта 1 (exp [a 2 (t t 0 ) 1] ) exp [ A (t t 0 )] = a2. (4.23) 0 exp [a 2 (t t 0 ) ] Таким образом, модели ЗОУ АИ, Э, Пр, О соответствует следующая постановка задачи z1 = z 2 (t ), & (АИ) z 2 = a2 z 2 (t ) + bu (t ), t [t 0, t к ];

& tк I э = u 2 (t ) dt min;

(Э) (4.24) u t ( ) u = u (t ), t [t 0, t к ] ;

(Пр) t [t 0, t к ]: u (t )[u н, u в ], (О) zi (t 0 ) = z i0 ;

zi (t к ) = z iк, i =1;

2.

Данная задача, кроме иллюстрированного характера, имеет самостоятельное значение. Она часто встречается при управлении тепловыми аппаратами, электродвигателями, движущимися объектами и гироскопическими системами [18, 19, 114, 115].

Для численного решения ЗОУ задается массив исходных данных (реквизитов) ( ) 0 0 к к R = a 2, b, u н, u в, z1, z 2, z1, z 2, t 0, t к, (4.25) при этом с учетом (4.23) tк z ( ) (e 1) u ( s ) ds;

b + 2 e a2 ( t к t 0 ) 1 + a (t s ) к = z z1 2 к a2 a2 t tк z 2 = e a2 (tк t 0 ) z 2 + b e a2 (tк s ) u ( s ) ds.

к (4.26) t В соответствии с (4.6) утверждения 4. tк ( e a (t t ) 1) = ( e a (t s ) 1) u(s ) ds;

( ) a2 к 0 z l1 = z1 z1 2к 0 2к b b t tк 1к l 2 = z 2 z 0 e a2 ( t к t 0 ) = e a2 (tк s ) u ( s ) ds.

(4.27) b t Учитывая особенности матричной экспоненты exp [ A (t t0 )] удобно вместо l1 использовать l1 = l2 l1, т.е.

tк ( ) ( ) 1 к 0 a2 к z z = u ( s ) ds.

l1 = z2 z 2 (4.28) b b t В этом случае вектор синтезирующих переменных l и синтезирующий параметр соответственно равны l = (l1, l2 ), = a2.

(4.29) Соотношения для поверхности Pc получаются с использованием подстановки uб (t ) (см. (4.11)) в выражения для l1, l 2, т.е.

tк tк l1 (u б ) = u б (t ) dt = u в dt + u н dt = 1 (u в u н ) u в t 0 + u н t к ;

0 t0 1 tк l2 (u б ) = u н dt + u в dt = 1 (u н u в ) u н t 0 + u в t к (4.30) t или l1 (uб ) uнtк + uвt0 l (u ) uвtк + uнt, 1 = 1 б 1 = (4.30а).

uв uн uн uв В результате соотношения, задающие поверхность Pc, принимают следующий вид tк l2 (u б ) = u в e a2 (tк s ) ds + u н e a2 (tк s ) ds = 0 l1 ( uб ) uнtк + uвt uв a2 (tк t0 ) uн uн uв a2 tк uв uн e = + (4.31) e a2 a2 a и аналогично l1 (uб ) uвtк + uнt a2 t к u u u u l2 (uб ) = н e a2 (tк t0 ) в + в н e uн uв. (4.31а) a2 a2 a Изменению 1 в пределах от t0 до t к соответствует область значений l1 от uн (tк t0 ) до uв (tк t0 ), т.е.

l1 [u н (t к t 0 ) ;

u в (t к t 0 )].

(4.32) Соответственно границы изменения l2 определяются равенствами ( ) u в a2 ( tк t 0 ) u н u н u в a2 ( t к t 0 ) u н a2 ( t к t 0 ) 1 = t 0 : l 2 (u б ) = + = 1, e e e a2 a2 a2 a ( );

u н a2 ( tк t 0 ) u в u в u н a2 ( t к t 0 ) u в a2 (t к t 0 ) l 2 (u б ) = + = e e e a2 a2 a2 a ( ) ( ) u в a2 ( t к t 0 ) u 1, l 2 (u б ) = н e a2 (tк t0 ) 1, 1 = t к : l 2 (u б ) = e a2 a т.е.

( ) ( ) u u l 2 н e a2 ( t к t 0 ) 1 ;

в e a2 ( t к t 0 ) 1. (4.32а) a2 a Переходя к базовой (нормированной) ЗОУ с временем T [0;

2], U (T )[1;

1], получаем Z = a Z (T ), Z = a Z (T ) + b U (T ) + b, T [0;

2], & & 1 2 2 2 2 I э = U 2 (T ) dT min ;

(4.33) U ( ) U () = U (T ), T [0;

2], T [0;

2]: U (T )[1;

1], Z i (0 ) = z i0, Z i (2 ) = z iк, i = 1;

2, где a = 0,5 (t к t 0 ), a 2 = 0,5 a 2 (t к t 0 ), b = 0,25 b (t к t 0 )(u в u н ), b0 = 0,25 b (t к t 0 ) (u в + u н ).

Для численного решения базовой ЗОУ задается массив данных ( ) 0 0 к к R = a, a2, b, b0, z1, z 2, z1, z 2. (4.34) Так как матрице A соответствует матричная экспонента ( ) a a2 T 1 e exp [A T ]= a2, (4.35) 0 a2 T e то вектор синтезирующих переменных L = ( L1, L2 ) и параметр соответственно равны ( ) ( ) b 1 к 0 a2 к z1 z1 2 0 = U (T ) dT ;

L1 = z2 z b ba b ( ) ( ) b 1 к 2 a z 2 + 0 e 2 a2 1 = e a2T U (T ) dT ;

L2 = z2 e b b a2 = a2. (4.36) Следует заметить, что в качестве L2 может рассматриваться также ( ) ( ) b 1 к 0 2 a 0 e 2 a2 1 = e a2 ( 2 T )U (T ) dT.

L2 = z2 z 2 e (4.37) b b a2 Для базовой ЗОУ соотношения для поверхности L c, аналогичные (4.31), (4.31а), (4.32, (4.32а), имеют вид ( ) L2 (u б ) = е 2 a2 1 + е 2 a2 2e a2 ( L1 + 2 ) / 2 / a 2 ;

(4.38) L2 (u б ) = е 2 a ( 2e a ( 2 L ) / 2 е 2 a 1) / a 2, (4.38а) 2 2 1 [( ) ].

) ( L1 [ 2;

2], L2 1 е 2 a2 / a2 ;

е 2 a2 1 / a при этом (4.39) Для проверки существования решения ЗОУ при заданном массиве исходных данных R требуется рассчитать значения ( L1, L2, a2 ) и затем определить, находится ли точка L1, L2 внутри области, ограниченной линиями L2 (uб ) и L2 (uб ).

Например, пусть a2 = 0,1, b = 0,2, uн = 100, uв =100;

R = z = 0;

z 0 = 0;

z к =1000;

z к = 0;

t = 0;

t = 20, 1 2 1 2 0 к тогда в соответствии с формулами (4.18), (4.36) a = 10, a2 = 1, b = 200, b0 = 0, L1 = 0,5, L2 = 0.

При L1 = 0,5 и a2 = 1, согласно (4.38), (4.39):

L2 (uб ) = 0,19, L2 (uб ) = 0,847.

Так как L2 [0,19;

0,847], то решение ЗОУ при исходных данных R существует.

Как видно из примера 4.1, вместо рассмотрения ОУ в зависимости от значений компонентов массива R размерности, равной десяти (см (4.20)), анализ методом синтезирующих переменных производится в трехмерном пространстве ( L1, L2, a2 ). Это позволяет визуализировать и хранить в базе знаний результаты анализа для различных моделей ЗОУ.

4.2. ПРОГРАММНАЯ СТРАТЕГИЯ В данном разделе рассматриваются основные задачи полного анализа оптимального управления в виде программы ( ) u () = u (t ), t [t 0, t к ].

К этим задачам относятся определение возможных видов функций u (t ) для конкретных моделей ЗОУ, получение соотно шений для расчета параметров этих функций, определение границ существования функций ОУ различных видов и некото рые другие.

4.2.1. Виды функций оптимального управления Определение видов функций ОУ производится с использованием принципа максимума [60]. Рассмотрим эту задачу применительно к модели объекта в нормированном виде [см. (4.33)] для n = 2, т.е.

f (Z, U, T ) b Z = A Z (T ) + B U (T ) + 0 = F (Z, U, T ) = 1 & (4.40) f (Z, U, T ) b 2 и функционала I = f 0 ( Z, U, T ) dT min. (4.41) U В этом случае Гамильтониан (функция Понтрягина) имеет вид H = f 0 + F = f 0 + 1 f1 + 2 f 2 ;

= (1, 2 ), т (4.42) где 1 (T ), 2 (T ) – промежуточные переменные (импульсы), аналогичные неопределенным множителям Лагранжа.

Возможные виды функций ОУ определяются из условия H = f 0 + 1 f1 + 2 f 2 max, (4.43) U при этом функции i (T ) i = 1, 2 находятся решением уравнений дH & дH & 1 =, 2 = (4.44) дZ1 дZ или в векторно-матричной форме дH ~ & = A (T ).

= (4.44а) дZ Очевидно, решение (4.44а) имеет вид ~ = (1 (0 ), 2 (0 )), T (T ) = e A T (0 ), (4.45) где i (0 ), i =1, 2 – начальные условия (константы).

Определение 4.4. Функции ОУ ui (t ) и u (t ) относятся к разным видам, если они различаются числом параметров, а j также при равном числе параметров, если последние находятся решением разных уравнений.

Утверждение 4.3. Если ЗОУ формулируется как задача (4.1) – (4.4) при функционале I э, то возможные виды функций u (t ), t [t0, tк ] определяются из соотношения:

~ если 0,5 b n (T ) 1;

1, b ~ ~ U (T ) = n (T ), если 0,5 b n (T )[ 1;

1];

(4.46) 2 ~ 1, если 0,5 b n (T ) 1, полученного для соответствующей базовой ЗОУ (4.16), где n (T ) – п-я компонента вектора (t ) = (1 (t ),..., n (t )), являюще ~ ~ ~ ~ T гося решением системы уравнений ~ ~ ~ ~ & = ( 1) AT (t ) ;

(t 0 ) = 0. (4.47) Доказательство утверждения непосредственно следует из принципа максимума и соотношений метода синтезирующих переменных.

Определение 4.5. При анализе ЗОУ M, Э, Пр, О вид функции ОУ, для которого b~ T [0;

2] : U (T ) =U1 (T ) = n (T )[ 1;

1] и число параметров U (T ) равно n, будем называть первым или основным без переключений. Виды функций ОУ, отли чающиеся от первого наличием участков с граничными значениями –1 или 1, будем называть основными с переключениями.

Определение 4.6. Функции ОУ, для которых при определении параметров не требуется решать уравнения вида (4.21), будем называть полюсами.

Примерами полюсов являются ОУ вида U п1 (T ) =1, T [0;

2];

U п 2 (T ) = 1, T [0;

2] и др.

П р и м е р 4.2. Пусть решается ЗОУ (4.33), т.е.

Z1 = a Z 2 (T ) ;

& & b Z 2 = a2 Z 2 (T ) + b U (T ) +, b f1 ( Z, U, T ) = a Z 2 (T ) ;

b f 2 ( Z, U, T ) = a 2 Z 2 (T ) + b U (T ) + 0 b и b f 0 ( Z,U, T ) = U (T ) + 0.

b В этом случае условие (4.43) принимает вид b b H = U (T ) + 0 + 1 (T ) a Z 2 (T ) + 2 (T ) a2 Z 2 (T ) + b U (T ) + 0 max.

b b U (4.48) Предположим, что интервал [uн, uв ], ограничивающий скалярное управление, симметричный, т.е. uн = uв, тогда b0 uн + uв = =0 (4.49) b uн uв и H = U 2 + 1 a Z 2 + 2 (a Z 2 + b U ) max. (4.49а) U Система уравнений (4.44) для нашего случая имеет вид & 1 = 0;

& 2 = a 1 (T ) a2 2 (T ), (4.50) или & 1 0 0 1 (T ) ~ 0 = ;

A =. (4.50а) & a a2 (T ) a a 2 Заметим, что система дифференциальных уравнений (4.50) является сопряженной системе уравнений Z1 = a Z 2 (T ) ;

& 0 a при A = & Z 2 = a 2 Z 2 (T ) 0 a и ~ A = ( 1) A т.

Матричная экспонента в (4.44а) ~ ~ (T ) 12 (T ) ~ e A T = ~11 (4.51) ~ 21 (T ) 22 (T ) может быть определена с использованием обратного преобразования Лапласа, т.е.

) ( ~ ~ 1 e AT = L pE A, (4.52) где E – единичная матрица;

p – параметр преобразования Лапласа.

( ) ~ Для рассматриваемого примера корни характеристического уравнения матрицы pE A равны ~1 = a2, ~2 = 0, следо p p вательно, 1 ~ AT = a a2T ( ). (4.53) e e a2T a e 2 ~ ~ Заметим, что матрица e A T может быть получена транспонированием матрицы e A T, заменой exp [a2T ] на exp [a2T ] и введением a = 0,5 (tк t0 ).

Используя (4.53) и (4.50), получаем 1 (T ) = 1 (0) ;

( ) (4.54) a a2T 1 1 (0 ) + e a2T 2 (0).

2 (T ) = e a Учитывая, что i (0), i = 1, 2 – константы, можно записать 2 (T ) = c0 + c1e a2T, (4.55) где c0, c1 – неизвестные (пока) постоянные.

Для выполнения условия (4.48а) дифференцированием H по U получаем уравнение b 2U + b 2 = 0 или U = 2. (4.56) С учетом ограничения на управление, используемое в базовой задаче (4.33), т.е.

T [0;

2] : U (T )[1;

1], получаем соотношение, определяющее возможные виды функций ОУ:

b 2 (T ) 1;

1, если b b если 2 (T )[ 1;

1];

U (T ) = 2 (T ), (4.57) 2 b если 2 (T ) 1.

1, В соответствии с определением 4.5 и уравнением (4.55) функция ОУ первого вида записывается следующим образом ( ) b b 2 (T ) = c0 + c1e a2T = C1 + D1e a2T, U1 (T ) = (4.58) 2 где C1, D1 – параметры ОУ, которые рассчитываются по известным значениям L1, L2, a2 решением уравнений (4.36).

На основе (4.57), (4.58) и учитывая характер функции exp [a2T ], получаем следующие семь основных видов функций нормированного ОУ с двумя параметрами:

U 1 (T ) = C1 + D1e a2T, T [0;

2];

T [0, T2 ) ;

U 2 (T ), U 2 (T ) = T [T2, 2];

1, T [0, T3 ) ;

U 3 (T ), U 3 (T ) = T [T3, 2];

1, T [0, T4 ) ;

1, U 4 (T ) = T [T4, 2];

U 4 (T ), T [0, T5 ) ;

1, U 5 (T ) = T [T5, 2];

U 5 (T ), T [0, T7 ) ;

1, T [T6, T6 ) ;

U 6 (T ) = U 6 (T ), 1, T [T6, 2];

(4.59) T [0, T6 ) ;

1, T [T7, T7 ) ;

U 7 (T ) = U 7 (T ), 1, T [T7, 2];

U i (T ) = Ci + Di e a2T, i = 2, 7, где Ti, i = 2, 3, Ti, i = 6, 7 – моменты "переключения", т.е. перехода функции U i (T ) на граничное значение.

Следует заметить, что для основных видов функций ОУ с переключениями U i (T ), i = 2, 7 число параметров сводится к двум с использованием дополнительных условий в точках "переключения" (T = 0, U = 1), (Ti = 0, U = 1), (Ti = 2, U = 1), (Ti = 0, U = 1).

Например, для ОУ четвертого вида, т.е.

T [0, T4 ];

1, U 4 (T ) =, T (T4, 2] a2T C 4 + D4 e дополнительное условие имеет вид C4 + D4 e a2T4 = или 1 1 C T4 = ln, a2 D т.е. момент "переключения" T4 выражается через параметры C 4, D4.

Видам функций ОУ (4.59) соответствуют некоторые области G1, G2,..., G7 в пространстве синтезирующих перемен ных L1, L2, a2.

Помимо функций (4.59) имеются функции ОУ с одним параметром, уже рассмотренные в разд. 4.1 применительно к за даче оптимального быстродействия, т.е.

T [0, T8 ) ;

1, U 8 (T ) = T [T8, 2];

1, (4.60) T [0, T9 ) ;

1, U 9 (T ) = T [T9, 2];

1, а также другие. К последним относятся функции, у которых момент "переключения" Ti совпадает со значением T = 0 или T = 2. Например, T4 = 0, в этом случае T = 0;

1, U 4(1) (T ) = (4.61), T (0;

2].

a2T C 4 + D4 e В соответствии с определением 4.6 наряду с полюсами U п1 (T ) =1, T [0;

2];

(4.62) U п2 (T ) = 1, T [0;

2] (4.62а) имеются еще два полюса T = 0;

1, (T ) = U п 3 (T ), T (0;

2) ;

(4.62б) U п 1, T = и 1, T = 0;

(T ) = U п 4 (T ), T (0;

2) ;

(4.62в) U п 1, T = 2.

Функциям ОУ U пi (T ), i =1, 4 в пространстве ( L1, L2, a2 ) соответствуют линии, а в сечениях a2 = const – точки.

На рис. 4.1 показаны граничные линии (сечения граничных поверхностей), разделяющие области существования функ ций ОУ различных видов при a2 = 1, а точками выделены места, соответствующие функциям U пi, i = 1, 4. Как видно из рисунка, сечение области существования функции ОУ U1 (T ) представляет собой параллелограмм со сторонами, соединяю щими точки U пi, i = 1, 4.


U п L L L L U G п L U п L L L U п Рис. 4.1. Сечения областей существования видов ОУ модели АИ, Э, Пр, О при a 2 = – 4.2.2. Расчет параметров оптимального управления В общем случае соотношения для расчета параметров функций U i (T ) по значениям синтезирующим переменным по лучаются решением систем уравнений вида L j = j, n (2 T )U i (T ) dT, j =1, n. (4.63) П р и м е р 4.3. Для рассматриваемого объекта второго порядка в примере 4.2 параметры основных видов функций ОУ (4.59) определяются решением систем уравнений 2 L1 = U i (T ) dT ;

L2 = e a2T U i (T ) dT (4.64) 0 и дополнительных условий типа (T = 0 ;

U i = 1).

Расчет параметров C1, D1 функции ОУ первого типа U1 (T ) = C1 + D1e a2T может производиться по конечным формулам.

Действительно, подставляя U1 (T ) в (4.64) и интегрируя, получим систему линейных уравнений относительно C1, D1 :

( ) 1 e 2 a2 D1 = L1 ;

2C1 + a (4.65) ( ) ( ) 1 2 a2 1 2 a e e 2 a2 D1 = L2.

e 1 C1 + a2 2a В результате параметры C1, D1 в зависимости от значений L1, L2, a2 рассчитываются по формулам:

[( )] ) ( C1 = 0,5 L1 e 2 a2 e 2 a2 L2 1 e 2 a2 / a 2 ;

(4.66) D1 = [ 2 L2 L1 (e 2 a )] 1 / a2 /, здесь ( ) ( )2, 1 2a2 e e 2a2 2 e a2 e a = a2 a или ( ) a2 L1 2a2 L2 e 2 a2 1 D1 = ;

2 a2 2 a 1 a2 e a2 e (4.66а) ( ).

D C1 = L1 1 1 e 2 a 2 2a Для пересчета параметров C1, D1 в параметры d 0, d1 управления u1 (t ) = d 0 + d1e a2 (t t0 ) в натуральном масштабе ис пользуются формулы (4.19), т.е.

u u u + uв u u d 0 = в н C1 + н, d1 = в н D1.

2 2 Пусть имеет место функция ОУ U 3 (T ), T [0;

2] (см. (4.59)). В этом случае с учетом условия U 3 (T3 ) =1 и формул (4.64) получаем три уравнения C3 + D3e a2T3 = 1;

(4.67) ( ) D3 a2T C3T3 = L1 2 + T3 ;

(4.67а) e a ( ) ( ) C3 1 e a2T3 + D3 1 e a2T3 = a2 L2 + e 2 a2 e a2T3. (4.67б) Используя равенства (4.67) и (4.67а), определяем зависимости L1 D3 = a2 (4.68) ;

a2T ( 1 + a2T3 ) 1 e L C3 = 1 a 2 e a2T3 (4.68а).

a2T ( 1 + a 2T3 ) 1 e Подставляя (4.68), (4.68а) в (4.68б), получаем соотношение для расчета T3, т.е.

(e a T )2 a2 L2 + e 2 a2 =. (4.69) a2 (0,5L1 1) 1 e a2T3 ( 1 + a2T3 ) Если компоненты массива R равны 0 a2 = 0,8, b = 0,02, u н = 2, u в = 2, z1 =1, z 2 = 1, к к z1 = 2,3, z 2 = 0 ;

t 0 = 0, t к = 5.

Тогда, согласно (4.36), L1 = 0,4;

L2 = 10 и a2 = 2.

В результате T3 =1,844, C3 = 0,769, D3 = 0,044, т.е.

0,769 + 0,044 e 2T, T [0;

1,844 ) ;

U 3 (T ) = T [1,844;

2] 1, или t [0;

4,61) ;

0,8t 1,5376 + 0,0855 e, u3 = t [4,61;

5].

2, Следует заметить, что при возрастании размерности вектора фазовых координат увеличивается число видов функции ОУ, а также их параметров. Пример возможных функций для объекта, динамика которого описывается дифференциальным уравне нием третьего порядка, рассмотрен в [116].

4.3. АНАЛИЗ ЭНЕРГОСБЕРЕГАЮЩЕГО УПРАВЛЕНИЯ МНОГОМЕРНЫМИ ОБЪЕКТАМИ Большинство энергоемких технологических объектов (машин, аппаратов и других) имеют несколько входов и несколь ко выходов, т.е. относятся к классу многомерных динамических систем, называемых MIMO-системами. Существующая тео рия решения задач оптимального управления такими объектами в основном базируется на методах аналитического конст руирования оптимальных регуляторов (АКОР) или синтезе линейных квадратичных регуляторов (ЛКР). Данная теория не получила развития для решения задач энергосберегающего управления в связи со сложностью оперативного определения видов функций оптимального управления, вызываемых изменением производственно-технологической ситуации.

Рассмотрим основные аспекты использования принципа максимума и метода синтезирующих переменных примени тельно к многомерным объектам с "сильными" перекрестными связями.

Типичным примером таких объектов являются электрические печи, в которых необходимо учитывать распределение температуры по длине печи. Для решения задач анализа ОУ обычно такие объекты рассматривают как многозонные. Упро щенная схема т-зонной электрической печи приведена на рис. 4.2, а;

здесь u = (u1, u2,..., um ), y = ( y1, y2,..., ym ) – векторы T T управления и выходных переменных, соответственно. В качестве ui обычно используется ток через нагревательные элемен ты i-й зоны, а yi – измеряемая температура в центральной части i-й зоны.

Принципиальной особенностью такого объекта управления от ранее рассмотренных является то, что необходимо учи тывать взаимное влияние температурных режимов в соседних зонах друг на друга.

Задача энергосберегающего управления, таким образом, формулируется следующим образом.

Объект, описываемый моделью динамики z = A z (t ) + B u (t ), t [t 0, t к ], (4.70) & требуется перевести из начального состояния z 0 в конечное z к, т.е.

( )т ( )т, z (t 0 ) = z 0 = z1,..., z n, z (t к ) = z к = z1,..., z n 0 0 к к (4.71) при выполнении ограничений на управляющие воздействия в каждый момент времени t [t 0, t к ] : ui (t ) [u нi, uвi ], i = 1, m (4.72) 1 2 m 1 m … y2 y m1 ym y … u1 u2 u m 1 um а) y u u2 y u3 y..

..

..

y m u m um ym б) Рис. 4.2. Упрощенная схема т-зонной электрической печи (а) и схема связей между входными и выходными переменными (б) и минимуме функционала tк J э = u т (t )Сu (t ) dt min, (4.73) t где uнi, uвi границы изменения управляющего воздействия ui ;

А, В – матрицы параметров объекта соответствующих раз мерностей;

С – m m - матрица весовых коэффициентов.

Основные трудности решения задачи (4.70) – (4.73) связаны с определением видов функций оптимального управления (ОУ) ui (t ), i = 1, m и расчетом их параметров, а также с проверкой существования решения задачи для задаваемого массива исходных данных.

Рассмотрим предлагаемый подход решения задач второго класса на простейшем примере. Пусть n = m = 2 и a a12 b1 0 1 A = 11, B =, C =. (4.74) a 21 a 22 0 b2 0 В этом случае для определения функции ОУ u1 (t ), u2 (t ) задается массив исходных данных ).

R = (a11, a12, a21, a22, b1, b2, uн1, uв1, uн2, uв2, z1, z 2, z1, z 2, t 0, t k 0 0 к к (4.75) Так как n = 2, то, используя принцип максимума и метод синтезирующих переменных, можно показать, что "основной" вид компонентов вектора U (T ) в нормированном масштабе, т.е. U [1;

2], T [0;

2], определяется выражениями u1 (T ) = b1 ( f11 (T ) D1 + f12 (T ) D2 );

(4.76) u 2 (T ) = b1 ( f 21 (T ) D1 + f 22 (T ) D2 ), ( ), где f ij (T ) компоненты матричной экспоненты exp A т T A = 0,5tA;

bi = 0,25tbi, i = 1, 2;

t = t к t 0 ;

u = uв uн, D1, D2 – параметры функций ОУ.

Значения параметров определяются решением системы линейных уравнений D1 (b111,11 + b2 12, 21 ) + D2 (b111,11 + b2 12, 22 ) = L1 ;

(4.77) D1 (b1 21,11 + b2 22, 21 ) + D2 (b1 21,12 + b2 22, 22 ) = L2, в которых синтезирующие переменные L1, L2 рассчитываются по формулам L1 = z1 f11 (2 ) z1 f12 (2 ) z 2 ;

к 0 (4.78) L2 = z 2 f 21 (2 ) z1 f 22 (2 ) z 2, к 0 а коэффициенты ij, vµ (i, j, v, µ {1;

2}) есть интегралы вида ij,vµ = ij (2 T ) vµ (T )dT, где f ij (2 T ) – компоненты матричной экспоненты exp (A т (2 T )). Если для матрицы A выполняется условие D = (a11 + a22 )2 + a11a22 a11a22 0, (4.79) то уравнения U i (T ), i = 1, 2 приводятся к виду U i (T ) = Di e T + Di e T, i = 1, 2, (4.80) здесь параметры Di, Dij вычисляются по значениям параметров D1, D2, а t a11 + a22 t a + a + D, = 11 22 D.

= 2 2 2 Полученные результаты позволяют сформулировать основные положения предлагаемого подхода решения задач энер госберегающего управления методом синтезирующих переменных.

1. Исходная задача (4.70) – (4.73) нормируется по времени t и управлению u (t ), т.е. вводя T и U (T ).

2. Вводится вектор синтезирующих переменных L (см. (4.78)) и рассчитываются его значения для исходных данных (4.75).

3. Решением системы уравнений (4.77) определяются параметры D1, D2 и затем функции ОУ U i (T ), i =1, 2 по форму лам (4.78).

4. Проверяется выполнение условия (4.79) и, если оно выполняется, то далее используются управления U i (T ) в форме (4.80).

5. Рассчитываются траектории U i () = (U i (T ), T [0;

2]) и проверяется выполнение условия (4.72) для нормированного управления, т.е. t [0;

2] : U i (T ) [ 1;

1, i =1, 2]. Если это условие выполняется, то U 2 (T ) обеспечивает минимум функ ционала (4.73) и является оптимальным. Если условие не выполняется, то по значениям траектории U i (T ) делается предпо ложение о возможном виде функции ОУ. Для предполагаемого вида составляются уравнения для расчета параметров. (Сле дует заметить, что они уже не будут линейными.) 6. Рассчитанное нормированное оптимальное управление (если для задаваемых исходных данных (4.75) оно вообще существует) пересчитывается в ОУ натурального масштаба по формулам uв + uн uв uн t U i t0 + T.

ui (t ) = + 2 Таким образом, использование метода синтезируемых переменных с соответствующим нормированием исходной зада чи существенно облегчает создание программных модулей для автоматизированного синтеза алгоритмического обеспечения микропроцессорных устройств энергосберегающего управления многомерными объектами.

4.4. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ПРИ ВОЗДЕЙСТВИИ ПОМЕХ Многие системы энергосберегающего управления в процессе реальной эксплуатации подвержены воздействию возму щений и помех. Поэтому важной задачей анализа является оценка влияния этих факторов на значение энергетического функционала, достижение конечного значения вектора фазовых координат и выбор стратегии управления.

Рассмотрим эти вопросы на примере задачи оптимального управления при ограничении на управление, с закрепленны ми концами траектории изменения фазовых координат, при минимизируемом функционале – затраты энергии, при наличии помех в каналах управления и измерения типа "белый шум", которая в дискретной форме записывается в виде xi +1 = Fxi + Gui + wi, i = 0, N 1;


(4.81) yi = Hxi + vi ;

(4.82) N I э = t ui2 min ;

(4.83) i = i [0, N 1] : ui [uн, uв ] ;

(4.84) x0 = x 0, x N к ;

(4.85) E [ wi, w т ] = R (i, j ), E [vi, v т ] = Q (i, j ), (4.86) j j где xi, ui, yi – значения соответственно вектора фазовых координат, управления (скалярного) и выходной переменной на i-м шаге;

wi, vi – шумы в каналах управления и измерения;

F, G, H – матрицы параметров объекта управления соответствую щих размерностей;

t – временной шаг дискретизации;

N – число шагов на временном интервале управления;

x 0, к – на чальное значение вектора x и конечная область, в которую требуется перевести объект за N шагов;

E [] – знак математиче ского ожидания;

R, Q – дисперсии w и v ;

(i, j ) – функция Кронекера.

Требуется найти управляющие воздействия, являющиеся решением задачи (4.81) – (4.86) при позиционной стратегии с учетом помех. Массив исходных данных сформулированной задачи имеет вид R = ( F, G, Н, x 0, к, u н, uв, Q, R, t, N, xi ). (4.87) В ряде случаев дополнительно к ограничению на управление в каждый момент времени (см. (4.84)) накладывается ин тегральное ограничение на лимит энергии, т.е.

N t ui2 I доп. (4.88) i = Кроме того, может допускаться увеличение временного интервала управления [0 ;

Nt ], в этом случае при постоянном t число шагов N должно удовлетворять условию N [N н, N в ]. (4.89) Необходимо определить влияние числа шагов и помех различной интенсивности на величину функционала (4.83) при позиционной стратегии реализации энергосберегающего управления с применением оптимальной фильтрации [48, 50, 53, 138].

Оптимальное управление ui на каждом шаге задается синтезирующей функцией S, т.е.

ui = S ( yi, N i, R). (4.90) П р и м е р 4.4. Пусть динамика объекта описывается линейным дифференциальным уравнением первого порядка с па раметрами a, b. В этом случае синтезирующая функция применительно к задаче (4.81) – (4.86) имеет следующий вид [139]:

2ayi ui =, t = Nt. (4.91) 2 a ( t i t ) 1) b (e Для снижения влияния помех вместо yi в алгоритм подставим оценку вектора фазовых координат xi, полученную с использованием оптимальной фильтрации, т.е.

ui = S ( xi, N i, R) ;

(4.92) xi = Fхi 1 + Gui 1 + K i ( yi Fхi 1 Gui 1 ).

(4.93) Значения K i (коэффициента усиления фильтра Калмана) определяются по формулам [48, 138]:

F 2 Pi 1 + R RF 2 Pi 1 + R Ki = ;

Pi = (4.94), F 2 Pi 1 + R + Q F 2 Pi 1 + R + Q где Pi – дисперсия ошибки фильтрации.

В рассмотренном алгоритме предполагается, что массив реквизитов R за исключением значений xi остается неизмен ным на временном интервале управления, т.е. система находится в одном состоянии функционирования.

Для оценки влияния временного шага дискретизации, интенсивности возмущений и помех на показатели работы СЭУ используется метод синтезирующих переменных в совокупности с имитационным моделированием [140 – 142].

П р и м е р 4.5. В качестве численного примера приведем результаты имитационного моделирования управления объ ектом первого порядка при исходных данных uн = 3;

uв = 3, x (t 0 ) = 10, x(t к ) [0,1;

0,1], t0 = 0;

tк = 20. Для этих данных в случае временного шага дискретизации t = 1 ЗОУ записывается в виде xi = 0,9 xi 1 + 0,2ui 1 + wi 1, i = 0, 1,...., 19, yi = xi + vi ;

19 (4.95) ui2, i [0;

19] : ui [ 3;

3], x0 = 10, x20 [ 0,1;

0,1].

Iэ = i = При определении синтезирующей функции в качестве конечного значения x (tк ) берется середина интервала к, т.е.

x (t к ) = 0. Для расчета I э управление на последнем шаге u N 1 рассчитывается из условия Fx N 1 + Gu N 1 + wN 1 = 0.

В табл. 4.2 приведены результаты моделирования для различных значений числа шагов, шагов дискретизации, интен сивностей помех в виде среднеквадратичных отклонений в каналах управления w и измерения v. Здесь минимизируемый пз пз функционал при управлении без фильтрации обозначен I э ( y ) и с фильтрацией – I э ( x). В качестве эффекта оптимальной пз I э ( x) фильтрации рассматривается I = 100 100. Интенсивности шумов по каналам управления и измерения принимают пз I э ( y) ся одинаковыми.

Из табл. 4.2 видно, что при увеличении интенсивности помех затраты энергии растут, при этом использование опти мальной фильтрации обеспечивает эффект экономии энергии (см. рис. 4.3).

Таблица 4. w I, % v пз пз t N I э ( y) I э ( x) 0 0 7,40541 7,40541 0,05 0,05 7,47694 7,47464 0, 5 4 0,2 0,2 7,59557 7,52801 0, 0,5 0,5 9,45879 8,42355 10, 0,8 0,8 10,77637 8,56543 20, 0 0 7,21943 7,21943 0,05 0,05 7,2444 7,23536 0, 10 2 0,2 0,2 8,17852 7,91439 3, 0,5 0,5 11,58292 9,33299 19, 0,8 0,8 16,06588 11,252 29, 0 0 7,14798 7,14798 0,05 0,05 7,44105 7,41843 0, 0,2 0,2 9,35906 8,84811 5, 20 0,5 0,5 17,43127 13,02637 25, 0,8 0,8 33,43228 19,4339 41, 0 0 7,1269 7,1269 0,05 0,05 7,41989 7,40137 0, 40 0,5 0,2 0,2 10,60044 9,73801 8, 0,5 0,5 29,06011 19,95556 31, 0,8 0,8 60,63058 34,07669 43, Следует заметить, что эффект фильтрации больше, когда интенсивность помехи в канале измерения выше, чем в канале управления. При значительных интенсивностях помех в каналах измерения и управления использование оптимальной фильтрации позволяет существенно снизить затраты энергии, причем с уменьшением временного шага дискретизации эф фект энергосбережения возрастает.

В случае малой интенсивности помех в канале измерения применение фильтра Калмана не ведет к ощутимой экономии энергозатрат при любом временном шаге дискретизации. Для получения наибольшего эффекта от использования оптималь ной фильтрации необходимо устранить (компенсировать) помеху в канале управления и уменьшать шаг дискретизации.

I, % 0 0,2 0,4 0,6 0,8 Рис. 4.3 График зависимости эффекта оптимальной фильтрации vв w ( ) экономии энергии от числа шагов и величины помех:

– N = 5;

– N = 10;

– N = 20;

– N = ВЫВОДЫ ПО ЧЕТВЕРТОЙ ГЛАВЕ Полученные результаты полного анализа оптимального управления служат основой базы знаний для широкого круга задач разработки алгоритмического обеспечения систем энергосберегающего управления различными динамическими объ ектами. Использование метода синтезирующих переменных при решении анализа позволяет представлять результаты по конкретной модели ЗОУ в комплексном виде, т.е. эти результаты можно оперативно применять в последующем для любых значений исходных данных во всех задачах с одинаковыми моделью, функционалом и стратегией реализации ОУ.

В качестве примеров решения задач полного анализа в основном рассматривались ЗОУ с моделями динамики объекта А, ДИ и АИ, функционалами I э и I б, программной и позиционной стратегиями. Ограниченность объема раздела не позво ляет привести все полученные результаты. Читатель, интересующийся результатами (анализ ОУ при функционале расход топлива, анализ ОУ для модели динамики объекта, описываемой дифференциальным уравнением третьего порядка и др.), может обратиться к литературе [116, 143 – 145]. Результаты полного анализа ЗОУ в полном объеме используются при анали зе систем энергосберегающего управления на МСФ.

5. АНАЛИЗ ЗАДАЧ ЭНЕРГОСБЕРЕГАЮЩЕГО УПРАВЛЕНИЯ НА МНОЖЕСТВЕ СОСТОЯНИЙ ФУНКЦИОНИРОВАНИЯ В процессе реальной эксплуатации многих объектов могут существенно изменяться компоненты модели ЗОУ M, F, S, O, например, вид модели динамики, вид функционала или стратегии, такие изменения будем называть измене ниями состояний функционирования. Если при изменении значений массива данных R модель ЗОУ сохраняется, то пере счет управления происходит с использованием соотношений, полученных при полном анализе одной ЗОУ. В случае измене ния компонентов "четверки" M, F, S, O для расчета нового ОУ требуется переход к результатам полного анализа другой ЗОУ. Анализ сложной задачи управления, требующий использования разных "четверок", выполняется на множестве состоя ний функционирования.

5.1. КЛАССЫ СИСТЕМ И СТРАТЕГИИ ЭНЕРГОСБЕРЕГАЮЩЕГО УПРАВЛЕНИЯ НА МНОЖЕСТВЕ СОСТОЯНИЙ ФУНКЦИОНИРОВАНИЯ Введенное во второй главе расширенное множество состояний функционирования приводит к необходимости рассмот рения различных классов систем, а также увеличивает число возможных вариантов стратегий, реализующих оптимальное управление. В дальнейшем множеством H будем обозначать как все РМСФ, так и отдельные подмножества, характерные для рассматриваемой ситуации.

В разделе 2.2 были рассмотрены две основные стратегии реализации ОУ – программная S пр и позиционная Sпз (см.

(2.15) и (2.16)). В случае позиционной стратегии при расчете ОУ в каждый момент времени t учитывается текущее значение вектора фазовых координат z (t ) и "оставшееся" время tк t.

В процессе реализации ОУ на временном интервале [t 0, t к ] возможны изменения переменной состояния функциониро вания hH. В общем случае эти изменения могут быть связаны с изменением значений компонентов массива исходных данных R, например параметров модели объекта, границ u н, u в для управления u, времени tк и других, а также с измене нием самой ЗОУ, например изменением вида минимизируемого функционала, введением дополнительных ограничений и т.д.

В зависимости от характера использования управляющим устройством информации о значении h (t ), t [t 0, t к ] будем раз личать следующие виды стратегий.

Определение 5.1. Программная стратегия называется некорректируемой на множестве H, если оптимальная программа ( ) u () = u (t ), t [t 0, t к ], рассчитанная к моменту времени t0 при состоянии функционирования h (t 0 ) = h0, сохраняется при любых изменениях значения h на временном интервале [t 0, t к ]. Программная стратегия называется корректируемой на множестве H, если оптимальная программа u (t ) пересчитывается при каждом изменении h (t ), t [t 0, t к ]. Данные страте гии будем обозначать S пр. нк и S пр. к.

По аналогии с S пр. нк и S пр. к дается определение позиционной некорректируемой стратегии S пз. нк и корректируемой S пз. к.

Системы управления, использующие стратегии S пр. к и S пз. к, должны включать устройства идентификации значений h (t ). Эти системы относятся к классу адаптивных систем.

Определение 5.2. Программная стратегия называется частично или условно корректируемой на множестве H, если оп тимальная программа u (t ), рассчитанная к моменту времени t0 при состоянии h (t 0 ) = h0, сохраняется без изменения, пока значения h (t ) не выходят за пределы некоторого подмножества H 0 = { h0, h1,... }, и программа пересчитывается, если h (t ) выходит за пределы H 0. Данную стратегию обозначим S пp. чк.

Аналогично определяется позиционная частично корректируемая стратегия S пp. чк.

Наряду с основными стратегиями S пр и Sпз возможно использование комбинированной стратегии Sкм, когда, напри мер, на начальной части временного интервала применяется S пр, а затем происходит "переключение" на Sпз. Комбиниро ванные стратегии характерны для систем переменной структуры.

Используя определения 5.1 и 5.2, нетрудно ввести понятия комбинированной некорректируемой S км. нк, корректируе мой S км. к и частично корректируемой S км. чк стратегий.

Наряду с рассмотренными стратегиями применяется много других, например программные стратегии с автоматическим регулятором, устраняющим отклонения от оптимальной траектории y () выходной переменной, позиционные стратегии, использующие прогнозирование изменения фазовых координат, и др. [48, 51, 53, 75].

На рис. 5.1 для ряда систем приведены упрощенные структурные схемы и соответствующие стратегии, отражающие специфику оптимального управления на множестве H. В системе, схема которой представлена на рис. 5.1, а, может исполь зоваться только стратегия S пр. нк. Здесь управляющее устройство по данным массива реквизитов R(h0 ) рассчитывает опти мальную программу u () изменения управляющих воздействий на объект. Данная стратегия применяется, когда вероят ность изменения функционирования на временном интервале [ t 0, t к ] мала, влияние возмущающих воздействий на измене ние фазовых координат незначительно.

Программные стратегии S пр. к и S пр. чк могут использоваться системой, схема которой показана на рис. 5.1, б. В этом случае при изменении переменной h и соответственно массива исходных данных R управляющее устройство пересчитыва ет оптимальную программу. В системе предусмотрена обратная связь по переменной h, для этого используется идентифи катор переменной состояния функционирования – Идh. В круглых скобках на рис. 5.1, б указана стратегия S пр. нк, которая может использоваться при нарушении работы Идh.

Стратегии S пз. нк и S км. нк предусматривают наличие обратной связи по вектору фазовых координат z. Схема системы оптимального управления (см. рис. 5.1, в) содержит идентификатор вектора z – Идz. Данные стратегии используются, когда на объект оказывают влияние возмущающие воздействия, а состояния функционирования изменяются редко. Заметим, что системы, реализующие позиционные стратегии, часто называют оптимальными регуляторами.

Схема системы оптимального управления со стратегиями S пз. к, S пз. чк, S км. к, S км. чк представлена на рис. 5.1, г. Данные стратегии учитывают как влияние возмущающих воздействий, так и изменение перемен-ной h.

Программные стратегии с автоматическим регулятором S пру. нк, S пру. к, S пру. чк используются в системах, схемы которых приведены на рис. 5.1, д и 5.1, е. В данном случае управляющее устройство рассчитывает оптимальную траекторию измене ния выходной переменной у, которая является заданием для автоматического регулятора.

u () z УУ О S пр.нк a) h S пр.к () * uh S пр.чк h z УУ О Идh (Sпр.нк ) Rh б) u ( z, tк t ) S пз.нк z S км.нк УУ О (Sпр.нк ) Идz в) h Sпз.к S пр.к ( z, tк t ) h Rh uh Sпз.чк z S пр.чк Идh О УУ Sкм.к S пр.нк Sкм.чк Идz г) y () R u z S пру.нк УУ АР О – д) h S пру.к () yh h Rh S пру.чк u z УУ АР О Идh (Sпру.нк ) – е) Рис. 5.1. Структурные схемы систем оптимального управления и стратегии реализации ОУ на МСФ:

УУ – управляющее устройство;

О – объект управления;

АР – автоматический регулятор;

Идh, Идz – идентификаторы соответственно значений h и z Важной задачей при проектировании систем оптимального управления является выбор наиболее целесообразной стра тегии реализации ОУ из рассмотренного множества стратегий. При выборе стратегии учитываются следующие обстоятель ства: разрабатывается новая СОУ или усовершенствуется существующая система управления, например автоматический программный регулятор;

насколько часто изменяются условия ЗОУ;

имеется ли возможность контролировать изменения фазовых координат и значений переменной h ;

каковы допустимые стоимость и сроки проектирования системы управления;

разработаны ли алгоритмы для оперативного расчета программ и синтезирующих функций.

В зависимости от характера изменения переменной h и возможности идентификации ее значений на временном интер вале управления [t 0, t к ] можно выделить четыре основных класса систем оптимального управления на множестве H [46].

Определение 5.3. СОУ принадлежит к первому классу, если при реальной эксплуатации системы значение переменной h к моменту времени t0 известно и сохраняется постоянным на временном интервале [t 0, t к ].

Изменения h в таких системах, обозначим их СОУ1, происходят между временными интервалами реализации ОУ.

Примерами СОУ1 являются надежные системы управления простыми аппаратами периодического действия, для которых интервалы [t 0, t к ] незначительны.

Определение 5.4. СОУ принадлежит ко второму классу систем на множестве H, если значение переменной h на вре менном интервале [t 0, t к ] постоянно, но неизвестно, известными могут быть подмножество состояния H (t0 ) = H 0 H и вероят ности отдельных состояний p (h ), h H 0.

Системы данного класса (СОУ2) аналогичны стохастическим системам и системам с дифференциальными включения ми [76, 77]. Примерами СОУ2 являются системы, в которых отсутствуют Идh, а отдельные компоненты массива R могут иметь различные значения.

Определение 5.5. СОУ принадлежит к третьему классу систем на множестве H, если значение переменной h на вре менном интервале [t 0, t к ] может изменяться, при этом значение h (t ) в каждый момент времени t [t 0, t к ] известно.

Динамические режимы СОУ3 могут описываться дифференциальными уравнениями с разрывной правой частью [27].

Примерами СОУ3 являются системы, содержащие устройства диагностики для идентификации значений h.

Определение 5.6. СОУ принадлежит к четвертому классу систем на множестве H, если значение переменной h на временном интервале [t 0, t к ] может изменяться, при этом информация об изменении h либо отсутствует, либо не может быть учтена управляющим устройством.

В СОУ4 могут быть известны h (t 0 ) или H (t 0 ), а также модель изменения значений h, позволяющая имитировать воз можные траектории h () = (h (t ), t [t 0, t к ]).

Следует заметить, что при разработке СОУ1 и СОУ3 широко используются подходы адаптивных систем, а для СОУ2 и СОУ4 – робастного управления.

Представленные на рис. 5.1 стратегии могут эффективно использоваться в СОУ1 и СОУ3. Эти стратегии практически не пригодны для систем второго и четвертого классов, так как здесь точное значение переменной h неизвестно. Определен ный эффект энергосбережения в СОУ2 и СОУ4 может дать использование стратегий гарантированного управления.

Определение 5.7. Программная стратегия применительно к СОУ2 называется гарантированной на подмножестве H, если она позволяет определить программу u ( / H ), которая обеспечивает решение ЗОУ h H. Данную стратегию обозна чим Sпр.г (H ).

Аналогично дается определение стратегиям Sпз.г (H ) и Sкм.г (H ).

Определение 5.8. Программная стратегия применительно к СОУ2 называется вероятностной на множестве H, если она рассчитывает программу u ( / hmax ), которая оптимальна для значения переменной h, имеющего максимальную вероят ность. Эта стратегия обозначается S пр (hmax ).

Таким же образом определяются стратегии S пз (hmax ) и S км (hmax ).

Определение 5.9. Программная стратегия применительно к СОУ4 называется гарантированной на подмножестве H () траекторий h () = ( h (t ), t [t 0, t к ] ), если она позволяет рассчитывать программу u ( / H ()), которая обеспечивает решение ЗОУ h () H (). Такую стратегию обозначим S пр.г (H ()).

Аналогично дается определение стратегиям S пз.г (H ()) и Sкм.г (H ()).

Определение 5.10. Программная стратегия применительно к СОУ4 называется вероятностной на множестве траекторий ( ) H (), если она рассчитывает программу u / h(), которая оптимальна для наиболее вероятной или усредненной траектории () h (), определяемой методом имитационного моделирования. Обозначим эту стратегию Sпр h ().

() () Аналогично определяются стратегии S пз h () и Sкм h ().

Выбор наиболее предпочтительной стратегии должен производиться с учетом класса СОУ на множестве H, а также факторов эффективности, которые в конкретной ситуации наиболее значимы. К таким факторам обычно относятся экономия энергозатрат, точность, надежность, робастность и стоимость. В табл. 5.1 приведены группы альтернативных вариантов стратегий для различных ситуаций.

Следует заметить, что выделенные четыре класса систем на множестве H не охватывают всего многообразия, которое может иметь место на практике. В частности, возможны промежуточные варианты, когда в одних ситуациях система прояв ляет свойства одного класса, а в других – другого.



Pages:     | 1 || 3 |
 





 
© 2013 www.libed.ru - «Бесплатная библиотека научно-практических конференций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.