авторефераты диссертаций БЕСПЛАТНАЯ БИБЛИОТЕКА РОССИИ

КОНФЕРЕНЦИИ, КНИГИ, ПОСОБИЯ, НАУЧНЫЕ ИЗДАНИЯ

<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ


Pages:     | 1 |   ...   | 5 | 6 || 8 | 9 |   ...   | 10 |

«Федеральное агентство по образованию САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ ПОЛИТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ А.Н.ВАСИЛЬЕВ, Д.А.ТАРХОВ НЕЙРОСЕТЕВОЕ ...»

-- [ Страница 7 ] --

Рассматриваемый далее несеточный способ построения кусочно аналитически заданного приближенного решения задачи основан на представлении его в виде выхода одной искусственной нейронной сети N u (x) = cs (x, a s ) (5.1) s = или набора из нескольких сетей Nj u j (x) = cs, j j (x, a s, j ), (5.2) s = где в качестве базисных нейроэлементов могут быть использованы радиальные базисные функции, персептроны, полиномиальные сети и др.

Возможно применение и других типов нейронных сетей (см. главу 1).

В первом случае приближение строится с помощью единой нейронной сети для всей области, во втором – с помощью согласованного набора сетей, дающих приближения для подобластей j.

При первом подходе обучение сети – подбор ее линейно входящих в выражение для u параметров ck и нелинейно входящих параметров a k – проводится на основе минимизации единого функционала ошибки J (u ).

Выберем этот функционал следующим образом J (u ) = A j (u ) g j d + i Bi (u ) f i d + kl 2 2 Ckl (u ) Clk (u ) d.

j j i kl i kl Такой способ введения функционала ошибки удобен в случае нелинейных уравнений и комплекснозначных функций, но возможны и другие способы задания J – см. обсуждение в главе 1. В некоторых случаях решение исходной задачи можно свести к минимизации функционалов, построенных, к примеру, на вариационных принципах, но поиск таких принципов – отдельная задача, которую не всегда удаётся решить.

При подстановке нейросетевых функций в функционал J (u ) получаются интегралы, которые вычисляются аналитически только в исключительных случаях, при этом существенно ускоряется процесс обучения нейронной сети.

Если применить для оценки этих интегралов какой-либо численный метод, основанный на вычислении подынтегральной функции в некотором дискретном наборе точек, то при первом подходе функционал J (u ) сведётся к некоторому дискретному представлению вида Mj Mi J (u ) = Aj (u ) g j (xt j ) + i Bi (u ) fi (xti ) + 2 ti = j t j =1 i.

Mi + kl Ckl (u ) Clk (u ) (xtkil) tkl = kl При таком подходе получается нечто похожее на метод коллокации.

Принципиально другая ситуация возникает, если применить к вычислению интегралов метод Монте-Карло. Простейший его вариант состоит в том, что подынтегральная функция вычисляется в некотором наборе случайных точек – пробных точек, распределённых равномерно внутри области (если область конечна) с последующим усреднением результата. Для бесконечной области приходится брать другое распределение, например, нормальное. Но если процедуру выбора точек производить только один раз, то возникает по сути еще один вариант метода коллокации – и ничего принципиально нового не получается. Наш опыт показал, что гораздо более эффективным является подход, при котором после заданного числа шагов оптимизации функционала (эпохи обучения сети) происходит перегенерация точек тестовых множеств в области {xt }, на границе {xt } и на участках стыка {xt }, затем оптимизируется новый функционал, и далее эта процедура повторяется необходимое число раз.

Такое перемешивание пробных точек позволяет избежать вырождения зависящего от параметров a линейного подпространства, описываемого (5.1), в процессе настройки весов нейронной сети. Это принципиально отличает данный подход от других вариантов применения нейросетевых базисных функций (например, RBF) для решения уравнений в частных производных [100,105,176,262-266,268-269,279,281-283,286,289,300], подробности в главе 1 и в [56]. При этом для оценки ошибки внутри области можно применить обычные статистические процедуры, см. [2-4].

В случае симметрии операторов C : Ckl = Clk условия согласования выполняются автоматически, и последнее слагаемое в выражении для функционала может быть опущено;

в случае несимметричных операторов C условия согласования «размазываются» по тонкой подобласти kl, содержащей kl, выбором контрольных точек {xtkil} в подобластях kl k и kl l.

При втором подходе обучение нейросетей, дающих приближенные решения в подобластях j, можно проводить как одновременно, обучая всю совокупность сетей сразу, с учетом условий согласования, добавляя соответствующее слагаемое в функционал, так и раздельно, чередуя процессы обучения сетей на основе минимизации соответствующих функционалов ошибок J j по подобластям j, представленных в дискретной форме Mj Mi J j (u ) = Aj (u j ) g j (xt j ) + i Bi (u j ) fi (xti ), 2 t j =1 ti = i где суммирование во втором слагаемом проводится по таким значениям i, что i j, с процедурой их стыковки, при этом условия согласования в простейшем варианте учитываются с помощью альтернирующего метода Шварца, см. главу 4.

Рис.5.1. Подобласть j области Отметим достоинства и недостатки двух предложенных принципиально различных подходов к построению приближенных нейросетевых решений в составных областях. Достоинством первого подхода, при котором используется единая сеть, дающая приближённое решение во всей области, является простота реализации и бесконечная гладкость полученного решения в случае выбора соответствующих функций активации. Главный недостаток состоит в том, что мы пытаемся точные решения, которые могут быть разрывными или у которых разрывны первые или вторые производные, приблизить бесконечно гладкими функциями – в такой ситуации не следует ожидать очень хорошей точности. При втором подходе для каждой подобласти строится своя сеть.

Достоинством такого подхода является большая точность аппроксимации для каждой подобласти при фиксированном числе нейронов, недостатком – необходимость стыковать сети между собой, что влечёт усложнение алгоритма.

Предложенный подход не предъявляет особых требований ни к форме области (односвязность, возможность декомпозиции), ни к уравнению (линейность, вещественность коэффициентов). Однако усложнение формы области и уравнения затрудняет выбор начальных приближений для весов сетей, увеличивает требуемое для достижения заданной точности решения число элементов в нейронной сети и приводит к соответствующему замедлению процесса обучения сети, основанного на нелинейной оптимизации.

При более изощренном способе обучения сети или совокупности сетей возможно сочетание определения параметров с одновременным подбором структуры – подробности с примерами расчетов в задаче Дирихле для уравнения Лапласа в стандартной L области см. в главе 4 и работах [44,219], обобщение – в главе 7.

Самый простой вариант такой адаптивной процедуры – добавлять нейроны по мере необходимости. При этом можно использовать вычисляемые в процессе обучения сети ошибки в удовлетворении уравнения, граничных условий, условий согласования на участках стыка, кластеризовать их и центры кластеров брать в качестве начального приближения для центров RBF–сетей, доучивая сеть, если это необходимо. Аналогичную процедуру можно применить и для персептрона, но в этом случае роль центров играют линии максимальной крутизны (переключения в случае разрывной функции активации). Можно применить и более сложные варианты структурирования, например, такие как различные генетические алгоритмы или процедуры типа многорядного алгоритма МГУА см. главу 2, [61,70,131,134,217-219,278].

Ещё одна возможность модификации процесса настройки весов и структуры сети, ведущая к уменьшению ошибки и числа используемых базисных нейроэлементов – применение коллектива сетей [44,70,217, 219] по аналогии с процедурами, рассмотренными в [195]. При таком подходе обучается не одна сеть, а несколько, после этого для каждой сети определяется область, в которой она даёт наименьшую ошибку (при этом можно использовать сети Кохонена), при необходимости сети доучиваются – каждая в своей области – и для расчётов используется своя сеть. Можно этот подход развивать и дальше – использовать не одну сеть для каждой точки, а взвешенную сумму выходов нескольких сетей и т.п.

Ещё один способ управления результатами процесса обучения – неравномерный выбор пробных точек. Для равномерной аппроксимации (уменьшения максимальной ошибки), надо учесть тот факт, что максимальные ошибки следует ожидать в окрестностях особенностей и стыков, поэтому пробные точки там следует брать гуще.

В тех случаях, когда какие-то участки раздела или части границы неизвестны заранее и определяются в ходе решения задачи, они могут быть описаны с помощью дополнительных нейросетей, которые обучаются наряду с исходной сетью (совокупностью сетей), дающей решение задачи. Подобный подход применялся нами при изучении фазовых переходов – при построении свободной границы в задаче Стефана, при рассмотрении математической модели калибратора переменного давления – при построении оптимальной границы, см. главу 6.

Предложенный общий нейросетевой подход к моделированию многокомпонентных распределенных систем проиллюстрирован на приведенных ниже примерах построения приближенных математических моделей.

5.2. Задача Пуассона В качестве модельной задачи рассмотрим следующую краевую задачу для двумерного оператора Лапласа: пусть R 2 – ограниченная область с кусочно-гладкой границей ;

D – ее строго внутренняя подобласть;

требуется найти решение u ( x, y ) однородной задачи Дирихле для уравнения Пуассона u = u xx + u yy = g, где g ( x, y ) = 0 при ( x, y ) \ D, u = 0.

Для численных расчетов выбирались : x 2 + y 2 1, D : ( x x0 ) 2 + ( y y0 )2 r 2, x0 = 0.4, y0 = 0, r = 0.4, g = A = 10,( x, y ) D, g = 0,( x, y ) \ D.

Рис.5.2. Область в задаче Пуассона Рассмотрим для этой задачи с учетом ее симметрии следующие реализации предложенных нейросетевых подходов к решению.

В качестве нейронной сети использовалась RBF-сеть с единой гауссовыми базисными функциями { } N u ( x, y ) = ci exp ai ( x xi ) + ( y yi ), 2 i = алгоритм обучения сети – метод случайного поиска с перегенерацией точек тестовых множеств после каждого этапа обучения. В качестве функционала ошибки J (u ) выбран интеграл Дирихле (как один из возможных вариантов) u 2 u J (u ) = + + 2 gu dxdy.

x y Однородные краевые условия учитываются введением в функционал штрафного слагаемого 0 u (cos,sin ) d.

Можно, используя симметрию задачи (подобно тому, как это делалось в работе авторов [55]) и специальный вид функции g, привести J (u ) к виду { } N J (u ) = 8 ci ck ai ak exp ai ( xi2 + yi2 ) + ak ( xk + yk ) 2 i,k = [ ( xi + xk )( ai xi + ak xk )( yi + yk )( ai yi + ak yk )] exp [ (ai + ak )] I 0 (2 ( ai xi + ak xk ) 2 + ( ai yi + ak yk ) 2 ) + 2 ( ai xi + ak xk ) 2 + ( ai yi + ak yk ) [ ( xi + xk )( ai xi + ak xk ) ( yi + yk )( ai yi + ak yk )] + ( xi xk + yi yk ) K1 (ai + ak, (ai xi + ak xk ) + (ai yi + ak yk ) ) + + 2 ( ai xi + ak xk ) 2 + ( ai yi + ak yk ) ( ai + ak )[ ( xi + xk )( ai xi + ak xk )( yi + yk )( ai yi + ak yk )] + 1+ K 3 (ai + ak, (ai xi + ak xk ) 2 + (ai yi + ak yk ) 2 ) ( ai xi + ak xk ) + ( ai yi + ak yk ) N c +4 Ar exp{ak [( xk x0 ) 2 + ( yk y0 ) 2 ]}K1 (ak r 2, ak r ( xk x0 ) 2 + ( yk y0 ) 2 ), k k = где K p (, ) = exp( 2 ) I 0 (2 ) p d, p = 1,3.

Штрафное слагаемое также может быть упрощено и преобразовано к виду N 0 {2 ci ck exp[ ai (1 + xi2 + yi2 ) ak (1 + xk2 + yk2 )]I 0 (2 (ai xi + ak xk ) 2 + (ai yi + ak yk ) 2 ).

i,k = Таким образом, функционал сводится к конечному числу слагаемых, в которые наряду с модифицированной функцией Бесселя I 0 входят лишь два интеграла K1 и K 3, зависящие от двух комбинированных параметров. Заметим, что эти интегралы можно не вычислять на каждом шаге итерационного процесса, а вычислить в некотором достаточно представительном множестве точек и проинтерполировать, например, при помощи отдельной RBF-сети.

Наличие явных формул упростит процесс настройки сети.

В случае двухкомпонентной сети получаются результаты подобного рода, однако в функционал требуется ввести еще и условие согласования u + ( x, y ) u ( x, y ) компонентов сети. Обозначив через и нейросетевые аппроксимации решения в области D и в дополнении \ D соответственно, получаем следующее представление для функционала ошибки J (u +, u ) :

u + 2 u + 2 u 2 u J (u, u ) = dxdy + + + dxdy + x y x y D D u 2 u 2 + dxdy + 2 A u dxdy + 0 u d.

+ + x y D Каждое из первых двух выражений заменой переменных сводится к первому слагаемому в выписанном выше представлении функционала J (u ) для измененных значений параметров ± ± ± ak r 2 ak, xk ( xk x0 ) r, yk ( yk y0 ) r, последние же два выражения – в точности J (u ). Условия стыковки на границе D могут быть включены в функционал, например, в виде слагаемых, имеющих структуру выражений, рассмотренных выше:

N+ c exp{ a [ r 2r ( x cos + y sin ) + ( x ) + ( y ) ]} + + + + +2 + 2 k k k k k k k = d.

N ck exp{ ak [r 2 2r ( xk cos + yk sin ) + ( xk ) 2 + ( yk ) 2 ]} k = Аналогично могут быть исследованы условия более гладкой склейки решений u ±.

Приведем другой возможный вариант выбора функционала ошибки:

2 2 J (u ) = u g dxdy = u A dxdy + u dxdy.

\ D D Подразумевается, что однородные краевые условия, как и ранее, вводятся в выражения для функционала ошибки штрафным слагаемым 0 u d.

В случае построения единой аппроксимирующей сети перепишем функционал в виде J (u ) = u dxdy 2 A udxdy + r 2 A2.

D При подходе, использующем сеть, удобней двухкомпонентную представление 2 J (u +, u ) = u + dxdy + u dxdy 2 A u + dxdy + r 2 A2 = \ D D D 2 2 = u + dxdy u dxdy + u dxdy 2 A u + dxdy + r 2 A2.

D D D Выражение для лапласиана в случае функции Гаусса имеет вид N u = 4 ci exp[ ai (( x xi ) 2 + ( y yi ) 2 )]ai2 [( x xi ) 2 + ( y yi ) 2 ai1 ].

i = Подставляя его в выражения для функционалов ошибки и учитывая при необходимости условие стыковки компонентов нейронной сети, как это сделано ранее, проведем упрощение. И в этих случаях также приходим к представлению каждого из функционалов в виде конечного числа слагаемых, содержащих интегралы типа K p, которые могут быть затабулированы и заданы изначально.

Таким образом, во всех этих постановках задачи симметрия позволяет построить аппроксимирующие нейросети, которые характеризуются существенно меньшим набором параметров в сравнении с предложенными подходами для общих случаев.

Ниже приведен график решения u, которое получено с помощью единой нейронной сети, составленной из 20 линейных элементов с коэффициентами – однослойными персептронами с функцией активации ( s ) = th( s ) или RB функциями в виде гауссовых пакетов. Обучение проводится на основе минимизации функционала второго типа. Результаты обучения сходны, но для второго случая достижение заданного уровня обучения происходит быстрее.

Рис.5.3. График нейросетевой аппроксимации решения u Расчет решения этой задачи, сделанный на основе Метода Конечных Элементов с помощью стандартного пакета FEM, привел к тем же самым результатам.

Рис.5.4. Сравнительный график u и g u Приведенный на Рис.5.4 график функции показывает, что использование единой нейронной сети недостаточно хорошо описывает кусочный характер решения в случае нарушения гладкости (в данном случае разрыв терпят вторые производные), этот факт отмечался ранее в общей ситуации при сравнении двух нейросетевых подходов.

5.3. Уравнение Шредингера с кусочным потенциалом (квантовая точка) Задача построения устойчивых приближенных математических моделей нанообъектов (квантовых точек, проволок) является весьма актуальной как для теории, так и для практики. Об этом свидетельствуют многочисленные публикации, среди которых выделим монографию [9] и статьи [307] и [308], посвященные отдельным задачам такого рода. Точное решение задачи может быть получено в случае высокой симметрии и крайне упрощенной модели – в случае, когда симметрия отсутствует или требуется более точно описать поведение моделируемого объекта, приходится строить приближённое решение.

Задача построения модели такой наноструктуры, как квантовая точка, относится к задачам указанного выше типа. Будем исходить из рассмотрения в качестве модельной следующей краевой задачи:

в составной области = 1 2, где 1 – односвязная строго внутренняя подобласть с границей 1 = 12, 2 = \ 1 – двусвязная подобласть с полной границей 2 = 12, требуется найти решение стационарного уравнения Шредингера ( pu ) + (q )u = = pj, q = qj, j = 1,2, в случае кусочно-постоянных коэффициентов p j j условий согласования вида p1 u1 n = p2 u2 n на участке стыка 12 – 12 Ben Daniel-Duke interface condition – при разрывном коэффициенте p : p1 p2, = 0 на участке границы. Подобласть и краевых условий Дирихле u2 отвечает квантовой точке, а подобласть 2 – окружающей ее матрице.

Рис.5.5. Область Коэффициенты являются в данной модели квантовой точки pj рациональными функциями спектрального параметра :

p j = K 2 (( + E j q j )1 + (2( + E j q j + j ))1 ), j K j, Ej, j коэффициенты и потенциалы считаются известными.

qj Спектральный параметр входит нелинейно, что осложняет решение задачи.

При известном значении параметра, полученном из эксперимента или вычисленном в простых задачах с симметрией из нелинейного характеристического уравнения, поставленная задача вкладывается в общую схему. Вообще говоря, задача определения допустимых значений спектрального параметра далеко нетривиальна [307-308]. Ее рассмотрение в рамках нейросетевого подхода здесь не проводится, представляя собой предмет отдельных изысканий.

В случае одномерной задачи область представляет собой систему из двух вложенных отрезков;

обыкновенное дифференциальное уравнение q u( x) + u ( x) = 0 1 = [ d ;

d ] для каждой из подобластей и p ( ) 2 = [ m, d ] [ d, m] решается явно. Условия согласования на стыке и требование убывания решения при x ± m приводят к трансцендентному соотношению для значений спектрального параметра, характеризующих связанные состояния. В случае q1 = 0 и конечного потенциала q2 таких значений будет конечное число. Собственные функции также вычисляются явно в кусочно аналитической форме. Вычисления проводились для d = 10нм, m = 40нм и следующих значений параметров:

K1 = 0.8503, E1 = 0.42, 1 = 0.48;

K 2 = 0.8878, E2 = 1.52, 2 = 0. и потенциалов q1 = 0, q2 = 0.7. Приведем соответствующие результаты.

Будем искать волновые функции в кусочном виде q2 q x + D exp 2 x, x (;

d );

C exp p2 p u ( x) = A cos x + B sin x, x [d ;

d ];

p1 p q2 q E exp x + F exp 2 x, x (d ;

+).

p2 p u = u+ ( x ) = u+ ( x ).

Вначале рассмотрим четные решения Условия убывания решения на бесконечности, четности и согласования при x = ± d приводят к соотношениям q d = C exp A cos d, p1 p q q Ap1 d = Cp2 2 exp 2 d, sin p1 p1 p2 p B = D = E = 0, F = C.

Нетривиальные четные решения задачи ( A 0, C 0 ) существуют лишь при некоторых определенных значениях параметра, входящих в спектр задачи, которые находятся из условия q exp cos d d p1 p = 0, det p sin d q2 q exp p2 d 1 p1 p1 p2 p последнее соотношение может быть переписано в виде p2 ( ) q d= tg.

p1 ( ) p1 ( ) Это трансцендентное уравнение относительно имеет при данных значениях параметров три различных вещественных корня : 0 2 4, 0 = 0.03333135654541547, 2 = 0.23125766492176728, 4 = 0.4896336310029232.

См. также иллюстрирующие графики входящих в указанное уравнение p2 ( ) q функций f ( ) = tg d и g ( ) = p1 ( ) p1 ( ) 17. 12. 7. 2. 0.02 0.04 0.06 0.08 0. Рис.5.6. Графики f ( ) и g ( ) при [0;

0.1] 17. 12. 7. 2. 0.1 0.2 0.3 0.4 0. Рис.5.7. Графики f ( ) и g ( ) при [0;

0.5] 2. 1. 0. 0.45 0.5 0.55 0.6 0.65 0. Рис.5.8. Графики f ( ) и g ( ) при [0.4;

0.7] Аналогично рассматриваются нечетные решения u = u ( x ) = u ( x). Те же требования к решению на бесконечности в сочетании с условиями нечетности и согласования на стыке подобластей при x = ± d приводят к системе уравнений q d = C exp B sin d, p1 p q q Bp1 d = Cp2 2 exp 2 d, cos p1 p1 p2 p A = D = E = 0, F = C.

Точки спектра, отвечающие антисимметричным волновым функциям, определяются из соответствующего характеристического уравнения q exp sin d d p1 p = 0, det p cos d q2 q exp p2 d 1 p1 p1 p2 p которое также может быть представлено в виде p ( ) d= tg.

p1 ( ) p2 ( ) q При выбранных значениях параметров это уравнение также имеет три различных вещественных корня : 1 3 5, 1 = 0.1183375658839791, 3 = 0.3575647706695449, 5 = 0.6214300827986622.

Ниже приведены иллюстрирующие графики входящих в указанное p ( ) уравнение функций f ( ) = tg d и h ( ) = 1 =.

p1 ( ) p 2 ( ) q2 g ( ) 0. 0. 0.05 0.1 0.15 0. -0. -0. -0. -0. - Рис.5.9. Графики f ( ) и h( ) при [0;

0.2] 0. 0.1 0.2 0.3 0. -0. - -1. - Рис.5.10. Графики f ( ) и h( ) при [0;

0.4] 0.1 0.2 0.3 0.4 0.5 0.6 0. - - - - Рис.5.11. Графики f ( ) и h( ) при [0;

0.7] Таким образом, в – спектре энергий устойчивых состояний – 0 1 2 3 4 5, происходит чередование значений отвечающих состояниям с симметричной и антисимметричной волновой функцией:

0.03333135654541547, 0.1183375658839791, 0.23125766492176728, 0.3575647706695449, 0.4896336310029232, 0.6214300827986622.

Приведем график волновой функции для наименьшего u+ ( x ) собственного значения 0 = 0. 0. 0. 0. 0. -40 -20 20 Рис.5.12. График точного решения для наименьшего собственного значения Для нахождения волновой функции u в рамках нейросетевого подхода используется система нейронных сетей, кусочно приближающая ее в каждой из Nj подобластей j : u j ( x) = cij exp(aij ( x bij ) 2 ), j = 1,2. Параметры a, b, c – веса i = сети – находятся в процессе ее обучения на основе минимизации функционала ошибки, который выбран в виде M1 M J (u ) = ( p1 (u1 ) 2 + (q1 )(u1 ) 2 )( xm1 ) + ( p2 (u2 ) 2 + (q2 )(u2 ) 2 )( xm2 ) + m1 =1 m2 = +1 ((u1 u2 ) 2 (d ) + (u1 u2 ) 2 ( d )) + 2 (( p1u1 p2u2 ) 2 (d ) + ( p1u1 p2u2 ) 2 ( d )), M здесь k 0 – штрафные множители, через {xm j }1 j, j = 1, 2, обозначены j, множества тестовых точек на которые перегенерируются после определенного числа шагов процесса обучения. (В рассматриваемом простом случае J (u ) может быть вычислен и в явном виде, что существенно облегчает процесс обучения сетей. Ввиду громоздкости это выражение не приводится.) При определенных упомянутых выше ухищрениях – «размазывание» условий согласования – можно было бы обойтись и единой нейронной сетью, но в численном эксперименте участвовал только второй подход.

Вычисления в нейросетевом варианте проводились также для d = 10нм, m = 40нм и следующих значений параметров:

K1 = 0.8503, E1 = 0.42, 1 = 0.48;

K 2 = 0.8878, E2 = 1.52, 2 = 0. и потенциалов q1 = 0, q2 = 0.7, что привело к следующим 6 значениям спектрального параметра – величинам энергии связанных состояний:

0.03333135654541547, 0.1183375658839791, 0.23125766492176728, 0.3575647706695449, 0.4896336310029232, 0.6214300827986622.

Использовался набор из двух сетей на основе Гауссовых пакетов: N1 = 16 – элементов для области 1, соответствующей квантовой точке, N 2 = 8 – элементов для матрицы – области 2, окружающей точку.

Численный эксперимент показал, что нейросетевая аппроксимация хорошо описывает известные точные решения.

0. 0. 0. 0. 20 40 60 -0. Рис.5.13. График нейросетевого решения для наименьшего собственного значения Рассмотрим многомерный случай. Как и ранее решение задачи – волновая функция u – будет приближаться кусочно в каждой из подобластей j, системой нейронных сетей на основе радиальных базисных функций (в данном варианте – Гауссовых пакетов) вида Nj u j (x) = cij exp(aij x bij ), j = 1,2.

i = Здесь через обозначена эвклидова норма в R n, n = 2 или n = 3.

Настройка весов сетей – векторных параметров aij = ( aij, bij, cij ) – осуществляется на основе минимизации функционала ошибки J, который в данном случае взят в виде M1 M J (u ) = ( p1 u1 + (q1 ) u1 )(x m1 ) + ( p2 u2 + (q2 ) u2 )(x m2 ) + 2 2 2 m1 =1 m2 = 2 M12 M12 M +1 u1 u2 (x m12 ) + 2 ( p1n u1 p2n u2 (xm12 ) + u2 (x m ).

m12 =1 m12 =1 m = Здесь через k 0 обозначены штрафные множители, n – единичный M Множества тестовых точек: {x m j }1 j, j = 1, 2 в вектор нормали к 12.

M подобластях j, {xm12 }1 12, {xm12 }1 12 на участке раздела 12 и {x m }1 на участке M M границы, меняются после определенного числа шагов процесса обучения сетей.

Отметим, что и в многомерной ситуации нейросетевой подход обладает упомянутыми достоинствами, проявившимися в простейшей одномерной ситуации. На Рис.3.14 приведен график приближенного нейросетевого решения задачи в двумерном случае для минимального значения спектрального параметра (энергетического уровня). Эта аппроксимация построена с помощью набора из двух нейросетей на основе Гауссовых пакетов: N1 = 36 – элементов для области 1, соответствующей квантовой точке, N 2 = 12 – элементов для 2, матрицы – области окружающей квантовую точку. Численные эксперименты показали хорошее соответствие приближений точным решениям (в простых случаях) и решениям, полученным другими методами [307-308].

- Рис.5.14. Аппроксимация решения для min Заметим, что полученные положительные результаты на начальном этапе построения модели нанообъекта, дают основания применить нейросетевой метод при построении иерархии моделей для широкого круга сопутствующих задач. Несомненный интерес в этих задачах может представлять • изучение разных типов квантовых точек, проволок (другие варианты геометрии области), • рассмотрение другого варианта выбора функционала ошибки J (в частности, в связи с другим типом зависимости коэффициентов p, q от спектрального параметра ), • возмущения параметров задачи, • использование разных нейросетевых базисных наборов, • сравнение односетевого и двухсетевого приближений решения задачи, • применение и сравнительный анализ эволюционных алгоритмов обучения (настройки весов и подбора структуры нейросетей), приводящих к уменьшению числа используемых нейросетевых функций, • рассмотрение нелинейной спектральной задачи в рамках нейросетевого подхода, • соотнесение результатов, полученных на основе нейросетевого подхода с вычислениями, проведенными с применением стандартных математических пакетов, позволяющих моделировать физические процессы в областях со сложной геометрией, • рассмотрение квантовых точек во внешнем магнитном поле.

5.4. Нелинейное уравнение Шредингера В качестве другого модельного уравнения рассматривалось нестационарное нелинейное уравнение Шредингера вида i t + + = G (x, t ) = g (x)exp[i (k x t )], k = (k x, k y ) R 2, x = ( x, y ) R 2, k x = k x x + k y y.

Это уравнение широко применяется для описания нелинейных волновых процессов – световых пучков в волноводах, колебаний в плазме, эффектов в теории сверхпроводимости и т.д. Если искать его решение в виде плоской волны (t, x) = u (x)exp[i (k x t )], то для функции u = u (x) = u ( x, y ) получаем стационарное уравнение Шредингера с кубической нелинейностью 2 A(u ) = u {( k )u 2ik u u u} = g.

Кроме уравнения, необходимо задать и граничное условие. Рассмотрим два типа условий – два варианта постановки задачи.

Во-первых, можно искать решение уравнения в ограниченной области на плоскости – для численных расчетов и здесь в качестве модельной области выбирался круг : x 2 + y 2 1 – и задать условие на границе области (круга). При этом если g 0, то это условие можно задать однородным. В качестве g использовались функции двух типов гладкости с носителем в некотором ( x x0 ) 2 + ( y y0 ) 2 r 2, x0 = 0.4, y0 = 0, r = 0.4, небольшом круге D:

расположенном внутри исходного круга. Одна функция g равна константе в круге D, то есть является цилиндрической ступенькой: g = A = 10;

( x, y ) D;

g = 0;

( x, y ) \ D. В этом случае получаются вполне приемлемые результаты, если исключить окрестность границы этой ступеньки (или выбирать при обучении специальный закон распределения тестовых точек). Вторая функция g – это гладкая функция с гладкой вершиной:

g = 10{1 [(( x x0 ) 2 + ( y y0 ) 2 ) r 2 ]2 },( x, y ) D, g = 0,( x, y ) \ D.

По понятным причинам для такой функции результаты получаются существенно лучше. При расчетах использовалась нейронная сеть из Гауссовых пакетов.

Рис.5.15. График решения Re u ( RBFG, N = 25, k x = 1, k y = 1, = 20, = 1) Во-вторых, можно искать решение уравнения во всей плоскости, при этом в качестве граничного условия обычно выступает требование ограниченности или квалифицированного стремления к нулю на бесконечности. Рассматриваемый класс RBF-сетей удовлетворяет этому условию автоматически, более того, получающиеся функции достаточно быстро стремятся к нулю на бесконечности.

При обучении нейронной сети в этом случае часть тестовых точек бралась равномерно распределённой в окрестности особенности, а часть – нормально распределённой во всей плоскости.

Несомненный интерес представляет построение аппроксимации решения u для всей плоскости в случае гладкой правой части g в виде Гауссова пакета g ( x, y ) = A exp{( x x0 ) 2 ( y y0 ) 2 }.

Здесь A = 100, x0 = 0.4, y0 = 0 ;

обучалась Гауссова RBF-сеть из 10 элементов.

Рис.5.16. График решения Reu ( RBFG, N = 10, k x = 1, k y = 1, = 20, = 10) Особенно наглядно видно качество нейросетевой аппроксимации на следующем рисунке.

Рис.5.18. Графики значений Re A(u ) и g на сечении y = Соответствующие подходы можно было бы применить и для уравнения теплопроводности в случае разрывных коэффициентов для области составного типа при известной границе раздела. Однако интересней задача моделирования многокомпонентной системы, в которой эта свободная граница изначально неизвестна и определяется в процессе решения задачи – см. главу 6.

5.5. Теплообмен в системе «сосуды – ткани»

Несомненный интерес представляет построение нейросетевых математических моделей многокомпонентных систем в случае областей составного типа со сложной геометрией [57]. Решение таких задач, характеризующихся разномасштабностью процессов в компонентах, традиционными методами существенно усложняется необходимостью учета в некоторых моделях изменения типа уравнения при переходе от одной компоненты области к другой при условии достаточно гладкой стыковки соответствующих решений. В качестве модельной рассмотрим следующую плоскую задачу теплообмена в системе «сосуды-ткани»: венозный и артериальный сосуды окружены мышечной тканью, в которой выделяется тепло. Предполагаем, что перенос тепла в сосудах осуществляется, в основном, за счет конвекции, в тканях – за счет кондукции [68,160]. Будем искать температурное поле в некоторой окрестности сосудов – см. Рис.5.19.

Рис.5.19. Область определения температурного поля (плоская задача) Обозначим через Tv температурное поле в венозном сосуде и T v – температурное поле в прилегающей к нему ткани, через Ta и T a – соответствующие поля температуры для артерии и прилегающей к ней ткани.

Скорости кровотока в вене uv и в артерии ua с учетом эффекта прилипания u = 0 на стенках сосудов имеют вид ( x xv )( xva x ), u ( x, z ) = 4u ( x, z ) ( x xva )( xa x ), uv ( x, z ) = 4uv ( x, z ) ( xva xv ) ( xva xv ) a a 2 где uv, ua – слабо зависящие от x функции с малыми случайными аддитивными возмущениями, xv, xva и xva, xa – координаты границ вены и артерии соответственно. Пусть q – плотность тепловыделения в мышечной ткани, c – ее теплоемкость, b – коэффициент температуропроводности, – плотность, ( x, z ) – малая случайная величина с оценкой, определяемой экспериментально.

Возникает следующая краевая задача, связанная с изменением типа уравнения и краевого условия:

дифференциальные соотношения – температура T v и T a (ткань) удовлетворяет уравнению Пуассона (эллиптический тип) 2T 2T q + 2 =, cb x 2 z в сосудах температура Tv и Ta удовлетворяет уравнению теплопереноса (параболический тип) 2T T T + u = 0, b x x z при этом в вене T = Tv и u = uv, а в артерии T = Ta и u = ua ;

граничные условия имеют вид:

на 1, 7 и 8 – условие Дирихле T = T0, на 3, 4 и 5 – условие T Дирихле T = T1, на 2 и 6 – условие Неймана = 0;

x условия согласования на участках стыка подобластей имеют вид:

T v Tv T T на 12 – T = Tv, =, на 23 – Tv = Ta, v = a, v x x x x Ta T a на 34 – Ta = T, = a.

x x Необходимо отметить, что коэффициенты теплопроводности ткани и крови приблизительно равны. В случае капилляров, стенки которых состоят из одного слоя клеток эндотелия – толщина этого слоя настолько мала, что теплоперенос свободно осуществляется сквозь стенки сосудов – и это позволяет на границах сосудов между собой и границах сосудов с тканями поставить условия, указанные выше: равенство потоков приводит к равенству производных. В случае сосудов другого типа – толстостенных или зашлакованных – условия сопряжения на границах стыка могут носить более сложный характер. Примеры таких условий также рассматривались. Надо иметь в виду, что в приведенном иллюстративном примере ячейка, вообще говоря, весьма условно может считаться замкнутой системой, для которой выполняется закон сохранения энергии.

Рассмотренная постановка задачи предложена специалистами в предметной области – физиологами;

она была также решена методом сеток, при этом получилось достаточно хорошее согласование как с результатами этих расчётов, так и с результатами наблюдений.

Аналогичным образом формулируется постановка плоской задачи в случае системы из нескольких разнородных сосудов, окруженных мышечной тканью.

Большой интерес представляют возмущения, приближающие постановку задачи к реальным условиям. В случае плоской задачи рассматривались возмущения двух типов: сосуды с искривленными стенками и сосуды с пристеночными бляшками. Предлагаемый нейросетевой подход позволяет и при этих усложнениях построить достаточно точные решения возмущенных задач (см. Рис.5.22 и Рис.5.23).

Интерес представляет и распространение рассмотренной постановки задачи на случай трех переменных: найти температурное поле T ( x, y, z ) в области = (0;

x ) (0;

y ) (0;

z ), удовлетворяющее в ее подобластях – вене v = ( xv ;

xv ) ( yv ;

y ) (0;

z ) и артерии a = ( xv ;

x ) ( yv ;

y ) (0;

z ) –, уравнению параболического типа с переменным коэффициентом который описывает условие прилипания = 0 на стенках сосудов, 2T 2T T + 2 = 0, x 2 y z в области v ( x xv )( xva x )( y yv )( ya y ), T = Tv, = v ( x, y ) = ( xva xv ) ( ya yv ) 2 в области a ( x xva )( xa x )( y yv )( ya y ), T = Ta, = a ( x, y ) = ( xva xv ) ( ya yv ) 2 а в окружающих сосуды тканях – в подобласти t = \ ( v a ) – T = Tt удовлетворяет уравнению эллиптического типа 2T 2T 2T + + = Q.

x 2 y 2 z На общих участках границы раздела компонент функция T непрерывна вместе со своей нормальной производной;

на боковой части границы функция T = Tt удовлетворяет однородному условию Неймана;

на нижней части границы за исключением участка 0 = ( xv ;

xva ) ( y v ;

ya ) {0} функция T удовлетворяет условию Дирихле – T = T0, на верхней части границы за исключением участка 1 = ( xva ;

xa ) ( y v ;

ya ) {z } функция T удовлетворяет условию Дирихле – T = T1.

Рис.5.20. Область определения температурного поля (пространственная задача) Отметим некоторые особенности конкретной реализации рассмотренных ранее двух подходов. При первом подходе использовалась единая RBF-сеть, построенная на эллипсоидальных Гауссовых функциях, которые по независимым переменным могут иметь разный масштаб, что важно для правильного отражения особенностей задачи. Сильная сторона нейросетевого подхода состоит в том, что необходимое соотношение между параметрами – весами сети – устанавливается в процессе обучения, хотя для ускорения процесса построения оптимальных весов сети целесообразно соответствующим образом выбрать начальные значения этих параметров. При расчётах начальные значения параметров разделялись на две группы: одна (сосуды) – для эллипсоидальных Гауссовых функций, сильно вытянутых по z, другая (ткани) – для слабо деформированных функций. Преимущество этого подхода – в простоте реализации и в автоматическом удовлетворении (в силу гладкости коэффициентов) условиям согласования на участках стыков подобластей:

сосуды-ткани.

При втором подходе строилась система из двух сетей, одна из которых описывала температурное поле в тканях, другая – в сосудах. В данном случае лучше отслеживается кусочный характер решения, вычисления могут быть распараллелены. При этом для обучения системы нейросетей могут быть применены алгоритмы эволюционного типа (см. главы 2,4 и 7), позволяющие подобрать одновременно веса и структуру сетей.

Возможны и более изощренные варианты: например, для каждой компоненты системы – в каждой подобласти строится своя нейронная сеть, или строится сеть на основе элементов другого вида.

Для проверки работы нейронной сети удобно иметь модельное решение (желательно в явной форме). В качестве такого решения использовалось следующее температурное поле A Q T v ( x, y ) = A + Qxv ( x xv ) ( x xv ) 2 + Ez, 2 E A Tv ( x, y ) = A + Qxv ( x xv ) + v ( x xv ) 2 + Ez, 2 E A Ta ( x, y ) = A + Q( x xa )( x xa ) + a ( x xa ) 2 + Ez, 2 A Q T a ( x, y ) = A + Q( x xa )( x xa ) ( x xa ) 2 + Ez, 2 uv ua q v = a = x0 = xva, Q= где введены обозначения,,, c a a a Q[ xv + ( x xa )] E=, v ( x0 xv ) a ( x0 xa ) E [a ( x0 xa ) 2 v ( x0 xv ) 2 ].

A = Q[ xv ( x0 xv ) + ( x xa )( x0 xa )] + Ниже приведен график модельного решения для значений параметров A = 0, Q = 0.128, v = 93.75, a = -83.75, xv = 0.85, x0 = 1, xa = 1.15, x = 2, z = 4.5.

Результаты нейрокомпьютинга показали, что рассогласование между модельным решением и его нейросетевой аппроксимацией мало.

0. 0. 0. 0 0. 1 1. Рис.5.21. График модельного решения Численные расчеты показали, что нейросетевая аппроксимация правильно отражает качественное поведение решения задачи в плоском и в пространственном случае. Приведенные рисунки характеризуют хорошее качество предлагаемых подходов.

0. 0. 0. 0.3 0. 0. 1 1. 1.1 Рис.5.22. График решения в окрестности искривленного сосуда 0. 0. 0.5 0. 0. 0. 0. 1 1. 1. Рис.5.23. График решения в окрестности сосуда с пристеночными бляшками 5 -5 1. - 0 0. 0. 1. Рис.5.24. Лапласиан решения в окрестности сосудов (пространственная задача) Приведенный рисунок иллюстрирует экспериментально наблюдавшееся отличное от нулевого значение лапласиана температурного поля в сосудах и окрестности сосудов на нижней границе области.

Глава 6. Принципы нейросетевого моделирования многокомпонентных систем с переменными границами подобластей Задачи, для которых какие-то участки раздела или части границы неизвестны заранее и определяются или подбираются в ходе решения, вызывают намного большие трудности для классических подходов по сравнению с задачами, рассмотренными в предыдущих двух главах. С помощью нейронных сетей они могут быть решены без особых дополнительных сложностей, при этом неизвестные границы обычно описываются с помощью дополнительных нейросетей, которые обучаются наряду с исходной сетью (совокупностью сетей), дающей решение краевой задачи [58,65,76,305].

Задачи с неизвестной границей можно разделить на два больших класса.

К первому относятся задачи моделирования многокомпонентной системы, в которой граница раздела изначально неизвестна и определяется в процессе решения. Наиболее интересной задачей такого рода является задача Стефана, в которой неизвестной границей раздела является фронт фазового перехода.

Нейросетевые подходы к одномерной задаче Стефана рассмотрены в статье [65], случай одной пространственной переменной непринципиален и без труда распространяется на случай двух или трёх пространственных переменных.

Такая задача рассмотрена в параграфе 6.1.

К задачам второго класса можно отнести задачи, в которых осуществляется управление границей области, когда, например, требуется, подбирая границу области, выделить из семейства краевых задач ту, решение которой доставляет экстремум некоторому заданному функционалу. В этом случае при построении нейросетевой модели – системы из двух сетей – приходится использовать два функционала: с помощью одного обучается нейросеть для решения краевой задачи, по другому функционалу настраивается нейросеть для оптимальной границы области. Задача построения математической модели образцовой поверочной установки – калибратора переменного давления – является задачей указанного типа. Ранее [52] она была исследована с помощью традиционных методов математической физики. В работах [76,305] к решению этой задачи был применен нейросетевой подход, который представляется более адекватным в силу следующих очевидных преимуществ: помехоустойчивость – результат мало меняется при небольших изменениях входных данных (граничные условия, свойства среды, временная нестабильность);

нет необходимости при решении серии задач (среди которых могут быть и нелинейно возмущенные) настраивать сеть заново, можно использовать уже обученную сеть для достаточно близких входных данных и, если необходимо, доучить сеть до уровня требуемой точности. Данная задача рассмотрена в 6.2.

В параграфе 6.3 рассмотрены некоторые обобщения задач подобного рода.

При описании сложных объектов – построении их приближенных математических моделей – приходится сталкиваться с ситуацией, когда доступная информация разнородна – она представлена в виде набора соотношений: например, дифференциальные уравнения, законы сохранения, данные наблюдений, некие «разумные» ограничения и др. (некоторые данные могут отсутствовать). Единая методология решения задач в такой нестандартной постановке [54] появилась в публикации [63]. Такие неклассические задачи рассматриваются в статьях [66,73,74], посвященных построению приближенных нейросетевых моделей по разнородным данным. В данной главе лишь коснемся этой темы. Подробнее она обсуждается в главе 7.

6.1. Нейросетевые подходы к моделированию систем с фазовыми переходами Построение математической модели процессов, происходящих в многокомпонентных системах с неизвестной границей, которая должна быть найдена в процессе решения задачи, существенно сложнее, чем решение подобных задач для составных областей фиксированной формы (см. главы 4 и 5). Особенно трудной становится задача в случае, когда присутствует фазовый переход, т.е. одна компонента переходит в другую.

Будем исходить из модели многокомпонентной системы в виде начально краевой задачи математической физики вида A(u ) = g, u = u (t, x), (t, x) R p +1;

Bi (u ) = f i, = = i, i i где A и Bi – некоторые операторы в частных производных. Коэффициенты этих операторов, а также функции g, fi задаются кусочно в подобластях j = j и, вообще говоря, могут иметь разрывы на участках kl стыка j подобластей k и l. При этом граница области (или ее часть i ) или какие то участки стыка kl не фиксированы заранее, а находятся в процессе решения задачи.

В качестве модельной рассмотрим одномерную ( p = 1 ) нелинейную задачу теории теплопроводности, связанную с фазовыми переходами – задачу Стефана, решение которой известно и может использоваться для контроля предлагаемого нейросетевого подхода. Пусть двухфазная система описывается = (0;

T ) (0;

1) = +, следующим образом: в прямоугольнике где + = {(t, x) 0 t T,0 x (t )}, = {(t, x) 0 t T, (t ) x 1}, требуется найти решения уравнений теплопроводности для каждой из фаз u± 2 u± = a± 2, (t, x) ±.

t x Здесь a± – коэффициенты температуропроводности соответствующих фаз, u± (t, x ) – температуры этих фаз, которые удовлетворяют начальным условиям u+ (t,0) = (t ) 0, u (t,1) = (t ) u (0, x) = u0 ( x) 0, краевым условиям и условиям на свободной поверхности – фронте фазового перехода, заданном некоторой неизвестной гладкой функцией x = (t ), t 0, которую требуется определить в процессе решения задачи в соответствии с условиями d u+ u = u = 0, k+ k =q u+, x = 0 x = + 0 x = 0 x = + x x dt где k± – коэффициенты теплопроводности, q – теплота фазового перехода, а u (t, ) d d t = для вычисления можно воспользоваться выражением.

u dt dt (t, ) x Заметим, что последнее выражение, полученное дифференцированием по времени t изотермы u (t, (t )) = 0, написано для предельных точек компонент на фронте, так что его следует понимать как u± (t, ) d t =, u± dt (t, ) x в силу свойства равных отношений для скорости движения фронта справедливо u+ u (t, ) + (t, ) d = t t.

u+ u dt (t, ) + (t, ) x x Следует отметить, что это только модельная задача, рассматриваемая для простоты изложения. Несложные модификации приводимых ниже подходов позволяют рассмотреть случаи, когда функции u0 ( x), (t ) и (t ) меняют знак, а граница распадается на несколько компонент связности. Многомерный случай также не требует принципиального изменения подхода и не должен приводить (при предлагаемом подходе) к катастрофическому увеличению времени вычислений.

Известно, что преобразованием Больцмана уравнение теплопроводности сводится к обыкновенному дифференциальному уравнению. Решения этого уравнения для каждой из фаз при постоянных начальных и граничных условиях = (0;

) (0;

) для полубесконечной области легко находятся:

u± (t, x) = A± + B± ( x 2a± t ), где i = 1,2, ( z ) = erf ( z ) – интеграл ошибок.

Определяется и закон движения фронта фазового перехода (t ) = c t, где c – постоянная, являющаяся единственным положительным решением трансцендентного уравнения, возникающего из условий на фронте. Похожее (но несколько более сложное) решение получается и в рассматриваемом случае ограниченной области.

Мы предлагаем следующие естественные с точки зрения методологии нейронных сетей подходы к задаче Стефана:

1. Аппроксимация температурных полей для обеих фаз с помощью соответствующим образом обученной RBF-сети или персептрона.

2. Построение гетерогенной сети, которая включает в себя наряду с описывающими температурные режимы RBF-сетями для каждой из фаз еще и персептрон с одним скрытым слоем, задающий фронт, т.е. функцию (t ).

3. Поиск температурного поля с помощью пространственной RBF сети (т.е. сети, входом которой является переменная x ), зависящие от времени веса которой находятся из системы обыкновенных дифференциальных уравнений.

4. Использование рекуррентных нейронных сетей для задания нестационарных температурных режимов фаз.

Первый подход наиболее прост в реализации и мало отличается от своих нейросетевых аналогов для других задач математической физики. Второй подход не многим сложнее, но лучше отвечает особенностям задачи и позволяет достигать требуемой точности, используя сети с меньшим числом элементов и меньшее время обучения;

он также допускает распараллеливание задачи. Третий и четвёртый подходы быстрее, что особенно существенно при решении серии однотипных задач, однако требуют тщательного учёта особенностей задачи для обеспечения устойчивости реализующих их алгоритмов.

При первом подходе решение поставленной задачи сведём к обучению нейронной сети на основе минимизации функционала ошибки J (u ), взятого в форме 2 u 2 u u 2 u 2 a+ 2 dtdx + J (u ) = a 2 dtdx + t x t x + 1 T +1 u (0, x) u0 ( x) dx + 2 u (t,0) (t ) dt + 2 0 d T T u u + 3 u (t,1) (t ) dt + 4 k+ x = 0 k x = + 0 q dt, x x dt 0 l 0 – штрафные параметры для слагаемых, отвечающих начальным и краевым условиям. В более сложном случае, когда функции u0 ( x), (t ) и (t ) меняют знак, третье, четвёртое и пятое слагаемые разбиваются на части, соответствующие отрезкам знакопостоянства этих функций, которые мы можем определить, так как эти функции известны. Последний интеграл в выражении для функционала J (u ) берётся по отрезку (или отрезкам), для которого существует граница раздела сред. Если (t ) является неоднозначной функцией от переменной t, то нужно взять соответствующее количеству ветвей число интегралов.

В данном исследовании в качестве аппроксимирующей нейронной сети выбирается RBF-сеть или персептрон с одним скрытым слоем. Таким образом, поиск минимума функционала ошибки J (u ) осуществляется на функциях вида N u (t, x) = ck uk (t, x, k, k, tk, xk ) k = ck, k, k, tk, xk, k = 1,..., N. В качестве RB-функций путем подбора весов сети выбраны гауссианы uk = exp{ k (t tk )2 k ( x xk )2 }. Возможен и другой вариант выбора радиальной базисной функции, когда вместо Гауссова пакета v = exp( r 2 ) используют функцию Коши v = или другие функции 1+ r (1 + r 2 ), r 2 k, r 2 k ln r и т.п. Для персептрона выбраны функции активации th() :

uk = th{ k (t tk ) + k ( x xk )}, хотя можно использовать и другие функции аналогичного сигмоидного вида.

Приведённый выше функционал J (u ) аналитически вычислить сложно, поэтому в процессе обучения сети используется его дискретный аналог:

2 u (t +, x + ) 2u (t +, x + ) u (t, x ) 2u (t, x ) M+ M J (u ) = + a+ a + j j j j j j j j 2 t x 2 t x j =1 j = M0 M+ +1 u (0, x j0 ) u0 ( x j0 ) + 2 u (t j+,0) (t j+ ) + 2 j0 =1 j+ = u (t jb, + (t jb )) u (t jb, (t jb )) d (t jb ) Mb M + 3 u (t j,1) (t j ) + 4 k+ k q, x x dt j =1 jb = {(t, x ± )} M± ± где используются следующие наборы тестовых точек: – внутри j j j = {(0, x )} {(t } {(t } M0 M+ M областей ±, – на участках границы,,0),,1) j0 j+ j j+ =1 j = j0 = области. Последняя сумма вычисляется в окрестности свободной границы, которая определяется как линия, на которой u (t, x) = 0.

Также как и в главах 4 и 5. тестовые точки внутри области через определённое число шагов итерационного процесса перегенерируются.

Аналогичная процедура может использоваться и для точек на границе, хотя численные эксперименты показали, что в случае таких множеств контрольных точек это не так необходимо для устойчивости вычислительного процесса, как в случае тестовых точек внутри области.

Для оценки последнего слагаемого в сумме используются точки с d минимальным по модулю значением u, а производная оценивается с dt помощью линейной регрессии по этим точкам в достаточно малой подобласти.

Производную можно оценить и по приведённой выше формуле, т.е. заменить d выражением dt u+ (t jb, (t jb )) u (t jb, (t jb )) + t t.

u+ (t jb, (t jb )) u (t jb, (t jb )) + x x Для неограниченной области описанный выше алгоритм требует несложной модификации. Проблема состоит в том, что мы не можем взять точки для оценки сумм распределёнными равномерно – при удалении на бесконечность плотность распределения таких точек должна стремиться к нулю. Наиболее подходящим для этого представляется нормальное распределение, хотя возможны и другие варианты. В частности, можно это распределение выбирать зависящим от скорости изменения температуры, т.е.


точки брать гуще всего там, где градиент температуры максимален.

Первый подход допускает следующую нетрадиционную модификацию.

Будем искать решение в виде ak xuk (t, x,1k, 1k, t 1k, x1k ) + N u (t, x) =, k =1 + bk tvk (t, x, 2 k, 2 k, t 2 k, x 2 k ) + ck wk (t, x, k, k, tk, xk ) где коэффициенты uk, vk и wk – обычные радиальные базисные или персептронные функции. Если для персептрона в качестве этих функций sign{ k (t tk ) + k ( x xk )} ), то суммарная выбрать ступеньку (например, функция будет кусочно-линейной, что позволяет получить такое же приближение, как и в соответствующем варианте метода конечных элементов.

Рассматривая бесконечногладкие функции – вроде упомянутого выше th(), можно получить решение, близкое к конечноэлементному, но обладающее бесконечной гладкостью. При этом конечноэлементное решение может быть взято в качестве начального приближения при настройке весов нейронной сети.

Можно рассмотреть и гибридные сети, когда часть нейронов имеют функцию активации типа RBF, а часть – типа персептрона. Привлекательность такой структуры для решения рассматриваемой задачи состоит в том, что персептронная часть искомой функции задаёт переход от одной среды к другой, а часть типа RBF – уточняет решение в каждой среде по-отдельности.

Для подбора структуры сети целесообразно использовать один из генетических алгоритмов (см. главу 2). При этом каждый представитель популяции должен содержать слагаемые, отвечающие обеим фазам.

Скрещивание разумно производить, обменивая слагаемые разных представителей, отвечающие одинаковым фазам или зоне, окружающей границу фазового перехода. В методе МГУА целесообразно чередовать слои, отвечающие за решение для каждой из фаз и слои, отвечающие за рассогласование на стыке подобластей.

Второй подход отличается от первого тем, что для определения u+ и u используются различные сети, а для нахождения границы раздела фаз используется персептрон с одним скрытым слоем:

N (t ) = k k (t, k, tk ), k = где k (t, k, tk ) = th{k (t tk )}. При этом необходимо добавить в функционал = u условие стыковки. Поиск всех весов можно вести u+ x = 0 x = + одновременно, а можно для поиска решений в каждой из подобластей и для нахождения границы использовать разные функционалы. Например, для поиска u+ можно использовать функционал u+ (t j, x j ) 2u+ (t j, x j ) Mb M+ M+ + 2 u+ (t j+,0) (t j+ ) + 5 u+ (t jb, (t jb )), a+ t x j =1 j+ =1 jb = для u – функционал – u (t j, x j ) 2u (t j, x j ) M M + 1 u (0, x j0 ) u0 ( x j0 ) + a t x j =1 j0 = Mb M + 3 u (t j,1) (t j ) + 5 u (t jb, (t jb )), j =1 jb = а границу (t ) искать, минимизируя функционал Mb u+ (t jb, (t jb )) u (t jb, (t jb )) + jb = u+ (t jb, (t jb )) u (t jb, (t jb )) d (t jb ) Mb + 4 k+ k q.

x x dt jb = При этом в процессе оптимизации несколько шагов минимизации первых двух функционалов при фиксированной границе раздела фаз следует чередовать с несколькими шагами минимизации третьего функционала при фиксированных u+ и u. В этом варианте требуется меньшее суммарное количество функций, но вычислительный процесс является менее устойчивым.

Такой подход удобнее для применения генетических алгоритмов, при этом можно рассматривать два варианта их реализации. В первом работаем с единой популяцией, элементами которой являются наборы из трёх сетей, производя над ними генетические операции по-отдельности, во втором – рассматриваем три популяции, обучающиеся раздельно, а эволюционирующие в соответствии с возможностью составить тройку, дающую лучшее решение.

Возможен и промежуточный между первым и вторым подход, при котором для определения u+ и u используются различные сети как во втором подходе, при этом для поиска коэффициентов можно использовать функционал 2 u+ 2 u+ u 2 u 2 a+ 2 dtdx + J (u ) = a 2 dtdx + t x t x + 1 T +1 u (0, x) u0 ( x) dx + 2 u+ (t,0) (t ) dt + 2 0 d T T u u + 3 u (t,1) (t ) dt + 4 k+ + x = 0 k x = + 0 q dt, x x dt 0 или его дискретный вариант 2 u+ (t +, x + ) 2u+ (t +, x + ) u (t, x ) 2u (t, x ) M+ M J (u ) = + a+ ai + j j j j j j j j 2 t x 2 t x j =1 j = M0 M+ M +1 u (0, x j0 ) u0 ( x j0 ) + 2 u+ (t j+,0) (t j+ ) + 3 u (t j,1) (t j ) + 2 2 j0 =1 j+ =1 j = u+ (t jb, (t jb )) u (t jb, (t jb )) + u+ (t jb, (t jb )) u (t jb, (t jb )) Mb t t + 4 k+ k +q.

u+ (t jb, (t jb )) u (t jb, (t jb )) x x jb = + x x В соответствии с третьим подходом, который можно трактовать как некоторый вариант метода прямых, ищем решение в виде N u (t, x) = ck exp{ k ( x xk ) 2 }, k = где ck, k и xk являются неизвестными функциями времени. При этом u N = (ck + 2ck k ( x xk ) xk ck ( x xk ) 2 k )exp{ k ( x xk )2 }, t k = 2u N = ck (2 k + 4 k2 ( x xk ) 2 )exp{ k ( x xk ) 2 }.

x k = Далее можно как в первом подходе строить единую сеть для всей области u 2u, записывая уравнение теплопроводности в виде = a(u ) 2, где a(u ) – t x a при u a (u ) = + кусочно-постоянная функция вида. После этого a при u подставляем выражения для производных в уравнение, рассматриваем его для некоторого фиксированного множества точек x j – наиболее простой способ – взять 3N таких точек, затем решаем получившуюся систему N (c + 2ck k ( x j xk ) xk ck ( x j xk ) 2 k )exp{ k ( x j xk ) 2 } = k k = N = a (u (t, x j )) ck (2 k + 4 k2 ( x j xk ) 2 )exp{ k ( x j xk ) 2 }, j = 1,...,3 N k = относительно ck, k и xk, а далее – интегрируем каким-либо приближённым методом, например, одним из вариантов метода Рунге-Кутта. При этом остаётся решить две проблемы. Во-первых, коэффициенты системы будут зависеть от всего решения, т.е. интегрируя уравнения, придётся отслеживать область, в которой находится получившееся решение, при этом моменты перехода от одной фазы к другой при разных x будут различными. Таким образом, разделить этап решения системы и этап интегрирования уравнений до конца не удаётся, и эти этапы надо будет проводить совместно, подправляя коэффициенты системы после каждого шага интегрирования. Во-вторых, для интегрирования уравнений необходимы начальные значения ck, k и xk. Мы не можем их найти только из начального условия задачи u (0, x) = u0 ( x), так как тогда не остаётся параметров для удовлетворения граничных условий u (t,0) = (t ), u (t,1) = (t ) и условия теплового баланса на границе раздела фаз d u u k =q k+. Для решения этой проблемы нужно либо x = 0 x = + x x dt оставить часть начальных значений параметров для возможно более точного удовлетворения этих условий, либо взять меньше точек x j, например, 3 N 3 и использовать граничные условия и условие теплового баланса в виде связей для системы.

Можно, как и во втором подходе, строить две сети такого же типа (с зависящими от времени весами) – свою для каждой из фаз. При этом первая проблема исчезает, так как в каждой области коэффициент температуропроводности постоянен, вторую приходится преодолевать тем же способом, только для нахождения начальных значений коэффициентов каждой из сетей используются свои условия. В рассматриваемом нами частном случае для u – это начальное условие задачи u (0, x) = u0 ( x), а для u+ – условия = u = 0 и теплового баланса стыковки u+ x = 0 x = + d u+ u k =q k+.

x = 0 x = + x x dt Ещё один вариант третьего подхода возникает, если в каждой из областей приравнять соответствующие слагаемые в обеих частях системы, т.е.

ck + 2ck k ( x xk ) xk ck ( x xk ) 2 k = a± ck (2 k + 4 k2 ( x xk ) 2 ).

Если в этом равенстве приравнять коэффициенты при одинаковых степенях x, то для каждого слагаемого в аппроксимации решения задачи получаем фундаментальное решение уравнения теплопроводности ( x xk ) ck uk = exp{ 2 }, 4a± (t tk ) t tk причём для нахождения коэффициентов ck, tk и xk решения в каждой из фаз можно применить те же (приведённые выше) соображения, что и для поиска начальных условий.

В четвёртом подходе мы приведем только один из его возможных вариантов, так как различных архитектур рекуррентных нейронных сетей достаточно много (см. 1.4) и применение каждой из них имеет свои особенности. Этот вариант похож на известный метод сеток и обладает тем же принципиальным недостатком по сравнению с приведёнными выше подходами – решение вычисляется в отдельных точках, а не в области в целом. Разумеется, «точечное» решение можно продолжить на всю область, используя многие известные методы, в том числе и нейронные сети. Такая задача интерполяции рассматривалась ранее (см. 1.2 и главу 2) и достаточно хорошо представлена в литературе [217,232], поэтому мы на ней останавливаться не будем.

{(t, x )} Mt M x Выберем в области, равномерную сетку где ti = it,, i j i =0 j = x j = jx, t = T / M t, x = 1/ M x. Построим такую нейросеть, которая будет выдавать значения температуры uij = u (ti, x j ), j = 1,..., M x 1 в произвольном слое по значениям u (ti 1, x j ), j = 0,..., M x на предыдущем слое. При этом u0 j = u0 (0, x j ) – эти значения подаются на вход сети на первом шаге, ui 0 = (ti ), uiM x = (ti ) – в соответствии с граничными условиями, эти значения подаются на вход сети на соответствующем шаге. Выход сети в данный момент времени подаётся на вход в следующий момент. Таким образом, если сеть строить на основе персептрона – получаем формулу Mx N uij = jk f ( wkl ui 1,l wk 0 ) + j 0, k =1 l = где f – некоторая функция сигмоидального вида, например th() или sign().


Заметим, что такая конструкция является одним из вариантов сети Джордана, рассмотренной в 1.4.

Для того чтобы применить нейросетевую методологию, необходимо, прежде всего, построить функционал ошибки. Так как начальные и граничные условия удовлетворяются автоматически, ошибка оценивается по уравнению и условию баланса. Для дискретизации первой производной по времени нужно учитывать, как минимум, две соседние точки, а для второй производной по x – три. Таким образом, для оценки необходим простейший шеститочечный набор соседних точек и эта часть конструируемого функционала ошибки представляет собой сумму по всем таким наборам, для которых знак температуры сохраняется. Наборы, для которых знак меняется, можно использовать для оценки ошибки выполнения условия теплового баланса. При u+ u этом для оценки и можно использовать, например, x = 0 x = + x x d параболическую интерполяцию по трём точкам, а для вычисления dt u (, t ) d t = приведённую выше формулу или эту же интерполяцию. Таким u dt (, t ) x образом, получаем следующий функционал ui, j 1 + ui, j + ui, j +1 ui 1, j 1 ui 1, j ui 1, j + ( J (u ) = 3t ( i, j )± ui, j 1 2ui, j + ui, j +1 + ui 1, j 1 2ui 1, j + ui 1, j + a± )2 + 2x 3ui, j 1 + 4ui, j ui, j +1 3ui 1, j 1 + 4ui 1, j ui 1, j + + ( k+ 2 x ( i, j ) ui, j 1 4ui, j + 3ui, j +1 + ui 1, j 1 4ui 1, j + 3ui 1, j + k + 2x 4x(ui, j 1 + ui, j + ui, j +1 ui 1, j 1 ui 1, j ui 1, j +1 ) +q )2.

3t (ui 1, j +1 + ui, j +1 ui 1, j 1 ui, j 1 ) При этом (i, j ) ± – множества индексов, для которых значения температуры в соответствующих шеститочечных наборах сохраняют знак, а – (i, j ) множество индексов, для которого ui 1, j 1 и ui, j 1 имеют положительный знак, а ui 1, j +1 и ui, j +1 – отрицательный. Для точек с обратной переменой знака добавляются аналогичные, очевидным образом модифицированные слагаемые.

Далее этот функционал минимизируется по параметрам jk и wkl, при этом можно применить как метод, не требующий вычисления производных по подбираемым параметрам, например, метод случайного поиска, так и какой либо градиентный метод, так как производные по параметрам вычисляются аналитически. Следует заметить, что приведённый выше функционал не включает ещё один немаловажный аспект – начальные и граничные условия.

Если обучать сеть только для фиксированных условий, то и решение она будет строить только для этих условий, что не очень интересно. Более интересный вариант возникает, если мы рассматриваем некоторое множество начальных и граничных условий. Тогда вычислительный процесс в простейшем варианте может быть реализован следующим образом:

1. Выбираем некоторый набор начальных и граничных условий u0 ( x), (t ), (t ) или набор их поточечных вариантов.

2. Проводим некоторое небольшое (но достаточное для заметного уменьшения функционала) число шагов выбранного метода оптимизации для суммарного функционала по всем условиям из набора.

3. Формируем новый набор начальных и граничных условий и доучиваем сеть столько раз, сколько потребуется.

Более сложная процедура возникает, если мы хотим подобрать не только веса сети, но и её структуру. Для этого можно применить один из генетических алгоритмов из второй главы. В рассматриваемом случае наиболее перспективным представляется многорядный алгоритм МГУА [44,134,217-219].

Один из вариантов реализации такой процедуры – берём некоторое множество сетей различной структуры (т.е. сетей, у которых отличны от нуля только некоторые из коэффициентов jk и wkl ), обучаем их на двух различных наборах начальных и граничных данных и тестируем на третьем наборе. В результате отбирается та сеть (сети), выходы или веса которых наименее зависят от того, на каком наборе они обучались.

Приведем некоторые результаты вычислений. Для модельной задачи выбирались значения параметров: a+ = 1.2, a = 1, T = 3, k+ = 1.2, k = 1, q = 1.

Краевые условия: = t 1, = 1 ;

начальные условия: u0 = 1.

В качестве аппроксимирующей рассматривалась нейронная сеть из линейных элементов с коэффициентами в виде однослойных персептронов с функцией активации th().

Рис.6.1. График изотерм Интерес представляет и другой график температуры.

Рис.6.2. Графики вычисленной и заданной температуры на границе x = Для нейронной сети другой архитектуры – для RBF-сети, составленной из 50 гауссовых пакетов, получаем Рис.6.3. График изотерм Приведем для сравнения график температурного режима на левой границе и для RBF-сети.

Рис.6.4. Графики вычисленной и заданной температуры на границе x = Как и следовало ожидать, сети, построенные на основе персептронов, легче обучаются и лучше приближают решения задач с разрывными коэффициентами, чем гладкие RBF-сети.

6.2. Сравнительный анализ традиционного и нейросетевого подходов к построению приближенной модели калибратора переменного давления Постановка задачи Исследование, разработка и поверка измерительных систем, содержащих измерители-преобразователи давления, и создание соответствующих моделей является актуальным в связи с широким применением подобных систем в различных областях науки и техники, например, измерение давления в каналах, соплах, трубопроводах. Важно рассмотреть и сопутствующие задачи:

• оценка погрешностей, повышение точности измерительного процесса;

• учет и анализ некоторых других постоянных и переменных факторов (гетерогенность и наличие точек разрыва, нелинейность, изменчивость во времени и т.п.);

Рассмотрим образцовую поверочную установку переменного давления, измерительная рабочая полость которой симметрична как относительно оси вращения, так и перпендикулярной ей плоскости. Полость наполнена вязкой жидкостью, например, трансформаторным маслом. В полости создано высокое постоянное давление для подавления кавитационных процессов. На цилиндрической части границы полости находится пьезоэлектрический источник гармонических колебаний, который накладывает переменное давление на присутствующее постоянное давление. Предполагаем, что акустическое волновое поле в измерительной камере является гармоническим во времени, осесимметричным и четным по отношению к плоскости симметрии. На оси симметрии расположены два датчика давления – стандартный и проверяемый. Датчики предполагаются точечными при достаточном уровне точности. Нужно подобрать форму части границы, содержащей датчик, таким образом, чтобы давление в этой точке было максимальным. Можно делать и другие предположения: например, считать, что датчики не являются точечными – имеют конечные размеры (хотя и существенно меньшие характерных размеров рабочей полости установки), при этом поле на датчике практически не меняется. Требования, предъявляемые к датчику, будут учтены с помощью некоторого оптимизируемого функционала I. На нейросетевой подход подобная модификация практически не влияет.

Введем обозначения: V – скорость колебаний в среде, p – давление, – плотность, – кинематическая вязкость, c – скорость звука в среде, x = ( x, y, z ) – радиус-вектор точки, (,, z ) – его цилиндрические координаты.

Линейная аппроксимация уравнений акустики V = p + V, t p = c 2 V, t приводит к уравнению для переменного давления p = p (x, t ) 2 p = c 2 p + p.

t 2 t Будем рассматривать решение этого уравнения в некоторой ограниченной области R 3 – рабочей полости поверочного устройства. Следует указать особые колебательные условия на границе области = (граничные условия): непроницаемость стенок рабочей камеры, пьезоэлектрический генератор на цилиндрической части границы камеры, возможные неоднородности (измерительные окна или датчики).

Разложение Фурье приводит к изучению решений вида p (x, t ) = p (x, )exp(it ). Для Фурье-компонент u = u ( x, y, z ) p (x, ) имеем краевую задачу Неймана для уравнения Гельмгольца ( + k 2 )u = 0, k 2 = 2 ( c 2 + i ), (6.1) u n = f.

где u – давление в, – оператор Лапласа, – циклическая частота, = 0, = +, – часть = = 0 – граница области, f = f0, f 0 I [u ], границы, которую нужно оптимизировать, учитывая функционал описывающий волновое поле в месте расположения датчика.

Известные результаты о разрешимости задачи (6.1), содержатся, например, в книге [170]. При фиксированных данных k, f 0 можно решать задачу (6.1) в областях, различающихся выбором компоненты границы.

Множество таких областей {} будет далее параметризовано функциональным параметром.

z Симметрия задачи приводит к четному по переменной осесимметричному решению u ( x, y, z ) = u (, z ) = u (, z ) в плоской замкнутой области + R 2 – части осевого сечения, лежащей в полуплоскости z 0.

Далее для этого сечения будет использовано прежнее обозначение. В новых = x 2 + y 2, эта область определена как переменных, z, где :

( ) z ( ), 0 a;

с компонентами границы в виде 0 : = a, 0 a, ± : z = ± ( ), (a) = H, (0) = h 0, (0) = 0.

H z H ;

Указанная функция z = ( ) 0 задает параметризацию участка границы области и, тем самым, параметризацию самой области. Таким образом, порождается семейство областей.

Рис.6.5. Область Соответствующее граничное условие Неймана получаем в следующей форме:

u (a, z ) = f 0 ( z ), H z H ;

u (0, z ) = 0, h z h;

u (, ± ( )) ( )u (, ± ( )) = 0, z u (,0) = 0,0 a.

z Функцию f 0 ( z ) также предполагаем четной по z, независящей от угла d ( ) [0;

2 ). Как и ранее здесь обозначено ( ) =.

d Введем обозначения для предельных значений решения u изнутри области на компонентах границы и 0 : (, ( )) = ± (, ± ( )) = u, ± 0 ( a, z ) = u.

Среди различных способов описания условий оптимизации для моделирования датчика G – «большое поле на маленьком плоском датчике» – I [u ] = u (G ) = (0, h);

( ) = 0,0 a было выбрано следующее:

z = ( ), плоские в малой окрестности датчика, (выбираются кривые ортогональные оси симметрии z ). В качестве другого варианта требований, предъявляемых к акустическому волновому полю на датчике G, мог бы, например, выступить и функционал ( 0, 0 ) I = { d } + { d }1 q.

p q 1p 0 Получаем вариационную задачу I [u ] Max с условием связи в виде краевой эллиптической задачи Неймана (6.1). Нас будут интересовать ненулевые значения экстремумов, неспектральные значения параметра k (в том случае, если они вещественные).

Классический подход Оригинальный метод оптимизации границы и вычисления переменного давления u был представлен в публикации [52]: был разработан итерационный процесс для пары (, ), где = u – внутреннее предельное значение решения u на.

Утверждение. Экстремальную задачу с условием связи (6.1) можно заменить необходимым условием экстремума I = 0 с условием связи в виде граничного интегрального уравнения для функции вида = K + F (6.2’).

Наличие симметрии упрощает условие связи: граничное интегральное уравнение (6.2’) становится одномерным.

Доказательство Утверждения о возможности такого сведения основано на следующих рассуждениях и построениях.

Выберем во второй формуле Грина (здесь введено удобное обозначение aDb aDb bDa, где D – указанный дифференциальный оператор) u ( + k )Gd = u ( n)Gd в качестве функции u – решение задачи (6.1), а в качестве фундаментального решения G для оператора Гельмгольца – функцию Грина GN задачи Неймана для бесконечного кругового цилиндра радиуса a с осью симметрии z ( + k 2 )GN (x, x) = (x x), GN (x, x) = 0, n x =a G (x, x) = G (x, x) N N (явное выражение для GN см., например, в [190,226]). В результате получим представление для решения во внутренней точке x области лишь через граничные данные = u на подбираемых компонентах границы, исключив из рассмотрения граничные данные 0 = u на цилиндрической компоненте 0. При прямом выводе граничного интегрального уравнения для функции устремим точку x изнутри области к точке на. Относительно области предполагаем, что она удовлетворяет условию конуса [172]. Для получим – после предельного перехода и учета симметрии задачи – интегральное уравнение ( ) ) (, ( )) = (1 + cos 2 a = (, ( ))( ( ) ) g (, z;

, ( )) d (6.2) z = ( ) z H a f ( z )g (a, z;

, ( ))dz, где – плоский угол, соответствующий телесному углу, под которым видна из точки x (если в x существует касательная плоскость, то = ), а функция получается усреднением функции Грина:

g (G g (, z;

, z) = (,, z;

,, z) + GN (,, z;

,, z))d. Несложные N вычисления приводят к следующему выражению для g при вещественном k i eik z z + eik z + z + k i 0 m z z i 0 m z + z q q +e 1 N0 e g (, z;

, z) = 2 +i J 0 0m J 0 0m +, 0 m 0 m aa a m= e 0 m z z + e 0 m z + z q q + J 0 0m J 0 0m 0 m 0 m a a m= N0 +1 здесь 0 m = J 02 ( q0 m ), 0 m = k 2 ( q0 m a ), 0 m = ( q0 m a ) 2 k2, q0m – m -й (в порядке возрастания) корень уравнения J 0 ( q ) = 0, натуральное q0 N ka q0 N +1. При учете число определяется неравенствами N0 0 кинематической вязкости параметр k принимает комплексные значения (что с физической точки зрения соответствует диссипации энергии) – мы заведомо находимся не на спектре задачи – функцию g лучше задать в виде i ik z z + ik z + z +e k e 1 g (, z;

, z) = 2 0 m z z.

0 m z + z q0 m q0 m +e e a + J0 J0 0 m 0 m a a m=1 Решая при фиксированной кривой (заданной функции z = ( ) ) уравнение (6.2), определяем, а затем находим и 0 из соотношения ( z) ) 0 (a, z) = (1 + cos 2 (6.3) a H = (, ( ))( ( ) ) g (, z;

a, z) d a f ( z )g (a, z;

a, z)dz z = ( ) z 0 и, тем самым, граничные данные на всей границе (и решение u в области ).

Интегральные соотношения (6.2,6.3) в понятных обозначениях ( ) K (, ( );

, ( )) = (1 + cos ) ( ( ) ) g (, z;

, ( )) z = ( ), 2 z 2 ( ) H ) a f ( z )g ( a, z;

, ( )) dz, F (, ( );

a, H ) = (1 + cos 2 2 0 ( z) K 0 (a, z;

, ( )) = (1 + cos ) ( ( ) ) g (, z;

a, z) z = ( ), 2 z 2 ( z) H ) a f ( z )g (a, z;

a, z)dz F0 (a, z;

a, H ) = (1 + cos 2 2 0 могут быть представлены как a (, ( )) = K (, ( );

, ( )) (, ( ))d + F (, ( );

a, H ), (6.2’) a 0 (a, z) = K 0 (a, z;

, ( )) (, ( ))d + F0 (a, z;

a, H ). (6.3’) Граничное интегральное уравнение (6.2’) заменяет дифференциальное условие связи (6.1).

Рассмотрим вывод уравнения Эйлера нашей экстремальной задачи. (В соответствии с этим уравнением предполагается «подправлять» уравнение искомой границы.) Выражение для функционала I [u ] = (0, h) можно получить из соотношения (6.2) полагая = 0 :

a 1 I [u ] = (0, h) = M (, ( ), ( ), (0)) d + N ( (0)), 2 2 здесь функции M и N задаются равенствами M = (, ( ))( ( ) ) g (, z;

0, (0)), z = ( ) z H N = a f ( z )g ( a, z;

0, (0))dz. Это интегральное представление можно использовать при получении первой вариации I. Относительно приращений пока предположим, что C, (0) = (a) = 0 ;

далее уточним класс функций, которому должны принадлежать вариации. Стандартные приемы вычисления вариации приводят к равенству a a I = [ M ] d + M |0 + (0) ( Md + N ) (0), a (6.4) 2 0 где, как обычно, посредством [ M ] обозначена вариационная производная – M d M выражение. Второе слагаемое в (6.4) – внеинтегральные члены – d с учетом ограничений на и может быть записано в виде M |0 = ( I ) |0 + (0, (0)) (0).

a 2 Содержащее особенность первое слагаемое в правой части может исчезнуть лишь при (0) = 0, ибо нас интересуют экстремали со значениями I 0. Таким образом, необходимое условие экстремума в нашей задаче приводит к уравнению Эйлера [ M ] = 0 и к дополнительным ограничениям на класс приращений: (0) = 0. Для вариаций, удовлетворяющих и этим условиям, второе и третье слагаемые в (6.4) обращаются в нуль. Метод продолжения по параметру обобщенной функции | x | (см., например, [245]) позволяет преобразовать подынтегральное выражение – вариационную производную, переписав его в виде g g k 2 g ) z = ( ) + [ M ] = ( + z z 1 +{ ( (0, (0)) + (0) (0, (0)))(1 + (0) 2 ) 3 2 I (0) (0)(1 + (0) 2 ) 5 2 } (0) + 2 z + I (1 + (0) 2 ) 3 2 (0).

Сделанные ограничения на класс допустимых приращений приводят к упрощениям: второе и третье слагаемые пропадают, – уравнение Эйлера принимает вид:

g g k 2 g ) + = ( z = ( ) z z Это условие должно выполняться во всех внутренних точках оптимальной границы.

= ( ) Заметим, что с помощью соотношения можно z = ( ) z = ( ) z получить и другой способ записи уравнения g g = (k ), (6.5) g g z = ( ) z z который более удобен при построении численного алгоритма нахождения. Выражения для производных g z, g оптимальной границы выписываются в кусочно аналитической форме, но ввиду их громоздкости не приводятся. Уравнение (6.5) перепишем в виде ( ) = Z (, ( ), (, ( )),( )(, ( ));

a, k ). (6.5') На этом и завершается доказательство Утверждения.

Указанный классический прямой метод приводит к алгоритму итерационного типа: заданное приближение ( p ) для позволяет найти предельные значения решения u на границе (а тем самым и внутри области), а затем корректировать границу при помощи уравнения Эйлера и, таким образом, определить ( p+1). При этом начальное приближение (0) выбирается обычно из физических соображений.

Заменим уравнения (6.2'), (6.5') их дискретными аналогами. Приведем один из вариантов дискретизации: разобьем отрезок [0;

a] на n равных частей и =a n обозначим через длину шага разбиения. Введем mp ) = ( p ) (m ), m = 0,1,..., n : n p ) = H, – значения задающей участок границы ( ( функции в точках разбиения и соответствующие им значения mp ) = ( p ) (m, ( p ) (m )) искомой граничной функции, здесь и далее индекс ( p = 0,1,2,... Аппроксимируя ( p) указывает порядковый номер итерации:

интеграл в (6.2’) с помощью, например, простейшей квадратурной формулы прямоугольников, перейдем от интегрального уравнения (6.2’), написанного для фиксированной границы, к системе линейных уравнений для предельных значений mp ) ( n = Klmp ) mp ) + Fl ( p ), l = 0,..., m, ( p) ( ( l m = коэффициенты K lmp ), Fl ( p ) зависят от набора ( mp ) ). Решив эту систему, найдем ( ( приближение ( mp ) ) для граничных данных. А затем с помощью дискретного ( аналога уравнения (6.5'), имеющего вид разностного соотношения mp +1) mp +1) = Emp 1 ( mp ), mp ), mp )1 ), ( ( () ( ( ( 1 подправляем границу, принимая во внимание, что правый конец кривой z = ( ) закреплен:

n p +1) = n p ) = H, E0( p +1) = E0( p ) = 0, ( ( n1+1) = n p +1) En( 1) ( n p ), n p ), n1) ) = H En( 1) ( H, n p ), n1) ), (p ( p ( ( (p p ( (p n2 1) = n1+1) En( 2 ( n1), n1), n2 ), ( p+ (p p) (p (p ( p)...

1( p +1) = 2 p +1) E1( p ) ( 2 p ), 2 p ), 1( p ) ), ( ( ( 0( p +1) = 1( p +1) E0( p ) ( 1( p ), 1( p ), 0 p ) ) = 1( p +1), ( – получаем очередное приближение для границы – ( mp +1) ). Процесс построения ( приближений для оптимальной границы повторяем заданное число раз или до 0: max mp +1) mp ).

( ( достижения заданной точности вычислений 0 m n Заметим, что при построении аппроксимации интегрального уравнения можно было бы использовать более точные квадратурные формулы или заменить ядро интегрального оператора вырожденным [34], ограничиваясь частичной суммой ряда – слагаемого, входящего в представление для функции g. Более изощренные методы можно было бы применить и при аппроксимации необходимого условия экстремума. Но суть итерационного процесса для пары (, ) та же.

К недостаткам этого подхода следует отнести зависимость от геометрии – существенное усложнение вычислений при отсутствии симметрии;

зависимость от уравнения – принципиальное использование линейности задачи, рассмотрение случая постоянных коэффициентов уравнения, специальные довольно сильные требования гладкости границы области;

невозможность решения серии задач (например, возмущенных) – необходимость решения задачи заново при изменении входных данных.



Pages:     | 1 |   ...   | 5 | 6 || 8 | 9 |   ...   | 10 |
 





 
© 2013 www.libed.ru - «Бесплатная библиотека научно-практических конференций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.