авторефераты диссертаций БЕСПЛАТНАЯ БИБЛИОТЕКА РОССИИ

КОНФЕРЕНЦИИ, КНИГИ, ПОСОБИЯ, НАУЧНЫЕ ИЗДАНИЯ

<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ


Pages:     | 1 | 2 || 4 | 5 |

«ФЕДЕРАЛЬНОЕ АГЕНТСТВО ЖЕЛЕЗНОДОРОЖНОГО ТРАНСПОРТА ИРКУТСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ПУТЕЙ СООБЩЕНИЯ Институт информационных технологий и моделирования ИНФОРМАЦИОННЫЕ ...»

-- [ Страница 3 ] --

Постановка задачи такова. Имеется набор векторов x i, ( i = 1, n ), о ка ждом из которых известно, какому из двух классов он принадлежит:

1, если вектор x i принадлежит данному классу, yi = - 1, если вектор x i не принадлежит данному классу.

Задача состоит в моделировании границы, разделяющей эти два класса.

Граница ищется в виде некоторой гиперплоскости. Ниже метод иллюстри руется на двумерных векторах, однако основные соотношения метода справедливы для векторов любой размерности.

Случай линейной разделимости классов: разделение прямой линией Пусть два класса точек («ромбики» и «квадратики» на рис. 1, где по осям координат откладываются координаты векторов) можно разделить прямой линией (на самом деле – бесчисленным множеством прямых ли ний). Эта линия находится на расстоянии b0 от начала координат и имеет нормальный вектор w. Для произ вольного вектора x w = w Пр w x. Ес ли вектор x выходит из начала коор динат, а его конец лежит на самой разделительной линии, то Пр w x = b0, т. е. уравнение границы имеет вид x w - w b0 = 0.

На рис. 1 для «ромбиков»

x w - w b0 0, для «квадратиков»

0 5 10 15 20 x w - w b0 0. Введём b = w b0. То Рис. 1 гда x w - b 0, yi = -1 («ромбики») и x w - b 0, yi = 1 («квадратики»).

Случай линейной разделимости классов: разделение полосой Пусть линия, для которой x w - b = 0, занимает среднее положение между двумя другими линиями: x w - b = -1 и x w - b = 1, т. е. является осью симметрии полосы - 1 x w - b 1. Данная полоса должна разделять два класса точек, т. е. простираться между «крайними» точками 1-го и 2-го классов. Найдём ширину этой полосы. Пусть одна точка x1 является край ней для «ромбиков», другая x 2 для «квадратиков». Тогда x1 w - b = -1, y1 = -1, (1) x 2 w - b = 1, y2 = 1. (2) Рассмотрим скалярное произведение единичного нормального век w и вектора x 2 - x1 :

тора w w ( x 2 - x1 ) = x 2 - x1 cosj.

w Правая часть равенства как раз и представляет собой ширину поло сы. Используя (1) и (2), получаем w (x 2 - x1 ) 1 + b + 1 - b = =.

w w w Для лучшего разделения двух классов полоса должна быть как можно более широкой. Видим, что для максимизации ширины полосы следует минимизировать длину нормального вектора, т. е. w w ® min.

С учётом того, что для крайних точек множеств выполняются равен ства (1) и (2), имеем для «ромбиков» x w - b -1, yi = -1, т.е. (x w - b ) yi 1, yi = -1, для «квадратиков» x w - b 1, yi = 1, т. е.

(x w - b ) yi 1, yi = 1. Таким образом, для обоих множеств получается одно и то же ограничение (xi w - b ) yi 1, yi = -1 или 1. (3) Итак, при известных x i, y i ( i = 1, n ) получаем задачу оптимизации w w ® min, (4) (xi w - b) yi 1, в которой переменными являются координаты нормального вектора w и величина b.

Для иллюстрации метода рассмот Таблица рим набор данных в табл. 1 (см. также Набор векторов № рис. 1). Имеем 10 векторов, по 5 в каждом yi i Координаты векторов классе. При решении задачи оптимизации 1 3 2 – (4) (расчёты можно выполнить, напри 2 2 3 – мер, с помощью надстройки Поиск ре 3 4 3 – 4 4 4 – шения в Excel) получаем: w = (0.5, 1.5), * 5 1 5 – b* = 9. Разделительная линия (штриховая 6 2 6 линия на рис. 1) описывается уравнением 7 2 8 0.5 x(1) + 1.5 x( 2) - 9 = 0. На одинаковом 8 3 6 9 5 5 расстоянии от этой линии находятся 10 6 5 границы полосы. Точно на этих грани цах оказались ромбики i = 4 и i = 5, а также квадратики i = 6 и i = 9. (На границах должно оказаться, по крайней мере, по одной точке каждого класса.) Отсутствие линейной разделимости В практических задачах обычно два класса точек линейно нераздели мы, так что приходится допускать возможность выхода точек не только за внутреннюю границу данного класса (т. е. попадание в разделительную полосу), но даже за разделительную линию. Ошибка xi определяется как величина выхода точки данного класса за полученную внутреннюю грани цу этого класса. Однако если 0 xi 1, то точка не переходит через разде лительную (среднюю) линию и объект заносится в собственный класс (преодолимая ошибка). Если xi 1, то объект классифицируется непра вильно (непреодолимая ошибка). Т. о. условие отнесения точки к данному классу такое:

(x i w - b )yi 1 - x i, yi = -1 или 1.

При построении целевой функции нужно учесть два противоречащих друг другу требования: полоса должна быть как можно шире;

ошибки долж ны быть как можно меньше. Поэтому целевая функция задаётся в виде w w + C xi ® min.

C это регулирующий коэффициент, который устанавливает относи тельную важность двух названных требований. При слишком малом C ошибки обесцениваются, всё определяется первым требованием. Поэтому полоса становится широкой и весь набор данных оказывается внутри по лосы. Это, конечно, не имеет никакого смысла, и метод перестаёт работать.

Чем выше C, тем большее значение придаётся ошибкам. Следова тельно, полоса становится уже. Если полоса станет настолько узкой, что в ней не окажется точек (т. е. не останется преодолимых ошибок), то она пе рестанет сужаться с дальнейшим ростом C.

Итак, теперь задача оптимизации имеет вид w w + C x i ® min, (5) (xi w - b )yi 1 - x i, yi = -1 или 1, где переменными являются координаты нормального вектора, величина b, а также ошибки xi.

Сначала применим этот под ход к прежнему (разделимому) на бору данных (табл. 1). Зададим C = 1. При решении задачи оптими зации (5) получаем: w * = (0.5, 1), b* = 6.5. На одинаковом расстоянии от разделительной линии (штрихо вая линия на рис. 2) находятся гра ницы полосы. Точно на этих грани 0 5 10 15 цах оказался «ромбик» i = 5, а так же «квадратики» i = 8 и i = 9.

Рис. Внутри полосы оказался «ромбик»

i = 4 и «квадратик» i = 6. Для каж дой из последних двух точек ошибка составляет 0.5.

С ростом C полоса начнёт сужаться, а параметры разделительной ли нии будут приближаться к их значениям в расчёте, который соответствует модели (4) (рис. 1). Действительно, уже при C = 1.5 внутри полосы не ос таётся точек, а параметры разделительной линии оказываются равными w * = (0.5, 1.5), b* = 9.

Далее будем работать с линейно неразделимым на бором векторов. Для этого изменим только один век тор: x 6 = ( 2;

4.5). Зададим C = 1. При решении задачи (5) получаем: w * = (0.4, 0.8), b* = 5 (рис. 3). На одинако вом расстоянии от этой ли 0 5 10 15 нии находятся границы по Рис. 3 лосы. Точно на этих грани цах оказался «ромбик»

i = 3, а также «квадратики» i = 8 и i = 9. Внутри полосы оказались «ром бики» i = 4 и i = 5 и «квадратик» i = 6. Ошибки составляют соответствен но x 4 = 0.8, x 5 = 0.4, x 6 = 1.6. Таким образом, ошибки, связанные с «ром биками», являются преодолимыми, а с «квадратиком» непреодолимой. С ростом C полоса начнёт сужаться, а параметры разделительной линии бу дут изменяться. Так, при C = 6 внутри полосы вообще не останется точек, зато точка i = 6 будет иметь ошибку x 6 = 2.25 2, т. е. окажется за внут ренней границей «чужого» класса.

Метод множителей Лагранжа Пусть имеется задача оптимизации с ограничениями-неравенствами F ® min, Gi 0, i = 1, n.

Согласно методу множителей Лагранжа, строится новая целевая функция L = F - li Gi ® min ( li 0 ) и решается новая задача на безус ловные экстремумы по всем старым и новым ( li ) переменным. Либо li = 0, и тогда соответствующее ограничение не активно. Либо li 0, то гда ограничение Gi 0 активно, причём выполняется как равенство.

Рассмотрим сначала задачу с линейным разделением, в которой мож но избежать ошибок xi (в соответствии с использованной выше термино логией). В этой задаче целевая функция (Лагранжиан) L = w w - li ((x i w - b) yi - 1) ® min. (6) 2 i Здесь первое слагаемое есть величина, обратная ширине полосы разделе ния. По необходимому условию экстремума w - li x i yi = 0, т. е.

i li x i yi. Итак, искомый нормальный w= вектор есть линейная комбина i ция опорных векторов (т. е. таких, для которых множитель Лагранжа не равен нулю). В данном случае опорные векторы лежат на границах полосы разделения. Беря частную производную по b, получаем ещё одно условие экстремума:

li yi = 0.

i Показано [2], что выполнив некоторые преобразования, можно придти к «двойственной» задаче li - 2 li l j x i x j yi y j ® max, i i j li yi = 0, (7) i li 0, i = 1, n.

Решая эту задачу, получим оптимальные значения l*, i = 1, n. По ним i можно вычислить оптимальный нормальный вектор разделяющей гиперп лоскости:

w * = l*x i yi. (8) i i Значение b можно найти из условия, что опорные векторы лежат на гра нице полосы:

(x s w * - b )ys = 1.

Т. о. b* = x s w * - ys, где x s — любой опорный вектор.

Вернёмся к первому (разделимому) набору данных (табл. 1) и решим задачу (7). Результаты получаются идентичными прежним, показанным на рис. 1: w * = (0.5, 1.5), b* = 9. Число опорных векторов (они находятся на границах полосы и множители Лагранжа для них положительны) при этом равно 4 ( i = 4 и i = 5, i = 6 и i = 9 ).

Переходим к случаю, когда допускается попадание точек на полосу разделения. Целевая функция имеет вид w w + C xi ® min, при ограничениях (xi w - b ) yi 1 - x i, yi = -1 или 1.

Тогда новая целевая функция есть w w + C x i - li (xi + (x i w - b) yi - 1) ® min. (9) 2 i Это задача на безусловный экстремум (без ограничений) с переменными w (вектор), b, xi, li ( i = 1, n ). Экстремум лежит в точке, где равны нулю все частные производные.

Берём производную по w :

w - li x i yi = 0, т.е. w * = li x i yi.

i i Итак, искомый нормальный вектор есть линейная комбинация опор ных тренинговых векторов (т. е. таких, для которых множитель Лагранжа не равен нулю). Но теперь опорные векторы лежат на полосе разделения, а некоторые из них (по крайней мере, по одному от каждого класса) лежат на границах полосы.

Берём производную по b : li yi = 0. Приходим к задаче i l li l j x i x j yi y j ® max, i 2i j i li yi = 0, 0 li C, i = 1, n, (10) i которая от случая линейной разделимости (7) отличается только послед ним условием, зависящим от выбора константы C.

Решая эту задачу, найдём оптимальные значения l*, i = 1, n. По ним i можно вычислить оптимальный нормальный вектор разделяющей гиперп лоскости (8).

Для того, чтобы найти значение b, необходимо среди опорных векто ров ( ls 0 ) выбрать те 2 вектора разных классов, которые находятся на разных границах полосы. Затем нужно найти среднее арифметическое ме жду скалярными произведениями этих векторов на найденный нормаль ный вектор. Это и будет b. Сами скалярные произведения будут разли чаться ровно на 2 единицы, т. е. b будет отличаться от каждого из произ ведений ровно на 1.

Решим задачу (10) для первого (разделимого) набора данных (табл. 1).

Для сопоставления с результатами решения задачи (5), показанными на рис. 2, нужно задать C = 0.5, а не 1, т. к. в целевой функции при первом слагаемом появился множитель 1 2 (10). Результаты получаются идентич ными. Если задать достаточно большое значение C, например C = 1, то придём к результатам, полученным для этого набора данных в задачах (4) и (7). Как сказано выше, это связано с тем, что внутри разделительной по лосы не остаётся точек, т. е. сумма ошибок становится равной нулю. Число опорных векторов при этом равно 4 ( i = 4 и i = 5, i = 6 и i = 9 ).

Решение задачи (10) для второго (неразделимого) набора данных так же приводит к результатам, идентичным с результатами решения задачи (5).

Алгоритм работы метода опорных векторов Итак, метод опорных векторов (с использованием множителей Ла гранжа) реализуется в следующем порядке.

1. Присваиваем векторам x i метки yi (одному классу +1, другому - 1;

если поменять классы местами, то сменят знаки нормальный вектор и b ).

2. Решаем задачу квадратичного программирования (10).

3. Находим оптимальный нормальный вектор (8).

4. По найденным значениям l* 0 определяем, какие векторы яв i ляются опорными. Вычисляем для этих векторов произведения x s w*.

Среди опорных векторов класса yi = -1 находим вектор с минимальным x s w*, среди опорных векторов класса yi = 1 находим вектор с максималь ным x s w*. Эти два скалярных произведения должны отличаться друг от друга на 2 единицы, а величина b * определяется как среднее между ними.

5. Для того, чтобы классифицировать новый вектор x, нужно найти x w *. Если x w * -b* 0, то относим этот вектор к классу yi = -1, в про тивном случае к классу yi = 1.

Альтернативный методу опорных векторов простой линейный классификатор В методе опорных векторов (модель (10)) число переменных при решении задачи оптимизации равно числу обучающих (тренинговых) векторов. По этой причине метод является «медленно обучающим».

Другой недостаток метода, на наш взгляд, связан с необходимостью за давать регулирующий параметр C, не зная, при каком значении этой ве личины мы получим наибольшую вероятность правильного распознава ния классов.

Предлагаемый нами простой линейный классификатор (ПЛК) лишён этих недостатков. Алгоритм его работы таков.

1. Присваиваем векторам x i метки yi (одному классу +1, другому - 1).

2. В качестве критерия оптимизации задаём условие n (x i w - b )yi ® max, (11) i = которое означает, что разделительная линия должна быть выбрана так, чтобы тренинговые векторы оказывались как можно «глубже» в своём классе (в этом случае они будут вносить максимальный положительный вклад в сумму (11)). Величина b при этом определяется как ( ) b= xw + xw. (12) 2 A B Слагаемые в скобках в формуле (12) соответствуют усреднённым скаляр ным произведениям векторов одного и другого классов на неизвестный нормальный вектор разделительной прямой (гиперплоскости).

3. Задаём единственное ограничение: w = 1.

4. Находим w * как решение сформулированной задачи оптимизации и b * по формуле (12) с w = w *.

5. Для того, чтобы классифицировать новый вектор x, нужно найти x w *. Если x w * -b* 0, то относим этот вектор к классу yi = -1, в про тивном случае к классу yi = 1.

Таким образом, число переменных при решении задачи оптимизации данным методом равно размерности векторного пространства и не зависит от числа тренинговых векторов, что кардинально сокращает требуемые ре сурсы. С другой стороны, задача не зависит от каких-либо дополнитель ных параметров, подобных коэффициенту C в методе опорных векторов.

Тестирование методов. Сравнительный анализ результатов Переходим к демонстрации результатов, полученных разными мето дами. Для обучения моделей использовался набор случайных двумерных векторов x, координаты которых имеют нормальное распределение. Если обозначить математическое ожидание и среднеквадратическое отклонение нормального распределения через a и s соответственно, то для генерации случайных чисел задавалось для 1-й координаты x(1) векторов 1-го класса ( yi = -1 ): a = 3, s = 1 ;

для 2-й координаты x( 2 ) векторов 1-го класса ( yi = -1 ): a = 5, s = 1 ;

для 1-й координаты x(1) векторов 2-го класса ( yi = 1): a = 5, s = 1 ;

для 2-й координаты x( 2 ) векторов 2-го класса ( yi = 1): a = 7, s = 1.

В этом случае из соображений симметрии легко получить «теорети ческую границу» между классами: x(1) + x( 2) = 10 или x* = ( 12, 12 ), b* = 102.

На рис. 4 показан набор случайных векторов (по 25 тренинговых векторов каждого класса) и варианты границы разделения, полученной пятью различными способами: теоретическая граница, которая зависит лишь от генеральных характеристик, но не от конкретной реализации;

границы, полученные методом опорных векторов для указанных значе ний коэффициента C ;

граница, полученная с помощью ПЛК. Характери стики каждой из этих линий (до и после нормировки нормального векто ра) указаны в табл. 2.

Таблица Характеристики границ разделения Теоретическая ПЛК С = 0,5 С=3 С = 0,1 граница классов До нормировки w(1) 0,629945 0,798002 0,983222 0,669882 w (2) 0,77664 0,940227 1,102921 0,689795 b 7,236056 8,712453 10,55094 6,629587 w 1 1,233221 1,477552 0,96154 1, После нормировки w (1) 0,629945 0,647088 0,66544 0,696676 0, w (2) 0,776639 0,762416 0,746451 0,717386 0, b 7,236054 7,064797 7,140825 6,894758 7, w 1 1 1 1 После обучения всех моделей они были протестированы. Тестовый набор векторов генерировался точно таким же образом, как тренинговый набор (случайные векторы с теми же генеральными характеристиками) и включал в себя по 5000 векторов каждого класса. Очевидно, что парамет ры распределений случайных векторов в нашем случае таковы, что неко торая часть векторов неизбежно попадёт за границу между классами и бу дет классифицирована неправильно (см., например, рис. 4). Однако та мо дель, которая даст наименьший процент неправильно классифицирован ных векторов, может считаться самой удачной. Соответствующие резуль таты указаны в табл. 3. Как можно было ожидать, наиболее удачной оказа лась модель с теоретической границей классов (отметим, что в практиче ских задачах такая граница принципиально неизвестна). Модель, основан ная на ПЛК, показала результаты, по крайней мере, не худшие, чем метод опорных векторов (с различными значениями C ).

Таблица Доля неправильно классифицированных векторов Теоретическая граница Модель ПЛК С = 0.5 С = 3 С = 0. классов Доля, % 7.99 8.23 8.02 8.53 7. x(2) Класс Класс ПЛК С=0. С= С=0, теория x(1) 0 2 4 6 8 Рис. Таким образом, предложенный нами простой линейный классифика тор не обнаруживает худшего по сравнению с методом опорных векторов качества классификации, являясь при этом значительно более оператив ным.

Библиографический список 1. Vapnik V.N. The Nature of Statistical Learning Theory. – Berlin : Springer-Verlag, 1995. – 314 p.

2. Wan V. Speaker Verification using Support Vector Machines. Department of Computer Science University of Sheffield, United Kingdom, 2003, 117 р.

3. Гефан Г.Д., Иванов В.Б. Математическое моделирование систем верификации и идентификации личности по речевым сигналам. В кн.: Информационные системы контроля и управления в промышленности и на транспорте. – Иркутск : ИрГУПС, 2010. – Вып. 17. – С. 24–32.

УДК 519. Г.Д. Гефан, Е.А. Пальчик МОДЕЛИРОВАНИЕ СЛУЧАЙНЫХ ПРОЦЕССОВ И СИСТЕМ МАССОВОГО ОБСЛУЖИВАНИЯ МЕТОДОМ МОНТЕ-КАРЛО Введение. Теоретически сам метод статистических испытаний возник давно и не раз использовался в теории вероятностей и математической ста тистике. Однако серьёзное развитие он получил с конца 1940-х годов (в США) с разработкой и совершенствованием компьютеров. Американ ские ученые фон Нейман и Улам применили этот метод (дав ему название «Монте-Карло») к решению некоторых задач экранирования ядерных из лучений. В 1949 году Метрополис и Улам опубликовали статью «Метод Монте-Карло», в которой систематически его изложили. Название «Монте Карло» связано с одноименным городом в княжестве Монако, известным своими казино (рулетка является одним из простейших устройств для по лучения случайных чисел, на использовании которых основан этот метод).

Методом Монте-Карло (методом статистических испытаний, стати стическим моделированием) называется метод решения различных мате матических задач при помощи численной имитации поведения случайных величин (функций, процессов) и статистического оценивания их характе ристик. Метод Монте-Карло используется для решения задач физики, тео рии массового обслуживания, экономики, биологии, социологии и других.

Сама идея метода несложна. Производится многократно повторяю щийся «розыгрыш» случайного явления. Каждая реализация уникальна, однако статистическая обработка всего собранного материала может дать любые интересующие нас характеристики: вероятности, математические ожидания и т. д.

1. Виды единичного жребия. Разыгрывание случайных событий и величин. Реализация некоторого случайного явления или процесса ме тодом Монте-Карло строится из последовательности так называемых еди ничных жребиев (т. е. опытов со случайным исходом), перемежающихся с обычными расчётами. Единичный жребий может быть реализован с помо щью генерации случайного числа – значения случайной величины, равно мерно распределённой на интервале от 0 до 1. В EXCEL для этого сущест вует специальная функция без аргументов СЛЧИС() из списка математиче ских функций. Обозначим такое случайное число через g. Нас будут инте ресовать три вида единичного жребия, которые мы рассмотрим последова тельно.

Произошло ли данное событие? Пусть нам известно, что событие A имеет вероятность p. Можно условиться считать, что если g приняло зна чение меньше p, то событие A произошло;

при g p событие не про изошло. Вопрос о том, почему «граничный» случай g = p трактуется как ненаступление события, не имеет никакого практического значения. Учи тывая точность компьютерного представления действительных чисел, ве роятностью такого совпадения можно просто пренебречь. Во всяком слу чае, на результат статистического моделирования это никакого влияния не оказывает.

Какое из нескольких событий, образующих полную группу несовмест ных событий, произошло? Пусть события A1, A2,..., Ak наступают с веро ятностями A2 p1, p2,..., pk, образуя полную группу несовместных событий, k pi = 1.

так что Можно принять алгоритм, определяющий наступление i= того или иного события в зависимости от значения случайного числа g (рис. 1).

да A g p да нет g p1 + p нет … да Ak - g p1 + p2 +... + pk - нет Ak Рис. Пусть, например, A1, A2,..., A5 – равновозможные события, образую щие полную группу несовместных событий (т. е. каждое из них имеет ве роятность 0,2). Случайное число приняло значение g = 0,68. Поскольку 0,2 + 0,2 + 0,2 0,68 0,2 + 0,2 + 0,2 + 0,2, считаем, что произошло событие A4.

Какое значение приняла случайная величина X ? Сначала рассмотрим дискретную случайную величину с известным законом распределения:

значения x1, x2,..., xk принимаются с вероятностями p1, p2,..., pk соответ ственно. Легко понять, что этот случай сводится к предыдущей задаче, по скольку равенства X = x1, X = x2, …, X = xk можно рассматривать как события A1, A2,..., Ak. Пусть, например, случайная величина подчинена биномиальному закону распределения 3 - xi xi 1, xi = 0, 3, P ( X = xi ) = C3xi 4 т. е.

0 1 2 xi 27 27 9 pi 64 64 64 Допустим, что случайное число приняло значение 0,47. Поскольку 27 0,47, считаем, что случайная величина приняла значение X = 1.

64 Подход к разыгрыванию непрерывной случайной величины X по ее функ ции распределения F (x ) тоже достаточно прост. Имея случайное число g, следует определять случайное число x (значение случайной величины X ) как решение уравнения F (x ) = g. (1) Например, для равномерного распределения x-a F ( x) =, a x b, b-a и, следовательно, x-a = g x = (b - a )g + a. (2) b-a Заметим, что в данном случае связь между g и x достаточно очевидна:

умножение на (b - a ) изменяет длину интервала, добавление a смещает его начало.

2. Примеры анализа случайных процессов методом Монте-Карло.

Рассмотрим цепь Маркова с дискретным временем с двумя дискретными состояниями S1 и S 2 с матрицей перехода ~ 0,4 0, P = 0,3 0,7.

Найдём стационарное распределение вероятностей по состояниям.

Для этого составим систему уравнений 0,4 0, (P, P2 ) 0,3 0,7 = ( P, P2 ), 1 P + P2 = 1, решение которой имеет вид P = (1 3 ;

2 3). В установившемся режиме сис тема проводит одну треть времени в состоянии S1 и две трети времени в состоянии S 2.

Теперь решим ту же задачу методом Монте-Карло. На листе EXCEL размещаем исходные данные и формируем таблицу, моделирующую слу чайный процесс (табл. 1). Для определения предельного стационарного режима мы должны получить достаточно длинную реализацию случайного процесса. В этом случае начальное состояние можно задать любым. По этому в ячейку A5 введём 0 (нулевой момент времени), в ячейку C5 – чис ло 1 (состояние S1 ) или число 2 (состояние S 2 ). В ячейку B6 вводим =СЛЧИС(), а в ячейку C6 – формулу, которая будет определять состояние процесса в момент времени 1. Эта процедура задаётся в соответствии с приведённым выше правилом: событие, имеющее вероятность p, наступа ет в том случае, если случайное число g оказывается меньше, чем p. По этому, если предыдущим состоянием является S1, то в случае g P сис тема останется в этом состоянии;

в противном случае произойдёт переход в состояние S 2. Если же предыдущим состоянием является S 2, то в случае g P21 произойдёт переход в состояние S1 ;

в противном случае система останется в том же состоянии.

Таблица A B C Матрица перехода 2 0,4 0, 3 0,3 0, 4 Время Сл. число Состояние 50 =ЕСЛИ(C5=1;

ЕСЛИ(B6$B$2;

1;

2);

=СЛЧИС() ЕСЛИ(B6$B$3;

1;

2)) =A5+ Организуем эту процедуру с помощью логической функции ЕСЛИ (логическое выражение;

значение, если истина;

значение, если ложь). Со ответствующая формула вводится в ячейку C6. Знак $ фиксирует адреса ячеек, которые не должны измениться при последующем автозаполнении.

Теперь выделим ячейки A6:C6 и выполним автозаполнение вниз до строки 10005 (при этом реализация случайного процесса будет включать моментов времени). Под таблицей в двух свободных ячейках поместим формулы =СЧЁТЕСЛИ(C6:C10005;

1) и =СЧЁТЕСЛИ(C6:C10005;

2). В этих ячейках будет подсчитываться суммарное время T1 и T2, которое сис тема провела в состояниях S1 и S 2 соответственно.

Если теперь щелчком мыши активизировать любую свободную ячей ку рабочего листа и раз за разом нажимать на клавишу Delete, то при каж дом нажатии будет генерироваться новая реализация продолжительностью T = 10000, и, следовательно, будут появляться новые значения T1 и T2.

Стационарное предельное распределение вероятностей состояний может быть оценено как P = T1 / T, P2 = T2 / T. Можно убедиться, что почти при каждой реализации эти значения достаточно близки (до 0,01) к точным значениям P1=1/3, P2=2/3.

Перейдём к моделированию процесса с непрерывным временем.

Пусть задана матрица интенсивностей переходов - 3 1 L = 0 - 2 2.

1 0 - Для того, чтобы найти распределение вероятностей по состояниям, следует записать систему дифференциальных уравнений Колмогорова P(t= P(t )L, т. е.

) P(t ) = -3P (t ) + P3 (t ), 1 P2(t ) = P (t ) - 2 P2 (t ), P(t ) = 2 P (t ) + 2 P (t ) - P (t ), 3 1 2 дополнив её условием нормировки P1 (t ) + P2 (t ) + P3 (t ) = 1. Если требуется найти только стационарное распределение вероятностей, то, приняв Pi(t ) = 0, i = 1, 2, 3, получаем систему алгебраических уравнений. Её един ственное решение: P = 2 / 9, P2 = 1 / 9, P3 = 2 / 3.

Рассмотрим решение той же задачи методом Монте-Карло. Применим искусственную дискретизацию времени: будем считать, что время изменя ется дискретно с некоторым малым шагом Dt. В этом случае [5] Pij (t + Dt ) » lij Dt (3) при условии, что i j. Напротив, при совпадении начального и конечного состояний перехода Pii (t + Dt ) » 1 + lii Dt. (4) Записанные приближённые равенства могут быть использованы для того, чтобы перейти от процесса с непрерывным временем, характеризуе мого матрицей интенсивностей L, к процессу с дискретным временем, ха ~ рактеризуемому матрицей перехода P. Например, при Dt = 0 можно полу чить матрицу 0,7 0,1 0, ~ P = 0 0,8 0,2, 0,1 0 0, удовлетворяющую всем необходимым требованиям к матрице перехода.

На листе EXCEL в диапазон ячеек B2:D4 введём матрицу интенсивно стей, в ячейку D5 – выбранный шаг по времени, в диапазон B6:D8 – фор мулы, вычисляющие переходные вероятности в соответствии с правилами (3) и (4). Диапазон ячеек A9:C11 заполняется подобно тому, как это было сделано в предыдущем примере (табл. 1). Однако, в связи с тем, что число состояний увеличилось с 2 до 3, формула для генерации состояния процес са на текущем шаге (в ячейке C11) будет, разумеется, несколько более сложной:

=ЕСЛИ(C10=1;

ЕСЛИ(B11$B$6;

1;

ЕСЛИ(B11$B$6+$C$6;

2;

3));

ЕСЛИ(C10=2;

ЕСЛИ(B11$B$7;

1;

ЕСЛИ(B11$B$7+$C$7;

2;

3));

(5) ЕСЛИ(B11$B$8;

1;

ЕСЛИ(B11$B$8+$C$8;

2;

3)))).

Данной формуле можно было бы придать более простой вид, если учесть тот факт, что в матрице перехода есть элементы, равные нулю. Од нако в таком случае изготовленный нами файл не мог бы использоваться для решения аналогичных задач с другими исходными данными.

Таблица A B C D Матрица интенсивностей 2 –3 1 3 0 –2 4 1 0 – Матрица перехода за время Dt = 5 0, 6 0,7 0,1 0, 7 0 0,8 0, 8 0,1 0 0, Время Сл. число Состояние 10 0 Формула 11 =A10+$D$5 =СЛЧИС() (5) Описание дальнейших действий (автозаполнение, подсчёт времени, проведённого системой в разных состояниях, оценивание предельных ве роятностей) повторять не будем. При достаточно длинной реализации слу чайного процесса распределение вероятностей по состояниям будет близ ким к приведённому выше стационарному решению системы уравнений Колмогорова. Теперь с помощью изготовленного файла мы можем решить любую аналогичную задачу (о процессе с тремя возможными состояния ми). Достаточно лишь заменить матрицу интенсивностей.

3. Моделирование систем массового обслуживания методом Мон те-Карло. Как известно, в системе массового обслуживания случайный процесс является марковским, если поток заявок и поток обслуживания – простейшие. В простейшем (пуассоновском) потоке время между момен тами поступления (или обслуживания) заявок распределено по показатель ному закону. В других, более сложных случаях могут реализовываться иные законы распределения. Подход, основанный на использовании мат рицы интенсивности L, рассмотренный в пункте 2, применим только для марковского процесса, т. е. для простейших потоков. Можно отказаться от него, перейдя к непосредственному моделированию входящего и выходя щего потоков. Это будет проиллюстрировано на следующих примерах.

Пусть интенсивность входящего потока вызовов на данный телефон ный номер составляет 0,6 вызова в минуту, средняя продолжительность разговора равна 2,5 минуты. Входящий и выходящий потоки – простей шие. Требуется определить относительную и абсолютную пропускную способность данной системы массового обслуживания (одноканальной, с отказами) методом Монте-Карло.

Тот факт, что потоки, фигурирующие в задаче, являются простейши ми, в данном случае для нас не принципиален. Общее правило разыгрыва ния непрерывной случайной величины было определено выше: имея слу чайное число g, равномерно распределённое на интервале от 0 до 1, сле дует определять случайное число x (значение случайной величины X ) как решение уравнения F (x ) = g. Если поток простейший, то время между моментами поступления (обслуживания) заявок распределено по показа тельному закону. Поэтому F (t ) = 1 - e -lt и, следовательно, e - lt = 1 - g - l t = ln(1 - g ) t = - ln(1 - g ).

l Легко понять, что в силу специфики поведения случайного числа g последней формуле можно придать более простой вид:

ln g t=-. (6) l Подготовим таблицу для моделирования системы массового обслужи вания методом Монте-Карло.

Таблица A B C D E F G H l 1 0, m 2 0, Случайное чис прихода заявок Окончание об обслуживания обслуженных Время между служивания приходами Случайное Моменты Счётчик Номер заявки заявок заявок Время число ло В ячейки B1 и B2 введём соответственно интенсивность потока заявок l и интенсивность потока обслуживания m = 1 2,5 = 0,4. В ячейку A5 вве дём 1, в ячейку A6 – формулу =A5+1 и применим автозаполнение вниз до номера 100. В ячейку B5 введём функцию СЛЧИС() и выполним автоза полнение вниз (до ячейки B104 включительно). Работать будем только с одной реализацией 100 случайных чисел. Поэтому, чтобы не было их по стоянного обновления, зафиксируем эти случайные числа. Для этого выде лим диапазон B5:B104, скопируем его в буфер, щёлкнем по ячейке B5, вы берем Правка, Специальная вставка, Вставить…значения, ОК. Сгене рированные случайные числа больше меняться не будут. Время между приходами заявок (между вызовами) будем задавать по формуле (6). Для этого можно в ячейку C5 ввести формулу =(1/$B$1)*(-LN(B5)) и приме нить автозаполнение вниз. Момент прихода 1-й заявки (ячейка D5) совпа дает со временем в ячейке C5. Последующие же моменты прихода заявок вычисляются рекуррентным образом (предыдущий момент плюс новое время между заявками). Следовательно, в ячейку D6 нужно ввести форму лу =D5+C6 и применить автозаполнение вниз.

В ячейку E5 вводим =СЛЧИС(), генерируем случайное число и фик сируем его значение способом, описанным в предыдущем абзаце. Время обслуживания задаём по формуле tобсл = - ln g / m. Для этого нужно в ячей ку F5 ввести формулу =(1/$B$2)*(-LN(E5)). Время окончания обслужива ния есть время поступления заявки плюс время обслуживания. Поэтому в ячейку G5 вводим формулу =D5+F5. В ячейку H5 вводим 1 (первая посту пившая заявка обслужена).

Поскольку в задаче рассматривается одноканальная СМО с отказами, следующая пришедшая заявка будет обслуживаться только в том случае, если к моменту её прихода канал освободится. Поэтому в столбце D мы должны пропустить все ячейки, в которых числа оказались меньше, чем число в ячейке G5. Как только число в столбце D окажется больше, чем в G5, проводим описанную выше процедуру: генерация случайного числа, вычисление времени обслуживания и момента окончания обслуживания, запись 1 в счётчик обслуженных заявок (конечно, с использованием копи рования). Снова отыскиваем заявку, пришедшую следом за окончанием обслуживания, и т. д. Число обслуженных заявок можно подсчитать с по мощью функции СЧЁТЕСЛИ либо с помощью обычного суммирования.

Приводим результаты пробного расчёта. За 135,46 мин поступило заявок (звонков). Обслужена 41 заявка. Таким образом, для данной реали зации относительная пропускная способность системы массового обслу живания составила 41 / 100 = 0,41, а абсолютная пропускная способность равна 41 / 135,46 = 0,3. Первый показатель очень хорошо совпадает с ана литическим решением (0,4), которое в данном случае может быть легко получено [5]. Вычисленная при статистическом моделировании абсолют ная пропускная способность несколько превышает результат аналитиче ского расчёта (0,24), что объясняется более высокой интенсивностью вхо дящего потока в данной реализации (0,74 против 0,6).

Теперь, сохранив прежние интенсивности входящего и выходящего потоков l = 0,6 и m = 0,4, изменим предположение о законе распределе ния времени между моментами поступления (обслуживания) заявок. Вме сто показательного закона используем нормальный закон распределения с математическими ожиданиями a = 1 / l для входящего потока и a = 1 / m для потока обслуживания и среднеквадратическими отклонениями s = a / 3. В этом случае потоки не являются простейшими, система массо вого обслуживания не является марковской.

Разыгрывание нормальной случайной величины производится по сле дующему правилу, основанному на центральной предельной теореме. Для того чтобы приближённо разыграть значение x нормальной случайной ве личины с параметрами a = 0 и s = 1, надо сложить 12 независимых слу чайных чисел g и вычесть 6. Если же требуется, чтобы нормальная слу чайная величина Z имела произвольные характеристики a и s, то её зна чение находится по формуле z = sx + a.

Приводим результаты пробного расчёта. За 171,1 мин поступило заявок (звонков). Обслужено 52 заявки. Таким образом, для данной реали зации относительная пропускная способность системы массового обслу живания составила 52 / 100 = 0,52, а абсолютная пропускная способность равна 52 / 171,1 = 0,3.

Помимо рассмотренного случая немарковской системы массового об служивания, метод Монте-Карло может быть ценным инструментом и для исследования других сложных систем, например для системы с изменяю щимся случайным образом числом каналов.

Библиографический список 1. Браунли К.А. Статистическая теория и методология в науке и технике / К.А. Браун ли. – М. : Наука, 1977. – 408 с.

2. Вентцель Е.С. Исследование операций / Е.С. Вентцель. – М. : Советское радио, 1972. – 660 с.

3. Вентцель Е.С. Исследование операций. Задачи, принципы, методология / Е.С. Вентцель. – М. : Высш. школа, 2001. – 208 с.

4. Вентцель Е.С. Теория случайных процессов и ее инженерные приложения / Е.С. Вентцель, Л.А Овчаров. – М. : Высш. школа, 2007. – 479 с.

5. Гефан Г.Д. Марковские процессы и системы массового обслуживания / Г.Д. Гефан. – Иркутск : ИрГУПС, 2008. – 78 с.

6. Гмурман В.Е. Теория вероятностей и математическая статистика / В.Е. Гмурман. – М. : Высшая школа, 1998. – 479 с.

7. Саати Т.Л. Элементы теории массового обслуживания и ее приложения / Т.Л. Саа ти. – М. : Советское радио, 1971. – 520 с.

8. Соболь И.М. Численные методы Монте-Карло / И.М. Соболь. – М. : Наука, 1973. – 311 с.

9. Толстых О.Д. Цепи Маркова. Системы массового обслуживания / О.Д. Толстых. – Иркутск : Изд-во ИрИИТ, 1999. – 204 с.

10. Чернов В.П. Теория массового обслуживания / В.П. Чернов, В.Б. Ивановский. – М. :

Инфра-М, 1998. – 158 с.

УДК А.В. Данеев, А.С. Миронов К ВОПРОСУ О ТЕОРЕТИКО-МОДЕЛЬНОМ АНАЛИЗЕ ОБРАТНЫХ ЗАДАЧ НЕЛИНЕЙНОЙ ДИНАМИКИ К 70-м годам прошлого века сложилось впечатление, что та часть ка чественной теории обратных задач системного анализа, которую (по сути канонически) принято называть реализацией линейных конечномерных динамических систем управления с непрерывным временем [1], в целом завершена и в дальнейшем стоит ожидать лишь относительно второсте пенных улучшений. Данное впечатление усиливалось заявлениями основа телей теории реализации: Калман [1, с. 268]: «…в § 10.13 мы дадим новое и (надеемся) исчерпывающее изложение теории реализации линейных сис тем с непрерывным временем». Как впоследствии продемонстрировал Ме сарович и Виллемс [2, 3], задача непрерывной реализации, сформулиро ванная в [1, с. 21], – далеко не единственная постановка данной проблемы, и часто не самая естественная. Конструктивность созданного на этом пути набора общих понятий и методов была апробирована для нестационарных систем управления (см. [4] с библиографией), а также систем, описывае мых многомерными гладкими нелинейными дифференциальными уравне ниями [5], когда задача реализации состоит в том, чтобы заменить неявные дифференциальные уравнения высшего порядка на явные дифференциаль ные уравнения суть первого порядка и дополненные специальными алгеб раическими уравнениями, т. е. в виде системы типа «вход – состояние – выход»;

как показано в [6], при выполнении некоторых предположений та кая нелинейная реализация может быть редуцирована к дифференциальной модели реализации с уравнениями в пространстве состояний редуцирован ной системы минимальной размерности [2, с. 165].

Что же касается результатов теории реализации, относящихся к бес конечномерному случаю, то они не затрагивают всех тех вопросов, кото рые нашли [1] свое законченное аналитическое решение в конечномерном варианте, хотя некоторые из них решаются уже на этой степени общности [8, 9]. Здесь необходимо отметить, что один фундаментальный результат общей теории идентификации в банаховом пространстве [10], а именно следствие теоремы 1 [11], по существу указал аналитическую форму (кри терий), в которой следует искать необходимые и достаточные условия в разрешимости задачи дифференциальной реализации для динамического процесса типа «траектория, программное управление, позиционное управ ление». Позднее в подобной аналитической форме были получены нетри виальные обобщения результатов из [12] на системы реализации в гиль бертовом пространстве [13, 14] с опорой на теорему Рисса [15. с. 132] и разложение Фурье [15, c. 129].

В данном проекте на языке сигнальных функций [9, 11] и оператора Релея – Ритца [4, 13, 14] будут исследованы необходимые и достаточные условия аналитической разрешимости дифференциальной реализации сложной бихевиористической динамической системы (D-системы;

опреде ление 1[12]), представленной фиксированным пучком вектор-функций «траектория, программное управление, нелинейное позиционное управле ние» – экзогенное поведение [16] «вход-выход», D-системы типа «черный ящик» с модельной реализацией в классе обыкновенных стационарных и нестационарных дифференциальных уравнений состояния в равномерно выпуклом банаховом пространстве;

при этом не претендуя на полноту и законченность, а только уточняя и развивая главные принципы, поскольку исследования качественной теории обратных задач нелинейной динамики в банаховом пространстве, по-видимому, активно только разворачиваются.

Задача реализации динамической системы в ее наиболее общем виде [1–10] – «это просто абстрактная формулировка научного подхода к по строению моделей» [1, с. 21], поэтому ниже все модели будут рассматри ваться лишь с точки зрения соответствия или несоответствия некоторому фиксированному набору «экспериментальных данных», представленных апостериорным семейством вектор-функций вида «траектория, программ ное управление, нелинейное позиционное управление» – экзогенное пове дение динамической системы (D-системы «вход-выход» – определение [6]);

все остальные возможные свойства этих моделей остаются в стороне (относятся к другим областям исследований).

Пусть (B,||||B) - банахово пространство, r(T,n,B), r[1,) - простран ство всех интегрируемых отображений f: T®B с нормой ||f||B,Lr:= =(T||f(t)||Brn(dt))1/r. Как обычно, Lr(T,n,B) - банахово фактор-пространство классов n-эквивалентности в r(T,n,B), через AC(T,B)1(T,,B) - линейное множество всех абсолютно непрерывных функций (относительно меры ).

Выделим к рассмотрению дифференциальные модели класса:

dx(t)/dt=A(t)x(t) + B(t)u(t) + B#(t)u#(x(t)), (1) где xAC(T,X) - решение Каратеодори (К-решение), uLq(T,,Y) и u#(x)Lq(T,,Z) - программное и нелинейное позиционное управления, (A,B,B#)Lp(T,,L(X,X))Lp(T,,L(Y,X))Lp(T,,L(Z,X));

в целях удобства вектор-функцию (x,u,u#(x)) из (1) тоже будем называть К-решением, а тройку оператор-функций (A,B,B#) – моделью дифференциальной систе мы (1).

Современное состояние теории дифференциальной реализации тако во, что не будет преувеличением сказать: сколько-нибудь исчерпывающее изложение основных ее теоретических разделов в рамках вводной части любой исследовательской программы представляет почти неразрешимую задачу. Однако в целом отметим, что если смотреть на теорию реализации так, как её формулировал Калман [1, с. 21], то данная проблема по сущест ву представляет задачу представления, когда отображение «вход-выход», заданное в виде свертки, требуется промоделировать системой типа «вход состояние-выход» минимального динамического порядка. Исследование же данного проекта формулируется в «бихевиористической» постановке Виллемса [15] и методологически относится к теории обратных задач не линейной динамики непрерывных D-систем в бесконечномерном про странстве состояний, т. е. исходя из произвольного фиксированного (в ча стности, полученного a posteriori) наблюдаемого пучка программно позиционно управляемых траекторий можно попытаться точно смоделиро вать этот пучок дифференциальной (стационарной или нет) системой в ба наховом пространстве состояний. При таком подходе, следуя обычной ло гике «причинно-следственных» связей, «вход» – программное управление, а «выход» – траектория и нелинейное позиционное управление. Данная постановка апостериорного моделирования не исключает методологиче ского положения, когда аналитическое представление a priori закона пози ционного управления в структуре дифференциальных уравнений D системы детерминируется не связью «state feedback», а характеризует су щественную нелинейную компоненту в структуре уравнений динамики моделируемой a posteriori дифференциальной модели исследуемого дина мического (физического) объекта в классе нелинейных управляемых сис тем. Основной поток публикаций по общей теории реализации развивает математическую парадигму как правило линейных моделей – дискретных или непрерывных [1, 15]. Это объясняется не только возможностью вос пользоваться богатым аппаратом линейной математики, но и тем, что по добные модели необходимы для локального изучения уравнений динамики нелинейных объектов. И вряд ли вызывает удивление тот факт, что для не линейных систем теоретико-модельный анализ моделей вне локальной по становки оказывается более ограничительным, даже если речь идет о дос таточных условиях реализации модели;

на что, например, указывалось в [17]. При этом ситуация оказывается ещё более тонкой (сильная и слабая измеримость при нестационарности дифференциальной модели, неограни ченные операторы в её правой части и т. п.), если строить бесконечномер ные нелинейные D-системы с разрывными управлениями из банаховых функциональных пространств. Поэтому проект нацелен, прежде всего, на преодоление методологических препятствий при «бесконечномерном»

подходе к дифференциальной реализации нелинейных непрерывных D систем на бесконечных пучках динамических процессов с банаховыми пространствами состояний и управлений [14].

О теории дифференциальной реализации сложных динамических сис тем (D-систем) нередко говорят, что она резюмирует и систематизирует в символах и формулах данные физических наблюдений или экспериментов, извлекая из апостериорно полученных формул дополнительную информа цию, недоступную прямому наблюдению и эксперименту. Поэтому в про екте будет развит качественный теоретико-системный подход, позволяю щий увидеть задачи дифференциальной реализации D-системы в новом «теоретико-модельном» свете, отделить вопросы существования реализа ции от чисто вычислительных процедур, понять, что было недоделано в стационарной постановке [9, 13] и что еще оставалось сделать в нестацио нарных моделях, в частности, какие требуется внести коррективы в общую теорию MP-продолжимости [13], что позволит по-новому взглянуть на из вестные теоретико-системные положения нелинейной многомерной диф ференциальной реализации и более глубоко и всесторонне в них разо браться. Результаты проекта могут служить указанием на то, в каких прак тических ситуациях возможно, хотя бы в принципе, рассчитывать на кон структивное аналитическое решение в классе квазилинейных структур в сепарабельном банаховом пространстве задачи дифференциального моде лирования уравнений типа «вход-выход» для D-системы с нелинейным программно-позиционным управлением. Конечно, такое общее методоло гическое понятие, как «существование модели дифференциальной реали зации», является в большей степени чисто качественной характеристикой, но, как правило, она несет еще и информацию о том, насколько хорошо обусловлены расчеты прикладного характера [7]. Поэтому отметим, что значение результатов проекта нужно видеть и расценивать именно в свете означенной выше возможности моделирования, которая появляется, по крайней мере, тогда, когда удовлетворены аналитические условия сущест вования математической модели дифференциальной реализации D-системы, представленной фиксированным пучком динамических про цессов.

В общей теории дифференциальной реализации динамических систем авторы проекта планируют решить задачу построения характеристическо го признака (аналитического критерия) реализации нелинейной динамиче ской системы типа «вход-выход» (концепция «черного ящика») в классе дифференциальных моделей с программно-позиционным управлением и уравнениями состояния в сепарабельном банаховом пространстве и к кон цу 2012 г. получить решения задач:

– в конструкциях энтропийного оператора Релея – Ритца построить в аналитической форме принципа максимума энтропии характеризацию произвольного по мощности пучка динамических процессов (упорядочен ных троек вектор-функций типа «траектория, программное управление, позиционное управление»), обладающего свойством реализации в классе бесконечномерных квазилинейных нестационарных дифференциальных уравнений с программно-позиционным управлением;

– в терминах угловой метрики подпространств банахова пространства выявить аналитические условия инвариантности свойства реализуемости бесконечномерной квазилинейной нестационарной дифференциальной мо дели реализации при расширении множества наблюдаемых динамических процессов, характеризующих поведение исследуемой системы как модели «черного ящика»;

– разработать на уровне прямого вычислительного алгоритма задачу динамической реализации (как стационарной, так и нестационарной) мно гомерной квазилинейной дифференциальной системы и методом усечения числа гармоник построить процедуру структурно-параметрической иден тификации для дифференциальной модели колебаний гибкого аксиального элемента спутника-гиростата, а также нестационарного электролитическо го процесса в условиях управляемой пульсации концентрации и гидроди намики электролитической среды гальваностегии, а также кинематики пластин электродов и нестационарного электрического поля пары «анод – катод».

Библиографический список Калман Р., Фалб П., Apбиб M. Очерки по математической теории систем. – М. :

1.

Мир, 1971.

Месарович М., Такахара Я. Общая теория систем: математические основы. – М. :

2.

Мир, 1978.

3. Willems J.С. System Theoretic Models for the Analysis of Physical Systems // Ric. Aut. – 1979. – № 10. – P. 71–106.

Данеев A.В., Русанов В.А., Шарпинский Д.Ю. Нестационарная реализация Калмана – 4.

Месаровича в конструкциях оператора Релея – Ритца // Кибернетика и системный анализ. – 2007. – № 1. – С. 82–90.

5. Van der Schaft A.J. On Realization of Nonlinear Systems Described by Higher-Order Differential Equations // Mathematical Systems Theory. – 1987. – V. 19. – № 3. – P. 239–275.

Коровин С.К., Крищенко А.П., Четвериков В.Н. Нелинейные отображения вход 6.

выход и их минимальные реализации // Доклады РАН. 2010. – Т. 434. – № 5. – С. 604–608.


Русанов В.А., Шарпинский Д.Ю., Козырев В.А. Инструментальный программный 7.

комплекс разработки и моделирования алгоритмов идентификации дифференци альных уравнений динамики больших стержневых систем // Приборы и системы.

Управление, контроль, диагностика. – 2010. – № 9. – С 13–17.

Кривые в гильбертовом пространстве, инвариантные по отношению к однопара 8.

метрической группе движений / А.Н. Колмогоров. Избранные труды: том 1. Мате матика и механика. – М. : Наука, 2005. – 519 с. / С. 296–300.

Данеев A.В., Русанов В.А., Русанов M.В. От реализации Калмана – Месаровича к 9.

линейной модели нормально-гиперболического типа // Кибернетика и системный анализ. – 2005. – № 6. – С 137–157.

10. Ahmed N.U. Optimization and Identification of Systems Governed by Evolution Equa tions on Banach Space. – New York : John Wiley and Sons, 1988.

Данеев A.В., Русанов В.А. К методам качественной теории идентификации сложных 11.

динамических систем // Доклады РАН. – 1997. – Т. 355. – № 2. – С. 174–177.

Данеев A.В., Русанов В.А., Шарпинский Д.Ю. Принцип максимума энтропии в 12.

структурной идентификации динамических систем. Аналитический подход // Из вестия вузов. Математика. – 2005. – № 11. – С 16–24.

Русанов В.А. К качественной теории реализации квазилинейных систем в гильбер 13.

товом пространстве // Доклады РАН. – 2008. – Т. 421. – № 3. – С. 326–328.

14. Русанов В.А. Об алгебре множеств динамических процессов, обладающей диффе ренциальной реализаций в гильбертовом пространстве // Доклады РАН. 2010. – Т. 433. – № 6. – С. 750–752.

15. Иосида К. Функциональный анализ. – М. : Мир, 1967.

16. Polderman J.W., Willems J.C. Introduction to Mathematical Systems Theory: a Behav ioral Approach. Berlin : Springer-Verlag, 1998.

17. Van der Schaft A.J. On Realization of Nonlinear Systems Described by Higher-Order Differential Equations // Mathematical Systems Theory. – 1987. – V. 19. – № 3. – P. 239–275.

УДК А.В. Данеев ИНФОРМАЦИОННАЯ ПАРАДИГМА ЕСТЕСТВОЗНАНИЯ Существует достаточно оснований для суждения о том, что возникно вением информационной парадигмы Естествознания мы обязаны инфор матике. Стремительный рост роли и сфер применимости, а также понима ние значимости и перспективности информатики привели к возникнове нию этой парадигмы. Среди многочисленных теорий информационной па радигмы Естествознания приматом обладает фундаментальная теория ин формации Клода Шеннона [1]. В свою очередь, базовой сущностью этой парадигмы является энтропия Шеннона.

Энтропия Шеннона – количественная мера информации в объектах хранения, преобразования, передачи, использования и переработки ин формации. Здесь важным является то, что энтропия Шеннона – сущность идеального Мира. Для более глубокого понимания этого факта следует об ратиться к широко известной формуле знаний в информационной интер претации.

Предметом исследования Клода Шеннона является чистая информа ция: в его теории в явном виде никак не участвует носитель информации.

Это характерное свойство перешло и в информационную парадигму Есте ствознания. Поэтому информационная парадигма Естествознания – сущ ность идеального Мира.

Известно, что революционные изменения в современном научном Миропонимании начинаются со смены исследовательской парадигмы. В свою очередь, смена исследовательской парадигмы начинается с замены первичных сущностей предшествующей парадигмы на новые первичные сущности. Все необходимые материалы для подобной замены содержатся в семитомной серии А.Н. Панченкова «Энтропия» [2–8]. Напомним, что в физической парадигме первичной сущностью является энергия. В инфор мационной парадигме – информация. Но энергия и информация не вполне пригодны на роль базовых структур современного научного Миропонима ния. В настоящее время они потеряли свою фундаментальную значимость:

в новой парадигме, носителем которой является аналитическое Естество знание А.Н. Панченкова, на переднюю позицию вышла и приняла вид пер вичной сущности энтропия. В 1999 году в книге «Энтропия» А.Н. Панчен ков, в противоположность классической многоликой энтропии с отрица тельной семантикой, ввел новую энтропию, имеющую смысл положитель ного количества. Настоящая статья написана по материалам этих книг.

Энтропия, обладающая приматом, являющаяся базовым, ключевым, универсальным и наиболее общим понятием точного Естествознания, в своем развитии прошла четыре этапа:

• первый этап – этап термодинамической энтропии;

• второй этап – этап информационной энтропии;

• третий этап – этап динамической энтропии;

• четвертый этап – этап общей энтропии.

В начале первого этапа ввод понятия «энтропия» в физику (точнее, термодинамику) независимо осуществили два выдающихся естествоиспы тателя: Р. Клазиус и Л. Больцман [9, 10]. Причем Л. Больцман термодина мическую энтропию связывал с вероятностью замкнутой системы в том или ином состоянии S = k ln W, (1) где W – термодинамическая вероятность состояния, k – постоянная Больц мана. Термодинамическую энтропию можно рассматривать как меру каче ства энергии. Здесь необходимо сделать акцент на том, что одна из форм энтропии Больцмана в силу присущей ей общности сохранила актуаль ность в математической технике новой энтропии.

Отсчет времени второго этапа начинается с момента создания Кло дом Шенноном теории информации (1948 г.) и введения им в информаци онную парадигму Естествознания понятия «информационной энтропии»

(энтропии Шеннона) [10].

Следует отметить, что существующее на двух первых этапах толкова ние «энтропии» как меры хаоса (неопределенности, беспорядка) привело к моменту возникновения третьего этапа к большому числу сложностей в формировании энтропийной проекции точного Миропонимания. Третий этап связывается с именем И. Пригожина. Здесь энтропия рассматривается как мера упорядоченности. При упорядочении структуры объекта проис ходит снижение энтропии.

Наличие неясностей, противоречий и парадоксов привело естествоис пытателей к выводу о необходимости более глубокого изучения основных понятий теории энтропии, особенно в связи с многочисленными пробле мами динамики, управления и самоорганизации сложных объектов.

И здесь ключевую роль играет новая концептуальная модель А.Н. Панчен кова (четвертый этап) [11, 12].

На всех трех предыдущих этапах гносеологии энтропии при всей раз мытости семантики этого понятия ее стержневой смысл оставался неиз менным:

«Энтропия – мера Хаоса».

Достаточно подробно вопрос определения энтропии обсуждается в книге «Энтропия» [2]. Характерным звеном этого определения является субстанция «логарифмическая мера». В определенном смысле «логариф мическая мера» является ключом к пониманию Мироздания.

Остановимся подробнее на втором этапе. Энтропия (обладая прима том) тесно связана с информацией;

поэтому теория информации нашла свое применение в концептуальной модели А.Н. Панченкова, в которой речь не идёт о конкуренции – речь идёт о согласовании и совместном ана лизе новой теории энтропии и теории информации К. Шеннона. Этот со вместный анализ содержится в книге «Энтропия». Но здесь существует более общий вопрос: ряд исследователей полагают, что парадигмой есте ствознания XXI века будет информационная парадигма. В этом случае речь уже идет о сопоставлении и конкуренции двух парадигм:

– энтропийной парадигмы;

– информационной парадигмы.

В книге «Энтропия» содержатся убедительные аргументы в пользу энтропийной парадигмы и отрицания информационной парадигмы. Доста точно обратиться к известной формуле знание = чистое знание + носитель знания.

Предметом теории информации является чистое знание;

тогда как энтро пия, как раздел науки, изучает, в основном, носители знаний (не оставляя в стороне и чистое знание).

Задачу согласования и взаимодействия энтропийной и информацион ной парадигм Естествознания решает информационная интерпретация об щей энтропии [8]. Для анализа информационной интерпретации определим Hf общей формулой Hf = ln V для любого V 0.

Здесь V – объем структуры в хаотической сплошной среде (фазовый объем). Если интерпретировать фазовый объем как память структуры хао тической сплошной среды, то придем к очевидной информационной ин терпретации энтропии как количественной меры информации, содержа щейся в памяти структуры. Следуя далее, имеем известные формулы:

V =Vq ·Vp Hq = ln Vq ;

Hp =ln Vp.

А.Н. Панченков в [8] констатирует, что можно считать Hq мерой ста тической информации, а Hp – мерой динамической информации. В этом случае закон сохранения энтропии будет иметь семантическое содержание:

Все процессы Вселенной и окружающей Действительности происходят при постоянной сумме динамической и статической информации.

Но статическая информация в науке хорошо известна – это информа ционная энтропия теории информации. Таким образом, в современной науке эквивалентом структурной энтропии является информационная эн тропия теории информации. Заметим, что этот эквивалент не носит общий характер: он справедлив только в рамках интерпретации. Но в классиче ской теории в общем случае не выполняется закон сохранения энтропии.

Имеется только частный случай – Закон сохранения информационной эн тропии (энтропии Шеннона).

Если определить термодинамическую энтропию формулой Больцмана HT = –p f (u, t) ln f (u, t) du и отождествить вектор скорости с импульсом (p = u), то мы придем к тож дественности термодинамической энтропии с энтропией импульса в тер модинамической интерпретации. Учитывая это, для термодинамической энтропии получим Hp = HT.

Это равенство определяет фундаментальный факт [8]:

Утверждение 1. В термодинамической интерпретации термодина мическая энтропия является компонентой общей энтропии.

Таким образом, теория термодинамической энтропии является частью общей теории энтропии. Теперь, объединяя термодинамическую и инфор мационную интерпретации, получим:


Hq – информационная энтропия, Hp – энтропия Больцмана.

Таким образом, мы приходим к утверждению [8]:

Утверждение 2. В хаотической сплошной среде с положительным фазовым объемом общая энтропия равна сумме информационной энтро пии и энтропии Больцмана.

Объектами, либо атрибутами, статистической физики и теории ин формации являются различные компоненты общей энтропии, тогда как главным атрибутом и одним из объектов теории является общая энтропия, имеющая двойственную структуру.

В дискурсе точного Миропонимания первоосновой – базовой суб станцией физической парадигмы Естествознания является информацион ная энтропия. Если для случайной величины х существует дискретная функция распределения вероятностей p(xi) со значениями p1,..., pn, то шен ноновское представление информационной энтропии имеет вид [8]:

Hf = –K(p|ln p)Rn ;

p Rn. (2) Это количество и участвует в концепции, методологии, символьном выводе классической теории информации.

В точном Миропонимании онтологический статус фундаментальной симметрии хорошо известен: он является следствием принципа оптималь ности той или иной парадигмы Естествознания. Это ключевое свойство и определяет рецепт актуализации закона сохранения информации. Для от крытия основного закона информационной парадигмы Естествознания не обходимы:

· принцип оптимальности;

· экстремальная задача теории информации.

В теории информации и ее многочисленных приложениях получили весьма широкое распространение и практическое применение различные принципы максимума информационной энтропии: как правило, имеющие смысл задачи математического программирования. В [8] сконструирован следующий принцип оптимальности:

Принцип максимума информационной энтропии: Функционирова ние информационной сплошной среды удовлетворяет принципу оптималь ности – максимума информационной энтропии.

У этого принципа оптимальности существует характеризация:

· информационная сплошная среда – виртуальная среда;

· информационная сплошная среда – непараметризованная сплошная среда.

Исходной и характерной экстремальной задачей теории информации является задача максимума энтропии Шеннона [1] Hf * = max Hf;

u Rn u Hf = –K(u|ln u)Rn ;

(E|u)Rn = 1. (3) Ее решение хорошо известно и имеет вид: u = E /(nK).

Для проблемы принципов оптимальности важную роль играет интер претация вектора управнения u. Вектор «u» имеет смысл дискретной функции распределения вероятностей случайной величины {х}.

Известные и многочисленные варианты реализации идеи принципов максимума информации относятся к различным обобщениям характерной экстремальной задачи теории информации. В большей части эти обобще ния идут двумя путями:

· конструирование функционала;

· включение в экстремальную задачу дополнительных ограничений.

В пределах применимости принципа Лагранжа, на его основе конст руируется вспомогательный функционал. Для вспомогательного функцио нала экстремальная задача имеет вид [8]:

Hf * = max Hf;

u Rn u n (E|u)R = 1. (4) В принципах максимума информационной энтропии ключевую роль играет структура вспомогательного функционала. При достаточно общих предложениях эта структура имеет вид:

Hf = Hf + (u|F)Rn. (5) Изюминка принципов максимума энтропии состоит в том, что вспо могательный функционал их стандартной задачи содержит характеристи ческий член – энтропию Шеннона.

Симметрия информационной парадигмы имеет онтологический статус решения экстремальной задачи теории информации (4). Ее символьная формулировка имеет вид:

Hf = const: Hf = Hf + (u|F)Rn ;

Hf = –K(u|ln u)Rn.

Главный результат в [8] сформулирован следующим образом:

Закон сохранения информации: В информационной сплошной среде, удовлетворяющей принципу максимума информационной энтропии, суще ствует фундаментальная симметрия – энтропия Hf сохраняет постоян ное значение.

В частном случае характерной экстремальной задачи из закона сохране ния информации следует известный факт – постоянство энтропии Шеннона.

В дискурсе точного Миропонимания следует отметить, что информаци онная парадигма Естествознания далека от совершенства. Но при всей раз мытости, нестрогости, семантической неоднозначности в ней существует ключевое звено, лежащее в основе ее выдающей значимости во Вселенной.

Это звено – логарифм. Появление логарифма и исполнение им роли харак терной математической структуры не носит формальный характер: Во всем этом наличествует глубинный смысл. Смысл, лежащий в истоках и первоос нове Мироздания, но, к сожалению, еще до конца не понятый и осмыслен ный. Здесь существует и положительная часть: в текущий момент установлен и известен факт ключевой роли логарифма в точном Миропонимании.

Попытка поиска в классической и современной теории информации удовлетворительного, строгого и верного определения информации прак тически лишена надежд на успех. В естественно-научной и философской литературе содержится ворох версий определения информации. Семанти ческое поле информации весьма неоднородно и размыто. По крупному счету в текущий момент дефиниция информации отсутствует. В этой си туации лучший вариант – обратиться к определению Н. Винера: «Инфор мация – это информация». В естественно-научном дискурсе это определе ние вполне удовлетворительное.

В некотором смысле противоположная ситуация сложилась с терми ном «информационная энтропия». Здесь существует ряд точных, ясных и строгих определений. В [8] сформулировано следующее определение:

«Информационная энтропия – это логарифмическая мера количества ин формации».

Необходимо отметить, что по большому счету информация не имеет семантической нагрузки. Характерной чертой теории информации являет ся то, что все объекты ее частных теорий расположены в непараметризо ванной сплошной среде. Следствие этого факта хорошо известно: инфор мационная энтропия имеет смысл меры статической информации.

Таким образом, три основных понятия (энтропия, время, информация) современного естествознания находятся в тесной связи, причем в энтро пийной концепции эта связь наиболее очевидна и четко просматривается.

В информационной интерпретации все процессы во Вселенной и окру жающей нас Действительности происходят при постоянной сумме дина мической и статической информации.

Библиографический список 1. Шеннон К. Работы по теории информации и кибернетике. – М. : Изд-во иностр.

лит., 1963. – 827 с.

2. Панченков А.Н. Энтропия. – Нижний Новгород : Интелсервис, 1999. – 592 с.

3. Панченков А.Н. Энтропия-2: Хаотическая механика. – Нижний Новгород : Интел сервис, 2002. – 713 с.

4. Панченков А.Н. Инерция. – Йошкар-Ола : МПИК, 2004. – 416 с.

5. Панченков А.Н. Энтропийная механика. – Йошкар-Ола : МПИК, 2005. – 576 с.

6. Панченков А.Н. Эконофизика. – Нижний Новгород : Типография Поволжья, 2007. – 528 с.

7. Панченков А.Н. Аналитическое Естествознание. – Саранск : Красный Октябрь, 2008. – 640 с.

8. Панченков А.Н. Виртуальная Сингулярность. – Нижний Новгород : Типография Поволжья, 2011. – 368 с.

9. Больцман Л. Избранные труды. – М. : Наука, 1984.

10. Шамбадаль П. Развитие и приложение понятия энтропии. – М. : Наука, 1967. – 278 с.

11. Данеев А.В. Энтропия А.Н. Панченкова // Панченков А.Н.: физик, математик, ин женер. – Иркутск : Изд-во ИрГТУ, 2005. – C. 103–128.

12. Данеев А.В., Русанов В.А., Куменко А.Е. Энтропиология сильных дифференциальных моделей и их Фурье-анализ // Панченков А.Н.: физик, математик, инженер. – Иркутск :

Изд-во ИрГТУ, 2005. – C. 167–189.

УДК А.А. Дриженко, С.С. Унистюк ИССЛЕДОВАНИЕ ТОЧНОСТИ РАЗЛОЖЕНИЯ ФУНКЦИИ В ЦЕПНУЮ ДРОБЬ МЕТОДОМ ИМИТАЦИОННОГО МОДЕЛИРОВАНИЯ Имитационное моделирование есть процесс конструирования модели реальной системы и постановки экспериментов на этой модели с целью либо понять поведение системы, либо оценить (в рамках ограничений, наклады ваемых некоторым критерием или совокупностью критериев) различные стратегии, обеспечивающие функционирование данной системы [4].

Имитационное моделирование является поэтому экспериментальной и прикладной методологией, имеющей целью:

· описать поведение систем;

· построить теории и гипотезы, которые могут объяснить наблюдае мое поведение;

· использовать эти теории для предсказания будущего поведения сис темы, т. е. тех воздействий, которые могут быть вызваны изменения ми в системе или изменениями способов ее функционирования.

В отличие от большинства технических методов, которые могут быть классифицированы в соответствии с научными дисциплинами, в которые они уходят своими корнями (например, с физикой или химией), имитаци онное моделирование применимо в любой отрасли науки. Сфера примене ний моделирования обширна. Так, например, написаны книги по примене нию имитационного моделирования в коммерческой деятельности, эконо мике, маркетинге, в системе образования, политике, обществоведении, науке о поведении, международных отношениях, на транспорте, в кадро вой политике, в области соблюдения законности, в исследовании проблем городов и глобальных систем, а также во многих других областях.

Наиболее популярной программой для проведения имитационного моделирования является математический пакет Matlab и его приложение Simulink. При моделировании с использованием Simulink реализуется принцип визуального программирования, в соответствии с которым поль зователь на экране из библиотеки стандартных блоков создает модель уст ройства и осуществляет расчеты. Воспользуемся возможностями данного пакета для проверки правильности разложения дробно-рациональной функции в цепную дробь первого порядка.

Передаточная функция используется в управлении анодным эф фектом в процессе производства алюминия. Произведем декомпозицию данной функции в цепную дробь по следующей формуле [1, 2]:

Qm =, Rn A1 + n- m A2' +...

Q + 'm ' Am Qm - где A j – частное от j-го деления полинома степени i;

i Q ij – остаток от j-го деления полинома степени i.

Структурная схема цепной дроби W16 изображена на рис. 1.

Рис. 1. Структурная схема цепной дроби W Структурная схема содержит неминимально-фазовое неустойчивое звено (рис. 2):

Рис. 2. Неминимально-фазовое звено Это звено можно представить в ином виде [1] (рис. 3):

Рис. 3. Структурная схема, реализующая неминимально-фазовое звено Исследуем качество проведенного разложения. Для передаточной функ ции W16 и её реализаций в виде цепной дроби в программе Matlab создадим имитационные модели [3]. Модель для W16 изображена на рис. 4. Она со стоит из следующих блоков: Ttansfer Fcn (W16 до разложения), группы блоков Ttansfer Fcn1, Ttansfer Fcn2, Ttansfer Fcn3, Gain (Группа, реали зующая цепную дробь), блок Step (Источник сигнала) и блок Scope (Ос циллограф). Блоки цепной дроби охвачены отрицательной обратной свя зью, кроме блока Ttansfer Fcn3. Он охвачен положительной обратной свя зью посредством блока Gain. Эти два блока реализуют консервативное звено. Блок Step подает ступенчатый сигнал одновременно на W16 и цеп ную дробь, на осциллографе Scope мы видим результат прохождения сиг нала. Он показан на рис. 5. Как видно из графика, кривые полностью сов пали, значит, разложение передаточной функции W16 в цепную дробь вы полнено верно. Для наглядности на рис. 6 представлены увеличенные фрагменты графиков моделирования функции W16. Графики показывают, что разложение функции в цепную дробь выполнено верно. Разность ис ходной и преобразованной функции в среднем составляет 10-10, это гово рит о высокой точности разложения.

Рис. 4. Структурная схема имитационного моделирования функции W Рис. 5. График, отображающий результаты имитационного моделирования функции W Рис. 6. График, отображающий результаты имитационного моделирования функции W16 с увеличенным фрагментом Итак, в статье рассмотрены теоретические аспекты имитационного моделирования. Проведена декомпозиция передаточной функции W16 в цепную дробь первого порядка, что сделало разомкнутые контуры замкну тыми, то есть охваченными обратной связью. Неминимально-фазовые не устойчивые звенья реализованы в виде блоков с положительными коэффи циентами. В математическом пакете Matlab проведено имитационное мо делирование дробно-рациональной функции и её реализации в виде цеп ной дроби первого порядка. Моделирование показало высокую точность разложения.

Библиографический список 1. Алпатов Ю.Н. Синтез систем управления методом структурных графов. – Иркутск :

Изд-во Иркут. ун-та, 1988. – 184 с.

2. Хинчин Д.Я. Цепные дроби. – М. : Наука, 1978. – 112 с.

3. Ануфриев И.Е., Смирнов А.Б., Смирнова Е.Н. MATLAB 7. – СПб. : БХВ-Петербург, 2005. – 1104 с. : ил.

4. Шеннон Р. Имитационное моделирование систем – искусство и наука : перевод с английского / под редакцией Е.К Масловского. – М. : Мир, 1978.

УДК А.В. Мальцев ПОНЯТИЕ ИСКУССТВЕННОЙ ЖИЗНИ Понятие искусственной жизни неразрывно связано с понятием искус ственного интеллекта. Искусственный интеллект – это научное направле ние, в рамках которого ставятся и решаются задачи аппаратного или про граммного моделирования тех видов человеческой деятельности, которые традиционно считаются интеллектуальными. Сегодня за счет достижений в области искусственного интеллекта создано большое количество науч ных разработок, которое существенно упрощает жизнь людей. Распознава ние речи или отсканированного текста, решение вычислительно сложных задач за короткое время и многое другое – все это стало доступно благода ря развитию искусственного интеллекта [1].

В свою очередь искусственная жизнь – это изучение жизни, живых систем и их эволюции при помощи созданных человеком моделей и уст ройств. Данная область науки изучает механизм процессов, присущих всем живым системам, невзирая на их природу, и является подразделом науки «Искусственный интеллект».

Искусственная жизнь имеет дело с эволюцией живых объектов (по другому можно сказать «агентов») или популяций организмов, существую щих лишь в виде компьютерных моделей, в искусственных условиях. Моде ли организмов также позволяют проводить ранее невозможные эксперимен ты (такие как сравнение эволюции Ламарка и естественного отбора) [2].

Искусственная жизнь может быть описана как теория и практика моде лирования биологических систем. Разработчики, которые ведут исследования в данной сфере, надеются, что путём моделирования биологических систем мы сможем лучше понять, почему и как они работают. С помощью моделей разработчики могут управлять созданной средой, проверять различные гипо тезы, наблюдать, как системы и среда реагируют на изменения [3].

Моделирование системы Я смоделировал простую пищевую цепочку, состоящую из травы, травоядных животных, например кроликов, и хищников, например волков, и определил ряд правил, как должна проходить искусственная жизнь. Тра ва растёт сама по себе в различных местах. Эту траву поедают кролики, чтобы не умереть с голоду. А кроликов поедают волки по той же причине.

Кролики и волки умеют не только есть, но и размножаться для того, чтобы увеличивать свою популяцию. Если вдруг происходит такая ситуация, что кроликов всех съели, то тогда нарушится пищевой баланс и волки все вымрут от голода. Если вдруг кролики смогли убежать от волков, то волки могут умереть с голоду, и тогда останутся только кролики, у которых бу дет всего лишь 2 заботы: поедать траву и размножаться, тем самым увели чивая свою популяцию без предела.

Чтобы смоделировать простую пищевую цепочку, я определил неко торые параметры: окружающую среду, самих агентов (а также их воспри ятие и поведение в среде) и группу правил, которые определяют, как и ко гда происходит взаимодействие.

Для того чтобы агент смог размножаться, ему нужно съесть некоторое количество пищи. Таким образом, в среде создается новый агент опреде ленного типа. Происходит эволюция, при которой мутирует мозг агента.

Важно отметить, что агенты изначально не знают, как нужно выжи вать в среде. Они не знают, что поедание пищи позволит им прожить дольше. Также они не знают, что должны избегать тех, кто их ест. Агенты должны освоить все эти знания посредством эволюции.

Окружающая среда Агенты живут в мире, построенном по принципу сетки, причем если агент перемещается за грань в определенном направлении, он появляется на другой стороне. Растения занимают уникальные ячейки в среде, однако несколько агентов могут занимать одну и ту же ячейку (травоядное живот ное и/или хищник). Зелёные ячейки – это трава, серые – это кролики, чёр ные – это волки, а в белых ячейках не имеется никакого агента.

Агенты Агент является генетической особью. Он может быть только опреде ленного типа (травоядным или хищником), но метод изучения окружаю щей среды и образ действий для всех агентов одинаковы. Агента можно рассматривать как простую систему с набором входов (его ощущением мира), реакций на окружающий мир (его мозгом) и действий.

Сенсоры Агенты могут чувствовать, что происходит вокруг них в среде. Одна ко агент не видит всю среду, он реагирует только на группу ячеек вокруг него. Локальная среда, которую может чувствовать агент, разделена на че тыре отдельные области. Самая ближняя к агенту область называется об ластью близости, и это та область, в которой агент может действовать (например, съесть другой объект). Область впереди агента (5 ячеек) имену ется фронт, а две ячейки слева и справа – слева и справа.

Агент может выполнять ограниченное число действий в среде: перей ти на одну ячейку (в заданном направлении), повернуться налево или на право или съесть объект, который находится в области «близости». Дейст вие, которое производит агент, определяется его мозгом при оценке вхо дов, полученных на уровне сенсоров.

У каждого агента своё поведение, своя реакция на те или иные собы тия, которые происходят вокруг него в окружающей среде. За это всё отве чает мозг агента, а если точнее, нейронная сеть агента. На вход поступает окружающая среда, разделённая на четыре области (близость, фронт, сле ва, справа), а на выходе идёт действие, которое выполняет агент исходя из своего поведения, своей нейронной сети. Например, у одного кролика при появлении волка на фронте возникает действие повернуть направо, чтобы убежать, а у другого – повернуть налево, а третий вовсе не будет реагиро вать на волка и станет есть траву.

Воспроизведение Если агент поглощает достаточное количество пищи, то он допускает ся к участию в воспроизведении. Воспроизведение позволяет агентам, ко торые смогли выжить в окружающей среде, создать потомство (естествен ный отбор). Обучение в среде недоступно, однако то, что агент может вос производить себя, означает, что его нейронная сеть будет передана его ре бенку. Это повторяет принцип эволюции Ламарка, поскольку характери стики агента передаются его потомству (ребенок наследует нейронную сеть своего родителя).

Стратегии Во время симуляции происходит своеобразное соревнование. Хищни ки постепенно разрабатывают нейронные сети, которые подходят для об наружения и поедания травоядных животных. В то же время травоядные совершенствуют нейронные сети, которые помогают находить растения в среде и избегать хищников. Хотя эти стратегии видны при изучении симу ляции, анализ изменений в нейронных сетях позволяет сделать интересные выводы. Интересная стратегия для травоядных – это инстинкт стада. Кро лики будут следовать друг за другом. Сила травоядных в их количестве, в том, как они могут группироваться на определённой местности для выжи вания. Но и у волков образуется интересная стратегия: они находят расте ние и подстерегают возле него кролика. Вот такие интересные стратегии возникают при проведении симуляции искусственной жизни.



Pages:     | 1 | 2 || 4 | 5 |
 





 
© 2013 www.libed.ru - «Бесплатная библиотека научно-практических конференций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.