авторефераты диссертаций БЕСПЛАТНАЯ БИБЛИОТЕКА РОССИИ

КОНФЕРЕНЦИИ, КНИГИ, ПОСОБИЯ, НАУЧНЫЕ ИЗДАНИЯ

<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ


Pages:     | 1 || 3 |

«Министерство образования и науки Российской Федерации Уральский федеральный университет имени первого Президента России Б. Н. Ельцина В.М. Кормышев, В.Б. ...»

-- [ Страница 2 ] --

К классу «управление» (УПР) отнесли задачи, содержащие алгоритмы управления – совокупность правил приложения управляющих воздействий к исполнительным элементам объекта управления, обеспечивающих его функционирование с целью решения поставленной перед объектом задачи.

При этом имели в виду, что при управлении используется информация о положении установок и ограничений, заданных оператором управляющему устройству (априорная информация), и сигналов датчиков, вводимых обратными связями (текущая информация). Решаемые при управлении задачи: управление состоянием и сменой состояний, программное управление, стабилизация по отклонению от неконтролируемых возмущений и т.д., в информационном плане требуют знания точной траектории объекта.

Это предъявляет, по сравнению с классом ИДН, повышенные требования к ЭЗЗ, используемых при управлении сложными объектами и процессами. Так, например, необходимо дополнительно указывать, является ли зависимость траектории объекта, описываемая информационными гранулами, выпуклой (вогнутой) или монотонной (рис. 6).

f2 f I f I ЭЗЗ I ЭЗЗ I ЭЗЗ х х х x Рис. 6. К определению классов ИДН и УПР ЭЗЗ1, ЭЗЗ2, ЭЗЗ3 – информационные гранулы;

f1, f2, f3 – аппроксимирующие функции;

(x1;

I1), (x2;

I2), (x3;

I3) – координаты центров информационных гранул Характер аппроксимирующей функции можно установить, если воспользоваться соотношением:

x2 x I 2 I1 + ( I 3 I1 ), (2.11) x3 x где (x1;

I1), (x2;

I2), (x3;

I3) – координаты центров информационных гранул.

Отсюда следует, что для реализации управления объектом с помощью ЭЗЗ необходимо различать на информационном поле как минимум три информационные гранулы.

Аналогичные результаты имеют место при рассмотрении моделей прогнозирования. Осуществлять прогноз возможно также при различимости не менее трех состояний объекта во времени. Поэтому управление и прогноз технологических ситуаций объединены в один общий информационный класс «управление» (УПР).

Задачи, относящиеся к классу «оптимизация» (ОПТ) требуют, по сравнению с классами ИДН и УПР, большего объема исходной информации для своего решения. Например, для алгоритма нахождения оптимального значения ЭЗЗ в заданном множестве, предложили вариант метода отсечений:

– задаются начальные границы x1, х4 целевой функции Imax и интервал неопределенности 1 = x4 – x1 (рис. 7);

– производятся измерения I в двух дополнительных промежуточных точках x2 и x3 и из них выбирается та, значение I в которой оказалось меньше (для поиска max(I));

– сокращается интервал неопределенности до 2 = х4 – х2, путем совмещения одной границы с границей предыдущего интервала 1, а другой – с выбранной точкой в предыдущем пункте, т.е. х2. Значение оставшейся точки х3 лежит внутри нового интервала неопределенности 2.

Выполняется следующий шаг решения задачи оптимизации путем сужения интервалов неопределенности i.

I Iопт ЭЗЗ ЭЗЗ ЭЗЗ ЭЗЗ x x1 x2 xопт x3 x Рис. 7. Сокращение интервала неопределенности для информационного класса ОПТ Алгоритм выполняется до тех пор, пока точка стационарности Iопт(xопт) целевой функции, являющаяся оптимальной точкой не находится с заданной погрешностью.

Из вышеизложенного следует, что для решения задачи оптимизации (информационный класс ОПТ) необходимо различать координаты не менее четырех информационных гранул ЭЗЗ.

Учет риска при оптимизации сложных процессов на основе ЭЗЗ предложили осуществлять следующим образом. Задаются критерии эффективности КЭi процесса, рассчитываемые на основе ЭЗЗ. Затем строятся поверхности (кривые в двухмерном варианте) безразличия, для которых эффективность процесса (Э) в зависимости от выбранного сочетания КЭi равноценна (рис. 8).

Принимается, что риск представляет величину нереализованного эффекта от улучшения одного из критериев (КЭ1r) при постоянстве другого.

В предельном случае, риск при оптимизации сложного процесса определяется по двум кривым безразличия, построенным по трем точкам каждая на основе ЭЗЗ с различными информационными классами (рис 8).

Поэтому для реализации процедуры учета риска необходимо для таких ЭЗЗ различать не менее шести градаций по шкале, оценивающей их качество путем нечеткого измерения. ЭЗЗ, обладающие данными характеристиками отнесли к информационному классу «оптимизация с риском» (ОПР).

Таким образом, предложенные информационные классы, оценивающие уровень качества ЭЗЗ, связали с необходимым и достаточным числом градаций различимости информационных гранул, находящихся в составе диагностируемых ЭЗЗ, следующим образом:

ИДН – 2 градации;

УПР – 3 градации;

ОПТ – 4 градации;

ОПР – градаций.

КЭ Э ЭЗЗ ЭЗЗ ЭЗЗ ЭЗЗ31 ЭЗЗ КЭ2r ЭЗЗ Э КЭ КЭ1r Рис 8. Определение величины риска при оптимизации сложных процессов 2.2.3. Распознавание Задача распознавания качества ЭЗЗ представляла собой заключительный этап предложенного процесса диагностики ЭЗЗ (рис. 5). Ее решение заключалось в получении необходимой информации о принадлежности ЭЗЗ к классам, определяющим их уровень качества, т.е.

реализации отображения Количество классов качества ЭЗЗ (2.10).

рассматривалось как число возможных решений эксперта при управлении сложным процессом или объектом и определялось при решении задачи классификации.

При решении данной задачи воспользовались положениями теории распознавания образов, и на основании рекомендаций работ составили таблицу соответствия параметров ЭЗЗ терминам системы распознавания (табл. 4).

Таблица Словарь аналогичных терминов Термины системы распознавания Параметры решаемой задачи Объект распознавания ЭЗЗ Класс (кластер, таксон, образ) Уровень качества ЭЗЗ Алфавит классов Множество уровней качества ЭЗЗ Признак Вектор компетентности Словарь признаков Множество характеристик вектора компетентности Обучающая выборка Набор информационных гранул Решающее правило (Решающие Функции принадлежности к заданным границы, разделяющая функция, классам качества ЭЗЗ разделяющая поверхность) Далее, используя установленное соответствие в терминологии, решение задачи распознавания качества ЭЗЗ представили следующим образом:

1. Для заданного множества объектов (информационных гранул) ЭЗЗ = {ЭЗЗ1, ЭЗЗ2, …, ЭЗЗZ} и множества разбиения объектов на классы А = {А1, А2, …, Аr} выбрали вариант А, = 1,2,…,r разбиений множества ЭЗЗ на N классов:

A : ЭЗЗqA ЭЗЗ gA = ;

(2.12) N ЭЗЗ = ЭЗЗ, A i i = где ЭЗЗ – экспертные знания и заключения;

q, g = 1, …, N;

qg;

O – пустое множество.

2. На основе исходной информации составили априорный словарь признаков, описываемый вектором компетентности VC= {VC1,…, VCN} (см. раздел 2.5) 3. Рассмотрели первый вариант разбиения объектов на классы ( = 1), А = А1, при котором число классов равно N = N1 = k+1.

4. Задали обучающую выборку с подразделением ее на множества – классы: ЭЗЗ1A1, ЭЗЗ2A1, …, ЭЗЗN1A1.

5. Произвели описание классов с заданием функции принадлежности объекта соответствующему классу ФП(ЭЗЗiAi) в виде (х-р) модели.

6. Ввели критерий эффективности распознавания в виде функции:

R 2 (ЭЗЗ p, ЭЗЗq ) F=, (2.13) S (ЭЗЗ p ) S (ЭЗЗq ) который характеризует отношение расстояний между классами качества ЭЗЗ (E) к разбросу объектов внутри класса. Смысл критерия в данном случае заключался в том, что чем компактнее в признаковом пространстве располагались объекты каждого класса и чем больше при этом расстояние между классами, тем легче и точнее происходило распознавание качества ЭЗЗ.

В свою очередь произвели расчет величин R и S, которые, по существу, представляют собой среднеквадратические отклонения объектов внутри класса [S(ЭЗЗp)] и между классами [R(ЭЗЗP, ЭЗЗQ)].

Таким образом, задача распознавания заключалась в построении такого признакового пространства, т.е. определении такого рабочего словаря признаков вектора компетентности, который обеспечивал наибольшую эффективность распознавания ЭЗЗ при заданных ограничениях на ресурсы.

2.3. Модель эксперта как измерительной системы Как было определено выше, ЭЗЗ формируются экспертами – квалифицированными специалистами – производственниками, а также научными работниками, выполнившими теоретические или экспериментальные исследования сложного процесса, и представляются в виде информационных гранул. Эксперт является носителем информации и качество ЭЗЗ целиком зависит от его компетентности. Поэтому погрешность метода нечетких измерений качества ЭЗЗ определили, представив эксперта в качестве своеобразной измерительной системы (рис. 9).

CK C K E + + Y …….. …….. ……..

CKn CK1 CK 2 CKn …...

Рис. 9. Функциональная схема матема тиче ской моде ли эксперта, как измерительной с истемы В общем случае система состояла из функциональных звеньев с передаточными коэффициентами СК1, СК2, …, СКi, …, CKn, отражающими основные факторы, влияющие на степень компетентности (СК) эксперта и, в конечном итоге, определяющих погрешность качества ЭЗЗ. Например, к таким факторам обычно относят:

– Теоретические знания эксперта;

– Практический опыт;

– Особенности памяти;

– Логические способности;

– «Инженерное чутье», интуицию … – n. … и т.п.

Число звеньев определялось степенью приближения математической модели реальному эксперту в конкретно рассматриваемом случае, а характер их соединения соответствовал известным правилам работы экспертных систем, использующих методы обработки нечеткой информации и возможность компьютерной формализации мышления с помощью образов и понятий. Данный процесс выделения основных характеристик, влияющих на качество ЭЗЗ, рассматривался как операция факторизации множества входных сигналов Y, т.е. осуществлял отображение (2.7) процесса диагностики ЭЗЗ.

Таким образом, рассматриваемая измерительная система применялась на этапе классификации по уровню качества диагностируемых ЭЗЗ, т.е.

связывала выходной вектор Е, представляющий множество классов ЭЗЗ, с входным вектором Y, представляющим множество текущих состояний ЭЗЗ.

Формально эта связь описывалась вектором компетентности (ВК) VС(CK1, CK2,…, CKi, CKn, T) эксперта.

В текущий момент времени значения СКi находились на основе представления передаточных коэффициентов измерительной системы в виде функции распределения соответствующего фактора степени компетентности.

Таким образом, проекции ВК на временную ось представляли собой частный случай реализации известного понятия функции компетентности для соответствующей предметной области в определенные моменты времени.

Предложили определять обобщенную характеристику ВК на основе композиций законов распределения рассматриваемых факторов. Эта композиция выражается путем последовательного применения операции свертки (*) к функциям распределения соответствующих факторов:

f 4 = f 3 f f 3 = f 2 f f 2 = f1 f В общем виде:

f n = f n1 f n, (2.14) где n – число составляющих ВК.

Определение видов законов распределения погрешностей (f1, f2, …, fn) факторов СКi применительно к конкретной задаче проводилось на основе эвристического подхода.

Для оценки нечеткого, качественного характера характеристик эксперта, на основе аппарата теории нечетких множеств, ввели лингвистическую переменную LV «Уровень компетентности», значения которой определялись следующими нечеткими понятиями, нашедшими практическое подтверждение:

– Недостаточный;

– Достаточный;

– Удовлетворительный;

– Хороший;

– Очень хороший;

– Отличный, которые представили в виде кортежа:

LV = НД, Д, УД, ХОР, О.Х., ОТЛ. (2.15) Расчет оптимального количества значений лингвистической переменной (шесть) проводился по известным формулам Кендалла, Брукса и Каррузера, которые определяют оптимальное число градаций шкалы измерений нечеткого множества через количество наблюдаемых входных сигналов.

Кроме того, фиксированное число заданных значений указанной лингвистической переменной позволило в дальнейшем четко интерпретировать решения нейронной модели диагностики ЭЗЗ.

Таким образом, универсальное множество всех возможных значений входного сигнала Y, выражаемое интервалом [0,1],и имеющее физический смысл коэффициента корреляции входного сигнала к кортежу значений LV, разбили на шесть нечетких подмножеств.

Функции принадлежности нечетких множеств, определяемых кортежем значений (2.15), представили в виде композиций функций распределения погрешностей соответствующих факторов ВК.

При определении граничных значений данных множеств (опорных точек лингвистической переменной LV) использовали рекомендуемые значения класса точности из нормированного ряда чисел по ГОСТ 8.401 – 80). Эти значения использовали для расчета относительной погрешности экспертного оценивания и граничной величины коэффициента (э) корреляции, соответствующей опорной точке LV (э), с помощью следующих зависимостей:

XB э = 0 ;

X э = (1 3 '2 ), где э – относительная погрешность экспертного оценивания;

0 – класс точности предложенной измерительной системы;

ХВ – предел измерений системы;

отсчет измеряемой, соответствующей опорной точке Х – лингвистической переменной LV;

э – опорная точка LV.

Для рассматриваемой измерительной системы соотношение ХВ/Х – передаточный коэффициент между шкалами классов точности и относительной погрешности экспертных измерений – являлось постоянной величиной, равной 8,7.

В результате граничные значения опорных точек лингвистической переменной «Уровень компетентности» представили в виде табл. 5:

Таблица Определение граничных значений LV Нечеткое понятие, Значение класса Относительная Граничное характеризующее точности погрешность значение уровень компетентности измерительной экспертного коэффициента оценивания, э, системы корреляции, (значение LV) э % Недостаточный (НД) – 50,0 Достаточный (Д) 40 35,0 0, Удовлетворительный 30 26,3 0, (УД) Хороший (ХОР) 20 17,5 0, Очень хороший (О.Х.) 15 13,1 0, Отличный 10 8,7 0, В результате определили границы нечетких множеств, соответствующих кортежу значений LV, в виде следующих интервалов:

– НД: (0.000, 0.707) – Д : (0.707, 0.891) (2.16) – УД: (0.891, 0.953) – ХОР: (0.953, 0.974) – О.Х.: (0.974, 0.988) – ОТЛ: (0.988, 1.000) Центры распределения ФП, рассматриваемые как аналоги математического ожидания соответствующих, указанному кортежу значений LV, композиций функций распределения погрешностей характеристик ВК, представили как средние значения интервалов (2.16). Далее, на основании правила сигм», определили значения среднеквадратических «трех отклонений данных функций распределения и построили (с.к.о) соответствующие функции принадлежности входного сигнала к нечетким понятиям, определенных кортежем (2.15).

Таким образом, проекции вектора компетентности в текущий момент времени в обобщенной форме представили в виде, определенным следующим графиком (рис. 10).

На данном графике, в целях обеспечения удобства восприятия, представлены функции принадлежности к последним пяти значениям LV.

ФП к нечеткому понятию «Недостаточный» была построена аналогичным образом.

0,7 1, Рис. 10. Пример представления функций принадлежностей входного сигнала Применение указанного нечеткого подхода позволило определить значения относительной погрешности экспертных измерений для соответствующих временных интервалов реализации ВК, а также представить выходную информацию рассматриваемой измерительной системы в виде, удобном для определения качества ЭЗЗ.

2.4. Нейронная модель измерителя вектора компетентности При решении вопроса о применении нейросетевых технологий к решению задачи формализованного описания процедуры диагностики ЭЗЗ принимались во внимание основные факторы, отражающие наиболее существенные особенности процесса принятия решений экспертом, а также характеристики эксперта, наиболее сильно влияющие на данный процесс. В частности учитывалось, что процесс принятия решений является нелинейным, динамическим, нестационарным процессом, структура которого априори неизвестна.

Поскольку рассматриваемые нами процессы являются объектами нелинейными, то использование аппарата теории линейных систем не обеспечивает необходимой точности их описания. Отсутствие априорных знаний относительно структуры рассматриваемых процессов не позволяет в полной мере воспользоваться и математическим аппаратом нелинейных дифференциальных уравнений.

Таким образом, среди теоретико-экспериментальных подходов к использованию нелинейных систем наиболее подходящим, удовлетворяющим перечисленным требованиям, оказался подход с применением нейросетей.

В данной работе для повышения надежности, представительности экспертного заключения предложено использовать математическую модель диагностики ЭЗЗ, созданную на основе нейронной сети.

Поскольку, как было показано ранее, решение задачи диагностики ЭЗЗ разбивается на ряд последовательных подзадач: наблюдения, классификации и распознавания качества ЭЗЗ, то при выборе структуры предложенной нейронной модели руководствовались принципом обеспечения модульности, т.е. выполнения декомпозиции сложной задачи в ряд более простых подзадач.

Для этой цели представили нейронную модель в виде многослойной НС прямого распространения, в которой каждый слой нейронов решает соответствующую подзадачу диагностики ЭЗЗ.

Данное представление нейронной модели, таким образом, обеспечивает практическую реализацию диаграммы процесса диагностики, представленную на рис. 5, т.е. на выходе НС представляется оценка качества ЭЗЗ в виде определения степени принадлежности ЭЗЗ к одному из классов множества Е. Структурная схема нейронной модели диагностики ЭЗЗ представлена на рис. 11.

Необходимо отметить, что все нейроны, принадлежащие соответствующему слою НС, имеют идентичные передаточные функции (функции активации), а количество нейронов в слоях I,II,III может изменяться в зависимости от условий конкретной решаемой задачи.

Нейронная модель диагностики ЭЗЗ содержит следующие слои нейронов:

– входной слой (I), представляющий информацию, поступающую на его вход, в виде взвешивающих коэффициентов (обеспечивает решение задачи наблюдения);

– первый промежуточный слой (II) нейронов, учитывающий нечеткий, качественный характер ЭЗЗ и, в частности, такие характеристики эксперта как профессиональный опыт, теоретическую подготовленность, особенности памяти, логические способности, интуицию и т.п.;

– второй промежуточный слой нейронов – дискретизаторов (III), позволяющий получить оценку характеристик компетентности эксперта (II и III слои нейронов обеспечивают решение задачи классификации);

– выходной слой формирующий оценку качества ЭЗЗ (IV), (обеспечивается решение задачи распознавания качества ЭЗЗ).

При практической реализации НС важное место занимает вопрос выбора и математического описания передаточных характеристик нейронов соответствующих слоев.

I II III IV нд д идентификация уд х1 хор о.х х отл х управление нд х д х уд хор о.х оптимизация отл … … … нд д уд оптимизация с M хn риском хор о.х отл Рис. 11. Структурная схема нейронной модели диагностики ЭЗЗ Определение передаточных характеристик нейронов входного слоя Как было определено ранее, нейроны входного слоя обеспечивают решение задачи наблюдения, т.е. оценивают степень достоверности исходных данных и знаний, производят назначение весовых коэффициентов дискретным элементам этих данных и отсев ненадежной информации. Таким образом, по существу, производят процесс нечеткой фильтрации исходной информации. Описание работы нечеткого фильтра, представленного его нерекурсивной схемой, определялось через выражение (6.5).

В свою очередь, расчет параметров предложенного фильтра произвели по следующим зависимостям:

M W ( ) = b0 + 2 bk b э cos( k );

k = (2.17) c sin k ( 2 f s );

bk = k = 2 k c b0 = 0 = 2 f s.

где W ( ) – параметры фильтра;

С0, сk, b0, bk, bэ – весовые коэффициенты фильтра;

fs – полоса пропускания фильтра;

М – размах фильтра (определяется количеством нейронов);

k = 1, 2, 3,.. n.

При выборе параметров нечеткого фильтра учитывали, что при любой угловой частоте погрешность его работы уменьшается с увеличением размаха М. В данном случае задача заключалась в выборе минимального значения М, при котором удовлетворялись требования к точности аппроксимации нечеткой информации. В качестве критерия определения М выбрали приращение дисперсии выходного сигнала Y – Y при изменении порядка фильтра на единицу:

Y = (Y,M Y,M 1) / Y,M 1, 2 2 2 (2.18) где Y – приращение дисперсии выходного сигнала Y;

Y2,M – дисперсия выходного сигнала для выбранного порядка фильтра М.

Считали, что требования к точности аппроксимации удовлетворялись, если для выбранного М изменение дисперсии не превышало 10%. В свою очередь, дисперсию выходного сигнала определяли по формуле:

N max (Yn1 Yn ) 2, = (2.19) N max M n=M + Y где Y – дисперсия выходного сигнала Y;

Nmax – число измерений;

M – выбранный порядок фильтра М;

Y – выходной сигнал.

Весовые коэффициенты bэ рассчитывались аналогичным образом.

Дополнительно использовали экспертную информацию, если она повышала отношение сигнал/шум на входе нечеткого фильтра. Алгоритм вычисления bэ в этом случае был подобен алгоритму обнаружения и классификации сигналов в условиях сильных помех, когда проявлялось преимущество экспертного метода фильтрации перед формальными методами.

I 1 2 3 n b0 b1 b2 b3 bn Y Рис. 12. Функциональная схема нечеткого фильтра.

Функциональная схема, разработанного нечеткого фильтра представлена на рис. 12, а его основные характеристики на рис. 13.

b() W() а) b) b()=sin c(fs* ) s/ -2/fs 01/fs 3/fs -s/ d) c) K() K()=1/*cos(0)sin(s/2*) s Рис. 13. Основные характеристики фильтра в методе нечетких измерений:

а) временное окно;

b) амплитудно-частотная характеристика;

c) корреляционная функция;

d) спектральная плотность Таким образом, каждый нейрон входного слоя НС представляли в виде элемента соответствующего нечеткого фильтра, а функции активации нейронов совпадали с амплитудно-частотными характеристиками фильтра, параметры которых корректировались в зависимости от условий решаемой задачи. Общее количество нейронов входного слоя определялось исходя из существовавших условий наблюдаемости характеристик ЭЗЗ. Аксоны нейронов входного слоя принимали значения из интервала [0,1].

Определение передаточных характеристик нейронов промежуточных слоев (II и III) Представление эксперта в качестве измерительной системы позволило произвести факторизацию множества характеристик эксперта, влияющих на качество ЭЗЗ, а метод нечетких измерений дал возможность определить составляющие погрешности ЭЗЗ через погрешности данных характеристик.

Нейросетевая реализация данного подхода включала в себя представление передаточных характеристик нейронов II слоя в виде нормированного набора функций принадлежности нечетких множеств, определенных кортежем значений лингвистической переменной «Уровень компетентности» НД, Д, УД, ХОР, О.Х., ОТЛ;

интерпретацию аксонов II слоя (синапсов III слоя) в виде степеней принадлежности к соответствующим нечетким множествам и настройку аксонов III слоя к виду, позволяющему решить задачу распознавания качества ЭЗЗ.

Работу нейронов II слоя представили в виде следующей структурной схемы (рис. 14):

x w11 Y F1 K wM....

....

w1N....

YQ wQN FQ KQ xN Рис. 14. Структура II слоя нейронной модели x1,.., xn – сигналы, поступающие от нейронов входного слоя НС;

w11,.., wQN – весовые коэффициенты синапсов II слоя;

Yi – сумма взвешенных входов i ого нейрона;

Fi – функция активации i-ого нейрона;

Кi– выходной сигнал i ого нейрона Поскольку данные нейроны осуществляли преобразование входных сигналов, имеющих нечеткий, качественный характер, то определение Yi (получение взвешенной суммы входов каждого нейрона) выразили через операции суммы и произведения теории нечетких множеств и представили в виде:

Yi = min (max(wi1, xi),..,max(wiN, xi)), (2.20) где Yi – сумма взвешенных входов i-ого нейрона;

x – сигналы, поступающие от нейронов входного слоя НС;

w – весовые коэффициенты синапсов II слоя.

Поскольку значения входов и весов нейронов II слоя заключены в интервале [0,1], то и значения сигнала Yi будут принадлежать этому же интервалу.

Функции активации нейронов II слоя (Fi) представили в виде набора функций принадлежностей, соответствующих кортежу значений указанной лингвистической переменной (2.15). Определение параметров и построение данных функций проводили путем реализации алгоритма, изложенного в главе 4.

Таким образом, выходной сигнал нейрона Ki, представляемый в виде 6 мерного вектора, определял степень соответствия i-ой характеристики эксперта нечетким понятиям достаточный, недостаточный, удовлетворительный, хороший, очень хороший, отличный, определяющим лингвистическую переменную «Уровень компетентности».

Как видно из рис. 11, выход каждого нейрона II слоя связан с входами шести нейронов III слоя НС, наименования которых соответствовали кортежу значений указанной лингвистической переменной. В результате на входы нейронов III слоя подавались значения степени соответствия характеристики эксперта интервалу (принадлежащие [0,1]) соответствующему нечеткому понятию. На данном этапе реализовывалась операция дискретизации сигналов, поступающих на вход II слоя НС.

Количество нейронов III слоя НС, таким образом, определялось по формуле U=M*6, т.е. каждому нейрону II слоя ставилось в соответствие шесть нейронов – дискретизаторов III слоя нейронной модели (М – количество нейронов II слоя НС (рис. 11)).

Передаточные функции нейронов слоя реализовывали III преобразование входных значений (степеней соответствия к указанному кортежу нечетких понятий) в выходные, определяющие значение относительной погрешности измерений ЭЗЗ и лежащие в интервале [0,1].

Данное преобразование позволило представить выходные значения нейронов III слоя в удобном виде для решения задачи распознавания качества ЭЗЗ, которую решали нейроны IV слоя НС.

Определение передаточных характеристик нейронов выходного слоя Процедуру построения передаточных характеристик нейронов классификаторов выходного слоя НС разработали с учетом прототипа.

Основные операции заключались в следующем:

Выделялись точки e1, принадлежащие множеству Е, которые точно соответствовали нечетким подмножествам, определяемым кортежем с лингвистической переменной LE ИДН, УПР, ОПТ, ОПР (степень принадлежности равна 1).

eоп, ео л Определялись точки граничных значений нечетких подмножеств, лежащие справа и слева от е1 соответственно.

Рассчитывались координаты точек е0,5п, е0,5л, имеющих степень принадлежности, равную 0,5 для каждого нечеткого понятия справа и слева от е1 соответственно.

Осуществлялось графическое построение передаточных характеристик и определение аппроксимирующих выражений по найденным ранее точкам (рис. 15).

Проводилась формализация лингвистической переменной LE на выделенных указанным образом нечетких подмножествах.

Пример расчета численных значений точек ei для построения передаточных характеристик нейронов-классификаторов приведен в табл. 6.

Уровень принадлежности к нечеткому понятию LE 0, ei е0л е0,5л е0,5п е0п е Рис. 15. Пример построения передаточной характеристики нейрона выходного слоя НС Таблица Расчет характеристик нейронов выходного слоя Нечеткие понятия, Значение абсциссы ei л е0,5л е0,5п е0 п определяемые кортежем LE е0 е 1. ИДН 0,000 0,894 0,901 0,938 0, 2. УПР 0,901 0,938 0,961 0,969 0, 3. ОПТ 0,961 0,969 0,978 0,984 0, 4. ОПР – – 0,978 0,984 0, Операцию нечеткого суммирования входных сигналов нейронов – классификаторов проводили по известным правилам суммирования воздействий при обработке нечеткой информации в экспертных системах:

для суммирования положительных (возбуждающих) сигналов:

Y(+) = Y1(+) + Y2(+) – Y1(+)*Y2(+);

для суммирования отрицательных (тормозящих) сигналов:

Y(-) = Y1(-) + Y2(-) + Y1(-)*Y2(-);

для суммирования противоположных по воздействию связей:

Y = [Y1(+) + Y2(-)]/[1- min{abc [Y(+),Y(-)]}].

Распознавание класса, характеризующего качество ЭЗЗ, производилось НС по максимальному значению выходного сигнала (степени принадлежности к нечеткому понятию, определенному кортежем LE), который принимали нейроны-классификаторы выходного слоя НС.

2.5. Комплексы программ – измерителей 2.5.1. Использование элементов ядерной организации при построении нейронной сети Практическое использование нейросетей предполагает наличие двух уровней их реализации: инструментального – обеспечивающего этапы выбора структуры, проектирования и исследования НС, и прикладного – позволяющего осуществить процесс программной реализации НС.

Как было ранее определено, одной из основных характеристик предложенной нейронной модели является обеспечение принципа модульности, т.е. декомпозиции задачи диагностики ЭЗЗ в ряд более простых, последовательно решаемых, подзадач. Другим основополагающим принципом проектирования НС является обеспечение распределенной обработки информации.

Разработанная нейронная модель в виде НС прямого распространения целиком удовлетворяет данным принципам, однако при практическом применении подобных селективных структур необходимо дополнительно обеспечить реализацию ряда их свойств, в состав которых обычно включают:

Вырожденность. Это свойство предполагает, что селективная структура обеспечивает более одного способа удовлетворительного распознавания данного входного сигнала.

Избыточность. Это свойство предполагает наличие повторяющихся нейронных групп одинакового строения, т.е. работающих с одной и той же системой признаков.

Дистрибутивность. В селективной структуре нет никакой необходимости в том, чтобы выбранные изофункциональные группы были смежными, напротив рецепторные поля должны принимать некоторое общее положение в пространстве признаков, для того чтобы обеспечить распределенную обработку и надежность функционирования при локальных повреждениях.

На основе изложенных принципов при практической реализации предложенной нейронной модели в качестве НС прямого распространения руководствовались следующими положениями. Реализуя принцип модульности, определили в качестве структурно-образующего элемента НС группу нейронов, имеющих общее рецепторное поле. Данное представление соответствует и принципу дистрибутивности селективной структуры. Эту группу принято называть нейронным ядром. В нашем случае, в качестве такого ядра представили объединение каждого нейрона II слоя с соответствующим ему шестью нейронами III слоя НС, где видно, что рецепторные поля данных нейронных ядер не пересекаются. Это означает, что каждое нейронное ядро моделирует свойство избыточности селективной структуры, а все множество рассматриваемых ядер моделирует свойство вырожденности.

Таким образом, представили структуру предложенной нейронной модели диагностики ЭЗЗ в качестве НС прямого распространения с элементами ядерной организации, что предполагало целенаправленное ограничение связей между нейронными ядрами. Поэтому разработанная НС с элементами ядерной организации получила ряд качеств, имеющих важное практическое значение:

– модульность структуры, которая позволила выполнить декомпозицию сложной задачи в ряд более простых подзадач;

– возможность оптимизации структуры под конкретную задачу;

– сокращенное число синаптических весов, что позволило существенно увеличить вычислительную эффективность и использовать данный класс нейронных сетей для обработки данных в системах реального времени на обычных ПК.

Выделение нейронных ядер в качестве элементов, определяющих структуру нейронной модели диагностики ЭЗЗ, позволило существенно упростить практическую реализацию предложенной модели, т.е. реализовать декомпозицию процесса диагностики ЭЗЗ в ряд последовательно решаемых подзадач – наблюдения, классификации и распознавания качества ЭЗЗ.

Причем, решение каждой подзадачи возложено на соответствующие структурно-образующие элементы НС. Таким образом, структурную схему процесса диагностики, в соответствии с введенными ранее обозначениями, представили в следующем виде (рис. 16):

Y E X Aвх Aя Aвых E/N наблюде- классифика- распознавание ние ция качества Рис. 16. Структурная схема процесса диагностики ЭЗЗ на основе нейронной модели Авх - множество нейронов входного слоя НС, Ая- множество нейроных ядер, Авых множество нейронов выходного слоя Все структурно-образующие элементы НС работали поочередно, однако они образовывали конвейер, в котором освободившиеся элементы могли переходить к новому вектору данных. Поэтому при последовательном поступлении данных, время обработки было пропорционально числу нейронов, но производительность (количество обработанных векторов данных в единицу времени) определялось временем срабатывания соответствующего нейрона и не зависело от их числа.

Данное представление позволило при практической реализации НС воспользоваться парадигмами объектно-ориентированного (ОО) программирования. Программирование НС с применением ОО подхода позволило реализовать следующие положительные моменты. Во-первых, оно позволило создать гибкую, легко перестраиваемую иерархию моделей НС.

Во-вторых, такая реализация была наиболее прозрачна для программиста, и позволяла конструировать НС простым пользователям. В-третьих, так как уровень абстрактности программирования, присущий ОО языкам, в будущем будет расти, то реализация НС с ОО подходом позволит расширить их возможности и является перспективной.

ОО подход применили при практической реализации предложенной нейронной модели, выделив три абстрактных ОО класса, описывающих соответственно нейроны входного слоя, нейронные ядра и нейроны выходного слоя. В результате, наращивание элементов НС на этапе проектирования и настройки на условия конкретной ситуации происходило путем создания экземпляров объектов соответствующих классов.

Результатом проектирования явилась нейронная сеть, настроенная на условия конкретно решаемой задачи с программным интерфейсом, соответствующим модели многокомпонентных объектов (COM). Это означало, что каждый структурно-образующий элемент НС (Авх, Ая, Авых) был реализован в виде соответствующего Active-X элемента. Данное представление НС позволило осуществить практическую реализацию процесса диагностики ЭЗЗ в виде трех основных компонентов, отвечающих за решение указанных подзадач. Кроме того, применение технологии межзадачного взаимодействия СОМ дало ряд важных преимуществ, в частности:

– гибкость и взаимозаменяемость элементов, как в процессе разработки, так и во время эксплуатации;

– независимость реализации от языка программирования;

– полное соответствие существующим моделям объектно ориентированного программирования;

Необходимо отметить, что реализация предложенной НС на основе COM – технологии позволило легко встраивать данный интеллектуальный модуль в любое приложение Microsoft Оffice, включая электронные таблицы EXCEL, базы данных ACCESS, редактор WORD и пр. В равной степени интеллектуальный модуль может быть встроен в любой проект пользователя, реализованный на языках VISUAL C++, BORLAND C++, VISUAL BASIC, JAVA. Интеллектуальные модули с НС могут быть встроены в Web страницу INTERNET или использоваться в этой сети для построения гибких систем. В корпоративных сетях НС позволяет реализовать COM-технологию распределенную обработку ЭЗЗ. Разработанный программный продукт может быть также использован как средство лабораторного практикума в соответствующих учебных курсах.

2.5.2. Особенности программной реализации определения вектора компетентности Как было показано ранее, значение вектора компетентности VC(CК1, СК2, СК3, …, СКn, T) в текущий момент времени определялось на основе оценки личностных характеристик эксперта, к которым отнесли профессиональный опыт, теоретическую подготовленность, интуицию, логические способности, особенности памяти и т.п. Таким образом, вектор компетентности (ВК) в текущий момент времени представлял собой агрегированную, обобщенную величину, объединяющую оценки вышеперечисленных характеристик эксперта.

Составляющие ВК в данной работе предложено определять с помощью методов, наиболее подходящих для оценки той или иной личностной характеристики эксперта.

Так, например, профессиональный опыт эксперта оценивался по результатам апостериорных данных о протекании производственного процесса, в котором тот принимал непосредственное участие. Общеизвестно, что в идеальном случае, при соблюдении условий центральной предельной теоремы (взаимонезависимость или слабая зависимость факторов, влияющих на протекание процесса) распределение погрешностей любого производственного процесса распределяется по закону, близкому к нормальному распределению (закону Гаусса). В то же время, участие производственного персонала в процессе принятия решений по управлению производственным процессом, существенно изменяет закон распределения погрешностей данного процесса, в силу привнесения субъективной (качественной) составляющей, свойственной человеческой деятельности.

Следовательно, сравнение апостериорных данных о реальных погрешностях производственного процесса с нормальным законом распределения, позволяет выявить оценку субъективной составляющей экспертного вмешательства в данный процесс и, таким образом, оценить производственный опыт эксперта. В данной работе строилась зависимость между реальными производственными данными, распределенными по произвольному закону и нормальным распределением, свойственным протеканию идеального процесса. Полученный коэффициент корреляции интерпретировался как входное значение функции принадлежности рассматриваемой характеристики к нечетким множествам, определяемых кортежем лингвистической переменной LV.

Для определения теоретической подготовленности эксперта, логических способностей, особенностей памяти, и т.п. воспользовались методами психологической диагностики.

Известно, что психологическая диагностика изучает способы распознавания и измерения индивидуально-психологических особенностей человека (свойств его личности и особенностей интеллекта). Поэтому распознавание и измерение этих компонентов осуществляли с помощью методов психодиагностики.

В данной работе для оценки вышеупомянутых личностных характеристик эксперта применили следующую обобщенную схему (рис. 17).

Выбор методики тестирования для той или иной личностной характеристики эксперта зависел от предметной области рассматриваемой задачи. В частности, при диагностировании теоретической подготовленности экспертов, принимающих участие в доменном производстве, использовались вербальные стандартизированные стимулы с ответами типа выбор.

, Рис. 17. Обобщенная диаграмма процесса тестирования Данное формализованное описание психодиагностических методик и возможность выбора подходящей методики, заложенная в программной реализации процедуры тестирования, позволили произвести оценку той или иной личностной характеристики эксперта посредством наиболее подходящего для данной цели метода. Глубокое исследование данных методов осуществлено ранее в многочисленных публикациях по теории тестирования (тестологии) и психологии.

В результате получаемые оценки личностных характеристик эксперта приводились к единой шкале (принимали значения из интервала [0,1]), а в физическом смысле соответствовали коэффициентам корреляции и использовались в качестве весовых коэффициентов НС.

Необходимо отметить еще некоторые достоинства предложенной системы тестирования:

– реализован гибкий механизм тестирования: в процессе обследования осуществлялся мониторинг текущих данных и корректировка последовательности заданий;

– имелась возможность подключения внешних программ для работы в единой системе совместно с предлагаемыми методиками. В частности для оценки соответствующей личностной характеристики эксперта использовались такие примеры представительных психодиагностических методик, как классические тесты Люшера, Айзенка, Кэттэла, MMPI, Осгуда, шкала самооценки Спилберга Ханина, лучшие их отечественные адаптированные варианты, оригинальные психобиографические методы и т.п.;

– обеспечен удобный интерфейс для разработки и настройки собственных тестов: создания и корректировки вопросов, ответов и шкал, условий и текстов интерпретации.

– осуществлена реализация справочного режима, что позволяет избежать объемных инструкций и работать с системой слабо подготовленному пользователю;

– вся требуемая информация предоставлялась в удобном для восприятия виде (графики, диаграммы и т.д.). По желанию пользователь мог получить количественные характеристики тех или иных показателей.

Таким образом, разработанная система тестирования позволила оценить вышеупомянутые характеристики эксперта посредством применения наиболее подходящей психодиагностической методики.

Как показано ранее, одним из важных этапов оптимальной оценки личностных характеристик эксперта являлось использование адаптивных алгоритмов и процедур прогнозирования. Использование указанных алгоритмов позволяло учитывать такие свойства человеческого мышления, как интуиция и способность обучаться предсказанию.

Основной информацией для прогноза являлся отдельный временной ряд. При краткосрочных прогнозах наиболее важными были последние реализации исследуемого процесса. Тенденция его развития, сложившаяся в среднем на всем периоде предыстории, имеет существенно меньшее значение. Для повышения качества прогнозов необходимо постоянно сопоставлять прогнозные оценки с фактическими данными. Кроме того необходимо предоставлять эксперту информацию, определяющую параметры и предысторию других величин, коррелированных с основным прогнозируемым фактором.

На этой основе для определения указанных характеристик эксперта был разработан алгоритм, реализующий принципы адаптивного прогнозирования, схема которого представлена на рис. 18.

Отметим некоторые особенности программной реализации представленной процедуры прогноза, предлагаемой эксперту.

На первом шаге происходила настройка начальных условий прогноза, которая включала в себя выбор прогнозируемого фактора, определение границ временного окна для динамического ряда и т.п. Кроме того, система предлагала эксперту указать параметры производственного процесса, которые по его мнению наиболее тесно коррелируют с выбранным фактором.

Эксперт анализировал информацию по предыстории протекания технологического процесса и выдавал значение для прогнозируемого фактора.

Система анализировала результаты прогноза и производила расчет ошибки прогнозирования, а также предварительных значений коэффициентов корреляции и относительной погрешности.

Затем эксперту предлагалось выполнить прогноз на следующий момент времени. Процесс продолжался до исчерпания фактических уровней ряда (в нашем случае, в качестве оптимального количества членов динамического ряда для процедуры краткосрочного прогноза принято значение, равное (n=12)).

Получение начальных коэффициентов временного ряда Прогнозирование на один шаг вперед (получение оценки x1(t)) Модификация значений Сравнение прогнозного с учетом ошибки значения с фактическим.

прогнозирования, Вычисление ошибки обновление прогнозирования коэффициентов t+1=x(t+1) – x1(t), динамического ряда Предварительный расчет коэффициентов корреляции и относительной погрешности НЕТ Закончена процедура прогноза ?

(n=12) ДА Окончательная оценка характеристик эксперта (интуиция, способность обучения и т.п.) Рис. 18. Общая схема алгоритма, реализующего принципы адаптивного прогнозирования.

Эксперту предоставлялась возможность в любой момент времени сравнить прогнозируемые им значения с фактическими данными, получить информацию об изменении коррелируемых параметров и, исходя из этого, скорректировать значение производственного фактора на следующем шаге процедуры прогноза. Вся требуемая информация выводилась на экран монитора ПЭВМ в удобном для восприятия виде (графики, диаграммы и т.д.). По желанию эксперт мог получить количественные характеристики тех или иных показателей в любой момент времени. Процесс окончательного выбора прогнозируемого значения решался каждым экспертом персонально.

Получение общей оценки анализируемых характеристик эксперта состоял в нахождении такого значения, которое обеспечивало бы отражение тенденции процесса прогнозирования при одновременной фильтрации случайных отклонений от нее.

Обобщив вышеизложенное, можно заключить, что определение составляющих вектора компетентности в настоящей работе было реализовано с помощью методов, наиболее подходящих для оценки той или иной личностной характеристики эксперта.

Разработанная система предоставила для исследователя широкие возможности выбора методов определения составляющих ВК. К ним относятся: анализ апостериорных данных о протекании производственного процесса;

выбор соответствующей психодиагностической методики тестирования;

использование адаптивных алгоритмов и процедур прогнозирования и т.п.

3. Практика определения компетентности нейросетевым методом Широкий спектр информационных технологических задач относится к задачам распознавания образов, общей ключевой проблемой которых является выделение полезного сигнала на фоне шума. Информационный шум на производстве возникает вследствие колебаний параметров сырья, флуктуаций в самом технологическом объекте, из-за изменения внешних условий и недостаточной компетентности обслуживающего персонала. Так как нейронные сети более всего похожи на математические модели процессов типа “черного ящика” (но не являются их аналогами!), то их применение прежде всего связано с известными статистическими методами обработки выбросов, определения частоты и числа наблюдений, критериями их классификации. В последних все сводится к вычислению границ распознавания “свойчужой”, “годенне годен” и т.п. Если мощность полезного сигнала по сравнению с производственными шумами велика (более 30 дб), то вычисление критериев классификации практически любыми методами не представляет затруднений и распознавание технологической ситуации (ТС) происходит однозначно и с высокой степенью вероятности (более 0,9). Другое дело, если мощность сигнала сравнима с мощностью шума. Например, в статистической радиотехнике рассматривается некоторое пороговое значение отношения мощностей сигнал/шум (С/Ш), равное 1 и характеризующееся величиной корреляционной связи между входным и выходным сигналами, соответствующей 0,707. Доказывается, что ниже этого порога распознавание или обнаружение не гарантируется [10]. Построение для этой цели сложных и дорогих корреляционных фильтров в некоторых случаях повышает указанное соотношение, но одновременно порождает другие проблемы, связанные с необходимостью длительного наблюдения полезного сигнала, параметры которого при наблюдении не должны изменяться. Как правило, технологические процессы в промышленных объектах имеют высокие производственные шумы и по своей природе нестационарны, поэтому проводить на них такие наблюдения не представляется возможным.

Перечисленные особенности полностью переносятся на функционирование нейронных сетей. Хотя нейронные сети в целом устойчивы к шумам, однако у этой устойчивости есть предел. Например, выбросы, т.е. значения, не принадлежащие к выборке исходных данных некоторой переменной, поданной на вход нейросети, могут исказить результаты и вызвать ошибку обучения. По этому поводу академик О.И.

Ларичев [11] отметил, что ошибка ошибке рознь. Особенно опасны те ошибки, которые совершаются у самой границы, так как они меняют её вид.

В экспертных системах классификации на распознавание граничных элементов тратится в 2-3 раза больше времени, чем на классификацию состояния объектов, находящихся внутри класса. Если не предпринимать специальных мер по обработке шумящей информации перед тем как её подавать на входы суммирующих элементов нейросети, то последняя теряет свои преимущества в решении задач распознавания перед обычными статистическими методами.

3.1. Методы моделирования нейропроцессов при распознавании и классификации Известно существенное преимущество человека перед машиной при обнаружении и классификации сигналов в условиях сильных помех [12]. Так речь может быть разборчивой в таких зашумленных помещениях, как салон самолета или кабина такси. Разборчивость сохраняется даже при наличии всего двух уровней сигнала (0 и 0), когда имеет место явление “клиппирования” речи.

При зрительной идентификации человеком объектов шум иногда играет даже положительную роль. Так глаз имеет повышенную чувствительность к границам участков с одинаковыми уровнями квантования сигнала, например, при передаче таких изображений, как небо, где яркость и цвет меняются плавно. Уменьшить нежелательное влияние таких границ можно путем введения в квантуемое изображение небольшого по уровню шума – “снега”. Хотя полная ошибка квантования при этом увеличивается раза в два, но визуальное восприятие улучшается в результате расплывания границ. Данная методика нечеткой обработки сигнала применена, например, в интеллектуальных модулях телевизионных приемников фирмы “PHILIPS”.

В реальной жизни при распознавании сигналов человеком, пороговая граница соотношения мощностей сигнал/шум снижается до значений, меньших 1. В качестве примера приведем изображение сигналов в виде импульсов прямоугольной (рис. 19, а) и прямолинейной (рис. 19, б) формы при критическом соотношении мощностей сигнал/шум. При рассмотрении этих изображений зрительно без труда устанавливаются наличие импульса между отметками времени, равными 41 и 61 мин и линейная форма тренда, в то время как для математических моделей и систем распознавания без участия оператора эта задача является пока неразрешимой.


а) С оо тн ош ени е си гнал/шум =, а л а н г и.

с д е а.

н д 1 11 21 31 41 51 61 71 81 - т у о т и - л п В р ем я, м и н м А б) Соотношение сигнал/шум =, а л а н г. и с д е.

а н д т -1 у 11 21 31 41 51 61 71 81 т о - и л - п м - А Время, мин Рис. 19. Примеры типичных сигналов в технологических процессах:

а П-образный импульс управления;

б линейный тренд Современные представления об информационных процессах, происходящих в человеческом мозге учитывают их ассоциативный характер, поэтому при построении математических моделей для компьютерного моделирования и решения задач классификации и распознавания также предусматривают ассоциативные операции с информацией в виде информационных гранул – чанков (chunk) [11]. Чанки – элементы знаний с четкими смысловыми границами (1 бит, слово, образ) извлекаются из долговременной памяти в кратковременную (актуализируются) (оперативную) память, где соотносятся с оперативной информацией, поступающей с объекта также в виде элементарных единиц информации, которые человек способен сразу и целиком распознать, закодировать и запомнить. Объём оперативной памяти невелик, составляет 7 ± 2 чанков, поэтому способности специалиста к распознаванию технологических ситуаций всецело определяются знаниями понятиями и (образами, решающими правилами) об объекте, хранящимися в долговременной памяти.

Выбор того, какие именно чанки следует извлечь из долговременной памяти (прошлого опыта) в виде эталонов для сопоставления носит интуитивный характер и по законам ассоциаций происходит на подсознательном уровне.

Поэтому эти знания не могут быть в полной мере вербализованы и использованы в математических моделях или базах знаний экспертных систем.

Нейронные поля в этом плане имеют больше возможностей.

Соединения ассоциативных элементов, роль которых выполняют нелинейные элементы – нейроны, формируют как идентифицируемые объекты в виде кластеров, так и границы распознавания, которые имеют нечеткий характер.

В процессе обучения человека происходит запоминание перенесение из кратковременной памяти в долговременную как свойств задействованных нейронов с их синапсами, так и характеристик входных элементов – рецепторов, с входными каналами связи нейронов. При математическом описании работы и обучения нейросети это соответствует моделированию нечетких ассоциативных границ, например, путем представления активационной функции нейрона в виде функции принадлежности (ФП) [13].

ФП – функция, определяющая степень вероятности принадлежности параметра к тому или иному понятию. Однако пока не существует ответов на вопросы о том, какой вид должна иметь ФП, т.е. быть разной или одинаковой формы для нейронов промежуточных слоев, как должно осуществляться обучение таких нейросетей.

Для решения задачи распознавания в 1957 г. Ф. Розенблатт [14] создал перцептрон, содержащий 3 слоя элементов. В этой конструкции 2-ой, промежуточный слой, нейронов содержал модели ассоциативных элементов.

Однако их характеристики отдельно не определялись, а обучение перцептрона происходило путем изменения весов связей выходного нейрона.

Ничего не было предусмотрено и для повышения помехоустойчивости нейросети, так как входная информация поступала прямо на рецепторы перцептрона. В итоге трехслойный перцептрон был способен решать только простые задачи. Для преодоления этой ограниченности обратили внимание на многослойную конструкцию нейросети, предназначенную для моделирования процессов заданной сложности. Однако научный поископтимального количества слоев нейронов и их характеристик продолжается по настоящее время, а достигнутые результаты невелики и основываются в основном на эвристических приёмах программирования.

Академик Н.М. Амосов [15] предложил нейроструктуры рассматривать как активные семантические сети моделей (М-сети). Принцип работы такой нейросети основывался на том, что в каждый дискретный момент времени состояние М-сети может быть описано распределением возбуждений её узлов. Далее применяли специальную процедуру пересчёта для отображения состояния М-сети на её последующее или конечное состояние в момент +1.

Впервые такая динамическая нейросеть была практически реализована для целей управления нейророботом “Спиди”. Нововведением А.Н. Амосова являлось также то, что промежуточные нейроны конкретно предназначались для моделирования эмоций и чувств (страха, уверенности, риска и т.п.) на основе ассоциаций. Обучение нейроробота “Спиди” происходило путем задания матрицы весов связей между нейронами, обеспечивающей в целом заданный уровень “смелости” или “осторожности” при выполнении нейророботом отданного приказа на действие. В первоначальный этап обучения “Спиди” входило также построение передаточных характеристик сенсоров нейроробота, которые в дальнейшем не изменялись. К сожалению, в России это направление, связанное с представлением нейросети как детерминированной модели, не получило развитие и было забыто.

3.2. Применение составного нейрона в компьютерных программах эмуляторах Повысить до необходимого уровня шумовую помехозащищенность нейросетей, реализуемых на стандартном программном обеспечении и получить удовлетворительные результаты по распознаванию ТС на реальных технологических объектах возможно путем совместного применения ассоциативной фильтрации и суммирования сигналов с дополнительных информационных входов. В качестве примера рассмотрим механизм обработки информации с использованием множественной корреляции, который реализуется в схеме составного нейрона, предназначенного для распознавания изображения цветных объектов. Схема построена на основе информационной теории цветного человеческого зрения и приведена на рис.

20.

Зрительный нейрон содержит синапсы с величиной связей Wi, сумматор S, нелинейный активатор F. Он осуществляет преобразование вектора входного сигнала яркости X в электрический импульс Y, который изменяется при сканировании глазом изображения. Отличительной особенностью модели составного нейрона по сравнению с обычной структурой является наличие на входе слоя ассоциаторов красного (R), зеленого (G), синего (B) цвета с передаточными характеристиками в виде ФП. Составной нейрон применяется на входе нейросети и его ассоциаторы выполняют роль нечетких фильтров информации, поступающей от дополнительных информационных каналов. Такой дополнительной информацией, наряду с сигналом яркости Y, в данном случае являются сигналы цветности R,G,B.

Рис. 20. Составной нейрон Спектральные характеристики глаза хорошо изучены, поэтому определение на их основе ФП ассоциаторов не представляет трудностей. Вид ФП, рассчитанный и построенный с помощью компьютерной программы, реализованной в Exсel показан на рис. 21.

Выбор формы ФП обеспечивает полосовую фильтрацию помех в каналах сигналов R, G, B и, тем самым, эффективное подавление мульти коллинеарности корреляции), которая представляет (межканальной нежелательное явление в рассматриваемом механизме множественной корреляции.

Эффективность применения ассоциаторов покажем на примере расчета множественной корреляции основного сигнала Y c сигналами цветности R, G, B. Методика расчета известна и состоит в определении коэффициента множественной корреляции Ry/rgb по заданным значениям локальных коэффициентов корреляции между сигналами rij:

Ry/rgb=(1- /11)0,5, (3.1) где Ry/rgb коэффициент множественной корреляции;

определитель (4Х4) мерной корреляционной матрицы, 1 ryr ryg ryb rry 1 rrg rrb = rgy rgr 1 rgb ;

(3.2) rby rbr rbg 11 – определитель, получаемый из вычеркиванием первой строки и первого столбца.

. 1, д е и0, л0, о д, 0, и т 0, с о н0, т я0, о р0, е в ь0, н е 0, п е 0, т С 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 Диапазон изменения параметра, доли ед.

R - Кра сный G - зеле ный В - синий Рис. 21. Характеристики ассоциаторов R, G, B как функции принадлежности В качестве исходных условий расчета в этом примере покажем, что мощность шума равна мощности входных сигналов (C/Ш = 1, Ry/i = 0,707), а характеристики ассоциаторов обеспечивают подавление посторонних сигналов на уровне, при котором взаимные коэффициенты корреляции rij не превышают 0,25. Таким образом задается, что при использовании для распознавания только одного какого-либо сигнала, объекты неразличимы.

Эффект от применения всех сигналов получаем, подставляя в определители исходные данные для расчета множественной корреляции. В этом случае значение коэффициента Ry/rgb = 0,999, что соответствует подавлению шумов на уровне более 35 дб и, следовательно, надежному распознаванию объекта составным нейроном.

Рассмотренный пример показывает целесообразность применения составных нейронов не только для зрительного распознавания изображений.

В сложных технологических объектах также возможно выделение новых информационных каналов и применение множественной корреляции для распознавания ТС.

Таким образом, при обработке технологической информации с помощью нейросетей на их входе следует применять составные нейроны с ассоциаторами.

3.3. Основные этапы практического определения компетентности специалистов 3.3.1. Характеристики ассоциаторов как функции принадлежности Вид ФП задается экспертом-технологом и может быть произвольным.

Например, для входных параметров в технологических процессах целесообразно принимать следующие формы ФП [13]:

“низкий” “оптимальный” “высокий” В качестве исходной используют ФП нейтрального характера, описываемую кривой вероятности погрешности Гаусса. Построение ФП удобно производить в Excel, применяя вначале функцию “Частота” для расчета гистограммы распределения выбранного технологического параметра (например, температуры в обжиговой печи), а затем, ориентируясь на внешний вид полученной гистограммы, производить синтез ФП по алгоритму, сочетающему вычислительные и графические возможности электронных таблиц (рис. 22).


Гистограмма температуры обжига в ФУНКЦИЯ ПРИНАДЛЕЖНОСТИ печи "Тобж"=опт принадлежности, доли 14 1, Частота, отн.ед.

12 Вероятность 0, 0, 8 ед.

6 0, 0, 0, 1170 1181 1191 1202 1213 1170 1181 1191 1202 1213 Температура обжига, град С Температура, град.С Рис. 22. Гистограмма ТП “Температура обжига” и соответствующая ей ФП В соответствии с возможностями Excel методика определения ФП состоит в следующем.

Формируется исходная таблица расчета базовой ФП, описывающей лингвистические переменные нзк, опт, вск (мал, опт, блш).

Фрагмент таблицы представлен ниже (табл. 7). В ней обозначено:

Хисх – исходные значения технологического параметра (ТП) в нормализованной форме, заданные шагом 0,025;

Хэксп – значения ТП, заданные экспертом;

ФП = нзк – значения ФП, соответствующие лингвистической переменной нзк.

Значения ФП выводятся также в графической форме. Для коррекции экспертом кривой ФП на графике, что более удобно, используется механизм Excel динамической связи данных, автоматически изменяющий значения в ячейках таблицы, при изменении положения координат точек на графике.

Поэтому, если эксперта по какой-либо причине не устраивает вид ФП, предлагаемый в исходном варианте, он, согласно правилам работы с диаграммой Excel, может изменить форму графика ФП по своему усмотрению. При этом происходит синхронный пересчет табличных значений ФП.

Таблица Исходная таблица расчета базовой ФП А В С D № п/п Хисх Хэксп ФП=нзк 1 0 0 1, – 2 0,025 0, – 3 0,05 0, – 4 0,075 0, – 5 0,1 0, – – – – М 0,5 0,5 – – – – – – – – – – – – N 1,0 1,0 0, Исходные значения ФП рассчитывают по формулам, обеспечивающим оптимальные условия распознавания технологических ситуаций нейросетью в случае использования кривой Гаусса.

ФП нзк = EXP (–10 Х2эксп);

(3.3) ФП опт = EXP (–10 (Хэксп – 0,5)2);

(3.4) ФП вск = EXP (–10 (Хэксп – 1,0)2),. (3.5) где ФП нзк – значения ФП, соответствующие лингвистической переменной нзк;

Хэксп – значения ТП, заданные экспертом;

ФП опт – значения ФП, соответствующие лингвистической переменной опт;

ФП вск – значения ФП, соответствующие лингвистической переменной вск.

В представленной версии методики предусмотрена возможность экспертного задания ФП указанных видов для всех используемых ТП.

Сформированные таким образом ФП далее применяются для определения входных сигналов нейросети по текущим значениям ТП в ассоциаторах.

Алгоритм расчета входных сигналов состоит в следующем:

– определяется нормализованное значение ТП:

Хотн = (Х – Хmin) / (Хmax – Хmin), (3.6) где Хотн – нормализованное значение ТП, Х – текущее значение ТП, а Хmin, Хmax – минимальное и максимальное значения ТП, заданное экспертом в выбранном диапазоне изменения ФП соответственно;

– найденное значение Хотн ставится в соответствии с табличной величиной Хэксп, заданной экспертом;

– определяется значение ФП, соответствующее установленному Хэксп.

С целью реализации двух последних пунктов разработанного алгоритма составляются формулы Excel, предусматривающие необходимые логические операции. Данные формулы учитывают монотонно возрастающий (убывающий) характер ФП = вск, (ФП = нзк) и экстремальный характер ФП = опт.

Для ФП = нзк:

B1 = Если (A1 C1;

D1;

0);

------------------ BN = Если (A1 CN;

DN;

0);

D1 = МАКС (B1 : BN).

Для ФП = вск:

B1 = Если (A1 C1;

D1;

0);

------------------ BN = Если (A1 CN;

DN;

0);

D1 = МАКС (B1 : BN).

Для ФП = опт:

B1 = Если (A1 C1;

D1;

0);

------------------ BМ = Если (A1 CМ;

DМ;

0);

------------------ BN = Если (A1 CN;

DN;

0);

D1 = Если (A1 0,5;

МАКС (B1 : BМ);

МАКС (ВМ : BN)).

Здесь текущее значение ТП, равное Хотн, помещается в ячейку А1, далее в ячейках В1 – BN производится сравнение Хотн с дискретными табличными значениями Хэксп и выдаются значения ФП, содержащиеся в ячейках D1 – DN.

В ячейку D1 помещается найденное значение ФП*, соответствующее условию Хотн = Хэксп. Определенная таким образом величина ФП* используется далее как входная величина ТП для синапсов нейросети.

Описанный алгоритм легко тиражируется в Excel согласно необходимому количеству входных ТП в решаемой с помощью нейросети вычислительной задаче.

3.3.2. Экспертные оценки для нейронной сети Перспективным направлением в информационных технологиях являются методы экспертного оценивания, используемыев виде человеко машинных процедур нового поколения [16]. Однако известные методы экспертных оценок имеют существенные недостатки, ограничивающие область его применения в нейронных сетях. Например, изменение числа рассматриваемых вариантов может также изменить предпочтения специалиста, что не учитывается при обработке экспертных данных компьютером, а существующий математический аппарат выбора альтернатив не дает выхода на общеизвестные характеристики качества (относительную погрешность, достигнутый класс точности и пр.) результатов экспертизы.

Разработанный в УрФУ метод экспертного оценивания с применением ПЭВМ сочетает в себе известные положения теории выбора и принятия решений [16] с расчетом объективных характеристик компетентности специалиста, непосредственно проводящего экспертизу [17]. Это отличает предлагаемую человеко-машинную процедуру от известных ранее способов обработки экспертных оценок технологических ситуаций и повышает надежность и достоверность результатов экспертизы. Результаты получаются в виде нормированных величин, являющих входными сигналами для нейросети. Процедура основана на математической модели экспертного оценивания, представленной системой уравнений (3.7).

Решение данной системы уравнений осуществляется согласно алгоритму, представленному на рис. 23, и реализовано, например, в компьютерной программе “Эксперт-проект”, разработанной на кафедре вычислительной техники УрФУ в системе Exсel.

А = { А1, А2, … Аi, … Аk };

К = { К1, К2, … Кj, … К m};

ФК = Д ;

КЭ = || aij || mxm ;

АЭ = || bij || kxk ;

, (3.7) D = || Dij || kxm ;

d = {a1, а2, … аm } ;

w=Dxd;

S = max { Si } ;

i =1, k.

где А– множество альтернатив;

К – множество критериев;

ФК – функция компетентности эксперта;

Д – лингвистическая переменная “Достаточная“;

КЭ – матрица экспертных оценок весов признаков аij;

АЭ матрица экспертных оценок степени пригодности bij альтернативы Аi по критерию Кj;

D – матрица относительных весов Dij альтернатив по каждому критерию;

d – собственный вектор матрицы КЭ;

w – вектор взвешенных сумм экспертных оценок для множества А;

S – взвешенная сумма экспертных оценок наилучшей альтернативы.

Результатом работы алгоритма являются нормированные значения оценок глобальных приоритетов альтернатив и распределения возможностей относительно наилучшей альтернативы.

Что необходимо учитывать при подготовке входных данных в виде экспертных оценок для нейросети?

Начало Ввод критериев, альтер натив, информационных характеристик Назначение экспертных Коррекция альтернатив, оценок, расчет приоритетов характеристик, критериев Согласован Нет ность, компетентность, достаточны?

Да Протокол результатов с выбранной альтернативой Конец Рис. 23. Алгоритм обработки экспертных оценок для нейросети Экспертное оценивание включает важный этап формализации качественных характеристик, часто имеющих место в творческой деятельности специалиста. Эти характеристики задаются на основе опыта, интуиции и квалификации эксперта. Формализация осуществляется путем перевода в баллы лингвистических переменных, используемых для сравнения вариантов:

“лучше хуже”, – “менее более”, – “примерно одинаково” и т.д.

– Поэтому компьютерную программу, эмулирующую работу нейросети следует рассматривать как эффективное дополнение к традиционным методам и приемам обработки качественной информации. Однако в связи с этим не только упрощаются, но, наоборот, повышаются требования к подготовке первичной информации на этапе, предшествующей экспертизе.

Некорректно собранная информация затрудняет операцию назначения баллов экспертом, в результате чего степень согласованности оценок может быть недостаточной.

Неудачный выбор критериев и альтернатив не позволяет найти достаточно сильные отличия в них, выражаемые числом различимых экспертом градаций и получить необходимую точность экспертизы.

Указанное имеет прямое отношение к степени компетентности специалиста, подготавливающего информационное обеспечение и проводящего экспертизу.

Подготовка информационного обеспечения в производственных условиях должна включать следующие типовые мероприятия:

– рассмотрение технологических схем действующих процессов и их оборудования для выбора альтернатив;

– подбор критериев и их информационных характеристик для последующего сравнения;

– оценка новизны: видов сырья;

машин и аппаратов;

методов обработки сырья и подготовки полуфабрикатов;

– рассмотрение способов механизации автоматизации отдельных технологических и транспортных операций, линий цехов.

Надежность результатов экспертизы должна подтверждаться метрологическими характеристиками, найденными на основе информационной теории вероятностей и ошибок и являющимися, вследствие этого, объективными показателями компетентности эксперта.

3.3.3. Эталоны для обучения нейросети Эталонные ТС необходимы для обучения нейросети. Для специалиста, решившего применить нейросеть для решения какой-либо производственной задачи встает вопрос: какие ТС из их текущей череды выбрать в качестве эталонных? По аналогии с [2] перечислим основные положения, которые необходимы соблюдать при их выборе.

1. Технологические данные для обучения должны быть представительными (репрезентативными) как в совокупности, так и каждое в отдельности. Мнение программистов “garbage in, garbage out” (“мусор на входе – мусор на выходе”) нигде не справедливо в такой степени,как в нейросетевом моделировании.

2. Будущее не похоже на прошлое. Данные, собранные запрошлый период, могут не действовать в будущем. Это важно при определении размера “временного окна” и частоты обновления технологической информации.

3. Данные должны быть типовыми для рассматриваемой ТС.

Нейросеть не может правильно решать задачи распознавания для резко отличающихся ТС, данные которых не входили в диапазон обучающего множества.

4. Набор данных должен быть сбалансирован. Необходимо стремиться к тому, чтобы информация для различных ТС в обучающей выборке была представлена равномерно, без выбросов.

В производственных условиях перечисленные требования практически реализуются в правильном выборе и обработке целевой функции, применяемой, например, при решении задачи оптимального управления. В этом случае ТС, соответствующая минимуму материальных, энергетических и информационных затрат выбирается в качестве эталона обучения. Кроме того, вид целевой функции для выбора эталонов должен отвечать следующим требованиям:

1. Согласованность. Целевая функция должна строится на известных связях между входными и выходными параметрами, приведенных к одной координате объекта и моменту времени.

2. Однозначность. Одна целевая функция должна отражать изменение только одного критерия и иметь четкий физический смысл.

3. Экстремальность (вогнутость). У целевой функции должна быть ярко выраженная экстремальная область, распознаваемая экспертом.

4. Ориентированность на конкретный критерий, определяющий экономическую эффективность ТС.

5. Соответствие. Характер целевой функции и количественные характеристики ТС должны обеспечивать успешную оптимизацию технологического процесса.

6. Управляемость. В качестве аргументов должны фигурировать технологические параметры, поддающиеся управлению с помощью нейросети.

Для удовлетворения перечисленных требований целевую функцию Fц располагают на графике в координатах X-Y (например, производительность – расход топлива), задавая последовательный ряд текущих ТС с условными номерами N1,… N12, как это изображено на рис. 24. Далее фиксируют точку оптимума с координатами XоптYопт и выбирают ТСопт с N6 как наиболее подходящую, по мнению эксперта, в данном случае к оптимальным условиям.

В реальности часто приходится наблюдать большой разброс местоположений текущих ТС на графике относительно кривой целевой функции Fц. Фактически определение положения ТСопт также представляет собой задачу распознавания объекта, каковым является ТСопт, на фоне изображения траектории технологического процесса с производственными шумами. Трудности решения такой задачи были отмечены выше, поэтому в данном случае, при выборе ТСопт в качестве эталона для обучения еще не созданной нейросети часто прибегают к производственному опыту и инженерной интуиции специалистов. Так опытный производственник может уверенно выбрать не только ТСопт, но и указать пределы изменения Х,Y, соответствующие их оптимальному, низкому и высокому значениям.

Рис. 24. Выбор оптимальной ТС в качестве эталона для обучения нейросети Построение кривой Fц в условиях производственного шума необходимо дополнять корреляционной обработкой технологической информации. При выборе эталонов следует руководствоваться величиной коэффициента корреляции r для Fц, значения которого должны быть не ниже граничных значений, приведенных в табл. 8.

Таблица Значения граничных коэффициентов корреляции в зависимости от количества ТС на графике Fц Количество 3 4 5 6 7 8 9 10 11 ТС 0,998 0,995 0,990 0,980 0,950 0,707 0,665 0,632 0,602 0, r Здесь предусмотрено, что наименьшее количество точек, по которым может быть построен график Fц равняется 3. В то же время рассмотрение большего количества, чем 12 (числа, кратного количеству недель, месяцев в году) ТС нецелесообразно из-за ограничений на кратковременную память технолога-эксперта.

Если требуется несколько эталонов, (например, для диагностики дефектов продукции) их выбирают в зависимости от сочетания технологических факторов, от которых зависят эти дефекты, пользуясь значениями их ФП:

ФП= (НЗК, ПНЖ, ОПТ, ПВШ, ВСК), (3.8) где ФП значения ФП;

квантификатор лингвистической переменной;

НЗК, ПНЖ, ОПТ, ПВШ, ВСК лингвистические переменные “низкий”, “пониженный”, “оптимальный”, “повышенный” и “высокий” соответственно.

Результаты определения эталонов сводят в обобщающую таблицу 9.

Таблица Значения технологических факторов для эталонных ТС Дефекты Д0 Д1 Д2 ДN...

N нейронов Н0 Н1 Н2 НN...

Фактор 1 ОПТ НЗК ВСК ПНЖ...

Фактор 2 ОПТ ПВШ ПНЖ ПВШ...

..................

Фактор N ОПТ ПНЖ НЗК НЗК В таблице предусматривается бездефектная (Д0) ТС, когда все технологические факторы равны своим оптимальным значениям.

Количество факторов зависит от объема базы знаний в системе автоматизированного контроля технологического процесса, а количество различаемых лингвистических переменных и дефектов продукции определяется опытом и степенью компетентности специалистов. Таким образом, уже на стадии определения эталонов в обучение нейросети закладывается коллективный опыт ведения производства обслуживающим персоналом.

Общий алгоритм действий специалиста для определения необходимых эталонов обучения нейросети аналогичен алгоритму обработки экспертных оценок и приведен на рис. 25.

Начало Ввод технологических ситуаций, построение целевой функции Выбор значимых ТС, Коррекция значимых ТС, расчет корреляции Fц вида Fц Точность, компе Нет тентность достаточ ны ?

Протокол результатов с выбранными эталонами ТС Конец Рис. 25. Алгоритм выбора эталонов для обучения нейросети 3.3.4. Факторный анализ и повышение компетентности Как отмечалось ранее, внутренняя структура нейросети представляется для пользователя в виде “черного ящика”. Однако бывает целесообразно “заглянуть внутрь этого ящика”, например, чтобы выяснить наличие и вид новых взаимосвязей между входными параметрами и элементами обученной нейросети. Для этого необходимо воспользоваться методами факторного и регрессионного анализа.

При проведении анализа, в случае отсутствия в нейросетевом пакете опции внутренней активации, для простой однослойной сети нейросети или входных нейронов с ассоциаторами (рис. 20) применяют тестовое множество входных сигналов. Например, чтобы определить вес wi в каналахRGB, тестовое множество задают в виде таблицы-матрицы комбинаций входных нормированных сигналов.

В этом примере полученная гистограмма весов составного нейрона позволяет дать сравнительную оценку чувствительности к основным цветам человеческого глаза, адаптированного, как известно, к оптическим характеристикам земной атмосферы.

Таблица Матрица входных сигналов для расчета весов внутренних связей нейросети Канал R G B N комбинации 1 1 0 2 0 1 3 0 0 0, 0, Вес, доли ед.

0, 0, 0, 0, 0, R G B Канал Рис. 26. Гистограмма весов составного нейрона Обученную нейросеть можно представить как средство вычисления функции отклика в факторном или регрессионном анализе. В этом случае входные переменные нейросети будут представлять факторы, а их сочетание определять входной вектор X в факторном пространстве по выражению транспонированной матрицы:

X= (x1,..., xn)Т, (3.9) где X – входной вектор.

Для оценки влияния на функцию отклика факторов её представляют в виде уравнения регрессии аддитивных составляющих fi (i=1 … n):

Y(X) = f1(x1) + f2(x2) + … + fi(xi)… + fn(xn), (3.10) где Y(X) функция отклика;

xi факторы (входные переменные).

Обычно в качестве первого приближения принимают линейный вид функций fi. В этом случае функция отклика Y(X) определяется следующим образом:

n Y ( X ) = i xi, (3.11) I = где Y(X) функция отклика;

i коэффициенты регрессии;

xi факторы (входные переменные).

Коэффициенты регрессии i характеризуют чувствительность функции отклика к соответствующим факторам и находятся, например, методом наименьших квадратов при корреляционной обработке данных.

Для целевой функции коэффициент множественной корреляции отражает размер относительной дисперсии точек модели 2 по сравнению с дисперсией значений отклика y2, так как 2/ y2 = 1 – Ryx2. Для оценки значимости каждого фактора следует использовать показатель в виде (Ry2 – Ryx2), %, (3.12) где Ry, Ryx коэффициенты множественной корреляции, определяемые для случая наличия всех факторов и при отбрасывании рассматриваемого фактора, соответственно.

При выполнении факторного анализа с помощью нейросети выбирают базовую ТС, которая, как правило, входит в обучающее множество. Базовая ТС характеризуется входным вектором:

Xб= (x1б,..., xnб)Т, (3.13) где Xб входной вектор;

x1б,..., xnб численные значения факторов входного вектора ТС, выбранной в качестве базовой.

Если определяют влияние факторов на прогнозируемые во времени значения функции отклика по формуле (3.10), то в качестве базовой ТС задают ТС, расположенную последней по ходу времени в заданном временном окне.

Далее выбирают необходимый или определяющий фактор (например, xi), значения которого линейно изменяют в пределах 10% от xiб. Для установления характера функции fi производят расчеты с помощью нейросети, варьируя значениями xi и оставляя при этом постоянными на базовом уровне величины других факторов.



Pages:     | 1 || 3 |
 





 
© 2013 www.libed.ru - «Бесплатная библиотека научно-практических конференций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.