авторефераты диссертаций БЕСПЛАТНАЯ БИБЛИОТЕКА РОССИИ

КОНФЕРЕНЦИИ, КНИГИ, ПОСОБИЯ, НАУЧНЫЕ ИЗДАНИЯ

<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ


Pages:     | 1 || 3 | 4 |

«МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ ДЕПАРТАМЕНТ ОБРАЗОВАНИЯ ГОРОДА МОСКВЫ ГОСУДАРСТВЕННЫЙ ...»

-- [ Страница 2 ] --

(Примечание: ниже, в разделе, посвященном ступени трансформации менеджмента проекта ИС вопросы энтропийных и энтальпийных оценок рассмотрены подробнее).

Вычисление энтропии Нв(а) двух объектов обмена информацией А и В осуществляется следующим образом:

• определяется число информационных морфизмов Iq(a) между объектами А и В (в дуплексном режиме информационного обмена). Здесь q отображает категорию структурированных упорядоченных подмножеств знаний. Для оценки величины Iq(a) удобно воспользоваться матрицей Александера (см. ниже) или любой иной моделью сравнений в морфологическом анализе информационного наполнения систем.

• аналогично определяется число Inoq(a), характеризующее число модулей хаотических, неупорядоченных знаний, придающих системе стохастичность. Здесь noq отображает категорию хаотических, неупорядоченных знаний.

В частном предельном случае можно полагать состояние информационного объекта А условно упорядоченным по отношению к объекту В (например, проектируя объект В в сравнении с эталонным прототипом А, допустим, проектируя собственный образовательный портал в сравнении с эталонным Федеральным порталом "Российское образование"). Тогда информационную энтропию взаимодействующей интегрированной системы А-В можно интерпретировать как меру хаотичности или как меру отклонения структуры состояния одного объекта от другого. Изменение этого отклонения вследствие тех или иных проектных действий, эмиссии\ремиссии объекта В (объект А - условно статичен), дрейфа энтальпии объектов А и В или вследствие любых иных причин приводит к появлению НЕГЭНТРОПИИ (разности энтропий) комплексной системы А-В, величина которой наглядно свидетельствует об изменении эмерджентности системы (по Хартли коэффициента эмерджентности ИС). Здесь под негэнтропией понимается изменение энтропии системы взаимодействующих объектов А и В.

В соответствии с принципом максимума информационной энтропии Джеймса наиболее вероятным состоянием информационной среды системы А-В будет то состояние, когда информационная энтропия максимальна. В открытых Интернет пространствах это именно так. В корпоративных замкнутых средах такой тезис каждый раз требует проверки. В распределенных информационных корпоративных средах энтропия весьма высока при очень большом количестве модулей, образующих информационную структуру, а число информационных морфизмов Iq между объектами, наоборот, мало. Минимум этого числа есть предельный ограничитель устойчивости состояния информационной среды системы с позиций ее релевантности.

В проектной деятельности достаточно эффективным средством преодоления этого опасного минимума является технология ИНФОРМАЦИОННОЙ НАКАЧКИ.

Технология представляет собой структурное сопряжение, возникающее в результате рекуррентных информационных морфизмов двух или большего числа информационных систем. Именно такая технология часто используется для быстрого эффективного контентного наполнения создаваемых новых информационных образовательных порталов, в которые закачиваются модули уже существующих положительно себя зарекомендовавших образовательных порталов, сайтов и библиотек.

05.06. Эмерджентность Эмерджентность - новое свойство (информация), появившееся в результате объединения элементов в систему. Эмерджентное развитие характеризует скачкообразное развитие системы. Эмерджентность - самоорганизация в систему из многочисленных, на вид хаотически взаимодействующих элементов. В наиболее общем смысле эмерджентность есть мера системности.

j - коэффициент эмерджентности Хартли - уровень системной организации объекта, имеющего W - чистых состояний [http.:// lc.narod.ru/aidos/aidos02/3.1.3/3.1.3htm].

Эмерджентность измеряется коэффициентом эмерджентности. По А.А. Харкевичу коэффициент эмерджентности определяет степень детерминированности системы. Коэффициент равен единице при полностью детерминированной системе, равен нулю при совершенно случайной системе.

Понижение уровня системности, также как и степени детерминированности системы приводит к ослаблению влияния факторов на поведение системы, то есть к понижению управляемости системы за счет снижения роли каждого отдельно взятого воздействующего на систему фактора.

Частное следствие для обучающих систем: повторные обучающие выборки приводят к снижению степени детерминированности системы.

Коэффициент эмерджентности Хартли представляет собой относительное превышение количества информации о системе при учете системных эффектов (смешанных состояний, иерархической структуры ее подсистем, системы запретов и т.п.) над количеством информации без учета системности, то есть этот коэффициент отражает уровень системности объекта. Коэффициент эмерджентности Хартли отражает уровень системности объекта и изменяется от единицы (системность минимальна, то есть отсутствует) до отношения W/LogW по основанию 2, где W количество чистых классических (вне запретов) состояний системы (системность максимальна). Очевидно, для каждого количества элементов системы существует свой максимальный уровень системности, который никогда реально не достигается из-за правил запрета на реализацию в системе ряда подсистем различных уровней иерархии в ансамблях уровней иерархии системы. Здесь под системой правил запрета понимается информационный проект системы – основной результат работы над проектом ИС на ступени дивергенции полного менеджмента проекта ИС.

Отсюда строится системная численная мера количества информации в ИС на основе оценки эмерджентности системы (по Хартли и А.А. Харкевичу):

I = LogF(W), где логарифм исчисляется по основанию 2;

I - количество информации ИС с учетом системы запретов в ней и при соблюдении принципов аддитивности, соответствия и эргодичности;

F(W) - степенная функция W-количества чистых состояний системы в степени j, равной коэффициенту эмерджентности Хартли.

Согласно А.А. Харкевичу (теория цели в теории информации) количество информации, сообщенное объекту, можно измерять по изменению вероятности достижения цели P(A) этим объектом за счет использования им этой информации.

Достижение цели зависит от мощности пространства будущих состояний объекта управления, в том числе от количества его целевых состояний.

Следствием является закон возрастания эмерджентности: чем больше элементов в системе, тем большую долю от всей содержащейся в ней информации составляет системная информация, но по мере увеличения числа элементов скорость увеличения доли системной информации в ней возрастает с ускорением, которое постепенно уменьшается. При этом сложность системы зависит как от количества содержащейся в ней информации, так и от характера взаимосвязей между элементами системы. Чем выше уровень системности, тем большая доля информации системы содержится во взаимосвязях ее элементов. Чем меньше элементов в системе, тем быстрее возрастает доля информации, содержащейся во взаимосвязях элементов при возрастании уровня системности.

Генезис и интерпретации системной эмерджентности теории информации трактуются следующим образом:

Системное обобщение эмерджентной модели Хартли-Харкевича учитывает как взаимосвязи между признаками (факторами) и будущими, в том числе целевыми состояниями объекта управления, так и мощность множества будущих состояний объекта управления. Кроме того, оно объединяет возможности интегрального и дискретного описания объектов, учитывает уровень системности и степень детерминированности описываемой в проекте системы.

По мнению автора настоящей работы в общем случае вероятность достижения цели P(A) объектом A в теории эмерджентности должна определяться по формуле полной вероятности. Согласно такому подходу, в случае, если событие А происходит вместе с одним из событий полной группы событий на систему Н1, Н2,…..Нn = Hi или является следствием одного из них, вероятность события А вычисляется как сумма произведения вероятностей каждой гипотезы Hi шага i на вероятность события при этой гипотезе, то есть:

P(A) = Р(Н1)Р(А/Н1) + Р(Н2)Р(А/Н2) + …..+ Р(Нn)Р(А/Нn) Тогда, используя известную теорему умножения вероятностей, согласно которой вероятность произведения независимых событий равна произведению вероятностей этих событий, а также приведенную выше формулу полной вероятности, можно перейти к теореме гипотез для эмерджентных оценок величины P(A) (или, то же самое, к формуле Бейса). Теорема отвечает на вопрос, как изменяется вероятность гипотез Н1, Н2,…..Нn = Hi в связи с появлением в системе некоего события А, например, происходит изменение числа чистые состояний W системы (числа запретов) на приращение del W вследствие отражения атаки на информационную систему.

В конечном виде теорема гипотез для этого случая имеет вид:

P(Hi\A) = P(Hi)P(A\Hi) : (P(H1)P(A\H1)+(P(H2)P(A\H2)+...+(P(Hn)P(A\Hn)) где i = 1, 2,…..n, или для рассматриваемого выше примера изменения числа свободных состояний системы W под воздействием на систему атаки в теории эмерджентности:

P(Hi\A) = P(W2)P(A\H2) : (P(W1)P(W1\H1)+(P(W2)P(A\H2)) = P(W+delW\A) Отсюда виден переход к оценке количества информации I = LogF(W) и коэффициента эмерджентности j как до, так и после воздействия на систему, а также к определению энтропии (негэнтропии изменений системы), как это будет показано далее.

Нетрудно заметить, что возможность прямого сложения составляющих вероятностную функцию частей всецело опирается на свойство аддитивности применяемой и исследуемой модели поведения или семантики ИС. Нарушение этого свойства в силу динамических и нелинейных процессов лишает исследователя возможности корректно использовать энтропийные обобщенные (обобщенная энтропия) и даже условные оценки (условная энтропия) – по крайней мере, до следующего восстановления аддитивности в окрестностях следующего достигаемого аттрактора устойчивого состояния системы. Видимо, могут существовать различные подходы, определения и теоремы для выявления достаточности аддитивности в любой точке существования функции;

автором же исследована и опубликована интересная модель такого рода проверок на основании оценки принадлежности рассматриваемой функциональной области пространству Лебега, как и само понятие аддитивности допускающему любую гладкость истечения функции при обязательных условиях ее непрерывности и исчисляемости в интересующей области (это, весьма многостраничное решение, в настоящей работе не приводится).

В конечном счете, приведенный выше аналитический подход к моделированию эмерджентности ИС представляет один из многих вариантов реализации основной модели, связанной с переходом от той или иной оценки количества информации к вероятностям ее изменений или изменений состояний системы с последующим неизбежным переходом к заключительной энтропийной оценке системы и ее состояний.

Если использовать краткую классификацию мер количества информации К.Морриса, то можно получить синтаксические, семантические и прагматические меры. Две последние характеризуют показатели, характеризующие информационное наполнение системы, связанные с сущностью отражаемых информацией явлений и предметов.

Важную роль при оценке семантической меры информации имеет распределение Ципфа, записываемое в частотной дифференциальной форме, в частотной интегральной форме, в ранговой дифференциальной форме или в ранговой интегральной форме. Наряду с количеством информации распределение Ципфа, как и другие распределения, позволяет исследовать выборки модулей информационного наполнения на релевантность модулей по отношению к запросам в ИС (через различные «коэффициенты истинности» информации), на соответствие времени получения информации предельно допустимому или среднему временному параметру и на другие свойства и параметры, а уже отсюда сформировать модель эмержентности системы и перейти к энтропийной\энтальпийной заключительной оценке достоинств проектируемой информационной системы.

06. СТУПЕНЬ ТРАНСФОРМАЦИИ ПОЛНОГО МЕНЕДЖМЕНТА ПРОЕКТА 06.01. Общие замечания к ступени трансформации На этой ступени описывается техническая и технологическая реализация замыслов, рассмотренных на предыдущей ступени дивергенции полного менеджмента проекта. В отношении КОНТЕНТА завершаются ранее выполненные процедуры его структурирования и разделения на уровни по мере защищенности, устойчивости, чувствительности и т.п. Окончательно формируется ранее выделенный ТЕЗАУРУС, из него, в свою очередь, выстраиваются КАСКАДЫ КЛЮЧЕВЫХ СЛОВ, выносимые в перечень ключевых слов РПЗ к проекту. Далее осуществляется окончательное выстраивание атрибутов поиска (по типу, в алфавитном порядке, по глубине и географии, дате, ключевым словам и т.п.), уточняется КАТАЛОГИЗАЦИЯ информационного ресурса (обычно тезауруса), сопровождаемая разработкой МЕТАОПИСАНИЙ ресурса и адресацией по поиску.

Осуществляется, точнее завершается, логическое и физическое структурирование системы.

В самом общем виде простейшая структура ИС выглядит следующим образом:

Рис.1. Обобщенна структурная схема относительно простой ИС Для реализации выбранной структуры ИС привлекается и апробируется набор интегрированных пакетных решений в сфере программного обеспечения, а для вновь создаваемого или модернизируемого программного продукта выбирается инструментарий разработки (например, CASE - инструментарий). Разрабатываются и модернизируются интерфейсы, приложения, методики работы с ИС. В синтезированную таким образом ИС загружаются многомодульные (многофайловые) КОНТЕЙНЕРЫ контента и его МЕТАДАННЫХ, после чего система инсталлируется и апробируется в ограниченном информационном пространстве на работоспособность и предварительную оценку эффективности.

В завершающей части ступени трансформации еще раз обследуются интерфейсы, особенно пользовательский, на предмет их улучшения, для чего в проект обязательно вводится небольшой раздел, посвященный социализации проекта (информационно-социальные технологии), технико-эстетическим исследованиям и эргономическим обоснованиям проектных решений. На основании всех выше перечисленных позиций разрабатываются, на практике апробируются и утверждаются заказчиком инструкции всем уровням пользователей (различным администраторам, модераторам, гостям), а также инструкции по инсталляции, диагностикам, восстановлениям, модернизациям и экологически информационно чистой ликвидации (деинсталляции) системы.

06.02. Аналитические исследования и расчеты ИС на ступени трансформации менеджмента проекта. Семантико-энтропийный подход В приведенном выше обобщенном перечне вопросов, традиционно рассматриваемых на ступени трансформации ПЖЦ проекта пока совершенно не прозвучала самая принципиальная и сложная расчетно-аналитическая часть проекта ИС, базирующаяся на синергетическом семантико-энтропийном подходе к проектированию ИС и использовании современных математических моделей определения полного жизненного цикла (ПЖЦ) ИС. Именно эти вопросы являются наиболее интересными с точки зрения сложной актуальной проблемы семантического анализа информации, ее гармонизации и, отсюда, возможностей упреждающего проектирования высокоэффективных ИС с предсказуемым успешным развитием на весь предусмотренный ПЖЦ, обычно не менее 5 лет.

Синергетический энтропийный подход при семантическом анализе информационных массивов ИС и событий как в ИС так и вне ИС позволяет проектировщику:

• конкретизировать семантические показатели, создавая предпосылки для корректного определения производительности и надежности проектируемой ИС;

• уточнить и использовать методологию морфологического анализа информационных массивов на семантическом уровне, что, в свою очередь, предоставляет возможности оптимальных гармонизации, нормирования и снижения стохастичности информационного наполнения системы;

• отрегулировать модель информационного морфизма между проектируемым изделием и его окружением в мировом открытом, корпоративном и локальном информационном пространстве;

• сформулировать и использовать методику и расчетный формуляр прогнозирования полного жизненного цикла (ПЖЦ) ИС (по заданным фьючерсам тренды полосы информационного наполнения, энтропия и энтальпии системы) при соблюдении информационной экологической чистоты спроектированного продукта;

• обосновать и практически использовать возможность совершенствования созданной ИС в пределах всего ПЖЦ по показателям производительности, надежности, защищенности, энтропии и энтальпии.

Ступень трансформации – самая подходящая фаза проекта для всестороннего исследования указанных вопросов, поскольку на следующей ступени менеджмента – КОНВЕРГЕНЦИИ – проектанта ждут задачи инженерных расчетов основных параметров и характеристик уже созданной системы, всецело опирающиеся на результаты аналитической части работ на ступени трансформации полного менеджмента проекта ИС.

Представляется затруднительным в достаточно стройном виде перечислить и характеризовать основные этапы и направления всех возможных траекторий этого анализа. Здесь многое зависит как от особенностей проектируемого изделия, так и от интуиции, вкусов и знаний проектировщика. Поэтому ограничимся кратким аннотированным авторизированным перечнем, позволяющим составить представления о возможностях такого анализа в исследованиях и оптимизации ИС по морфологическим, семантическим и инфологическим признакам.

Приведем этот перечень по тематическим группам в несколько сокращенном описательном виде (в более полном виде перечень развернут в авторском учебно методическом комплексе по проектированию ИС и порталов).

06.03. Аналитическое определение полного жизненного цикла (ПЖЦ) ИС и порталов Для обеспечения ПЖЦ ИС проектными мерами, прежде всего, следует определить аналитическое значение ПЖЦ. Это позволяет оценить достижимость заданного в ТЗ срока эксплуатации изделия и увидеть, какие параметры системы наиболее всего влияют на ПЖЦ. Следовательно, лучше всего прибегнуть к вариативному подходу, используя метод встречных и параллельных вариаций.

В качестве конкретных математических моделей расчета ПЖЦ можно предложить достаточно их широкий выбор, в том числе:

• идеализированная модель ПЖЦ на основе экспоненциального распределения потока событий в ИС (наиболее простой и наименее точный подход);

• модернизированное Гамма-распределение экспоненциального распределения потока событий в ИС (для случая условно детерминированной тенденции изменения параметров формы распределения во времени);

• интегральный закон распределения (распределение Парето) – что соответствует условиям невыраженной детерминированности изменений параметров формы во времени;

• распределение Гомперца-Макегама как инструмент прогнозирования длительности ПЖЦ (с использованием математического аппарата метода Монте-Карло);

• математические модели стохастических систем с дискретными состояниями и непуассоновскими переходами (включая определение плотности маргинального распределения параметра формы);

• численный метод решения интегрального уравнения Фредгольма первого рода с ядром, равным характеристической функции экспоненциального распределения;

• метод рандомизации числа условных состояний (псевдосостояний) – то есть исследование потока Эрланга, описываемого системой линейных дифференциальных уравнений Колмогорова;

• редуцированное решение распределений событий в ИС потока Эрланга к потоку Пойа-Лундберга (то есть к потоку Эрланга со случайными интенсивностями переходов);

• другие методы, решения и методики.

Найденное расчетным путем значение ПЖЦ ИС является базовой величиной для всех последующих исследований и расчетов, где фигурирует время функционирования ИС, например, в расчетах надежности, производительности и в других оценках на всех фьючерсах тренда ПЖЦ ИС. На весь временной период распространяются требования по проверке проекта на соответствие стандартам.

06.04. Ассамблеи информационного ресурса ИС – поле для аналитических исследований проектируемой системы Напомним, что еще на ступени дивергенции проектант составляет и структурирует таблицы модулей информационного наполнения ИС. Простановка возле каждого модуля (аргумента в виде размеров модуля в битах или байтах) функции, отражающей вероятность события в виде отклика именно этого модуля приводит к образованию так называемой АССАМЛЕИ информационного ресурса ИС. В принципе, ассамблея есть ни что иное как матрица вероятностей событий (или иных функций) системы по отношению к полному набору входящих в нее модулей. С этой точки зрения в адекватном смысле можно толковать фигурирующий в специальной литературе близкий термин «КОЛЛЕКЦИЯ».

В общем случае по формуле Хартли количество информации I(U), как характеристика того или иного ансамбля U оценивается как I(U) = log N, где U – число модулей (элементарных семантических единиц в ансамбле), N – число возможных проявлений в ансамбле. Согласно принципу аддитивности для нескольких ансамблей одной системы совокупное количество информации есть сумма приведенных выше логарифмических оценок каждого из них или логарифм произведения чисел модулей во всех этих ансамблях.

Как уже отмечалось, функцию ансамбля наиболее полно отражает его энтропия.

Энтропия сомножества ансамблей есть простая сумма их энтропий. Это нисколько не противоречит приведенной выше оценке количества информации, так как согласно А.Л. Брюллену «информация представляет собой отрицательный вклад в энтропию».

Первое затруднение, с которым сталкивается проектант в анализе ассамблеи (коллекции), заключается в выборе одного из двух альтернативных подходов:

1. события на выходе системы (подсистемы) равновероятны для всех модулей;

2. события на выходе системы имеют различную вероятность для различных модулей, поскольку временные и энергетические (энтальпийные) затраты на них различны из-за разных размеров модулей, расширений, защищенности и других факторов или в случае разнесения приоритетов обслуживания старших и младших уровней системы.

Безусловно, в общем случае верно только второе утверждение. Однако, его реализация связана с большими объемами вычислительной работы при совершенно неопределенных выигрышах от такой точности определений.

Поэтому в ряде ситуаций можно рассматривать в качестве ассамблеи ИС или контейнеров ИС матрицу функций, отражающих итоговые накопленные значения размеров всех модулей (включая все сопровождающие дополнительные расходы дискового пространства на сервисы и обслуживание модулей) или итогового времени откликов модулей на запросы.

Второй вопрос: прерывность или непрерывность событий, а отсюда все последующие расчеты для дискретных или непрерывных распределений событий.

Проектировщик может выбрать любую (здесь дальнейшее рассмотрение опирается на дискретную модель).

Третий вопрос: одномерное, двумерное или многомерное распределение событий. В конечном счете, число мер отражает возможное число трансформаций информации в процессе ее переходов. Но и этот подход связан с субъективной позицией проектанта в смысле избранного им способа разделения частей системы для последующего анализа. Так, можно рассматривать системный подход на двумерной основе, соотнеся две меры отдельно к событиям на выходе ИС и в самой ИС.

Двумерный подход удобен для анализа двухуровневых систем «ядро – информационное окружение». Можно оперировать моделью двумерности также по отношению к двум взаимосвязанным ассамблеям двух ИС, обменивающихся информацией (например, в случае реализации зеркалируемых систем), где каждая из двух мер отражает вклад в совокупность объединенной общей ассамблеи. С тем же успехом можно считать многомерными ассамблеи территориально распределенных баз данных, рассматривая число адресных разбиений (узлов) как число мер ассамблеи.

Совершенно очевидно, что следует всячески избегать неоправданных усложнений анализа, а потому, по возможности, удобнее всего анализировать ассамблею как одномерную, Поэтому в дальнейшем изложении речь идет в основном об одномерных ассамблеях, хотя общеизвестные математические справочники дают достаточно установок для перехода к многомерным и двумерным рассмотрениям.

06.05. Числовые характеристики ассамблей информационного наполнения Можно рекомендовать взять за основу следующую последовательность определения числовых характеристик одномерных распределений вероятностей событий (а также распределения размеров или времени обработки модулей) в ассамблеях ресурсного наполнения ИС:

1. определение квантилей порядка одномерного распределения (медианы распределения);

2. определение характеристики положения – математического ожидания (центра распределения);

3. определение характеристики положения – медианы;

4. определение характеристики положения – моды непрерывного распределения (точки максимума плотности распределения вероятностей событий) или моды дискретного распределения;

5. определение характеристики рассеяния – дисперсии;

6. определение характеристики рассеяния – среднего квадратичного отклонения (стандарта);

7. определение характеристики рассеяния – коэффициента вариаций;

8. определение характеристики рассеяния – среднего абсолютного отклонения;

9. определение характеристики рассеяния – интерквартальной широты (то есть широты в пределах наиболее интересной части распределения от 10% до 90%);

10. определение характеристики рассеяния – размаха (разности между наибольшим и наименьшим спектральным значениями);

11. определение характеристики рассеяния – определение полушироты одномодального распределения;

12. определение ассиметрии и эксцесса – через моменты коэффициента асимметрии;

13. определение ассиметрии и эксцесса – через моменты коэффициента эксцесса;

14. определение асимметрии и эксцесса – Пирсоновской меры асимметрии для одномодального распределения;

15. определение ковариаций и коэффициентов корреляции (в основном в многомерных распределениях вероятностей событий в ассамблеях);

16. исследования регрессий и коэффициентов корреляций в совместном анализе сомножества ассамблей;

17. исследования сходимости по вероятностям вследствие принятых допущений и ограничений (см. выше);

18. исследование и улучшение коэффициента активности контента ассамблей ИС на основе продолжения морфологического анализа, начатого еще на ступени дивергенции менеджмента проекта;

19. решение специальных аналитических задач для ИС с особо сложной инфологией, таких как использование математического аппарата производящих функций (энумераторов) и теоремы Пойа для задач с неопределенным характером повторяемости событий для одних и тех же элементов, распределение Ципфа для задач, связанных с учетом решающего значения прироста энтропии системы в обеспечении эффективности системы, исследований фреймовых моделей и архитектур в задачах управления знаниями и обслуживания распределенных многоузловых систем и многих других специальных задач анализа.

Приведенный выше список следует рассматривать как инвариантный модульный конструктор, поскольку выбор из него тех или иных модулей зависит от многих причин, главная из которых, своего рода, водораздел - детерминирована, недетерминирована или слабо детерминирована исследуемая функция. Более того, далеко не всякий проект нуждается в таком глубоком сложном всестороннем исследовании, как это следует из обозначенного выше списка. Однако, зрелый проектант-исследователь обязан в полной мере ориентироваться в сущности, назначении и возможностях описанных выше аналитических приемов и обоснованно выбирать и использовать те из них, которые позволят достаточно достоверно и убедительно оценить и обеспечить высокую (требуемую) эффективность создаваемой системы. Более того, возможны и даже полезны отдельные упрощения, вступающие в незначительные рассогласования с рекомендациями строгой математической науки теории вероятностей. Так, например, практика расчетов ИС со средним уровнем объема неплохо нормированного информационного наполнения показала, что существенно облегчающая расчеты замена математического ожидания среднеарифметическим значением не приводит к заметным ошибкам.

Другой вариант: в учебном пособии «Теория статистки» для ВШ (с грифом Минобразования РФ) В.М. Гусарова рекомендовано помимо средней арифметической пользоваться средней гармонической. Дело в том, что вид средней определяется характером взаимодействия определяющего показателя с усредняемым. Средняя арифметическая применима в случаях, когда известны варианты варьирующего признака x и их частоты f. Когда статистическая информация не содержит частот f по отдельным вариантам x совокупности (ассамблеи), а представлена как их произведение, применяется формула средней гармонической взвешенной. Средняя гармоническая является средней взвешенной из варьирующихся обратных значений признака.

Однако, к различным изменениям и упрощениям надо относиться достаточно осторожно, каждый раз оценивая возможные ошибки и последствия таких действий проектанта. Выполняя эти исследования, прежде всего надо видеть их конечную цель:

оценку и улучшение генерального показателя качества ИС (энтропии или негэнтропии ИС), а также поиск улучшения показателей ИС в результате снижения асимметрии, нормирования и гармонизации ресурса, других оптимизационных решений.

06.06. Расчеты и улучшение энтропии (негэнтропии) и энтальпии – вершина и заключительная часть аналитических исследований проектируемой информационной системы.

Определение энтропии (негэнтропии) ИС представляется самой принципиальной частью аналитической оценки дееспособности проектируемой ИС.

Вопрос этот сколь важен, столь и запутан в ряде множества публикаций по этому поводу на протяжении немалого числа лет. Не втягиваясь в полемику с возможными оппонентами ограничимся толкованием энтропии, энтальпии и негэнтропии в видении автора настоящей публикации, опирающимся, впрочем, на труды таких известных ученых, как М. Брой, Е.С. Вентцель, А.Н. Колмогоров, А.Я. Савельев, А.А. Харкевич и других.

Согласно Е.С. Вентцель (Учебник для вузов «Теория вероятностей») «…понятие об энтропии является в теории информации основным». Эту же точку зрения разделяют многие авторы, а потому определение энтропии следует вводить в проект ИС как важную и очень интересную аналитическую часть проектирования ИС.

Во-первых, определимся под энтропией понимать количественно измеряемую меру неопределенности информации, в то время как под негэнтропией понимаем приращение продуктивной информации, то есть снижение неопределенности.

Во-вторых, потребность иметь воспроизводимость количественной оценки энтропии (негэнтропии) при любом количестве повторений опытов (расчетов) предписывает ей эргодическое свойство. Это означает, что каждая из реализаций ассамблей или коллекций обладает при любых изменениях ИС одними и теми же повторяющимися свойствами: средним значением модуля, вокруг которого происходят колебания, и средним размахом этих колебаний. Усредняя эти значения для исследуемой реализации получаем приближенные значения математического ожидания исследуемой функции, а усредняя квадраты отклонений от среднего, получаем приближенные значения дисперсий и т.д. Проверка этой возможности есть обоснование правильности энтропийной оценки функциональности ИС, а потому она и производится согласно описанной в предшествующем разделе последовательности.

В третьих, принимаем за основу непрерывность и монотонность изменения энтропии системы при любых некатастрофических (без коллапса) изменениях с системой и в ее информационном окружении.

Наконец, в четвертых, для соединения частных оценок энтропии отдельных частей в единое целое надо располагать возможностью складывать в общий результат полученные функции (результирующие вероятностные характеристики подсистем, частей ИС), полагая, что сумма этих функций равна функции произведения всех аргументов. То есть необходимо использование свойства АДДИТИВНОСТИ. Известно, что таковое свойство присуще исключительно логарифмической функции, для которой сумма логарифмов ряда аргументов равна логарифму произведения всех этих аргументов.

В итоге приведенных выше рассуждений приходим к версии энтропийной оценки согласно трактовки Е.С. Вентцель в упомянутом выше учебнике: «…энтропией системы (H(X)), отражающей меру ее априорной неопределенности, является сумма произведений вероятностей (Pi) различных состояний (Xi) системы на логарифмы этих вероятностей, взятых с обратным знаком»:

n H ( X ) = pi log pi i = для ассамблеи вида:

Х1 Х2 Х3 ….. Хn p(X1) p(X2) p(X3) ….. p(Xn) – для оценки H(Х) по вероятностям событий;

F(X1) F(X2) F(X3) ….. F(Xn) – для оценки H(Х) по размерным, временным и иным характеристикам, где на некую функцию Fi условно переносится физический смысл вероятности Pi, что иногда встречается в специальной литературе. Так, например, функция Fi может отражать полный размер временных или байтовых затрат на транзакцию ЭСЕ размером Хi. Простенький пример, комментирующий возможность такого подхода: в системе Microsoft Word на сохранение на жестком диске и обслуживание любого текстового файла размером Xi требуется дисковое пространство больше этой величины, то есть Xi + A, где А больше нуля. Соотношение величины А к сумме Xi + A дает проектировщику ИС количественный материал для построения некоей величины F(Xi) исследуемой ассамблеи.

Запись формулы определения H(Х) отражает приведенную выше таблицу, где в верхней строке аргументами перечислены возможные состояния системы, а в нижней – функциями соответствующие вероятности этих состояний или их количественные характеристики. Такие таблицы состояний, собственно, представляют собой ассамблеи тех или иных разделов, частей контента ИС.

Согласно ряду публикаций выбор основания логарифма в формуле энтропии не всегда важен, так как в последующих расчетах относительной энтропии в результате алгебраических сокращений роль этого выбора утрачивается. Однако, для оценки энтропий машинных двухзначных кодов обычно берут основание два;

по умолчанию для сложных систем часто пользуются основанием десять. Для достаточно мощных ИС иногда берут натуральное основание логарифма исходя из Пуассоновского закона распределения событий при очень большом числе модулей.

В случае умеренной дисперсии в распределении этих событий можно полагать, что система отличается равновозможными состояниями в отношении всех модулей исследуемой ассамблеи (коллекции). В этом случае задача энтропийной оценки весьма упрощается, поскольку для системы с равновозможными состояниями энтропия равна логарифму простого числа состояний, а сама величина энтропии системы уменьшается (увеличивается негэнтропия). Поэтому усилия проектировщика по введению мер, уменьшающих величину асимметрии, а также эксцесса всегда оправданы.

Энтропийные оценки ИС могут иметь как более простые, так и углубленно специальные толкования. Например, наряду с обобщенным показателем энтропии ИС в литературе занимают достойное место вариационная энтропия, информационная энтропия взаимодействующих объектов, обменная энтропия, относительная энтропия, квантовая относительная энтропия, условная энтропия, энтропийная корреляция и другие понятия.

Важнейшее удобство энтропийной оценки эффективности сложных ИС: при любом объединении независимых ИС или переконфигурировании ИС их энтропии просто складываются. Конфигурирование, связанное с введением одной системы в другую, имеет в этом же рассуждении ту особенность, что энтропия объединенной ИС равна энтропии одной из них плюс условная энтропия второй (вводимой) системы.

Таким образом в расчетах энтропии ИС кроме ее основных средних значений появляются так называемые условные энтропии, характеризующие степень неопределенности системы, остающуюся после того, как полностью определилось состояние видоизмененной системы (например, когда произошло видоизменение фреймовой структуры системы управления знаниями в результате воздействий процедур-демонов. Немаловажно учитывать также, что полная взаимная информация, содержащаяся в системах, одна из которых является подчиненной, равна энтропии подчиненной системы.

Приведенная выше трактовка полной взаимной информации сложной системы через энтропии ее подчиненных частей невольно подталкивает исследователя ИС к результирующей оценке ИС через более обобщающий показатель, чем сама энтропия.

Таким показателем согласно многим авторам является НЕГЭНТРОПИЯ (иногда пишут «негоэнтропия», как бы подчеркивая то обстоятельство, что негэнтропия отнюдь не является величиной, обратной энтропии).

Опять же, не втягиваясь в имеющую место полемику по поводу трактовки термина негэнтропии, ограничимся простым и ясным постулатом: негэнтропия как мера информативности системы есть величина, характеризующая уменьшение энтропии в результате тех или иных действий в системе. Так трактует этот термин современная наука «инфодинамика», опирающаяся прежде всего на второй закон термодинамики.

Отсюда, негэнтропия любой системы есть разность начальной и конечной энтропий, полученная в результате происходящих в системе изменений. Впрочем, опираясь на ряд публикаций, можно использовать понятие относительной негэнтропии, под которой понимается отношение энтропии системы в новом состоянии (или на выходе) к энтропии в исходном состоянии ( или к внутрисистемной энтропии).

Оба эти подхода открывают перед проектировщиком возможность проводить сравнительные исследования систем и их частей между собой или сравнивать информативность систем по соотношению энтропий на их выходе к внутрисистемным.

Эти исследования можно проводить на всех запланированных фьючерсах ожидаемого тренда полосы информационного наполнения ИС на всех этапах ПЖЦ проекта, получая наглядную красивую графическую иллюстрацию ПЖЦ (осциллятор, полосу Боллинджера и т.п.).

Завершает картину энтропийного анализа ИС оценка энтальпии системы. По поводу этой оценки развернутая полемика в специальной литературе пока отсутствует, что даже несколько странно. Термодинамика рассматривает энтропию и энтальпию любых физических процессов в совокупности. К тому же энтальпия в отличие от энтропии не является вероятностной оценкой некоей функции ИС, а носит признаки вполне конкретной количественной оценки мощности, потенциала, размеров системы, точно также как в термодинамике все физико-химические превращения и связанные с ними тепловые поглощения и выделения оцениваются через энтальпию с позиций совокупных изменений давления и температуры среды этих превращений с учетом замкнутости или разомкнутости системы.

В наиболее обобщенном случае энтальпия ИС есть ни что иное, как результат сложения двух ее значимых частей: свободной энтальпии и связанной энтальпии.

Под связанной энтальпией здесь понимается объем информации, занимаемый на дисковых пространствах, обслуживающих ИС по всем совокупным признакам ее функционирования, хранения, защиты, диагностики, развития и т.п. Сюда входят все ассамблеи (коллекции) контента, все средства программного обеспечения, адресации, сопровождения, защиты, фильтрации, транспортировки и т.п. Проектировщик волен сам выстроить всю цепочку этих объемов информации в виде простой суммы, желательно, проявив максимум скрупулезности. Свободная часть энтальпии отражает заготовленное, но еще не занятое, резервное или высвободившееся пространство, предназначенное именно для данной ИС. Отношение связанной части к полной энтальпии представляет коэффициент использования ИС. Очевидно, что чем ближе этот коэффициент к единице, тем полнее использован потенциал проекта, но тем меньше резервных возможностей для расширения контента, введения новых приложений, усиления средств защиты и надежности и т.п. Этот же баланс компромиссов дополнительно характеризует коэффициент информационной отдачи ИС, характеризующий отношение информативной ресурсной части связанной энтальпии (суммарный объем контента) к полной энтальпии системы. Эти коэффициенты также весьма наглядно вырисовываются в виде графиков по точкам фьючерсов ПЖЦ проекта. Полезно помнить, что суммарная энтальпия системы может изменяться только в двух случаях: изменение технологий поддержки ИС (например, выделение дополнительного дискового пространства для обслуживания ИС), и реконструкция инфологии системы. Связанная часть энтальпии может меняться часто и непрерывно, прежде всего в следствии воздействия эндогенного процесса - ремиссии (наполнения ИС новой информацией) и экзогенного процесса - эмиссии (сокращения наполнения информацией).

Таким образом, проектные действия в аналитической части проекта ИС направлены прежде всего на улучшение и\или оптимизацию энтропийно энтальпийного баланса. Либо при заданной энтальпии улучают энтропию – негэнтропию (прямая задача), либо удерживая значение энтропии на удовлетворяющем уровне, стремятся получить заданные значения энтальпии и сопутствующих коэффициентов использования системы (обратная задача анализа ИС).

И в том и в другом случае наиболее действенными средствами являются меры и акции по улучшению контента и его структуры (нормированию, гармонизации, квантованию, снижению стохастичности и т.д.) и по усовершенствованию инфологии системы, средств инструментальной, программной поддержки проекта.

Ниже остановимся на некоторых реализациях этого аналитического подхода.

06.07. Аутопойетизм информационных образовательных систем и порталов с позиций вероятностного моделирования информационного морфизма систем В системно-синергетических исследованиях ИС, опирающихся на семантико энтропийный подход, основное внимание уделяется проблеме аутопойетизма информационных образовательных систем. Под аутопойетизмом здесь понимается способность систем моделировать процесс воспроизводства виртуальных обучающих компонент, реализующих структуру образовательного процесса и его организацию. В соответствии с аутопойетической теорией определяющим атрибутом системной сущности информационного объекта является набор морфизмов (взаимодействий) между его компонентами, которые служат ядром идентификации. Это ядро определяет сущность концептуальной модели виртуального информационного концепта – информационный концепт. Множество определяющих морфизмов конституируют организацию информационной системы, задают границы ее структуры.

Опираясь на эти определения можно исследовать как дуплексный, так и однонаправленный процесс обмена информацией между объектами. При этом с точки зрения синергетики носитель информации возникает в результате нарушения ранее сложившейся симметрии информационного морфизма в точке бифуркации, как следствие синергетического развития информационного объекта.

Вероятностная модель информационного морфизма описана в специальной литературе и может быть воспроизведена в аналитической части проектирования ИС.

Модель связывает относительное количество информации в дуплексном или однонаправленном потоке с информационным морфизмом. Результирующим показателем модели является информационная энтропия взаимодействующих объектов, вычисляемая как логарифм от деления числа морфизмов неупорядоченных знаний между объектами к числу морфизмов структурированных знаний. В соответствии с принципом максимума информационной энтропии наиболее вероятным и наименее желательным будет то состояние ИС, при котором информационная энтропия будет максимальна, то есть в ситуации, когда количество объектов в структуре максимально, а число структурированных морфизмов минимально.

Улучшение этого баланса проектировщики ИС осуществляют, используя технологии информационной накачки, представляющие собой структурные сопряжения, возникающие в результате рекуррентных информационных морфизмов взаимодействующих систем. Практически такое сопряжение сводится к объединению и перестройке структур ИС до получения улучшенных значений энтропии. В кибернетическом аспекте функционирования управляющей дирекционной подсистемы такого рода структурное строительство (самоорганизация структуры среды ИС) могло бы опираться на структурированную совокупность трех компонент указанной подсистемы:

• интерпретация информации в виде данных, позволяющих использовать их метаописания;

• целевая память дирекционной подсистемы на все структурные изменения среды и последствия этих изменений;

• работоспособность шаблонов реакций-откликов и технология сопоставления шаблонов и данных релевантно по отношению к задачам информационного обеспечения, поручаемых проектируемой системе.

06.08. Исследование и регулирование информационного морфизма систем с использованием матриц Александера Матрица взаимодействий или матрица Александера является одним из эффективных средств проектирования, особенно на ступени трансформации менеджмента проекта.

Уже само назначение матрицы говорит о ее полезности в деле исследования и регулирования морфизмов, и, следовательно, энтропии информационных систем.

Главное достоинство метода – возможность простой и строгой проверки соответствия контента одной системы или подсистемы по отношению к другой с возможностью количественно оценить эффективность производимой работы по гармонизации информационного ресурса как в отдельно взятой системе, так и в результате дуплексных изменений. Для этого применительно к исследуемой системе, подсистеме, тендеру, консоли, контейнеру и т.п. заполняют матрицу, рассчитывают результирующие ее коэффициенты и итоговую энтропию как до изменений так и после них, например, на каждом шаге тренда ИС.

Не останавливаясь подробно на раскрытии методики этого процесса, отметим только, что в практике проектной работы кафедры ТИССУ МИРЭА прижилась система, когда по одной оси таблицы-выборки откладываются условные градации релевантности модулей создаваемой системы, а по другой – опорной, например, федерального или регионального образовательного портала. Оценка трехбальная: «0»

означает достаточное соответствие исследуемого модуля по отношению к «эталонному» опорной системы, «1» подсказывает целесообразность некоторой коррекции созданного модуля, а «2» говорит о полной несостоятельности модуля либо по содержанию, либо по технологическим признакам (размеру, расширению и т.п.).

Прочерк в клеточке матрицы означает естественное отсутствие корреляций сравниваемых модулей и воспринимается в расчете адекватно нулю. Понятно, что в главной диагонали матрицы Александера прочерки невозможны – иначе матрица не достоверна. Наилучшей является картина, когда набранная штрафная сумма матрицы минимальна, что описывается набором специально декларируемых коэффициентов.

Минимизация этой функции, а следовательно улучшение энтропийной оценки системы есть направление действий проектировщика.

Ясно, что в случае ограниченных выборок следует показать достоверность полученных оценок по отношению к полному объему контента, используя соответствующий математический аппарат.

06.09. Тензорный анализ в регулировании модели морфизма многомерных хранилищ данных и распределенных информационных систем Многомерность в упаковке данных в ИС, распределенность баз данных и многомаршрутность транспортировки запросов и откликов к таким сложным системам создают проектировщику немалые затруднения в применении всех приведенных выше подходов к аналитическим исследованиям проектируемых систем. Конечно, известные методы получения численных характеристик и энтропийных оценок вполне могут опираться на многомерность этих оценок, но расчеты при достаточно большом числе измерений получаются удручающе громоздкими.

Видимо, в значительной мере эту проблему анализа позволяют разрешить возможности тензорного анализа. Не исключены различные ключевые подходы к проблеме на этой основе. Здесь кратко комментируется один из наиболее простых вариантов, а именно, базирующийся на представлении каждого территориально или иным способом выделенного домена распределения в виде некоей условной точки, положение которой описано в условной системе координат. Число координат и размерности отсчета в них зависят исключительно от избранных проектировщиком параметров и величин характеристик домена для регулирования модели морфизма системы и ее частей. Описанием координат точки могут быть величины, с точностью до постоянных коэффициентов пропорциональные энтропийной (негэнтропийной), энтальпийной оценкам каждого выделенного домена, временным характеристикам, характеристикам производительности доставки, обработки и тому подобной совокупной информации о домене. Расчеты можно вести как для систем и подсистем в целом, так и для отдельно взятых интересующих исследователя консолей и срезов.

Таким образом, выбор компонентов объектов для синергетического исследования сложных ИС выглядит как вполне принятый в тензорном анализе. Выбирая эти параметры и величины, следует в первую очередь позаботиться о валидности выбора по отношению к используемым в тензорном анализе соглашениям о суммировании, соглашении о ранге и определении нижнего индекса.

Здесь же следует отметить существенное достоинство тензорного анализа сложных систем, заключающееся в возможности наглядно видеть и улучшать наиболее значимые и чувствительные тензоры, характеризующие домены в системе, что достигается ковариантным дифференцированием уравнений, описывающих положение тензоров.

06.10. Кластерный анализ в задачах гармонизации информационного ресурса ИС В синергетических исследованиях сложных систем широкие возможности открывает современный кластерный анализ. Использование кластерного анализа позволяет работать с моделями информационного морфизма, как это обсуждалось выше, а также явным образом воздействовать на показатели асимметрии в математических описаниях распределения событий в системах, реализовывать нормирование контента, решая задачу его гармонизации.

Кластерный анализ – математическая процедура многомерного анализа, позволяющая на основе множества показателей, характеризующих модули ИС (размеры модулей, вероятности событий с ними, время или производительность обслуживания модулей, энтропийно-энтальпийные характеристики и т.п.), сгруппировать их по классовым признакам и обработать таким образом, чтобы добиться наиболее гармоничных образований, что выражается в размерах метрик (расстояний) между ними. Такие преобразования подчинены планируемой разработчиком цикличности вплоть до достижения желаемого результата.


Решением задач кластерного анализа являются разбиения, удовлетворяющие некоторым критериям оптимальности. Так, в отношении задач гармонизации контента ИС известно, что улучшение изыскивается в направлении снижения асимметрии и дисперсии отклонений размеров семантических единиц информации от математического ожидания в пределах каждого информационного контейнера (подсистемы). Соответственно, в рассматриваемом примере в качестве целевой функции может быть взята внутригрупповая (внутри контейнера) сумма квадратов этих отклонений от средней гармонической (см. выше).

Соединение в единую конструкцию результатов исследования отдельно взятых групп кластеров облегчается благодаря тому, что вследствие принципа аддитивности результирующая энтропия объединения равна сумме энтропий компонентов, а также, согласно теореме сложения математических ожиданий математическое ожидание числа объектов, приведенных в состояние S равно сумме вероятностей перехода в это состояние для каждого из объектов.

Конкретная реализация этого подхода может опираться на различные версии методов кластерного анализа. Выбор конкретного метода диктуется прежде всего вводимыми разграниченими в описание параметров кластеров в части их сходства и разграничений.

Поскольку, как это уже упоминалось выше, наиболее интересный круг задач гармонизации контента ИС связан с регулированием дисперсии и эксцесса, ограничимся перечислением только основных методов минимальной дисперсии:

• метод полных связей;

• метод максимального локального расстояния;

• метод Ворда;

• центроидный метод.

Перечисленные выше методы позволяют воспользоваться алгоритмами последовательной кластеризации. Привлекательной принципиальной позицией такой алгоритмизации является возможность видеть и улучшать коэффициенты корреляции, описывающей сходства между кластерами. Последовательная кластеризация может завершаться построением дендограммы, являющейся графической интерпретацией алгоритма кластеризации в терминах матрицы расстояний.

06.11. Моделирование распределенных систем на основе продукционно фреймовых представлений знаний Не вызывает сомнения, что распределенные в совокупности различных сетей, в том числе, в Интернет, хранилища знаний составляют главную и весьма насыщенную часть всего образовательного и научного информационного пространства. К тому же возрастает степень интеллектуализации распределенных систем. Эффективное функционирование информационных систем с такими обширными распределенными хранилищами данных и знаний предъявляет к моделированию и проектированию ИС и порталов новые специальные повышенные требования.

Здесь, кстати, уместно заметить, что сам термин НОВЫЕ, все еще относящийся к информационным технологиям, теперь подразумевает именно интеллектуализацию этих технологий, постоянно обновляемую на базисе качественно новых наукоемких решений.

Простые клиент-серверные архитектуры способны обеспечить уверенный доступ к централизованному ресурсу, в то время, как для обслуживания многоузловых ИС требуются более сложные механизмы узлового взаимодействия, где в поддержку широко распространенным технологиям WWW используют продукты RPC, RMI, COBRA, DCOM и другие. Реализуются сети с искусственным интеллектом, на основе которых, собственно, моделируются и проектируются дидактические информационные системы. Обширный анализ моделирования подобных решений приведен в диссертации Д.В. Сошникова «Методы и средства построения распределенных интеллектуальных систем на основе продукционно-фреймового представления знаний»

(МАИ, г.Москва, 2002г.). Согласно Д.В. Сошникову указанное развитие идет в основном в двух смежных направлениях: обмен знаниями по сети (knoledge sharing) и совместное решение задач (cooperative problem solving).

Поиск в сетях с распределенными знаниями требует от каждого узла наличия в нем базы знаний более информативной, нежели список ключевых слов и контекстный поиск. Еще более действенным оказывается использование наряду с интеллектуализированными базами данных специальных интеллектуальных управляющих дирекционных систем консорциума баз знаний, то есть внедрение описанной выше идеологии информационных картелей. Картели отождествляют принципы современных многоагентных систем, где каждый агент, по существу, представляет самостоятельную ИС с символьным представлением знаний, а глобальное управление всеми ими осуществляется централизованно в целях совместного решения поставленных задач в распределенной среде с использованием специально разработанных языков обмена KQML, KIF и других. При этом для обеспечения единого пространства знаний создаются онтологии – эксплецидные спецификации концептуализации предметной области в виде таксономии концептов и некоторого количества сопровождающих установочных знаний в виде системы априорных положений и правил (common knoledge). По мнению автора настоящей публикации, указанные онтологии должны размещаться в специализированных повышенно защищенных информационных контейнерах, присоединяемых к ядру дирекционной системой управления картелем знаний. Выбор конкретной архитектуры распределенной фреймовой иерархии составляет основу такого подхода. При этом фреймовая архитектура может быть существенно расширена продукционными правилами для задания динамики предметной области в рамках, контролируемых механизмами эмерджентных семантико-энтропийных и энтальпийных оценок. Такую архитектуру, в частности, Д.В.Сошников относит к классу статических делиберативных коллаборативных агентов. При этом сохраняется и должна реализовываться в модельном строительстве таких картелей способность взаимодействия дирекционной системы и\или портала входа в картель с традиционными и внекартельными хранилищами данных: с реляционными, объектно-ориентированными базами данных, хранилищами слабо структурированной информации на базе XML\HTML.

Фреймовое представление знаний являет естественный способ кластеризации знаний, в особенности соответствующих фреймов в виде процедур-демонов и процедур запросов.

Фрейм – элемент структуры данных для представления стереотипной информации, реализующей возможности онтологического описания и поиска. Под фреймами понимается набор слотов со значениями определенного или произвольного типов. Фрейм – элемент языка HTML версии 3.0 и выше, позволяющий разделить WEB страницу на несколько независимых окон и в каждом из них разместить отдельную WEB страницу. Видимо, минимальный условно неделимый далее элемент такого разбиения в фреймовых конструкциях и есть элементарная семантическая единица (ЭСЕ), фигурирующая в аналитических исследованиях модели морфизма и расчетах энтропии фреймовых архитектур. Фрейм-модель являет структуру стереотипных ситуаций. Управление ситуациями в этой архитектуре поручается процедурам-демонам (присоединение, изменение значений слотов) и процедурам-запросам (определение значений слотов). Обычные реляционные базы данных могут преобразовываться в множество фреймов, что называется их горизонтальным срезом. Таким образом, фреймовые системы – это надстройки над языками программирования высокого уровня, в роли которых могут выступать, например, ЛИСП (КЕЕ) или ПРОЛОГ (ТНЕО).

Надо также иметь в виду, что переход к фреймовых архитектурам связан с необходимостью существенного увеличения производительности систем, сопровождаемого также ростом энтальпии при некотором благоприятном уменьшении суммарной энтропии картеля (консорциума).

Моделирование таких систем является самой сложной, новой и принципиальной частью работы проектировщика ИС, приходящейся на ступень трансформации менеджмента проекта. Модель фреймовой иерархии имеет сложное математическое описание. Принципиальным является формулирование модели представления знаний с кластеризацией продукционных правил прямого и обратного выводов относительно слотов в виде присоединенных процедур (процедур-демонов). Большая аналитическая работа связана также с выделением и описанием характерных топологий и конфигураций в задачах распределенного накопления и использования знаний и методов таких конфигураций распределенной иерархией с множественным, псевдо множественным и мобильным наследием.

Вслед за моделированием для таких сложных систем приходится решать ряд специальных взаимосвязанных задач встраивания, интеграции компонентов ИС, создания поисковых подсистем, развития инструментария, языковой поддержки обновляемых проектных решений и тому подобное, но эту часть работы проектировщика ИС можно отнести к ступени конвергенции полного менеджмента проекта ИС.

07. СТУПЕНЬ КОНВЕРГЕНЦИИ ПОЛНОГО МЕНЕДЖМЕНТА ПРОЕКТА 07.01. Общие замечания к ступени конвергенции На этой ступени происходит окончательная доводка ИС в отношении ее работоспособности и необходимой меры защищенности от несанкционированных воздействий. На ступени конвергенции завершается вся работа проектировщика по созданию, привлечению, отладке, освоению всех программных средств, технологической платформы, приложений, интерфейсов, то есть завершается вся технологическая часть проекта. В случае выделения управляющей части большой или распределенной системы в отдельную дирекционную подсистему, на ступени конвергенции, когда окончательно формируются библиотеки управляющих программ, завершается проектирование и описание этой дирекционной подсистемы.

В продолжение предшествующего раздела здесь заметим, что, например, в случае реализации архитектуры дирекционной подсистемы на основе Фрейм технологий, архитектура ее поисковой части может содержать:

• блок компилятора онтологических описаний;

• блок брокера поисковых запросов;

• компоненты пользовательского интерфейса;


• блок фильтрации (выбора кандидатского множества);

• блок логического вывода и другие блоки.

Выбор и удачное и использование технологий предопределяют окончательный успех проекта в целом. Однако вопросы технологий при всей их исключительной важности выходят за рамки задач настоящей публикации, посвященной наукоемкой компоненте и проблематике менеджмента проекта, а потому здесь подробно не обсуждаются.

Весьма важно, что ступень конвергенции, завершая собственно проектную часть ПЖЦ ИС, связана с разработкой, доводкой по требованиям стандартов и выпуском документации рабочего проекта. Вся созданная документация проверяется на соответствие ЕСКД, ЕСТД, ЕСПД, а также на соответствие требованиям специальных групп международных и отечественных стандартов и нормативных актов.

Указанная документация, обычно оформляемая в виде Расчетно-пояснительной записки (РПЗ) к проекту с сопутствующими чертежами (плакатами), является итогом и формой отчетности по завершенному и предъявляемому заказчику проекту.

В наиболее общем случае РПЗ содержит:

• титульный лист установленного образца с утверждающими подписями руководителей сдающей и принимающей сторон;

• подтитульный лист с выходными данными, номером УДК (универсальной десятичной классификации), аннотацией, сведениями об участниках проекта и их адресах, списками ключевых слов, сокращений и аббревиатур;

• оглавление;

• реферат (текст доклада);

• введение, Техническое задание (ТЗ), Технические требования к проектируемому изделию (ТТ), Технические условия эксплуатации (ТУ), предпроектное Техническое предложение (ТП) или Технико-экономическое обоснование (ТЭО), поглавное изложение согласно реализованному менеджменту проекта (в том числе Каталожное описания изделия (КО) или его Спецификацию (Сп) и инструкции всем уровням пользователей ИС, инструкции по инсталляции, диагностикам, восстановлениям, модернизациям и информационно экологически чистой ликвидации ИС, заключение;

• список источников;

• приложения, содержащие копии чертежей и плакатов к РПЗ, документы о внедрении, таблицы и описания, отражающие состав контента ИС, тезаурус ИС, описания демоверсий, листинги оригинальных авторских программ, таблицы сопоставительной проверки всех компонент проекта на соответствие стандартам или отечественным требованиям сертификации, акты и лоцманские записи по диагностикам, отказам, отладкам, модернизациям, описание демоверсии проекта и созданного продукта, другие материалы.

В учебной практике проекты сопровождаются также отзывом руководителя и рецензией независимого эксперта (назначенного рецензента).

Вся перечисленная документация, распечатанная в переплете на твердом носителе, сопровождается электронной версией на CD ROM с описанием внесенных папок и файлов.

Одновременно с подготовкой документации реализуются завершающие проект исследования и инженерные решения, в основном, направленные на улучшение и оптимизацию уже созданной и апробированной информационной системы и базирующиеся на классических теориях системного анализа и надежности сложных систем. Перечень решаемых на этой ступени менеджмента задач следует из утвержденного ТЗ, но может быть расширен или видоизменен в процессе реализации проекта.

В процессе проектирования на любом из ТЕХНОЛОГИЧЕСКИХ ПЕРЕХОДОВ различных ступеней менеджмента проекта может возникнуть задача реализации ИНТРОВЕРСИИ, то есть пересмотра ранее поставленных условий задач или найденных решений. Иными словами, возникает ситуация тупика или нерациональности дальнейшего продвижения по принятой траектории менеджмента проекта, что приводит к частичному откату назад, вплоть до изменения ТЗ, ТТ и ТУ, с последующим обновленным прохождением дефектной части этой траектории. В случае обширной интроверсии, затрагивающей позиции ТЗ, проектант обязан разработать и утвердить у заказчика (руководителя проекта) так называемый ПРОТОКОЛ РАЗНОГЛАСИЙ, сопоставляющий текстуально ранее принятые и вновь вводимые составляющие ТЗ. Такой протокол разногласий является неотъемлемым обязательным приложением к ТЗ.

Интраверсия не есть самостоятельная ступень менеджмента проекта, а скорее является возможным спутником проектных действий.

Интраверсия тем безболезненнее, чем раньше она осуществлена. Выполнение интроверсии на ступени конвергенции менеджмента крайне нежелательно, так как означает глубокий кризис проекта.

Значительное место на ступени конвергенции менеджмента проекта занимают инженерные расчеты и проектные действия, являющиеся результатом предшествующих аналитических исследований, а именно:

• расчет временных транспортных характеристик сетевого взаимодействия и маршрутизации;

• расчет производительности (прямая задача) или нагруженности (обратная задача) ИС, а иногда, еще и мощности ИС;

• расчет и обеспечение надежности ИС, а также создание и описание средств диагностики и восстановления заданной надежности;

• обеспечение и, желательно, расчеты в критериальной форме (в виде коэффициентов, например, определяемых в результате использования теории термов для построения математической модели защищенности ИС) защищенности системы;

• расчетно-аналитические действия по гармонизации информационного наполнения ИС на весь период ее жизненного цикла.

Перечисленные вопросы являются очень емкими в изложении, специальными вопросами проектирования ИС, а потому в настоящей публикации далее общего перечня не раскрыты, за исключением вопроса о расчете производительности ИС, напрямую связанного с приводимыми выше аналитическими материалами.

На ступени конвергенции рассчитываются и описываются также фьючерсные прогнозы функционирования ИС. Для этого по всем критериальным точкам фьючерсов, например, по годам, следует рассчитывать и отображать графически в виде гистограмм такие важные совокупные показатели ИС, как энтропиийные показатели, энтальпия, производительность ИС (прямая задача) или нагруженность ИС (обратная задача), коэффициент использования (коэффициент избыточности), показатели надежности и, по возможности, коэффициенты и показатели, характеризующие защищенность ИС.

Все ступени менеджмента проекта представляются в РПЗ и листах графики в виде сеточного или ленточного графика, например, ленточного графика Гантта.

При этом, увязывая все перечисленные выше задачи проекта между собой, полезно постоянно помнить, что показатели производительности, надежности и защищенности ИС образуют взаимосвязанную компромиссную систему, которую весьма полезно оптимизировать, например, по минимуму (критерий оптимизации) или ограничению (лимитер) затрат. Во всяком случае, можно утверждать, что разработка перечисленных выше вопросов составляет наукоемкую компоненту проекта, отражающую интеллектуальный уровень фундаментальной подготовки специалиста.

Уместно отметить также, что заключительными и наиболее ответственными разделами отчетности по проекту являются КАТАЛОЖНОЕ ОПИСАНИЕ (спецификация) изделия (КО) и текст доклада защиты, напоминающий обязательный для всякого проекта реферат. Каталожное описание строится, приблизительно, в следующей последовательности (перечисляются заголовки): наименование разработки, учреждение и подразделение разработчика, автор, цель, назначение разработки, область применения, особенности содержания и использования разработки, сведения об апробациях, диагностике и внедрении, краткая (табличная) техническая характеристика, соответствие стандартам (перечень), условия эксплуатации, инсталляции, ликвидации, хранения, транспортировки, кадровое обеспечение, перечень служебной (проектной) документации, включая перечень всех утвержденных инструкций, личная подпись разработчика.

07.02. Расчет и обеспечение производительности информационных систем Производительность информационной системы уместно вычислять при соблюдении, как минимум, следующих условий:

1. Аппаратная конфигурация системы соответствует заданной;

2. Система подключена к сети Интернет по локальной сети через шлюз. Скорость обмена данными по локальной сети задана и известна (обычно не хуже 10 Мбит/с).

Что то же самое, известны структура и время сетевых задержек с учетом всех объявленных приоритетов.

3. Время обработки запроса определено.

4. Суммарная задержка при обращении к жесткому диску и передачи данных по шине определена.

5. Коэффициент интенсивности использования системы задан или рассчитан на основании аналитических исследований (например, типовой случай, 30%).

6. Предельное время загрузки данных выяснено. В основном это время зависит от рассчитываемого объема трафиков блока поиска информации и блока работы с данными.

В расчетах производительности ИС значимыми фигурантами являются временные характеристики различных процедур, задержек, очередей, восстановительных и поисковых процессов (что касается поисковых функций системы, моделирование и исследование соответствующей подсистемы должно выполняться еще на ступени трансформации менеджмента проекта с использованием широко опубликованных классических методов и подходов).

Видимо, ранжируя перечисленные выше явления в проектной работе можно поочередно отнести все эти временные характеристики к следующим группам:

• изначальные характеристики дисциплин обслуживания с абсолютными приоритетами;

• изначальные характеристики дисциплин обслуживания с относительными приоритетами;

• откорректированные характеристики по результатам полного учета диспетчеризации заявок, планирования распределения производительности и выравнивания эффективности различных дисциплин обслуживания.

Производительность ИС рассчитывается исходя из приведенных выше предпосылок, например, с использованием формулы Эрланга и измеряется в одноименных единицах.

Один Эрланг равен объему перерабатываемой или передаваемой информации (трафику), обрабатываемому одним каналом (процессором, портом и т.п.) в течение одного часа при полной и постоянной занятости этого канала. Применительно к линиям связи это выглядит как объем трафика, равный 3600 вызовов в секунду.

Покажем вариант фрагмента такого определения на несколько упрощенном конкретном примере. Допущения и исходные данные:

• Коэффициент программной избыточности: КИЗБ=0.05 – часть вычислительной мощности системы, расходуемой на проверку входных данных для защиты от непредумышленных, случайных искажений вычислительного процесса, программ и данных – система оперативной защиты.

• Вероятность некритического сбоя системы: КСБ=10-5 (согласно В.В. Липаеву).

• Время восстановления после сбоя: ТСБ=3-5 сек. – время на перезагрузку интерфейса системы или повтор запроса.

• Вероятность отказа системы: КОТК=2*10-6 (согласно В.В. Липаеву).

• Время восстановления после отказа: ТОТК= от 15-20с до 180с – время перезапуска программы и сервера баз данных (15-20с.) или полная перезагрузка всей машины (до 180с.) • Коэффициент надежности линии связи: КЛС=0,88 (данные из документации по протоколу TCP/IP)– вероятность отката, зависания, искажения информации из-за шумов на линии, ведущие к повторной передаче данных.

• Расчетное общее среднее время задержки передачи данных составляет (например) 1,26с.

Тогда, например, эффективное число одновременно обслуживаемых запросов при 45% загрузке канала (по В.В. Липаеву) и математическом ожидании размера ЭСЕ Мб (как пример по результатам морфологического анализа):

полезная пропускная пропускная способность канала N ВЫЗ = коэфф. загрузки сети средний объем запрашиваемых данных 9750000 бит = 45% = 0,53 1 запрос 8 1024000байт При значении коэффициента загрузки канала свыше 50% резко падает его пропускная способность, поэтому рассматривается граничный вариант.

Среднее число запросов в час:

N ВЫЗ 60 мин 1 3600 NЗ = коэф. инт.исп.сист. = = время исп. запроса 1, 26 Коэффициент готовности системы:

К ГОТ = (К СБ К ОТК ) N З = (0.9999 0.99998) 857 = 0, Итоговая производительность системы при данных условиях:

N З VД 857 1024000 байт 0.9 (1 0.05) = 208422,4 байт P= К ГОТ (1 К ИЗБ ) = с 3600 3600 с N Tз 857 1. E= З = = 0,29 Эр, что в приведенном примере фрагмента не 3600 3600 с удовлетворило конкретного проектировщика ИС (пример взят из дипломного проекта Т. Лесновской, МИРЭА, 2004г.).

Используя в дальнейших проектных действиях полученный результат, следует иметь в виду, что при выполнении прикладных программ реальная производительность ИС может быть меньше теоретической, что, компенсируется запасом по коэффициенту использования системы или в самом начале анализа введением так называемого запасного коэффициента степени активности файла (активности ЭСЕ).

07.03. Расчет и обеспечение надежности информационных систем Расчет и обеспечение надежности создаваемой ИС и средств ее сопровождения осуществляются в проекте ИС на ступени конвергенции менеджмента проекта в духе и объеме требований, предъявляемых образовательным стандартом ВШ РФ по специальности «Информационные системы и технологии» в рамках соответствующей дисциплины «Надежность информационных систем».

Опираясь на приведенные в настоящей публикации списки источников можно рекомендовать проведение инженерных расчетов надежности ИС в рамках следующего набора вопросов:

• Мотивированное выделение основных показателей и понятий расчета надежности ИС и средств сопровождения ИС применительно к специфике проекта. (Расчет выделенных показателей надежности для всех фьючерсов тренда ПЖЦ ИС производится с использованием логико-вероятностных методов и алгебр логики, с помощью алгоритма разрезания или, то же самое, алгоритма минимальных сечений, алгоритма ортогонализации, рекуррентным методом, с помощью алгоритма наращивания путей, схемно-логическим методом, с использованием дерева отказов или других методов).

• Составление и описание структурной схемы надежности ИС и средств ее сопровождения, а также границ показателей надежности.

• Расчет средней наработки системы на отказ и среднего времени восстановления по каждому из фьючерсов тренда полосы информационного наполнения ИС на всем ПЖЦ ИС. (Выбор методики и результаты расчета существенно зависят от того, какие законы распределения возможных отказов взяты проектировщиком за основу.

По опыту автора и десятков руководимых им проектантов неплохие результаты при комплексном учете распределения различных событий в ассамблеях контента, библиотеках программ и других компонент обустройства ИС показывает распределение Вейбулла-Гнеденко, но вполне приемлемы и другие законы распределений, описывающие параметрические отклонения в больших массивах).

• Описание и определение избранных в проекте методов повышения надежности информационных систем и порталов.

• Выявление целесообразности и реализация резервирования как средства повышения надежности, в том числе ненагруженного, недогруженного и нагруженного резервирования, резервирования с автоматическим контролем и коммутацией (в функциях дирекционной системы), резервирования с восстановлением, специфических резервирований (создание буферов, тендеров, хирально чистых зеркалирований и т.п.). Разработка графа состояний и трендов фьючерсов результатов этих расчетов в пределах всего ПЖЦ ИС и средств сопровождения информационных систем и порталов.

• Дополнительный анализ надежности ИС при неизбежном нечетком оценивании надежности (особенно в условиях повышенной относительной энтропии системы) путем преобразования нечеткой структуры-оценки к условно четкой.

• Анализ критичности (чувствительности) и валидности полученных проектных результатов Комментируя приведенный выше перечень вопросов, можно еще раз отметить, что надежность функционирования ИС и средств ее сопровождения определяется как результат взаимодействия трех важнейших взаимосвязанных компонент, каждой из которых свойственна своя мера надежности и качества:

• компьютерно-сетевых аппаратных средств;

• установленного на них штатного базового программного обеспечения и вспомогательного дополнительного обеспечения, не входящего непосредственно в состав программных средств, поддерживающих ИС и созданных для нее;

• ПС, относящиеся непосредственно к создаваемой ИС.

Если по вопросам оценки качества и надежности аппаратных средств методики расчета, диагностики и обеспечения сложились достаточно давно (с опорой на теорию вероятностей), то с оценкой и обеспечением надежности современных ПС ввиду новизны ситуации и слабой детерминированности модели отказов вопрос выглядит несколько сложнее. Разрешается вопрос главным образом на методологическом уровне, предполагающем набор тех или иных последовательных действий и процедур еще на стадии рабочего проектирования ИС, опирающихся на соответствующие международные стандарты и учитывающие требования по сертификации ПС.

В стандартах и моделях жизненного цикла ПС определено содержание этапов и частных работ при создании и модификации компонент и ПС в целом. Для планирования и управления обеспечением качества и надежности ПС эти модели служат структурной базой объектов, работ и документов при детализации и реализации требований к показателям качества ожидаемых результатов. Необходимая надежность объектов формируется и обеспечивается в процессе выполнения частных работ каждого этапа и окончательно удостоверяется испытаниями и документами при их завершении. Для обеспечения качества и надежности ПС стандартами рекомендуется формулировать требования:

• к объекту разработки на данном этапе - к его программным и информационным компонентам, а также к интерфейсу между ними и с внешней средой;

• к процессу, технологии и организации выполнения совокупности работ и документов каждого этапа;

• к методам и характеристикам средств автоматизации выполнения работ, обеспечивающим необходимую надежность функционирования и качеству ПС;

• к методам и средствам контроля, измерения и документирования качества процессов и результатов выполненных работ.

Требования к инструментальным средствам автоматизации разработки надежных ПС наиболее полно изложены в стандарте IEEE 1209-1992. Стандарт содержит рекомендации по оценке и выбору инструментальных средств, поддерживающих процессы жизненного цикла программных средств, включая процессы управления проектами, процессы разработки и процессы, следующие за разработкой, а также интегральные процессы жизненного цикла ПС. Для оценки и выбора инструментальной среды и CASE-средств стандартом рекомендуется использовать соответствующие наборы правил и критериев. Группы критериев в стандарте выделены и сформированы с учетом общих требований стандарта ISO 9126:1991 по оценке качества программных продуктов и других стандартов (см.

Приложение 1).

В заключение раздела следует отметить, что расчет и обеспечение заданной, высокой с определенным запасом производительности наряду с расчетом и обеспечением надежности и защищенности информационных систем, порталов и картелей являются ведущей составляющей всех инженерных проектных действий, точно также как центральное место в аналитических исследованиях информационных систем занимают семантико-энтропийные оценки.

08. ПРИМЕР ВЫПОЛНЕНИЯ ПРОЕКТА СПЕЦИАЛИЗИРОВАННОЙ ИС ОБРАЗОВАТЕЛЬНОЙ ПЛОЩАДКИ МГДД(Ю)Т, ВЗАИМОДЕЙСТВУЮЩЕЙ С ОБРАЗОВАТЕЛЬНЫМИ ПОРТАЛАМИ РАЗЛИЧНЫХ УРОВНЕЙ (реферат) СПЕЦИАЛИЗИРОВАННАЯ ИНФОРМАЦИОННАЯ СИСТЕМА ПОДДЕРЖКИ УЧЕБНОГО ПРОЦЕССА НА БАЗОВОЙ ПЛОЩАДКЕ КАФЕДРЫ ТИССУ МИРЭА В МОСКОВСКОМ ГОРОДСКОМ ДВОРЦЕ ДЕТСКОГО (ЮНОШЕСКОГО) ТВОРЧЕСТВА А.А. Савочкин (МГДД(Ю)Т, МИРЭА) Целью проекта является разработка и реализация методики и рекомендаций по созданию и сопровождению типовой корпоративной информационной системы подразделения выпускающей кафедры ВУЗа на базовой учебно-технологической площадке. Площадка функционирует в МГДД(Ю)Т, реализуя модель непрерывного образования «школа-ВУЗ-дополнительное образование».



Pages:     | 1 || 3 | 4 |
 





 
© 2013 www.libed.ru - «Бесплатная библиотека научно-практических конференций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.