авторефераты диссертаций БЕСПЛАТНАЯ БИБЛИОТЕКА РОССИИ

КОНФЕРЕНЦИИ, КНИГИ, ПОСОБИЯ, НАУЧНЫЕ ИЗДАНИЯ

<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ


Pages:     | 1 |   ...   | 7 | 8 || 10 | 11 |

«Теоретические, организационные, учебно-методические и правовые проблемы О ПРОЕКТЕ СТРАТЕГИИ РАЗВИТИЯ ИНФОРМАЦИОННОГО ОБЩЕСТВА В РОССИИ ...»

-- [ Страница 9 ] --

Вторая составляющая модели МОП содержит систему параметров, определяемую разработчиком конкретной обучающей системы. Данные параметры определяются потребностями и предпочтениями разра ботчика и могут существенно отличаться для различных КОС. В общем виде – это вектор числовых и лингвис тических переменных, необходимым образом (с точки зрения разработчика) расширяющих и дополняющих встроенную модель МОФ.

Наряду с моделью обучаемого, для управления процессом обучения концептуальная модель включает дидактические знания (КАК-знания). Дидактические знания здесь – это множество правил-продукций R: CA, поставленных в соответствие узлам концептам ПО и интерпретирующих связи между ними, а также анализи рующих и модифицирующих параметры модели обучаемого (КОГО-знания). С их помощью осуществляется управление обучением с учетом индивидуальных особенностей обучаемого. Продукционный подход к пред ставлению дидактических знаний обеспечивает простоту их модификации и пополнения, а следовательно – адаптивность системы к пожеланиям разработчика и более тонкую «ситуационную» настройку системы обуче ния в целом.

Для обеспечения конечности и конфлюэнтности процесса адаптации введён ряд ограничений, наклады ваемых на продукционные правила.

Ограничение 1: Ri,RjAM: S(Ri)U(Rj) =.

Ограничение 2: Ri,RjAM:

Ri не зависит от Rj: (S(Ri)U(Ri)E(Ri)) U(Rj) =.

Ri является самонезависимым: (S(Ri)E(Ri)) U(Ri) =.

Использование ограничений 1 и 2 гарантируют конечность и конфлюэнтность, однако делает невоз можным процесс распространения правил. В связи с определены ограничения, ослабляющие условия достиже ния конечности и конфлюэнтности, но дающие бльшую выразительную свободу при написании правил адап тации.

Ограничение 1: AM = St-rulePr-rule, RiSt-rule, RjPr-rule: Pri(Ri)Pri(Rj), где AM-набор правил;

St-rule – набор стартовых правил;

Pr-rule – набор правил распространения;

Pri(Ri) – приоритет выполнения пра вила Ri.

Ограничение 2: Ri, RjAM, Ri Rj: U(Ri)U(Rj) =, где U(R) – набор атрибутов, которым присваи ваются значения в A.

Осуществление адаптации невозможно без обратной связи, реализуемой множеством диагностических знаний.

Описание и представление диагностических знаний осуществляется на основе их моделей [2]. На уров не, инвариантом к ПО и виду осваиваемой деятельности, модель вопроса (задачи, упражнения) Мq представляет собой кортеж:

Мq = ( A, C, Мs, Мsu, V, P, Vёu, Мas, Ov, Oa), (3) где A – цель (что требуется от обучаемого, какую деятельность необходимо выполнить);

C – ограничения, которые должны быть учтены при выполнении задания;

Мs – модель ситуации (в зависимости от назначения и вида КСО этот компонент может соответствовать моделям изучаемого объекта, среды профессиональной деятельности и т.д.);

Мsu – информационная модель, описывающая способ представления Мs, а также средства оперирования ею в рамках КСО;

V – результаты (ответы);

P – вес задания;

Vu – описание способа ввода результата;

Мas – эталонная модель деятельности;

Ov – функция оценивания результата;

Oa – функция оценивания деятельности.

Данная модель позволяет описывать диагностические знания любых типов. В моделях конкретных за даний могут использоваться не все компоненты, входящие в (3). Наиболее интересными для анализа членами Mq являются: Ms, P и Ov.

В модели ситуации выделено три составляющих:

Мs = (Str(Мs), Val(Мs), Int(Мs)), (4) где Str(Мs) – структура Мs;

Val(Мs) – значения параметров Мs;

Int(Мs) – интерпретация Мs.

Структура Str(Мs) определяет форму выражений (математических зависимостей, правил и т.д.), входя щих в Мs. Конкретные значения параметров фиксируются в Val(Мs). Подобная декомпозиция позволяет созда вать как негенерируемые, так и генерируемые системой вопросы и задания. Причем последние можно полу чить путем варьирования значениями параметров Val(Мs) при неизменной структуре модели ситуации или пу Теоретические, организационные, учебно-методические и правовые проблемы тем предусматривающим трансформацию Str(Мs). Интерпретация Int(Мs) характеризует смысл (т.е. предметное содержание) элементов Str(Мs) и Val(Мs).

Функции оценивания Ov и Oa определяются следующим образом:

Ov:(Vs, V) Bl, (5) Oa:(Мa, Мas) Bl, (6) где Vs – результат, введенный или выбранный обучаемым;

Bl – множество баллов;

Мa – модель деятельности, выполненной обучаемым в процессе ответа на вопрос и связанной с опери рованием Мs на основе реализации Мsu.

Функции Ov, Oa и механизмы, реализующие оценивание, традиционно являются фиксированными в рамках КОС (механизм оценивания, основанный на логиках с векторной семантикой рассмотрен ниже), однако использование компонентного подхода к их проектированию позволяет избавиться от этого ограничения.

Рассмотрим механизм оценивания предлагаемый в данной работе. Содержательно, задача оценивания сформулирована следующим образом.

Пусть Т – некоторое множество диагностических знаний определенных на заданной предметной облас ти;

ТА – активная выборка из множества Т с учетом параметров модели обучаемого;

qi – вопрос активной вы T A T ).

борки ( qi Учитывая, что:

pi = a1 i + a2 i + a3 i a4 ;

1) каждый вопрос qi характеризуется весом pi, где здесь i, i, i - характеристики вопроса определяемые в соответствии с системой показателей В.П.Беспалько [2], i = 1,5, i = 1,4, i = 1,3;

a1, a 2, a3 [0;

1] веса показателей i, i, i соответственно, a 4 [0;

1] – поправочный коэффициент;

qi T A определенно множество ответов с весами k ij [0,1], j = 1, N (i) ;

2) для каждого вопроса qi T A, определяется выражением 3) итоговый балл, получаемый при выполнении задания k ij pi, t = 0,2, N F NT pi 1 N k ij, t = 1, N T Bli (t ) = T j = (7) pi K D, t = 4, 0 K D pi N, t = N T где t - тип вопроса;

NF, NT – число ответов, выбранных неправильно и правильно, для вопросов «мно жественный выбор» и «соответствие».

Требуется:

оценить уровень знания обучаемым учебного материала, покрываемого выборкой ТА;

установить уровень доверия к полученной оценке с целью определения момента выхода из теста, или, при «досрочном выходе», учета этого уровня на последующих шагах обучения.

Для решения данной задачи предлагается использовать технику оценивания, основанную на логиках с [а ] = a+;

a векторной семантикой [1]. В данных логиках истинность суждения а описывается вектором, a +, a [0,1]. Здесь а+ - мера Истины некоторого утверждения а, а а- - мера его Лжи.

где В случае диагностики знаний таким суждением является высказывание:

а = «Испытуемый прошел тест TА» (8) В простейшем случае, когда задание теста может быть только выполненным или только не выполнен ным, результат единичного ответа на qi-й вопрос (задание) в рамках данного подхода представляется вектором истинности [a]i:

p i ;

0, если задание выполнено;

[a ]i = (9) 0;

p i, если задание не выполнено.

Теоретические, организационные, учебно-методические и правовые проблемы При тестировании каждый ответ рассматривается как свидетельство «за» или «против» утверждения (8). Для накопления свидетельств («суммирования» результатов теста) используется правило совмещения, в соответствии с которым [ a] = F1 (a1+, a2+ );

F2 (a1, a2 ) (10), где F1() и F2() некоторые функции компонент вектора истинности, определяемые схемой накопления свидетельств и предметной областью. В случае диагностики знаний в качестве таких функций выбраны сле дующие выражения:

F2 ( a1, a2 ) = a1 a2, F1 ( a1+, a2+ ) = a1+ a2+ (11) которые обеспечивают «симметричное» накопление положительных и отрицательных результатов тес тирования.

Критерием прекращения тестирования является достижение заданного порога мерой определенности µ o ( a ) = a + a, которая на каждом шаге рассматривается как уровень доверия к оценке.

В качестве операции выбрано выражение, x y = min(1, x + y ), согласно которому все тесто вые задания учитываются одинаковым образом, а момент достижения порога достоверности теста определяется простым суммированием весов всех предложенных заданий. При этом компоненты вектора оценивания удов a+ + а 1.

летворяют ограничению Для перевода векторной оценки в «скалярную» используется мера достоверности µ Д (а) = a а +. Например:

1 µ Д (а) 0 – «неудовлетворительно»;

0 µ Д ( а ) 0.5 – «удовлетворительно»;

0.5 µ Д ( а ) 0.75 – «хорошо»;

0.75 µ Д ( а ) 1 – «отлично».

Достоинством векторизации является возможность естественным образом учитывать вес каждого вопро са в тесте и оценивать как меру знания, так и меру незнания испытуемого, что повышает эффективность обрат ной связи при обучении.

Помимо векторного оценивания, особенностью предлагаемого подхода является использование для представления диагностических знаний как традиционных форм тестовых заданий (одиночный и множествен ный выбор, соответствие и т.д.), так и вопросов с присоединенной процедурой вывода и анализа ответов. Дан ная форма представления диагностических знаний позволяет автоматизировать проверку не только знаний обу чаемого, но и его умений и навыков, а также более углубленно анализировать причины пробелов в подготовке обучаемых.

На основе подхода, рассмотренного в рамках настоящей статьи, разработан программный комплекс TeachLab CourseMaster, обеспечивающий процесс создания КОС в естественных категориях предметно ориентированного лексикона пользователя-разработчика КОС в этой области, что позволило снизить трудоем кость и сроки разработки, расширить спектр разрабатываемых КОС. Использование данного инструментария обеспечивает повышение дидактической эффективности когнитивного процесса за счет использования адап тивной структуры организации КОС.

Состав авторской системы определяется множеством выполняемых системой функций, требованиями вычислительной среды, в которой работает система, а также потребностями различных пользователей, которые будут работать с системой.

Как минимум, в состав системы должны быть включены компоненты, поддерживающие процесс под готовки электронных учебных курсов (ЭУК) и обеспечивающие работу обучаемого с ними (авторская подсис тема и подсистема обучения).

Авторская подсистема (Конструктор учебных курсов) – предназначена для формального описания не которого подмножества предметных, дидактических, диагностических и иных знаний в форме, пригодной для хранения в ЭВМ.

Подсистема обучения (Браузер учебных курсов) – предназначена для передачи обучаемому некоторого подмножества систематизированных знаний и умений из выбранной предметной области и адаптации процесса обучения.

Разработанная система может использоваться как для работы с артикулируемыми, так и с неартикули руемыми знаниями, используя, соответственно, тематический и задачный подходы или их комбинацию. Это позволяет разрабатывать в системе различные педагогические программные средства: электронные учебные курсы, компьютеризированные учебники, контролирующие программы, тренажеры, справочники, энциклопе дии и т.д. Причем, анализ решения типовых задач возникающих при разработке данных педагогических средств, позволяет утверждать, что в зависимости от потребностей разработчика и уровня его знаний одни и те же задачи могут быть решены различными методами.

Теоретические, организационные, учебно-методические и правовые проблемы Литература:

1. Аршинский Л. В. Методы обработки нестрогих высказываний. Иркутск: ВСИ МВД РФ. – 1998. – 40 с.

2. Башмаков А. И., Башмаков И. А. Разработка компьютерных учебников и обучающих систем. – М.: Информационно-издательский дом «Филинъ», 2003. – 616 с.

3. Беспалько В. П. Основы теории педагогических систем: Проблемы и методы психолого педагогического обеспечения технических обучающих систем. Воронеж: Изд-во Воронеж. ун-та, 1977. - 304 с.

4. Гаврилова Т. А. Объектно-структурная методология концептуального анализа знаний и техноло гия автоматизированного проектирования баз знаний //Труды Междунар. конф. «Знания – диа лог-решение 95», Т. 1. Ялта, 1995. – С. 1- 5. Гаврилова Т. А., Червинская К. Р. Извлечение и структурирование знаний для экспертных систем.

– М.: Радио и связь, 1992. – 200 с.

6. Информационная технология исследований развития энергетики / Л. Д. Криворукций, Л. В. Мас сель. – Новосибирск: «Наука». Сиб. Издательская фирма РАН, 1995. – 160 с.

АНАЛИТИЧЕСКАЯ МОДЕЛЬ УПРАВЛЯЕМОГО ПРОЦЕССА ОБЕСПЕЧЕНИЯ ТРЕБОВАНИЙ К ДЕЯТЕЛЬНОСТИ СПЕЦИАЛЬНЫХ ПОДРАЗДЕЛЕНИЙ К.т.н., доцент, С.Н. Семкин, С.В. Смирнов (Академия ФСО России) В процессе выполнения специальными подразделениями (СП) задач по предназначению, в последнее время остро встает проблема контроля качества действий сотрудников, определяемых их функциональным со стоянием.

Процесс решения задачи обеспечения руководящим составом специальных подразделений (РС) требо ваний к деятельности СП, учитывающий изменение качества действий сотрудников СП, связан с проблемой поиска методов формализации основных закономерностей функционирования исследуемого объекта.

Построение математической модели управляемого процесса обеспечения РС требований к процессу деятельности СП, учитывающей особенности изменения надежности сотрудников при воздействии дестабили зирующих факторов этой деятельности, в рамках одного математического аппарата приводит к увеличению размерности модели. Поэтому целесообразно использовать для моделирования комплекса взаимоувязанных моделей малой размерности. В процессе исследования условий функционирования управляемого процесса обеспечения требований к процессу деятельности в СП необходимо наметить подходы к построению иерархи ческой системы моделей, на основе которых следует решать задачу обеспечения требований к процессу дея тельности СП.

В соответствии с реализуемыми функциями, личный состав СП можно условно разделить на два под множества:

- сотрудники СП – штатные работники, непосредственно реализующие специальные функции по пред назначению;

- руководящий состав СП – реализующий функции планирования работы, контроля и управления в СП.

Процесс выполнения своих обязанностей представляет собой направленное изменение состояния объ ектов, определяющих цели функционирования СП и принадлежащих соответствующему функциональному направлению деятельности, и представляет собой в общем случае процесс регулирования параметров этих объ ектов непосредственно или с помощью технических и (или) вспомогательных средств.

Подсистема сотрудников СП выступает в качестве объекта управления, реализующего в зависимости от особенностей направления деятельности принципы разомкнутого управления и управления с обратной связью.

При этом в ситуации, не предусмотренной требованиями нормативных документов, сотрудник руководствуется интересами безопасности и здравым смыслом, что предполагает реализацию принципа адаптации.

С другой стороны, в соответствии с требованиями руководящих документов, наряду с вопросами орга низации и планирования деятельности, должностные обязанности РС СП включают вопросы контроля за обес печением требований к процессу деятельности, а так же своевременное принятие мер в случаях нарушений.

Реализация этих требований заключается в управлении сотрудниками, которые в соответствии со свои ми функциональными обязанностями, несут персональную ответственность за конкретное функциональное направление деятельности.

Таким образом, РС СП реализует функцию управления и выступает в качестве управляющего объекта по отношению к сотрудникам, реализующим в свою очередь, принцип компенсации при обеспечении задач СП.

На основании этого, в работе предлагается рассматривать процесс функционирования СП как совокуп ность следующих процессов, вложенных во времени и в пространстве:

процесс управления сотрудниками параметрами объектов определяющих качество СП, в соответствии с планами и требованиями руководящих документов;

процесс контроля обеспечения требований к параметрам объектов определяющих качество функциони рования СП, РС всех ступеней в соответствии с планами проверки и своими обязанностями;

Теоретические, организационные, учебно-методические и правовые проблемы процесс обеспечения РС СП требований к процессу деятельности на этапе ее осуществления, при из менении качества действий сотрудников в соответствии со своими полномочиями.

Обобщенная модель управляемого процесса функционирования СП, изображена на рис. 1.

Функции сотрудников СП Определение требований к Анализ состояния процесса процессу Подсистема контроля требований к объектам СП Принятие и реализация решения Контроль объектов определяющих требования к процессу Подсистема руководящи х докуме нтов Подсистема планирования Подсистема поступления сотрудников по направлениям задач по направлениям деятельности СП деятельности Направления деятельности Контроль объектов определяющих Принятие и реализация решения требования к процессу Анализ состояния процесса Планирование по направлениям деятельности Определение требований к процессу Функции руководящего состава СП Рис. 1. Обобщенная модель процесса функционирования СП.

В составе обобщенной модели процесса функционирования СП необходимо выделить функционально распределенные процессы:

управляемый процесс реализации действий по основным направлениям деятельности СП в зависимости от состояния основных объектов деятельности;

управляемый процесс оперативного контроля качества обеспечения требований к процессу деятельно сти в СП;

управляемый процесс принятия и реализации решения РС СП управляющего воздействия, целью кото рого является обеспечения качества действий структуры сотрудников СП.

Определение функциональных подсистем модели системы управления проведено с учетом, разделения функциональных областей деятельности и средств контроля и управления при условии, что значительное коли чество реализуемых в СП процессов осуществляются при непосредственном участии сотрудников.

Таким образом, важным этапом обеспечения процесса принятия решения РС СП при реализации основ ных направлений деятельности сотрудниками СП, является разработка аналитической модели управляемого процесса обеспечения требований к деятельности специальных подразделений на стационарных объектах.

На основе анализ особенностей процесса, для его формализации, обоснована конструктивность приме нения аппарата теории управляемых полумарковских процессов.

Постанова задачи:

N – количество направлений деятельности СП K – количество сотрудников, реализующих n-е направление деятельности СП;

Множество состояний k-й структуры n-го направления деятельности сотрудников СП.

k G1 – состояние включения в процесс деятельности сотрудника k-й структуры n-го направления дея тельности СП;

k G2 – состояние пребывания сотрудника k-й структуры n-го направления деятельности СП в доступ ном для замены резерве;

k G3 – состояние пребывания сотрудника k-й структуры n-го направления деятельности СП в недос тупном для замены резерве;

Теоретические, организационные, учебно-методические и правовые проблемы n K1 – количество сотрудников k-й структуры n-го направления деятельности СП находящихся в со стоянии включения в процесс деятельности;

n K2 – количество сотрудников k-й структуры n-го направления деятельности СП находящихся в со стоянии доступного для замены резерве;

n K3 – количество сотрудников k-й структуры n-го направления деятельности СП находящихся в со стоянии недоступного для замены резерве;

n iр.н – среднее время работы k-го сотрудника СП n-го направления деятельности до состояния недоступного резерва n iр.д –среднее время работы k-го сотрудника n-го направления деятельности до состояния доступного резерва n kрез.д – среднее время пребывания в состоянии доступного резерва k-го сотрудника n-го направле ния деятельности до состояния работа n kрез.н – среднее время пребывания в состоянии доступного резерва k-го сотрудника n-го направле ния деятельности до состояния недоступного резерва.

Граф процесса функционирования k-й структуры личного состава n-го направления деятельности пред ставлен на рис. 2.

Управляющие воздействия РС СП представляют собой изменение времени пребывания k-го сотрудника n-го направления деятельности в одном из множества допустимых состояний.

( ) n n n n n упрij = f Pош, Pоп, Pош.тр., Pоп.тр. (1) где Pkn – вероятность ошибочного выполнения i-й операции на n-м направлении;

ош Pkn – вероятность снижения оперативности выполнения i -й операции на n-м направлении;

оп Pkn ош.тр. – требования к вероятности ошибочного выполнения i -й операции на n-м направлении;

Pkn – требования к вероятности оперативного выполнения i -й операции на n-м направлении.

оп.тр.

n n K1 K k k G1 G k G n K Рис.2. Граф управляемого процесса функционирования k-го сотрудника n-й структуры Уравнение баланса име ет вид (2):

1 = P ( K1n ) + P ( K 2 ( t ) ) + P ( K 3n ( t ) ) n (2) Теоретические, организационные, учебно-методические и правовые проблемы Поскольку известны только средние времена пребывания k-го сотрудника n-го направления в состояни ях процесса деятельности, то в качестве законов распределения переходов достаточно взять показательное рас пределение с параметрами:

12 = in упр n р.д 13 = упр n n iр.н (3) 21 = in упр n рез.д 32 = in упр n р.д Тогда матрица переходных вероятностей управляемого процесса имеет вид:

12 Pij упр = 21 0 0 (4) 0 Рассматривая управляемый процесс функционирования как полумарковский, найдем вероятности пере Q12 ( t ), Q13 (t ), Q21 (t ), Q32 ( t ).

ходов Функции распределения для случайных величин характеризующих время пребывания случайного про цесса в различных состояниях деятельности имеет вид:

G12 (t ) = 1 e12t G21(t ) = 1 e 21t (5) 32t G32 (t ) = 1 e G13 (t ) = 1 e 13t Таким образом, получаем:

) ( t 1 e (12 + 21 )t Q12 (t ) = [1 G 21 ( )]dG12 ( ) = 12 + ) ( t 1 e (13 + 31 )t Q13 (t ) = [1 G32 ( )]dG13 ( ) = 13 + ) ( t 1 e(32 + 21 )t Q32 (t ) = [1 G21( )]dG32 ( ) = 21 + Теоретические, организационные, учебно-методические и правовые проблемы t Q21(t ) = [1 G12 ( )][1 G13 ( )]dG21( ) = 0 (6) ) ( 12 + 1 e(21 + 12 + 13 )t = 21 + 12 + Находим стационарные вероятности переходов:

in n 13 р.д упр ( )( ) 13 = = 13 + 32 iр.н упр13 in n n n р.д упр in n рез.д упр ( )( ) 32 = = 21 + 32 in n 32 in n р.д упр р.д упр 12 + 21 = = 21 + 12 + ( inр.д n 12 )+ ( inр.н n 13 ) упр упр ( iрез.д упр21)( iр.д упр12 )+ ( iр.н упр13 )+ ( inрез.д n 21)) ( = n n n n n n упр in n рез.д упр ( )( ) 12 = = (7) 12 + 21 in n 12 in n рез.д упр р.д упр Таким образом, модель управляемого процесса обеспечения требований к деятельности РС СП может быть представлена в виде управляемого полумарковского процесса с применением в качестве закона распреде ления случайных длительностей функционирования сотрудников на отдельных направлениях деятельности показательного закона распределения.

Предложенная формализация моделей процессов обеспечения требований к процессу деятельности в звене личного состава СП предназначена для последующего синтеза методики принятия оптимального решения о необходимости применения допустимых управляющих воздействий для обеспечения цели функционирования СП.

Список литературы 1. Ахутин В. М, Зингерман А. М, Кислицин М. М, и др. Комплексная оценка функционального со стояния человека-оператора и системах управления. – В кн.: Проблемы космической биологии. Т.

34, М., 1977. –С. 120-125.

2. Крыжанвская О. В., Наумович А. С. Автоматизированные прогностические и диагностические системы для комплексной оценки функционального состояния организма человека // Жизнь и ком пьютер-91: Тез. Всесоюз. Семинара, 10, 91. Харьков 1991.– С. 187-189.

3. Семкин С.Н. Смирнов С.В. Оценка эргатической составляющей систем защиты информации./ Сборник трудов ХI Международной научной конференции "Информатизация правоохранитель ных систем". – М.: Академия управления МВД РФ, ИЗ ОПЫТА ПРЕПОДАВАНИЯ ДИСЦИПЛИН «КОМПЬЮТЕРНАЯ РАЗВЕДКА» И «ПРИМЕНЕНИЕ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ В АНАЛИТИЧЕСКОЙ РАЗВЕДКЕ»

К.ю.н., доцент В.Ю.Рогозин, к.т.н., доцент Д.В.Захаров (Волгоградская академия МВД России) Начиная с 2005 года кафедра информатики и математики Волгоградской академии МВД России препо дает новые дисциплины «Компьютерная разведка» (КР) и «Применение информационных технологий в анали тической разведке» (ПИТАР) для курсантов четвертого курса факультета подготовки сотрудников служб кри минальной милиции (специальность – 030505.65).

Целью изучения данных дисциплин является подготовка специалистов, имеющих представление о зна чимости современных информационных технологий в таких специфических областях профессиональной дея тельности, как аналитическая разведка, включая методы математического моделирования, применение которых Теоретические, организационные, учебно-методические и правовые проблемы на практике будет способствовать решению наиболее сложных задач, отнесенных к компетенции криминаль ной милиции, и, в частности, подразделений по борьбе с организованной преступностью. Обучаемые должны знать тактику и порядок применения специальных программных и технических средств компьютерной развед ки. В ходе изучения вышеозначенных дисциплин у обучаемых должны быть сформированы умения и первона чальные навыки применения этих программных средств.

Специфика преподавания указанных дисциплин заключается в большом объеме специальной информа ции как правового, так и программно-технического характера. При таких обстоятельствах достаточно хорошо просматривается преемственность изучения КР и ПИТАР после первоначального знакомства с компьютерными информационными технологиями в рамках дисциплины «Информатика и математика», которая преподается данной категории обучаемых на первом курсе.

Опыт преподавания этих или аналогичных по содержанию дисциплин в других вузах МВД России по казывает, что у обучаемых возникают немалые трудности в усвоении материала. На наш взгляд это происходит прежде всего из-за отсутствия сколь бы то ни было серьезной базовой математической и инженерно технической подготовки в области аппаратных и программных средств, что, с одной стороны, естественно для гуманитарного вуза, но с другой стороны, не позволяет преподавателю в должной мере раскрыть содержание изучаемого материала. В этой связи, а также для демонстрации практического применения полученных знаний на кафедре разработано несколько методических рекомендаций по проведению практических занятий, направ ленных на повышение мотивации к изучению данных дисциплин курсантами.

Одно из практических занятий «Расчет времени вскрытия пароля» предназначено для изучения курсан тами возможностей современных компьютеров по «взлому» предполагаемых паролей. При помощи встроенно го в операционную систему Windows программного блока Visual Basic (VBA) обучаемые, четко следуя инст рукциям, создают небольшой программный блок, позволяющий подобрать набранный пароль и просчитать время, затраченное компьютером на эту процедуру. Сама программа построена по принципу перебора и под становки цифр и символов русского и английского языков. Мы умышленно ограничились только этими тремя составляющими и не исследуем пароли, в состав которых входят другие знаки и специальные символы (№, #, §, $ и т.п.), так как в этом случае мы в реальном времени (за одно занятие) опытным путем получаем результаты исследования паролей, состоящих из 1-го – 5-ти символов. В среднем результаты работы таковы (РС – Celeron 2,4 ГГц): односимвольный пароль – 0 мс;

двух символьный – 0,0002 с;

трех символьный – 0,171 с;

четырех сим вольный – 11,390 с;

пять символов – 13,5 мин. Полученные результаты могут быть использованы при составле нии прогноза о возможностях данного компьютера по вскрытию паролей большей длинны (до 10-12 символов).

В этих целях использовалась стандартная функция MS Excel – построение линии тренда. На основе точечной диаграммы, построенной по результатам исследований, была построена линия тренда (для аппроксимации по лученного опытным путем времени, затраченного компьютером на определение пароля, был взят полином чет вертой степени). Полученная теоретическая кривая дала хорошую прогнозную оценку времени, необходимого для вскрытия шести символьного пароля (см. рисунок). Мы вполне осознаем, что полученные результаты мож но считать достаточно условными при всех тех ограничениях, которые были использованы. Однако степень наглядности чрезвычайно высока.

В ходе проведения подобных занятий нами достигаются следующие цели. Во-первых, в результате про деланной работы обучаемые получают наглядную демонстрацию того факта, что одинаковые (по техническому описанию) компьютеры в реальности все же обладают различной производительностью, что немаловажно учи тывать при проведении следственных экспериментов. Особенно наглядно этот факт подтверждается, когда на соседних компьютерах пытаются подобрать одинаковый пароль. Во-вторых, обучаемые получают хотя бы час тичное представление о необходимой степени подготовленности, привлекаемых к проведению некоторых след ственных действий специалистов. В-третьих, полученные результаты однозначно подтверждают необходи мость использования паролей, состоящих из комбинаций букв латинского и русского алфавитов в сочетании с цифрами и длинною не менее 10-12 символов. Эксперименты, проводимые курсантами, убедительно свиде тельствуют, что одноалфавитный (или попросту цифровой) пароль значительно более уязвим по сравнению со смешанными (буквенно-цифровыми) паролями.

Кроме того, курсанты закрепляют навыки работы с офисными приложениями и получают представле ние о более широких возможностях этих приложений (возможность программирования в VBA и прогнозирова ния в MS Excel).

Теоретические, организационные, учебно-методические и правовые проблемы y = 47,084x3 - 316,82x2 + 627,93x - 356, R 2 = 0, Время вскрытия (сек.) опытные теоретические 1 2 3 4 5 - Количество символов в пароле Рис. Опытные и расчетные значения времени вскрытия паролей в зависимости от количества символов в пароле В ходе преподавания дисциплин «Компьютерная разведка» и «Применение информационных техноло гий в аналитической разведке» курсанты должны получить представление о методах и способах получения ин формации из защищенных источников, что сопряжено с применением программных средств, способных нанес ти реальный вред операционной системе, установленной в классах. Возникает необходимость обеспечения со хранности установленных в классах операционных систем и иного программного обеспечения. Раздельная за грузка операционной системы для нас так же представляется неудобной формой работы. В целях обеспечения сохранности программного обеспечения и упрощения процедуры перехода из одной операционной системы в другую (в случае использования программного обеспечения с соответствующей адаптацией) нами используется «Виртуальный компьютер», что позволяет продемонстрировать не только работу нескольких операционных сред, но и безбоязненно применять программы взлома паролей, клавиатурные шпионы и иное, рассматриваемое в курсе программное обеспечение.

Обучаемые, работая в среде «Виртуального компьютера» с успехом применяют программы преодоле ния парольной защиты BIOS, исследуют процедуру расшифровки информации о паролях, находящихся в PWL файлах. Кроме того применяются средства взлома паролей офисных приложений и архивных файлов, посколь ку «Виртуальный компьютер» позволяет устанавливать практически все прикладные программы, используемые в стандартных комплектациях персональных компьютеров.

В случае же порчи самого «Виртуального компьютера» он легко восстанавливается простым копирова нием образа в заранее определенное место, что можно произвести в конце каждого занятия (или в оперативном режиме) централизованно, чтобы устранить нежелательные изменения в настройках, введенных обучаемыми.

Вопросы, связанные с соблюдением принципов нераспространения вредоносных программ решаются следующим образом. Все программы рассматриваемого курса имеют ограничения по использованию. Напри мер, при взломе пароля на доступ к системе ограничена длинна парольной комбинации до трех символов, про грамма попросту не способна вскрыть пароль большей длинны. Процедура подбора паролей к офисным файлам актуальна только при работе с файлами MS Office версии 2000 и паролями не длиннее пяти символов.

В ходе проведения занятий широко применяются мультимедийные технологии для наглядной демонст рации каждого из этапов занятия. Как показала практика, почти во всех группах задаваемые вопросы повторя ются. Нами подготовлены рекомендации по решению типовых проблемных ситуаций. Мультимедиа проектор позволяет наглядно продемонстрировать порядок работы в целом или осуществлять пошаговое руководство действиями обучаемых.

По завершении изучения вышеозначенных дисциплин принимается комплексный зачет. Теоретическая часть принимается в виде тестовых заданий на компьютере. Каждый обучаемый из общего числа имеющихся вопросов получает не более десяти и при положительном ответе на 80 % их них, теоретическая часть считается зачтенной. Практическая часть построена таким образом, чтобы курсанты могли продемонстрировать приобре тенные навыки работы. Каждому выдается индивидуальное задание. Суть задания состоит в следующем:

- на полученной дискете (3,5'') необходимо восстановить ранее стертый файл, причем файлов несколько и надо однозначно определиться, который их них следует восстанавливать;

- восстановленный файл содержит документ MS Word, доступ к которому закрыт паролем, который не обходимо «взломать», чтобы добраться до текста самого задания;

- вводная теоретическая часть текстового задания читается свободно и только само задание представля ет из себя зашифрованный текст (методом замены). Полученная в результате расшифровки фраза представляет ся экзаменатору.

Теоретические, организационные, учебно-методические и правовые проблемы Таким образом, обучаемый в ходе выполнения зачетного практического задания решает комплексную задачу восстановления файла, преодоления парольной защиты и дешифровки содержимого этого файла. Конеч ный итог – восстановленная, осмысленная фраза, которая для каждого из испытуемых индивидуальна и непо вторима.

МОДЕЛИРОВАНИЕ ПРОЦЕССОВ РАСПРОСТРАНЕНИЯ ДЕВИАНТНОГО ПОВЕДЕНИЯ И ПРЕСТУПНОСТИ НА ОСНОВЕ ИННОВАЦИОННОГО ПОДХОДА К. ф.-м. н., доцент С.Н. Тростянский (Воронежский институт МВД России) Под девиантным поведением понимается [1]: 1) поступок, действие человека, не соответствующие со циально установленным или фактически сложившимся в данном обществе нормам;

2) социальное явление, вы раженное в массовых формах человеческой деятельности, не соответствующее социально установленным или фактически сложившимся в данном обществе стандартам. Рассматривая преступление и преступность, можно, соответственно, определить их как поведение или социальное явление не соответствующие нормам уголовного законодательства. В то же время формирующиеся социальные стандарты (нормы) поведения для определенных подсистем социальной системы или даже для всей системы могут отличаться от законодательно установленных норм. В этом случае, преступное поведение, девиантное по отношению к законодательным нормам, не будет являться девиантным по отношению к социальным нормам соответствующей социальной подсистемы или всей системы. Важно определить условия, при которых происходит переход девиации в общественно признанную норму, так как поведение большинства членов социальной системы определяется социальными нормами.

Формирование девиантного поведения в социальной системе с точки зрения конфликта между выбором социально одобряемых целей и социально одобряемых норм поведения для достижения этих целей рассматри валось в теории социальной аномии Мертона [2]. Согласно теории Мертона, единственной недевиантной груп пой населения являются конформисты, готовые достигать социальных целей в соответствии с социальными нормами. По отношению к социальным нормам, лояльны также ритуалисты, понижающие уровень притязаний, отказываясь от социально признаваемых целей. Инноваторы готовы достигать социально одобряемых целей, не придерживаясь социально одобряемых норм поведения, а ретретисты отказываются как от социально признан ных целей, так и от социально признанных норм (бегство от действительности).

Среди населения, находящегося в состоянии фрустрации от конфликта несовместимости социальных целей и законных норм для их достижения, происходит распространение инновационных девиантных способов достижения социально признанных целей, нелегальными, соответственно, преступными способами. К таким преступным способам могут относиться разного рода корыстные преступления: взяточничество, кражи, неза конный оборот наркотиков, рэкет, а также связанная с ними организованная преступность. Преступное поведе ние также присуще появляющимся вследствие социальных фрустраций ретретистам: пьяницам, наркоманам, психически больным, другим социально деградировавшим слоям населения, для которых свойственны как ко рыстные преступления, так и немотивированные выгодой проявления агрессии. Таким образом, преступность можно разделить по характеру разрешения конфликта целей и норм, на преступность инноваторов и преступ ность ретретистов.

Распространение инновационных процессов, в том числе инноваций преступного характера, можно рассматривать в соответствии с закономерностями, выявленными для распространения (диффузии) инноваций в работе Роджерса [3]. Э. Роджерс выделил по скорости внедрения инноваций и склонности к риску следующие пять типов населения: 1) инноваторы, число которых составляет 2,5%;

2) ранние адапторы, составляющие 13,5%;

3) раннее меньшинство, составляющее 34%, это колеблющиеся;

4) позднее большинство, составляющее 34%, это скептики;

5) поздние адапторы, составляющие 16%, это традиционалисты, они последними принима ют инновации.

Таким образом, распространение новых идей, в том числе криминальных, оказывается возможным только с помощью отдельных слоев населения, которые более предрасположены к новой идеологии. Вероятно, среди молодежи наибольший процент людей, не имеющих устойчивых традиционных взглядов и подвержен ных восприятию различных инноваций. В соответствии с теорией инноваций, критической массой распростра нения инновации становится 5% популяции, но чтобы их убедить, следует охватить идеей 50% популяции. При переходе через 20%, инновация живет уже своей жизнью, то есть становится одной из общественно принятых норм. Это можно объяснить включением в принятие инноваций конформистов, составляющих раннее мень шинство и позднее большинство, а в дальнейшем и ритуалистов, соответствующих поздним адапторам.

Криминологическая оценка на основе опросов сотрудников правоохранительных органов различных регионов по вопросу о долях населения, включенных в совершение преступлений или активно стремящихся жить в рамках закона, приводит к выводам, что в современном российском обществе все более отчетливо выде ляются разные его подсистемы [4]: 1) легалистская, ориентированная на закон;

2) криминальная, устойчиво ориентированная на противоправные нормы поведения и лидеров организованной преступности;

3) маргиналь ная, ориентирующаяся в зависимости от ситуации и характера решаемых проблем на прямо противоположные нормы поведения и различных лидеров. По этим оценкам, размеры криминальной подсистемы в отдельных ре гионах, перешли критический 20% порог. При этом, криминальные нормы поведения становятся уже не девиа цией, а конкурирующей с легалисткой, альтернативной общественно признанной нормой, что обуславливает Теоретические, организационные, учебно-методические и правовые проблемы синергетический эффект криминализации населения, вследствие перехода в криминальную подсистему части конформистов, придерживающихся общественно признанных норм.

Подобный синергетический эффект криминализации в социальной системе при увеличении концентра ции носителей криминальных норм, наблюдается и в локальных группах населения с активной межличностной коммуникацией, таких например, как школы или микрорайоны. Так, например, в работе [5] при анализе карти ны распределения несовершеннолетних правонарушителей по микрорайонам города, а также территориального распределения неблагополучных семей, воспитывающих детей и подростков было показано, что 7–кратный разрыв по неблагополучным семьям сопровождался 13-кратным разрывом по числу несовершеннолетних пра вонарушителей.

Для предотвращения синергетического эффекта криминализации можно предложить концентрировать силы правоохранительных органов именно на тех территориальных образованиях и на тех локальных группах населения, где существует риск перехода размеров криминальной подсистемы через критический 20 % порог, когда криминальные отношения могут перейти в общественном сознании в поведенческую норму.

Инновационная и ретретистская компоненты преступности различаются между собой не только отно шением соответствующих им преступников к социально признаваемым целям, но и механизмами передачи, а также динамикой распространения. Распространение криминогенных инновационных процессов связано с пе редачей преступной идеологии или технологии и происходит, согласно исследованиям [6] по каналам "физиче ской" и "информационной" связи. "Физическая" связь реализуется через непосредственное, основанное на пря мом контакте, взаимодействие представителей преступности с вовлекаемыми в преступную деятельность людьми. "Информационная" связь осуществляется через освоение населением, особенно молодежью, норм по ведения, традиций и обычаев криминального мира.

Распространение инноваций как легального, так и преступного характера происходит по типу эпидеми ческого процесса [1].Исследуем динамику распространения инноваций в социальной системе. Рассмотрим со общество численностью N. Обозначим через y – число людей “зараженных” криминальной инновационной идеей “x”. Будем считать что “зараженный” контактирует с n людьми за единичный интервал времени, у каж дого из которых вероятность инновационного заражения k1. Иначе говоря, такой человек заражает за единич ный интервал времени инновационной идеей “х”: k1n человек (точнее, k1n есть математическое ожидание числа “зараженных”). Вероятность общения “незараженного” человека с “зараженным” равна y N, вероят ность заражения в результате общения есть произведение этой вероятности на k1. Следовательно, вероятность “заражения” хотя бы один раз за n контактов может быть выражена формулой:

n y q = 1 1 k1.

N Ввиду малости вероятности k1 и числа y по сравнению с числом N :

y q k1 n.

N При этом ошибка имеет порядок k12 y 2 N. Математическое ожидание числа “зараженных” от ранее “заразившихся” людей, за единичный интервал времени равно произведению q на число “незаразившихся” людей: q( N y ). Кроме такого межличностного “заражения” возможно информационное заражение через пре ступную субкультуру или ее устойчивых идеологов. Допустим, численность таких идеологов равна M, сред нее количество их пропагандистских контактов за единичный интервал времени равно k 2, вероятность их встречи с “незараженными” будет соответственно ( N y ) N и вероятность заражения при контакте равна k 3.

Тогда, математическое ожидание числа “заразившихся” криминальной инновацией за единичный интервал времени от идеологов преступности равно: Mk 2 k 3 ( N y ) N. Кроме того, необходимо учесть вероятность добровольного или вынужденного отказа людей от преступной инновации “х”, за единичный интервал времени, равную g. Тогда математическое ожидание изменения числа “зараженных” за единичный интервал времени можно записать уравнением:

( N y) ( N y) dy =a y + Mb gy, (1) dt N N где a = k1n и b = k 2 k 3 - соответствующие вероятности инновационного “заражения” за единичный ин тервал времени, y – число лиц принявших инновацию, N – максимально возможное число лиц способных принять инновацию, M – численность идеологов инновации, g – вероятность отказа от инновации за единич ный интервал времени.

Уравнением, схожим по форме с частным случаем уравнения (1) при g =0, моделировалось распро странение экономических инноваций в социальной системе [7]. Решение уравнения (1) описывается S – образ Теоретические, организационные, учебно-методические и правовые проблемы ной функцией [8]. В приближении M = 0 решение уравнения (1), описывающее динамику инновационого про цесса, определяется логистической S – образной функцией вида:

y (t ) = P /(1 + exp(C At )), где P = N (a g ) / a ;

A = a g ;

C – определяется из значения y (0). Так, например, динамика роста ко личества зарегистрированных преступлений y (t ), связанных с незаконным оборотом наркотиков, для многих регионов России по данным с 1994 по 2000 гг. [9], имеет тренд вида логистической функции:

y (t ) = P /(1 + exp(C At )) +, где величина – связана со случайными флуктуациями. Причем для России в целом, коэффициент распространения A =0,52 в год, а коэффициент насыщения P для логистической функции находится в преде лах от 282600 до 410000 преступлений в год. Для таких городов как Москва и Санкт-Петербург, коэффициенты распространения A соответственно равны 0,72 и 1,30 в год, а коэффициенты насыщения P составляют соот ветственно от 13600 до 27000 в год для Москвы, и от 12700 до 20000 в год для Санкт-Петербурга. Разумеется, эти расчеты соответствуют только зарегистрированным преступлениям и при расчете реального возможного уровня насыщения необходимо умножать значения P на множитель, учитывающий латентность данного вида преступлений. Динамика количества зарегистрированных преступлений совершенных организованными пре ступными группами в России, по данным за 1994–2000 гг. [9], также имеет логистический тренд с коэффициен том A равным 0,23 в год и коэффициентом P составляющим от 46900 до 75000 в год. Динамика выявленных убийств по найму имеет такой же тренд с A =1,05 в год и P от 158 до 200. Итак, для инновационной преступ ности характерно наличие общественно популярных целей и преступных идей для их реализации, что опреде ляет широту аудитории распространения таких идей и дает потенциальную базу для организованной преступ ности. Подобный же механизм распространения, связанный с информационным заражением экстремистскими идеями, свойственен и терроризму.

Преступность ретретистов не имеет целей и идей, объединяющих широкую аудиторию. Это преступ ность разрозненных единиц или разрозненных малых групп. К ретретистской преступности относится боль шинство так называемых бытовых преступлений, большая часть убийств, изнасилования, хулиганства, стихий ные кражи и грабежи. Динамика распространения ретретистской преступности, связанной с распространением асоциального образа жизни, не имеет инновационного характера: она более плавная и линейная, по сравнению с инновационной, и наиболее свойственна регионам с большим числом маргиналов и высокой социальной на пряженностью [10].

Для определения зависимости между различными видами преступности, на основе статистических дан ных [9], были вычислены коэффициенты корреляции по Пирсону между динамикой уровней различных видов преступности в России (Таблица 1). Вычисление коэффициентов корреляции показывает, что уровни преступ ности для преступлений, имеющих преимущественно инновационный характер, таких как преступления в со ставе организованных групп, преступность связанная с незаконным оборотом наркотиков, а также убийства по найму находятся во взаимной значимой положительной корреляционной зависимости, и наоборот, в обратной корреляционной зависимости с уровнями преступности для преступлений характерных для ретретистов, таких как хулиганство, изнасилования, тяжкие телесные повреждения, которые в свою очередь имеют положитель ную корреляционную зависимость между собой. На основании этого можно предположить, что имеют место процессы системного замещения между инновационной и ретретистской компонентами преступности.

Таблица 1.

Коэффициенты корреляции между динамикой различных видов преступности в России за период 1994–2000 гг.

орг. прест. хули- изнасилов. нарко- убийства тяжкие те- убийств по ганст. бизн. лесн. найму орг. прест. хулиганст. -0,84681 изнасилов. -0,95895 0,935889 наркобизн. 0,91998 -0,975 -0,94953 убийства -0,16507 0,313655 0,375321 -0,15576 тяжкие телесн. -0,80133 0,88736 0,930781 -0,82452 0,668152 убий. по найму 0,787566 -0,9798 -0,94147 0,952682 -0,0216 -0,87754 Литература 1. Гилинский Я.И. Социология девиантного поведения как специальная социологическая теория //СоцИс.-1991.№4. С.74.

2. R.K.Merton. Social Theory and Social Structure. – N.Y., 1957, p.140.

3. Everett M. Rogers. Diffusion of innovation.: 4 ed. N.Y.:Free press.-1995.-518 p.

4. Преступность в России и проблемы борьбы с ней. Под редакцией профессора А.И. Долговой – М., Российская криминологическая ассоциация, 2001. – С.244.

5. Ермаков В.Д., Крюкова Н.И. Несовершеннолетние преступники в России. – М. – 1998. – 311с.

Теоретические, организационные, учебно-методические и правовые проблемы 6. Плешаков В.А. Диссертация на соискание ученой степени доктора юридических наук “Кримино логическая безопасность и ее обеспечение в сфере взаимовлияния организованной преступности и преступности несовершеннолетних“.–М.–Академия управления МВД. – 1998.

7. Bass, F.M. A new product growth model for consumer durables. – Management Science, 15 (January). 1969.-P.215-227.

8. Тростянский С.Н. Моделирование формирования общественного мнения на основе эпидемических процессов// Вестник Воронежского Института МВД России. №2(7). 2000. С.190194.


9. Статистический сборник “Преступность и правонарушения. 1998“.– М.–1999;

Статистический сборник “Преступность и правонарушения. 1999“.–М.–2000;

Статистический сборник “Пре ступность и правонарушения. 2000“.–М.–2001.

10. Основные показатели служебной деятельности за 1996 – 2000 г.г. ГУВД Воронежской Области.

– г.Воронеж. – 51с.

ПРИМЕНЕНИЕ МОДЕЛЕЙ ВРЕМЕННЫХ РЯДОВ ДЛЯ ПРОГНОЗИРОВАНИЯ КОЛИЧЕСТВА СОВЕРШЕННЫХ ПРЕСТУПЛЕНИЙ А.Б. Флока (Академия управления МВД России) Для принятия рациональных управленческих решений требуется полная, всесторонняя оценка ситуации и надежный прогноз развития событий. Прогнозирование уже давно стало непременным условием успешной деятельности различных социальных систем, к которым относятся и органы внутренних дел.

Эффективность деятельности органов внутренних дел в профилактике и борьбе с преступностью на прямую связана с пониманием процессов влияющих на преступность, ее уровень, структуру, динамику. Много численные управленческие решения должны основываться на краткосрочных, среднесрочных и долговремен ных прогнозах преступности.

Несмотря на то, что рассматриваемый краткосрочный прогноз количества зарегистрированных престу плений носит вероятностный, статистический характер, он является вполне надежным, поскольку основывается на строгих методах научного исследования.

Для проведения прогноза предлагается использовать модели авторегрессионного интегрированного скользящего среднего. Эти модели объясняют поведение временного ряда, исходя исключительно из его значе ний в предыдущие моменты времени. Эти модели получили название моделей Бокса-Дженкинса для стацио нарных временных рядов.

yt называется строго стационарным или стационарным в узком смысле, если совместное распреде Ряд ление m наблюдений yt, yt,K, yt не зависят от сдвига по времени, то есть совпадает с распределением 1 2 m yt1 + t, yt2 + t,K, ytm + t для любых m, t, t1,K, tm.

Как правило, нас интересует средние значения и ковариации, а не все распределение. Поэтому часто используется понятие слабой стационарности или стационарности в широком смысле, которое состоит в том, yt не зависят от момента времени t :

что среднее, дисперсия и ковариации E ( yt ) = µ, V ( yt ) = 0, Cov( yt, yt k ) = k.

Из строгой стационарности следует слабая стационарность. Для построения моделей Бокса-Дженкинса достаточно, чтобы исследуемые временные ряды были слабо стационарны, поэтому в дальнейшем мы будем везде под стационарностью понимать слабую стационарность.

Рассмотрим временной ряд ежемесячных данных о количестве совершенных преступлений с января 1993 по декабрь 2003 года в Курганской области (рис. 1).

Теоретические, организационные, учебно-методические и правовые проблемы Число совершенных преступлений 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 Рис. 1. График количества совершенных преступлений на территории Курганской области Исследование автокорреляционной функция исследуемого ряда показало, что наблюдается сильная ав токорреляция между соседними членами ряда, причем значения коэффициентов автокорреляции убывают очень медленно, отсюда следует, что ряд нестационарный.

Применение моделей Бокса-Дженкинса непосредственно к временному ряду количества совершенных преступлений невозможно, т.к. эти модели основаны на предположении о стационарности временного ряда.

Во многих случаях взятие разностей временных рядов позволяет получить стационарные временные ряды.

Первые разности стохастического процесса имеют вид:

yt = yt yt 1.

yt Если первые разности временного ряда стационарны, то ряд называется интегрируемым первого порядка. В противном случае дальнейшее взятие разностей приведет ко вторым разностям:

2 yt = yt yt 1.

yt Если этот ряд стационарен, то называется интегрируемым второго порядка. Если мы получаем пер вый стационарный ряд после k–кратного взятия разностей, то процесс называется интегрируемым k–го порядка.

Временной ряд, сгенерированный случайным процессом, интегрируемым k–го порядка, также называется ин тегрируемым k–го порядка.

Исследование графика первых разностей исследуемого ряда и его автокорреляционной функции позво лили выдвинуть гипотезу о том, что он является интегрируемым первого порядка.

Для проверки гипотезы об интегрируемости первого порядка была использована интеграционная стати стика Дарбина-Уотсона (IDW-статистика):

n (y yt 1 ) t IDW = t =, n (y yt ) t t = yt – исследуемый на стационарность временной ряд;

где yt – выборочное среднее временного ряда.

yt Для первых разностей исследуемого на стационарность ряда интеграционная статистика Дарбина Уатсона равна:

Теоретические, организационные, учебно-методические и правовые проблемы n (y yt 1 ) t IDW = = = 2,71.

t = n (y yt ) t t = Для оценки стационарности необходимо сопоставить расчетное значение IDW-статистики с критиче скими. Поскольку распределение IDW-статистики не соответствует ни одному из известных теоретических распределений, критические значения будут представлены не единичными значениями, а интервалами прямой в окрестности точки 2.

Критическая точка статистики Дарбина-Уатсона для оценки стационарных временных рядов и 150 на блюдений (взято более ближайшее более строгое значение) и уровня значимости 5% – 1,6983.

Расчетное значение IDW-статистики 2,71 больше критического, следовательно гипотеза о стационарно yt сти временного ряда первых разностей не отклоняется на уровне значимости 5%.

Следовательно, исследуемый временной ряд числа зарегистрированных преступлений является интег рируемым первого порядка.

Автокорреляционная функция первых разностей исследуемого ряда показала высокое значение авто корреляционной функции с лагом 12 месяцев, что позволяет предположить наличие сезонной составляющей временного ряда. Наличие сезонных колебаний временного ряда имеет большое значение для идентификации модели, и требует учета сезонных составляющих в модели.

Для подтверждения этого предположения был построен график спектральной плотности, который представляет собой разложение в ряд Фурье автокорреляционной функции:

p ( ) = 2( 0 + 2 cos ), P P = где Р – период длины предполагаемой периодической вариации.

Для одного временного ряда – одной реализации случайного процесса оценкой спектральной плотности является выборочная спектральная плотность:

n ) p ( ) = 2(c0 + 2 g c cos ), P P = где эмпирические (полученные в результате одной реализации случайного процесса автоковариации g, для того, чтобы получить состоятельные оценки. Чаще всего ис взвешены весами из подходящего «окна»

пользуются следующие спектральные окна: Тьюки, Хемминга, Барлетта, Даниэля и Парзена;

1n c0 = ( yt yt ) 2 – оценка 0 ;

n t = 1 n ( yt y )( yt + y ).

c = – оценка n t = Расчет спектральной плотности показал, что наибольший вклад в колебательный процесс временного ряда вносят колебания с периодом равным 12 месяцам.

Перейдем непосредственно к построению моделей Бокса-Дженкинса, для этого рассмотрим следующий класс моделей стационарных временных рядов:

d yt 1 d yt 1 L 1 d yt 1 = + t 1 t 1 L 1 t q, t iid (0, 2 ).

Для более компактной формы записи введем оператор сдвига L:

yt k = Lk yt.

Тогда в более компактной форме записи:

p ( L) d yt = + q ( L), t iid (0, 2 ), где p ( L ) = 1 1 L L p L ;

p Теоретические, организационные, учебно-методические и правовые проблемы q ( L) = 1 1L L q Lq – полиномы от оператора сдвига.

Эта модель получила название авторегрессионного проинтегрированного скользящего среднего и обо значается: АРПСС(p,d,q), где p,d,q – параметры модели.

При наличии сезонных колебаний временного ряда модель усложняется наличием сезонных компонент и в короткой форме записи выглядит следующим образом:

p ( L)* ( Ls ) d s yt = q ( L)* ( Ls ) t, D P Q p ( L) = 1 1L L p Lp ;

где * ( Ls ) = 1 1* Ls L P LsP ;

* P q ( L) = 1 1L L q Lq ;

* ( Ls ) = 1 1* Ls L Q LsQ.

* Q Если вместо символа взятия разности (1 L), то получим представ вновь использовать оператор ление временного ряда yt с сезонностью s, как мультипликативного сезонного процесса общего вида АРПСС ( p, d, q) ( P, D, Q) :

p ( L)* ( Ls )(1 Ls ) D (1 L) d yt = q ( L)* ( Ls ) t.

P Q Моделирование временных рядов состоит из следующих шагов:

Шаг 1. Проверка на стационарность, которая включает: изучение графика временного ряда, его авто корреляционной функции, выполнение тестов на стационарность. В случае нестационарности – взятие разно стей и повтор тестов.

Шаг 2. Спецификация модели или, другими словами, выбор типов возможных процессов, сгенериро вавших этот временной ряд.

В результате должны быть получены шесть параметров (возможно часть из них равна нулю): d – поря док интегрируемости, p – порядок компоненты авторегрессии, q – порядок компоненты скользящего среднего.

Если автокорреляционная функция и спектральный анализ показывают наличие сезонных колебаний временного ряда необходимо определить параметры мультипликативной сезонной составляющей: D – порядок сезонной интегрируемости, P и Q – порядки авторегрессии и скользящего среднего для сезонной модели соот ветственно.

Шаг 3. Оценивание параметров для всех возможных версий модели подходящими статистическими ме тодами: обычным методом наименьших квадратов, когда модель содержит только составляющие авторегрес сии. В случае если есть основание полагать, что в модели присутствуют составляющие скользящего среднего, применяют методы максимального правдоподобия: МакЛеода и Сейлза с ретрополяцией и Меларда.

Шаг 4. Проверка адекватности и выбор наиболее подходящей модели среди оцененных. Критериями p ( L), * ( Ls ), q ( L), * ( Ls ) ;

анализ ос отбора являются: значимость коэффициентов полиномов: P Q татков, которые должны иметь свойства белого шума.


Если указанным свойствам удовлетворяют несколько моделей вычисляются информационный критерии Шварца и Акаике для каждой модели. На основе сравнения этих критериев выбирается оптимальная модель.

Информационные критерии Шварца и Акаике для моделей временных рядов включают, параметры мо дели p, d, q, P, D, Q :

p+d +q+ P+ D+Q ) AIC = 2 + ln 2 ;

n ( p + d + q + P + D + Q)ln n ) + ln 2.

SH = n Согласно этим критериям выбирается модель с наименьшими значениями критериев. Критерий Швар ца, по сравнению с критерием Акаике, предусматривает большие штрафы за количество параметров модели.

Первый шаг моделирования временных рядов, нами уже выполнен. Найден порядок интегрируемости исследуемого временного ряда, следовательно определен параметр d=1 модели. Практика показывает, что для исследуемого типа временного ряда порядок интегрируемости чаще всего равен единице, реже нулю или двум.

Спектральный анализ и вид автокорреляционной функции показывают наличие сезонной составляющей исследуемого временного ряда. Это требует включения в модель сезонной мультипликативной составляющей и определения порядка сезонной интегрируемости. На практике сезонная интегрируемость D чаще всего берется равной единице. Сезонный лаг s, исходя из спектрального анализа, равен 12 месяцам.

Теоретические, организационные, учебно-методические и правовые проблемы Определение оставшихся параметров: p, q, P, Q непростая задача. Обычно при выборе этих параметров полагаются на результаты исследования автокорреляционной и частной автокорреляционной функции, сравни вая их вид с таблицами модельных примеров.

Согласно методике Бокса-Дженкинса по виду корреляционной и частной автокорреляционной функции исследуемого процесса можно предположить, что процесс можно описать моделями АРПСС ( p, d, q) ( P, D, Q) со следующими параметрами:

АРПСС (0,1,1) (0,1,1) ;

1.

АРПСС (1,1,0) (1,1,0).

2.

Для проведения более широкого исследования можно рассмотреть все возможные комбинации p, q, P, Q, исходя из того, что каждый из перечисленных параметров может принимать значения: {0, 1, 2}. На практике эти параметры чаще всего принадлежат указанному множеству значений. При отсутствии опыта построения моделей временных рядов аналитику органов внутренних дел можно посоветовать метод перебора как основ ной.

Перейдем к третьему шагу моделирования временных рядов – оценивание параметров всех возможных версий модели. Для оценивания параметров модели применялся метод максимального правдоподобия МакЛео да и Сейлза с ретрополяцией. Параметр ретрополяции BC, рассчитывался исходя из соотношения:

BC max( p + sP, q + sQ).

В ходе исследования были проверены все модели авторегрессии и скользящего среднего от нулевого до p ( L), * ( Ls ), q ( L), * ( Ls ) второго порядка. Все коэффициенты полиномов значимы на уровне P Q 5% только у моделей 1 и 2.

Запишем оцененные параметры моделей в табл. 1 и 2.

Из таблицы видно, что первая модель АРПСС (0,1,1) (0,1,1) имеет меньшие значения информа ционных критериев Акаике и Шварца, при равном числе параметров (p, d, q, P, D, Q ), поэтому предпочтение отдаем этой модели.

Табл. 1.

Сводная таблица оценок параметров модели АРПСС(0,1,1)(0,1,1) и информационных критериев Акаике и Шварца АРПСС (0,1,1) (0,1,1) ;

Модель Сезонный лаг = 12 месяцев;

Параметры мо- ) дели = 65513;

AIC=11,15;

SH=11,23.

Стандартная уровень значи Оценка t–статистика ошибка мости % 1 0,388413 0,101151 3,83992 0, 1* 0,822524 0,061634 13,34526 0, Теоретические, организационные, учебно-методические и правовые проблемы Табл. Сводная таблица оценок параметров модели АРПСС(1,1,0)(1,1,0) и информационных критериев Акаике и Шварца.

АРПСС (1,1,0) (1,1,0) ;

Модель Сезонный лаг = 12 месяцев;

Параметры мо- ) дели = 81917;

AIC=11,382;

SH=11, Стандартная уровень значи Оценка t–статистика ошибка мости % 1 -0,247902 0,092522 -2,67939 0, 1* -0,369021 0,093158 -3,96125 0, Запишем спецификацию модели.

(1 L12 )(1 L) X t = (1 1 L)(1 1* L12 ) t, 1 = 0,388413, 1* = 0,822524, где – 2 = 255, нормально распределенные случайные величины с дисперсией и средним 0.

N ( 0, (255,95) ).

Для t = T+h в форме прогноза на h шагов вперед с началом в момент времени T на основе информации, доступной к моменту времени T+1 модель принимает вид:

) X T + h = X t + h 1 + X T + h 12 + X T + h 13 1 T + h 1 1* T + h 12 + 11* T + h 13 + T.

Дисперсию ошибки прогноза получаем из формулы:

) 2 h var(eT + h ) =, i i = где i – коэффициенты представления прогнозируемого процесса в виде бесконечного процесса сколь ( L).

зящего среднего с лаговым полиномом Из формулы видно, что при увеличении шага прогноза h возрастает дисперсия ошибки прогноза. Это приводит к расширению зоны доверительного интервала прогноза при увеличении h.

Число зарегистрированных преступлений Янв арь 2002 И юль 2002 Янв арь 2003 И юль 2003 Янв арь 2004 И юль Рис. 2. Прогноз количества совершенных преступлений (непрерывная линия – реально наблюдаемые данные;

штриховая линия – прогноз, рассчитанный по модели;

тонкие непрерывные линии ограничивают 95% довери тельный интервал прогноза).

Теоретические, организационные, учебно-методические и правовые проблемы Для проверки качества построенной модели прогнозные значения за январь-июнь 2004 г. были сравне ны с реально наблюдаемыми данными за этот же период времени (рис. 2). Тонкой непрерывной линией ограни чен 95% доверительный интервал прогноза, штриховой линией обозначены прогнозные значения и непрерыв ной линией – реально наблюдаемые значения.

График показывает, что проведенный краткосрочный прогноз является вполне надежным, поскольку основывается на строгих методах научного исследования и может быть использован для принятия управленче ских решений.

АВТОМАТИЗАЦИЯ ПРОЦЕССА ОБРАБОТКИ ИНФОРМАЦИИ В ПРАВООХРАНИТЕЛЬНЫХ ОРГАНАХ К.т.н., доцент И.В. Писаренко, Е.Н. Сажинова (Академия экономической безопасности МВД России) Важнейшим направлением деятельности правоохранительных органов является выявление и докумен тирование преступлений и правонарушений. В настоящее время правоохранительные органы имеют большие возможности по получению и документированию информации о совершенных, совершаемых и подготавливае мых преступлениях и правонарушениях. Сведения поступают в ходе проведения различных оперативно розыскных мероприятий, в том числе с использованием специальных технических средств, из агентурных ис точников, из аналитических подразделений, баз данных различных организаций, от отдельных граждан и из других источников.

Увеличение объемов поступающей в правоохранительные органы информации, предъявляемые требова ния к оперативности ее обработки и достоверности, а также своевременности подготовки информационных документов оперативного характера зачастую приводят к снижению эффективности работы подразделения, ведут к увеличению материальных и людских ресурсов, что не всегда возможно и оправданно.

В этих условиях наиболее целесообразным направлением повышения эффективности оперативно служебной деятельности является автоматизация процесса обработки информации, так как именно этот этап во многих случаях занимает значительную часть времени и является наиболее трудоемким.

Решение, даже частичное, проблемы автоматизации обработки полученной в ходе оперативно розыскных мероприятий информации и внедрение полученных технологий в практику служебной деятельности оперативных подразделений правоохранительных органов позволит, в перспективе, существенно сократить сроки обработки информации, повысив тем самым оперативность проводимых мероприятий, снизить нагрузку на операторов, позволив им тем самым более эффективно решать другие задачи. Естественно, что полностью автоматизировать деятельность по обработке информации невозможно (во всяком случае, на современном эта пе развития технических средств), т.к. за человеком остаются вопросы принятия решения, обработка наиболее сложной, спорной информации, контроль за функционированием автоматизированной системы и т.д.

Процесс обработки информации включает в себя ряд различных этапов и процедур, среди которых мож но выделить непосредственно обработку информации различных видов (прежде всего аудио-, видео-, фотоин формации) с целью создания оперативных документов информационного характера, идентификацию и верифи кацию людей и объектов, управление информационными потоками и т.д.

Обработка информации различного вида в подразделениях правоохранительных органов, специализи рующихся на вопросах получения и документирования противоправной деятельности, занимает очень важное место – здесь задействованы значительные материальные и людские ресурсы, информация может иметь ре шающее значение при проведении оперативно-розыскных мероприятий, при ее предоставлении в органы доз нания, следствия, в прокуратуру и в суд.

В техническом плане проблему автоматизации обработки поступающей оперативной информации можно разбить на ряд частных задач, например, по функциональному признаку (непосредственно обработка, иденти фикация объекта оперативной заинтересованности, верификация и т.д.), применительно к виду информации:

звуковая, визуальная, текстовая, графическая, компьютерная и т.д.

Важнейшей составной частью специальных технических систем приема и обработки информации яв ляются автоматизированные рабочие места (АРМ) обработки информации. С помощью АРМ обработки ин формации оператор выполняет слуховое или визуальное воспроизведение полученной оперативной информа ции, анализирует её и готовит оперативный документ информационного характера.

Отличительными особенностями современных и перспективных АРМ обработки информации явля ются: специализация рабочих мест и объединение их в рабочие группы, а также создание систем комплексной автоматизации технологических процессов получения и обработки информации. Ряд предприятий производителей технических средств, предназначенных для регистрации и обработки информации, уже реали зует на практике комплексную систему сбора информации на основе опорной сети, позволяющую комплекси ровать источники информации, объединяя их для передачи информации, использовать различные сервисы управления и контроля.

Системы комплексной автоматизации технологических процессов получения и обработки информации мероприятий в числе других решают следующие принципиально новые задачи:

интеграция с аналитической системой;

расширение методов автоматической обработки.

Теоретические, организационные, учебно-методические и правовые проблемы Интеграция системы комплексной автоматизации технологических процессов получения и обработки информации с аналитической системой позволит более качественно, оперативно и полно составлять документы оперативного и аналитического характера.

Здесь необходимо реализовать взаимосвязь рабочей группы с информационно-справочной системой, а именно:

- обеспечить возможность работы операторов с информацией о принадлежности номеров телефонов (база 09);

- реализовать возможность работы с базой данных о связях объекта контроля как многопользователь ской системой;

- на рабочих местах должны готовиться данные, которые могут быть в дальнейшем использованы для аналитической работы.

Именно на этом этапе в состав рабочей группы могут быть включены рабочие места с элементами ав томатизации, в том числе и распознавания речи, речевого управления и идентификации объекта контроля по голосу.

При автоматизации обработки звуковой и визуальной информации, к сожалению, пока остается нере шенной краеугольная задача автоматического распознавания речи и изображения соответственно, хотя опреде ленные усилия на этом направлении предпринимаются во многих странах и получены частные решения неко торых задач.

Так разработан ряд систем, позволяющих достаточно успешно распознавать человеческую речь, в основ ном английскую, немецкую, японскую и т.д.

Русская слитная речь очень сложна для решения таких задач: имеется несколько программных продук тов, позволяющих распознавать русскую речь, но с недостаточно высокой вероятностью, и только в условиях качественной записи сигнала, после длительного обучения системы. В целом же задача автоматического распо знавания слитной русскоязычной речи произвольного диктора в реальных условиях (например, при воздейст вии помех) является весьма сложной и на сегодняшний день не существует приемлемого решения этой пробле мы для слитной русскоязычной речи.

Существенно осложняют практическое применение разработанных научных подходов, например, сле дующие факторы:

существующие методы опознавания речевых сигналов неустойчивы к воздействию интенсив ных (60 дБ) акустических шумов;

характеристики голосов различных операторов, как правило, имеют значительные отличия;

даже характеристики голоса одного оператора в различные моменты времени могут значи тельно отличаться;

амплитудно-частотные характеристики голоса чувствительны к параметрам канала связи и звукозаписывающей аппаратуры и др.

Поэтому задача опознавания речевых сигналов имеет ярко выраженный нестационарный характер.

В основе научных подходов к решению задачи автоматического распознавания слуховых образов лежат принципы, разработанные в общей теории распознавания образов. В соответствии с ней каждая задача рас познавания образов характеризуется картежом из пяти характеристик:

S, X, Z, D, N, где S - алфавит образов, X - пространство признаков, D - решающее правило, Z - обучающая последовательность, N - затраты на реализацию распознающего устройства для конкретных S, X, Z, D и Н, (здесь Н - гипоте за, лежащая в основе метода распознавания образов).

Классическая задача распознавания образов сводится к минимизации затрат N min путем выбора отдельных элементов указанной пятерки или их комбинаций. Остальные элементы счита NN 0.

ются заданными. Ограничением являются допустимые затраты:

Не исключается наличие определенных связей между выбираемыми элементами, что необходимо учиты вать при решении конкретных задач.

Во многих системах распознавания слитной речи широкое распространение находит использование лингвистического анализа, что существенно улучшает результаты распознавания слитной речи по сравнению с распознаванием изолированных слов. Распознавание слов во фразе происходит в такой системе не просто за счет механического сравнивания с эталонными образцами из проблемно-ориентированного словаря, а еще и с учетом тезауруса.

Казалось бы, с ростом количества слов во фразе теоретическая вероятность правильного распознавания ее (как единого целого) должна уменьшаться, т.к.

) Pф ( m ) = ( Pс ) m, Теоретические, организационные, учебно-методические и правовые проблемы ) где Pф - оценка вероятности распознавания всей фразы;

) Pс - оценка вероятности распознавания изолированных слов;

m - количество слов во фразе.

Опыт подтвердил, что так и происходит, если не подвергать результаты распознавания лингвистиче скому анализу.

Применение лингвистического декодера позволяет в среднем повысить вероятность распознавания с 84…86% для изолированных слов до 92…94% для слитной речи. Причем увеличение длины фразы более неко торого значения практически перестает влиять на результат. Это объясняется тем, что для погружения в тезау рус при лингвистической обработке фонограммы достаточно 8…10 слов.

Полученное увеличение вероятности распознавания наблюдалось даже при произнесении фраз с неко торыми лексическими изменениями в пределах разумных норм (перестановка слов, замена их синонимами и т.п.). Это становится возможным из-за избыточности информации в анализируемом алфавите слов и фраз.

В дополнение к проблемам распознавания слитной речи к системам понимания речи предъявляется еще одно чрезвычайно важное с практической точки зрения требование: система должна работать, даже если произ несение содержит стилистические ошибки, пропуски отдельных слов, плохую формулировку, а также при на личии речеподобного шума (например, бессвязной речи, кашля и т.п.). Это требование несколько смягчается благодаря тому, что конечной целью является не распознавание каждого слова произнесения, а понимание об щего смысла сообщения. Эти системы должны следить за контекстом разговора и использовать этот контекст для разрешения неоднозначностей, которые могут возникнуть в данном предложении. Разумеется, можно по пытаться построить систему распознавания слитной речи, обладающую всеми рассмотренными выше характе ристиками, не используя информацию, зависящую от задачи.

Указанные выше требования реализовать нелегко. По-прежнему важной остаются проблемы определе ния начала и окончания слова и значительной изменчивости акустических характеристик слов в слитной речи.

Но методы разрешения этих задач в системах распознавания слитной речи не вполне подходят для систем по нимания речи: при анализе произнесения нельзя больше применять только направление слева направо ввиду возможности ошибки или речеподобного шума в середине произнесения. Таким образом, полезный способ придерживаться упорядоченного перечня последовательностей слов, расширяющихся вправо после каждой итерации, должен быть существенно модифицирован.

Особенностью проблемы выявления “смысловой значимости” фрагментов звукозаписи является на правленность на определение тех или иных фрагментов звукозаписи с точки зрения оператора. “Смысловая значимость” фрагмента определяется исходя из конкретной задачи, которая стоит перед оператором, то есть, исходя из информационной потребности оператора. Информационная потребность оператора выражается сово купностью фраз, которые и определяют круг вопросов, интересующих оператора. Фразы представляются для их дальнейшего анализа на смысловое соответствие фрагментам звукозаписи в виде именных словосочетаний с указанием дополнительно слов-флагов (или звуков-флагов), служащих индикаторами при определении значи мости фрагмента. Слова-флаги могут как содержаться в исходной фразе, так и дополнять ее.

Упрощенная схема обработки данных включает следующие основные этапы анализа и обработки ин формации:

1. определение содержания информационной потребности - задание человеком-оператором спи ска фраз (именных словосочетаний), отражающих общий искомый смысл звукозаписи, исходя из информационной потребности;

2. индикация возможной значимости фрагментов звукозаписи - задание искомых слов-флагов (звуков-флагов), исходя из особенностей поставленной задачи и особенностей возможного сценария действия;

3. распознавание слов и звуков в звукозаписи – автоматическое распознавание слов и звуков зву козаписи;

4. выявление наличия слов-флагов (звуков-флагов) в анализируемой звукозаписи;

5. приближенный морфологический анализ слов – установление соответствия каждого слова по его форме определенной грамматической информации (выявление возможных частей речи, па дежей, родов, флективных классов и т.п.) 6. приближенный синтаксический анализ звукозаписи - на основе результатов морфологического анализа выявление возможных связок слов;

7. уточненный морфологический анализ слов - уточнение морфологической информации на осно ве приближенного синтаксического анализа звукозаписи;

8. уточненный синтаксический анализ звукозаписи - уточнение границ связок слов;

9. нормализация фрагментов звукозаписи - соотнесение выявленных связок слов с перечнем имеющихся в системе именных словосочетаний;

10. определение степени важности фразы - соотнесение нормализованных фрагментов звукоза писи с именными словосочетаниями, заданными оператором при отражении им своей инфор мационной потребности;



Pages:     | 1 |   ...   | 7 | 8 || 10 | 11 |
 





 
© 2013 www.libed.ru - «Бесплатная библиотека научно-практических конференций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.