авторефераты диссертаций БЕСПЛАТНАЯ БИБЛИОТЕКА РОССИИ

КОНФЕРЕНЦИИ, КНИГИ, ПОСОБИЯ, НАУЧНЫЕ ИЗДАНИЯ

<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ


Pages:     | 1 | 2 || 4 | 5 |   ...   | 7 |

«ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ ВОЛГОГРАДСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ »«¬–“» ¬—–  ...»

-- [ Страница 3 ] --

2. Коньюктивное отношение AND(o(I);

x1(I), тег ADD – обязательный элемент контей x2(I),…). Задает значение атрибута определяю нера ESS. Является контейнером определяю щего предиката o(I), равного значению унарно щего предиката. Обозначает добавление неко го предиката x(I).

торой составляющей (более простой сущно 3. Дизьюктивное отношение OR(x1(I),x2(I),…).

сти) в набор. Для универсализации модели Предназначено для задания атрибута разными, описания, принято, что сущность – всегда на альтернативными способами. Эквивалентно за бор, который может иметь одну или множест данию понятия, через обобщение, выделение во составляющих;

предметов некоторого класса по определенным тег AND – указание признака, соотнесенно общим и в совокупности специфическим для го с определяющим предикатом. Тело контей них признакам [6].

нера содержит уточняющую часть признака.

4. Ассоциативное отношение ASS(o(I)). За тег OR – может использоваться только дает значение атрибута через определение не внутри контейнера AND. Уточняет значение которой другой сущности или некоторого контейнера AND через обобщение.

класса сущностей, имеющих некоторый об щий и специфичный признак. тег ASS – задает область действия локально Как указывалось выше, в высказываниях го определяющего предиката. Задает признак отсутствует выражение действия, и задание через указание некоторой другой сущности. Яв признака ситуативным способом не использу- ляется контейнером определяющего предиката.

ется. Такой подход близок идеям работы [5]. Действительно, в примере, набор состоит из Рассмотрим следующий содержательный двух предметов: фотобумаги и картриджа. Для пример: "Набор, фотобумага LOMOND и кар- фотобумаги задано только название производи тридж T036140 для Stylus C42Plus/ C42S/ теля. Картридж может идентифицироваться ус C42SX/ C42UX (черн.)". ловно-кодовым обозначением "T036140", или Представим в виде набора контейнеров, до- указанием совместимости с каким-либо видом пускающих вложенность одного в другой: принтеров.

48 ИЗВЕСТИЯ ВолгГТУ Следует отметить зависимость семантики тойчивых словосочетаний (“western digital”) и со терма от принадлежности к контейнеру опре- ставных слов (“светло-коричневый”).

деляющего предиката. Так, терм "черн." может 4. Задание термам высказывания домена принадлежать КОП "набор" и обозначать цвет предиката и семантического значения в соот упаковки, или принадлежать КОП "картридж" ветствии с текущим КОП.

и обозначать тип картриджа. Омонимия терма разрешается через принадлежность к контейне- БИБЛИОГРАФИЧЕСКИЙ СПИСОК ру определяющего предиката. 1. Бердник В. Л. Заболеева-Зотова А. В. Задача иден Неоднозначность отнесения терма может тификации сущности заданной слабоструктурированным возникать в тексте высказывания только на текстом // Известия Волгоградского Государственного технического университета: межвуз. сб. науч. Ст. № 2(28) / границах между контейнерами определяющих ВолГТУ. – Волгоград, 2007. – 120 с.

предикатов (в т. ч. при их вложенности). Дей- 2. Жигалов В. А., Жигалов Д. В., Жуков А. А., Коно ствительно, если предположить, что, какой- ненко И. С., Соколова Е. Г., Толдова С. Ю. Система Alex либо терм вне границы контейнеров может как средство для многоцелевой автоматизированной об работки текстов. // "Компьютерная лингвистика и интел быть отнесен к другому контейнеру, то, как лектуальные технологии". Труды Международного семи следует из указанного ниже примера, приведет нара Диалог’2002.– Т. 2: Прикладные проблемы – М.:

к невозможности правильного понимания текста. Наука, 2002.

П р и м е р: 3. Большакова Е. И., Баева Н. В., Бордаченкова Е. А., "Многоэтажный монолитный дом, 9 этажей, Васильева Н. Э., Морозов С. С. Лексико-синтаксические шаблоны в задачах автоматической обработки текста. // с комфортабельным пентхаузом".

Компьютерная лингвистика и интеллектуальные техноло В случае переноса терма, получим гии. Труды Международной конференции “Диалог-2007”. – "Многоэтажный дом, 9 этажей, с комфорта- М. Изд-во РГГУ, 2007.

бельным монолитным пентхаузом". 4. Вагин В. Н., Головина Е. Ю., Загорянская А. А., Фомина М. В. Достоверный и правдоподобный вывод в ин Грамматический анализ высказывания иден теллектуальных системах / Под. ред. В. Н. Вагина, Д. А. По тификации сущности должен включать сле- спелова. – М.: ФИЗМАТЛИТ, 2004. – 704 с.

дующие действия: 5. Семенова С. Ю. Если семантический класс широк 1. Восстановление состава и структуры де- для слова (к представлению лексики в машинном словаре) // рева определяющих предикатов высказывания. Компьютерная лингвистика и интеллектуальные техноло гии. Труды Международной конференции “Диалог-2007”. – 2. Анализ границ (окна) контейнеров опре М. Изд-во РГГУ, 2007.

деляющих предикатов в тексте высказывания. 6. Большой энциклопедический словарь / Гл. ред.

3. Выделение и обработка в пределах контей- А. М. Прохоров. – 2-е изд., перераб.и доп. – М.: Большая нера текстовых единиц (например, “128 Мб”), ус- Российская энциклопедия,1998. – 1433 с.

УДК 621. П. В. Жильцов ВЫБОР ОПТИМАЛЬНЫХ СИГНАЛОВ С ЦИФРОВЫМИ МЕТОДАМИ МОДУЛЯЦИИ С ИСПОЛЬЗОВАНИЕМ ПРОЦЕДУРЫ ВЫБОРА АДАПТИВНОГО ТИПА Московский энергетический институт (технический университет) (cad@vstu.ru) Цель данной работы состоит в определении оптимальных сигналов с современными цифровыми методами модуля ций для применения в системах передачи данных (СПД) с конкретными требованиями к построению. В этой связи в рабо те вводятся показатели качества сигналов, для которых затем определяются их количественные оценки путем имитаци онного моделирования в пакете LabVIEW. Далее определяется модель многокритериального выбора и производится сравнение сигналов между собой при определенных критериальных требованиях.

Ключевые слова: цифровые методы модуляции, адаптивный выбор, имитационное моделирование в LabVIEW.

P.V. Zhiltsov SELECTION OF OPTIMAL SIGNALS WITH DIGIT MODULATION METHODS USING AN ADOPTIVE SELECTION PROCEDURE The matter of the present paper is detection of optimal signals with the up-to-date digit modulation methods [1, 2, 3] for us ing them in data transmission systems with certain requirements for conctruction. Bacuse of it indeces of the signal quality are in troduced in the paper;

quantitave estimations of the indeces are computed using simulating in LabVIEW. After all the model of multicriteria selection is described and the signals are compared with each other under the given criteria requirements.

Digit modulation methods, adoptive selection, simulating in LabVIEW.

Цель данной работы состоит в определении кретными требованиями к построению. В этой оптимальных сигналов с современными цифро- связи в работе вводятся показатели качества выми методами модуляций [1, 2, 3] для приме- сигналов, для которых затем определяются их нения в системах передачи данных (СПД) с кон- количественные оценки путем имитационного ИЗВЕСТИЯ ВолгГТУ моделирования в пакете LabVIEW [4]. Далее ных ширине импульса и времени его начала от определяется модель многокритериального вы- носительно символьного интервала;

бора и производится сравнение сигналов между • ПК7 (макс.) – Потенциальная выгода при собой при определенных критериальных требо- увеличении алфавита сигнала – минимальное ваниях. расстояние dЭФ от точки на плоскости до кри В работе рассматриваются сигналы с цифро- вой – теоретическому пределу, задаваемому выми модуляциями ФМ-4, /4-ОФМ-4, КАМ-4, теоремой Шеннона. Чем больше значение дан КАМ-16, ЧМ-4 1/Т, ЧМ-4 1/2Т, СМП-4, СНФ-4 ного расстояния, тем большим потенциалом об Sin 0,25, СНФ-4 Sin 0,125, СНФ-4 Tri 0,25, СНФ- ладает сигнал.

4 Tri 0,125, ММС. Для осуществления сравнения Результаты имитационного моделирования введены показатели качества (ПК): прохождения сигналов через узлы и блоки СПД • ПК1 (мин.) – Отношение С/Ш сигнала на (количественная оценка по ПК1-ПК7) приведе входе приемника, требуемое для достижения ны в табл. 1.

вероятности битовой ошибки Pb = 10–4;

Таким образом, для 12 сигналов, представ • ПК2 (макс.) – Отношение битовой скоро- ляющих собой исходное множество альтерна сти передаваемой сигналом информации к по- тив = {i}, i = {1,N} N = 12, назначено 7 ПК.

лосе частот, в которой содержится 95 % энергии Для осуществления выбора оптимальных сиг сигнала;

налов при наличии определенных требований • ПК3 (макс.) – Коэффициент прямоуголь- при построении СПД, необходимо определить ности формы спектральной плотности мощно- модель выбора.

сти сигнала – определяется как отношение по- Так как все ПК независимы, и их количест лос, в которых содержится соответственно 50 % во сравнимо с количеством исходных альтерна и 95 % всей энергии сигнала;

тив, то модели выбора а п р и о р н о г о типа, • ПК4 (мин.) – Устойчивость к воздейст- подразумевающие постановку задачи на на вию входных нелинейных (НЛ) безинерцион- чальном этапе, здесь неэффективны, так как ных цепей – определяется как приращение С/Ш могут отсечь альтернативы, потенциально бо отношения С/Ш с целью сохранения вероятно- лее сильные по другим ПК.

сти ошибочного приема при воздействии вход- А п о с т е р и о р н о г о типа модели выбора, ной нелинейности приемника вида Arctan(5*x);

характеризующиеся вмешательством на завер • ПК5 (макс.) – Устойчивость к воздейст- шающих этапах процедуры выбора, имеют вию импульсной помехи – определяется ампли- большую информационную насыщенность и бо тудой импульса АИМП при фиксированных ши- лее гибкий подход по сравнению с моделями рине импульса и времени его начала относи- априорного типа, однако не являются многоша тельно символьного интервала;

говыми в смысле уточнения стратегии по мере • ПК6 (макс.) – Устойчивость к воздейст- приближения к результату. Недостатки подоб вию селективной помехи – определяется ам- ного рода могут быть учтены в адаптивных мо плитудой радиоимпульса АСЕЛ при фиксирован- делях выбора.

Таблица R/W, Обозначе- Eb/N0, дБ КП С/Ш АИМП, В АСЕЛ, В dЭФ (бит/с*Гц) Вид модуляции ние аль тернативы ПК1 ПК2 ПК3 ПК4 ПК5 ПК6 ПК 1 ФМ-4 8,4 1,11 0,15 0 26,4 39 3, 2 /4-ОФМ-4 15,1 1,11 0,15 2,2 11,8 17,8 6, 3 КАМ-4 8,4 1,11 0,15 1 26,4 39 3, 4 КАМ-16 13,0 4,44 0,15 20 6,5 1,5 3, 5 ЧМ-4 1/T 5,5 0,28 0,53 0 33,1 4,5 2, 6 ЧМ-4 1/2T 8,7 0,38 0,37 0 33,6 3,8 4, 7 СМП-4 8,9 3,33 0,45 3,8 29 6,3 2, 8 СНФ-4 Sin m = 0,25 13,2 2 0,4 0 42 3,4 5, 9 СНФ-4 Sin m = 0,125 19,4 4 0,67 0 23,5 1,7 5, 10 СНФ-4 Tri m = 0,25 13,2 2 0,4 –0,6 31 2,7 5, 11 СНФ-4 Tri m = 0,125 22,4 4 0,67 0 18,2 1,4 5, 12 ММС 5,3 1,1 0,36 0 472 8,1 2, 50 ИЗВЕСТИЯ ВолгГТУ В основе а д а п т и в н ы х процедур много- З а д а ч а 3 – Условия сильных импульсных и критериального выбора [5] лежит идея разделе- селективных помех (предпочтение по ПК5 и ПК6).

ния общей задачи на несколько подзадач с про- З а д а ч а 4 – Условия уплотнения полосы межуточными решениями, которые анализиру- (предпочтение по ПК2 и ПК3).

ются на каждом этапе, и дальнейшие шаги Определим оптимальный сигнал для задачи предпринимаются с учетом полученных проме- 1. В условиях отсутствия предпочтений к ПК, жуточных результатов. Рассматриваемая задача выберем надсистемные метакритерии, в про может быть сформулирована как описание аппа- странстве которых будем оценивать значимость рата целевых постановок выбора альтернатив че- самих ПК:

рез частично упорядоченные показатели качества. • эффективность (Э) – степень влияния Примером процедуры выбора адаптивного ПК на процесс передачи данных через приемо типа является комбинированная SL-постанов- передающие тракты и канал связи;

ка [5], которая основана на декомпозиции ис- • стоимость (С) – условная стоимость, ходного множества {kl}, l = {1,M}, М = 7 рас- включающая в себя различные экономические сматриваемых ПК на r: 1rM подмножеств, затраты на обеспечение данного ПК.

внутри каждого из которых ПК имеют одина- Далее применим метод экспертных оценок ковый приоритет. Сами подмножества ПК свя- и назначим каждому ПК весовые значения в про заны отношением линейного порядка по воз- странстве метакритериев Э и С (см. табл. 2).

растанию приоритетов их групп. Такое разбие Таблица ние может быть сформулировано в виде ком бинаций S-, - и L-постановок. ПК1 ПК2 ПК3 ПК4 ПК5 ПК6 ПК Таким образом, комбинированная SL-пос Э 20 20 12 6 15 15 тановка состоит из следующих этапов. Задача С 5 5 20 30 10 10 1. Выбор надсистемных метакритериев, в про странстве которых оценивается значимость са Решением метакритериальной постановки мих ПК. Примером таких метакритериев могут является следующая последовательность, рас служить эффективность, стоимость, экологич положенная в степени убывания важности ПК:

ность, эстетичность и т. д.

{ПК1,ПК2},{ПК5,ПК6},{ПК3,ПК4},{ПК7}.

2. Формирование частичного порядка ПК по При этом несравнимые ПК (ПК1 и ПК2, каждому из метакритериев.

ПК5 и ПК6, ПК3 и ПК4) приводят к -поста 3. Формирование общего порядка ПК в про новкам, а ПК7 – к L-постановке.

странстве метакритериев (L-постановка). При Решением задачи выбора среди исходного этом, если некоторые ПК несравнимы, то они множества альтернатив в -постановке являют образуют S- или -постановки. Запись комби ся следующие последовательности, располо нированной SL-постановки выглядит следую женные в порядке убывания:

щим образом:

• для ПК1-ПК2 (см. рис. 1) L ( / S{k1,…,kp},kp+1,…, {ks,…,ks+g},kf ), ПК1-ПК2 = {1,3,4,7,12}, где "" обозначает линейный порядок убыва {5,6,8,9,10},{2,11};

ния, а "{}" обозначает несравнимые варианты.

• для ПК5-ПК6 (см. рис. 2) 4. Последовательное решение задачи с по ПК5-ПК6 = {1,3,12},{2,5,6,7,8}, этапным анализом промежуточных результатов {10},{9},{4,11};

и корректировкой.

• для ПК3-ПК4 (см. рис. 3) Ввиду высокой разности свойств сигналов ПК3-ПК4 = {9,10,11},{5},{6,7,8,12}, с различными видами цифровых модуляций, {1,3},{2},{4}.

для осуществления выбора далее использована При этом {7,8},{6},{12} было скор комбинированная SL-постановка.

ректировано в {6,7,8,12} ввиду близости Определим задачи выбора оптимальных расположения альтернатив (см. рис. 3). В этом сигналов при различных требованиях к СПД.

и проявляется адаптивность модели выбора;

З а д а ч а 1 – Отсутствие специальных тре • для ПК бований (нет предпочтений по ПК1-ПК7).

ПК7 = {2},{9},{11},{8},{10},{6}, З а д а ч а 2 – ПК1 и ПК2 – равнозначные и {1},{4},{3},{5},{12},{7}.

предпочтительны по сравнению с остальными ПК.

ИЗВЕСТИЯ ВолгГТУ Упорядочив ПК1-ПК2 в условиях ПК5-ПК получаем:

= {1,3,12},{7},{4},{5,6,8}, {10},{9},{2},{11} Затем упорядочим полученный ряд в ус ловиях ПК3-ПК4:

= {12},{1,3},{7},{4},{5},{6,8}, {10},{9},{2},{11} Последним шагом упорядочим полученный ряд в условиях ПК7:

= {12},{1},{3},{7},{4},{5},{8},{6}, {10},{9},{2},{11}.

В ы в о д 1. Оптимальным сигналом среди рассмотренных в отсутствии специальных тре бований в условиях ПК1-ПК7 является сигнал с цифровой модуляцией ММС. За ним следуют сигналы ФМ-4, КАМ-4 и СМП-4. Причем сиг налы ФМ-4 и КАМ-4 являются несравнимыми Рис. 1. Множество на плоскости "ПК1 – 1/ПК2" по ПК1-ПК2 и ПК5-ПК6 и проигрывают по ПК3 в 2,5 раза сигналу ММС.

Для других задач также были найдены оп тимальные сигналы и сделаны выводы.

По результатам сравнения могут быть сде ланы следующие выводы:

В ы в о д 2. При условии равнозначности помехозащищенности и эффективности исполь зования полосы оптимальным является сигнал с цифровой модуляцией ММС. Если дать не большой допуск, то выбор может быть расши рен сигналом ЧМ-4 1/T.

В ы в о д 3. Оптимальным с точки зрения применения в системах с повышенной устой чивостью к импульсным и селективным поме хам является сигнал ММС, за которым вплот ную (вплоть до последней постановки по ПК7) следуют ФМ-4 и КАМ-4.

В ы в о д 4. При построении систем переда Рис. 2. Множество на плоскости "1/ПК5 – 1/ПК6" чи данных, главным требованием для которых является наиболее эффективное использование полосы, оптимальным является сигнал СМП, однако если действовать строго и убрать не большой допуск на альтернативы, которые по другим ПК имеют больший вес, то в этом слу чае оптимальным является сигнал КАМ-16.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК 1. Скляр Б. Цифровая связь. Теоретические основы и практическое применение. Изд. 2-е, испр.: Пер. с англ. – М.: Издательский дом "Вильямс", 2003. – 1104 с.

2. Феер К. Беспроводная цифровая связь. Методы модуляции и расширения спектра: Пер. с англ. / Под ред.

В. И. Журавлева. – М.: Радио и связь, 2000. – 520 с.

3. Прокис Дж. Цифровая связь. Пер. с англ. / Под ред. Д. Д. Кловского. – М.: Радио и связь. 2000. – 800 с.

4. Тревис Дж. LabVIEW для всех: Пер. с англ. Клу шин Н. А. – М.: ДМК Пресс;

Приборкомплект, 2004. – 544 с.: ил.

5. Кандырин Ю. В. Методы и модели многокритери ального выбора вариантов в САПР: Учебное пособие для Рис. 3. Множество на плоскости "1/ПК3 – ПК4" вузов. – М.: Издательство МЭИ, 2004. – 172 с.: ил.

52 ИЗВЕСТИЯ ВолгГТУ УДК 004.8;

004. А. В. Заболеева-Зотова, Ю. А. Орлова АВТОМАТИЗАЦИЯ ПРОЦЕДУР СЕМАНТИЧЕСКОГО АНАЛИЗА ТЕКСТА ТЕХНИЧЕСКОГО ЗАДАНИЯ Волгоградский государственный технический университет (zabzot@vstu.ru, yulia.orlova@gmail.com) Целью исследования является повышение эффективности проектирования программного обеспечения за счет раз работки автоматизированной системы семантического анализа текста технического задания.

Ключевые слова: семантический анализ, текст, техническое задание.

A. V. Zaboleeva-Zotova, Y. A. Orlova AUTOMATION OF PROCEDURES OF SEMANTIC TEXT ANALYSIS OF A TECHNICAL SPECIFICATION The purpose of research is to increase of efficiency of software designing due to development of the automated system of semantic text analysis of a technical specification.

Semantic analysis, text, technical specification.

В настоящее время проектирование про- Хранение Предварительная граммного обеспечения представляет собой Интерфейс документов обработка текста трудоемкий процесс, требующий от пользова- БД разделов, теля глубокого знания предметной области и на- предложений и Файловая лексем система выков в проектировании. Семантический Синтаксический Наиболее известные из коммерческих про- анализ анализ граммных продуктов, используемых при про- 5 6 ектировании программного обеспечения, в ос- Построение БД БД Фреймовая Морфологичес новном предназначены для визуализации про- Семантически «Синтаксическ диаграмм структура кий словарь е правила ие правила»

межуточных и конечных результатов процесса проектирования. Некоторые из них позволяют MS Visio Функциональная связь Информационная связь полностью автоматизировать последние этапы проектирования: генерация кода, создание от- Рис. 1 Архитектура автоматизированной системы:

четной и сопровождающей документации и 1 – файлы документов;

2, 3 – данные о разделах, предложениях и лексемах;

4 – синтаксические юниты, группы, клаузы;

5, 9 – фреймы;

т. д. При этом задача автоматизации начально 6 – семантические правила;

7 – синтаксические правила;

8 – морфо го этапа проектирования – формирования и логические признаки;

10 – надписи и координаты фигур диаграмм анализа текста технического задания остается открытой. Это связано с необычайной сложно- Предварительная обработка текста необхо стью проблемы синтеза и анализа семантики дима для того, чтобы разделить исходный текст технического текста, для решения которой не- технического задания на отдельные лексемы.

обходимо использовать сембиоз методов ис- Входной информацией подсистемы является кусственного интеллекта, прикладной лин- текст технического задания на ограниченном ес гвистики, психологии и т. п. Однако, возмож- тественном языке, выходной информацией – таб но приблизиться к достижению данной цели, лицы разделов, предложений и лексем рассмат выделив некоторые небольшие подзадачи, риваемого технического задания. Результаты мо вполне доступные для решения известными гут быть представлены как в виде соответствую методами трансляции. щих таблиц, так и в виде дерева разделов. Это Целью исследования явилось повышение позволяет легко находить ошибки в оформлении эффективности проектирования программного документа, если он не соответствует ГОСТам.

обеспечения за счет разработки автоматизиро- Предварительная обработка текста осуще ванной системы семантического анализа текста ствляется с использованием аппарата конечных технического задания. Данная система состоит автоматов (см. рис. 2).

из следующих подсистем: предварительной об- В ходе работы конечного автомата симво работки текста, синтаксического и семантиче- лы, поступающие на его вход, накапливаются ского анализа и построения моделей программ- в буфере. В определенных состояниях конечно ного обеспечения, хранение документов и ин- го автомата осуществляется запись текущего со терфейс. держимого буфера в одну из таблиц, после чего Архитектура разрабатываемой системы буфер опустошается. Работа автомата продол представлена на рис. 1. жается до достижения конечного состояния.

ИЗВЕСТИЯ ВолгГТУ Рис. 2. Фрагмент автомата разбора текста технического задания После этого полученные таблицы поступа- Рассмотрим фрагмент разработанной атрибут ют на вход подсистемы синтаксического и се- ной грамматики, представленной в xml-формате:

мантического анализа. Семантический анализ … global-rule id="Section42" comment = текста производится на основе разработанной "Раздел 4.2. Требования к функциональным характерис атрибутной грамматики текста технического тикам" ruleruleref uri="#Section42Name"/ задания. Продукционные правила верхнего ruleref uri="#Section42x"//rule/global-rule уровня служат для разбора разделов верхнего global-rule id="Section42Name" sectionPart="Name" уровня. Правила для разбора разделов состоят comment= "Заголовок раздела 4.2."ruleclause из двух частей: первая часть служит для разбо- clauseType="НЕОПРЕД"/rule type="or"words ра названия раздела;

вторая часть служит для contains="функции"/ words contains= "функциональ ные характеристики"/ /rule/rule/global-rule разбора текстового содержимого раздела. Сим global-rule id="Section42x" frame= "FunctionFrame" волы данной грамматики могут обладать син frameSlot="Function" comment="Функция"rule таксическими атрибутами. В атрибутах нетер ruleref uri="#Section42xName" /ruleref минальных символов указываются названия uri="#Section42xContent" / /rule/global-rule фреймов или названия слотов, в которые долж global-rule id="Section42xContent" sectionPart= на быть помещена информация, полученная "Content" comment="Входы и выходы функции" в ходе дальнейшего разбора. В атрибутах тер- ruleruleref uri= "#Section42xInputs" minOccurs= минальных символов могут быть дополнитель- "0"/ruleref uri="#Section42xOutputs" minOccurs= но указаны синтаксические атрибуты текста. "0"//rule/global-rule Сравнение слов при разборе производится с уче- global-rule id="Section42xInputs" comment= том их морфологии. В ходе разбора синтакси- "Входы функции" ческий и морфологический анализ производят- rulesentence/clause/rule type="or"words contains="входы"/ words contains="входные данные"/ ся только в том случае, если имеется такая /ruleruleref uri="#Input" maxOccurs="unbounded"/ необходимость, что значительно сокращается /rule/global-rule … время выполнения семантического анализа.

54 ИЗВЕСТИЯ ВолгГТУ Морфологический и синтаксический моду- –R ли, используемые в программе, являются моду- Автоматизированная система расчета локальной сети NR лями стороннего разработчика. Если в правиле I1R –DF грамматики встретился терминал, имеющий План помещений NDF синтаксический атрибут, то запускается меха- TDF низм синтаксического анализа для текущего Файл CDF разбираемого предложения.

I2R +DF После создания дерева разбора начинается … построение фреймового описания технического O1R +DF задания. Для этого используется информация … о фреймах и названиях слотов, которая содер F1R –F жится в атрибутах символов грамматики.

Полученная фреймовая структура содержит Определение оптимальных путей между NF устройствами значимую информацию о системе: сведения I1F1 –DF о входах и выходах системы, функциях и огра ничениях. Для каждой функции также выделя- NDF6 Координаты устанавливаемых ются входы и выходы. Это позволяет на основе устройств и оборудования фреймовой структуры получить диаграммы по TDF6 структур типа Точка токов данных системы, которая описана в тех ническом задании. CDF6 Массив Фреймовая структура представлена в виде: … R = NR, FR, IR, OR, где NR – название системы, Определение DF IR – вектор входных воздействий, OR – вектор Оптимальных путей между устройствами GF выходных воздействий, FR = NF, IF, DF, GF, HF, HF OF – вектор функций системы, NF – имя функ- O1F1 –DF ции, IF – вектор входных воздействий функции NDF8 Участки кабеля без изгибов F, DF – название действия, выполняемого функ цией, GF – объект, над которым выполняется TDF8 структур тип Отрезок действие, HF – ограничения на функцию F, OF – CDF8 Массив вектор выходных воздействий функции F.

Фрагмент фреймовой структуры для авто- F2R +F матизированной системы расчета локальной се … ти представлен в следующей таблице:

Рис. 3. Фрагмент диаграммы потоков данных:

1 – план помещений;

2 – масштаб рисунка по оси Х;

3 – масштаб рисунка по оси Y;

4 – координаты рабочих мест;

5 – требуемые средства;

6 – координаты устанавливаемых устройств и оборудования;

7 – пары соединяемых устройств;

11 – разметка пространства карты;

12 – цены уст ройств и кабелей;

18 – тип выбранной топологии сети;

19 – правила выбора топологии сети;

20 – правила выбора архитектуры сети ИЗВЕСТИЯ ВолгГТУ Подсистема “Построение диаграмм потоков труда человека по извлечению полезной ин данных” осуществляет построение и упорядочение формации из стандартного документа и ото графа потоков данных, а также создание фигур бражению ее в виде моделей программного диаграмм потоков данных в Microsoft Office Visio. обеспечения.

Для построения потоков данных сначала Проектирование программного обеспечения производится поиск входов функций, совпа- мало отличается от проектирования в других дающих с входами системы. Затем функции, на областях науки и техники, поэтому результаты все входы которых поступают данные, поме- данной работы можно расширить для примене щаются на диаграмму на одном уровне. Их ния в других областях человеческих знаний.

входы соединяются с входами системы. Далее Таким образом, открывающиеся перспективы производится поиск функций, входы которых повышают актуальность данной работы.

совпадают с выходами полученных на преды- Проект разработан на платформе Micro дущем шаге функций. Они помещаются на сле soft.NET Framework (язык разработки C#).

дующем уровне, их входы соединяются с выхо Таблицы разделов хранятся в формате XML, дами функций предыдущих уровней и с входа а их визуальное представление возможно и ис ми системы. Работа алгоритма продолжается до пользованием XSL-преобразования. Получен тех пор, пока все функции не будут помещены ное при семантическом анализе фреймовое на диаграмму. После этого производится со описание также сохраняется в формате XML.

единение выходов функций с необходимыми Построение диаграмм потоков данных осуще выходами системы.

ствляется с помощью взаимодействия системы Фрагмент диаграммы потоков данных, син с программой MS Visio 2003.

тезированной на основе фреймовой структуры, представлен на рис. 3.

В результате разработки и внедрения пред- БИБЛИОГРАФИЧЕСКИЙ СПИСОК лагаемой системы повышается качество проек- 1. Заболеева-Зотова А. В. Лингвистические системы:

тирования за счет автоматизации рутинного модели, методы, приложения // Волгоград: ВолгГТУ, труда человека по извлечению полезной ин- 2004. – С. 220.

2. Заболеева-Зотова А. В., Орлова Ю. А. Разработка формации из стандартного документа и ото средств автоматизированного проектирования программ бражению ее в виде моделей программного ного обеспечения на основе анализа текста технического обеспечения. задания / В сб. трудов Международных научных конфе В результате разработки и внедрения пред- ренций “Интеллектуальные системы”(AIS’05) и “Интел лагаемой системы повышается качество проек- лектуальные САПР”(CAD’2005). – М..: Физматлит, 2005, Т. 2. – С. 41–43.

тирования за счет автоматизации рутинного УДК 681. Э. Е. Кудряшова РАЗРАБОТКА АДАПТИВНОЙ АОС НА ОСНОВЕ МЕЖДУНАРОДНЫХ СПЕЦИФИКАЦИЙ Волгоградский государственный технический университет (ela42@bk.ru) Международные стандарты IMS, включенные в европейскую методику высшего образования, использованы при разработке адаптивной автоматизированной обучающей системы.

Ключевые слова: адаптивная автоматизированная обучающая система, международные стандарты IMS.

E. E. Kudryashova DEVELOPMENT ADAPTIVE AUTOMATED EDUCATIONAL SYSTEM BASED ON INTERNATIONAL SPECIFICATIONS International Standards IMS included in European methodology of higher education used in development Adaptive auto mated educational system.

Adaptive automated educational system, International Standards IMS.

Вопреки общей тенденции сокращения ра- продукт его личной познавательной деятельно бочего и возрастания свободного времени у боль- сти. В учебных заведениях, как правило, рабо шинства социально-профессиональных групп – чие программы по дисциплинам разрабатыва для преподавателей имеет место противопо- ются с расчетом на "среднего" студента, что ложное явление. Имеются противоречия учеб- противоречит объективно существующим раз ного труда и у студентов. Как известно из пси- личиям учащихся, снижает мотивацию и эф хологии, знания и умения человека есть всегда фективность обучения.

56 ИЗВЕСТИЯ ВолгГТУ Адаптивные автоматизированные обучаю- Основная информационная модель щие системы (АОС) обладают возможностью Основные структуры данных, которые ис настройки к обучаемому (его уровню знаний, пользуют в IMS QTI:

скорости и пути продвижения по изучаемому 1) пункт(ы) (Items) – независимый модуль, материалу и т. д.), развитой системой сбора который может быть обменен, используя IMS QTI. Пункт не может быть составлен из других и обработки статистической информации о каж пунктов. Пункт – содержит 'вопрос', представ дом обучаемом, группе и потоке обучаемых ление команд для обработки ответа, обратную (в том числе накапливают информацию о часто связь, которая может быть представлена (вклю встречающихся ошибках при работе с обучаю чая подсказки и решения);

щей системой и ошибках обучаемых по теме 2) раздел(ы) (Section(s));

или дисциплине).

3) исследование (Assessment) – содержит В рамках методических материалов Болон тестирование и по крайней мере, один раздел, ской конференции разработаны спецификации таким образом, не возможно разместить пункты IMS QTI для разработки адаптивных АОС в еди непосредственно в пределах исследования;

ном формате. АОС должна разрабатываться на 4) банк Объекта (Object bank) – это собра основе спецификаций, которые включают: ние пунктов, разделов или смеси пунктов и раз 1) цели программы (с указанием предпола- делов.

гаемых действий обучаемого после обучения В терминологии, принятой в QTI, пункт оп по данной программе);

ределен как фундаментальный блок, который 2) описание схемы шагов обучения, струк- содержит один или более вопросов и ответы.

тур задач;

Принятая таксономия в IMS типа ответа показа 3) характеристики обучаемых, на которых на на рисунке: основной, составной, сложный.

рассчитана данная программа (курс, специали Задачи методического обеспечения АОС зация);

объем знаний по базовым предметам, Для того чтобы имелась возможность срав необходимый при обучении по данной про нения различных обучающих программ и ре грамме;

время обучения;

зультатов обучения, целесообразно выделить 4) тесты (начальный – для определения ис определенные показатели. К таким показателям ходного уровня знаний учащегося, то есть воз можно отнести:

можности его работы с учебной программой, число основных понятий, изучаемых в дан и итоговый – для установления достижения ной программе;

обучаемым заданных целей обучения);

отношение этого числа к числу понятий, со 5) инструкцию по эксплуатации программы ставляющих полный объем данного курса.

с указанием языка, на котором она написана.

Под уровнем усвоения понимается способ Использование спецификаций IMS QTI ность обучаемого выполнять некоторые целе Компоненты (круги) и структуры данных направленные действия для решения опреде (прямоугольники), разработчики и пользовате- ленного класса задач, связанных с использова ли адаптивной АОС на основе IMS QTI изо- нием объекта изучения. Уровень усвоения можно бражены на рисунке. рассматривать как качество изучения предмета.

Для задания целей обучения необходимо представить последовательность подлежащих изучению понятий и для каждого из них ука зать предполагаемые значения в начале и конце обучения параметров: уровень усвоения, уро вень абстракции, затрачиваемое время.

В процедуре шага обучения выделены сле дующие элементы – кадры: информационный, операционный, кадр обратной связи, контроль ный и дополнительные кадры. Задачи состав ляют содержание операционных кадров. Выде ляются задачи, требующие интеллектуальных процессов при решении и не требующие их (использующие в основном память). В свою очередь задачи, требующие творческой дея Рис. Структура адаптивной АОС на основе международ тельности, разделяются на две подгруппы:

ных спецификаций ИЗВЕСТИЯ ВолгГТУ задачи, когда известны цель и способ ее шения;

число просьб об изменении сложности достижения, задачи;

число обращений к "Справке", "Разъяс задачи-проблемы – цель известна, а способ нению";

"Помощи".

ее достижения не ясен, которые решаются с по- Для каждого обучаемого необходимо иметь мощью эвристических приемов. сведения за каждый урок с конкретным указани Каждая задача, используемая в программе, ем номеров задач, предложенных ему, данного должна быть соотнесена с определенным набо- ответа, времени решения каждой задачи. Ин ром индивидуальных характеристик студента. формация о числе верных и неверных решений К ним необходимо отнести: уровень усвоения позволяет провести качественную оценку задач, понятия, заданный целями обучения;

коэффи- получить характеристику трудности решенных циент усвоения;

уровень задачи (то есть, уро- задач. Информация, получаемая по каждой зада вень для формирования действий, на котором че, может служить исходным материалом при используется данная задача);

сложность задачи. индивидуализированном обучении. Для каждого обучаемого в процессе адаптации АОС настраи Статистика в АОС вается наиболее подходящий набор задач.

Характерная черта применения АОС – воз Основные направления развития АОС можность сохранения в памяти ПК информа ции, касающейся как обучения каждого студен- 1. Разработка адаптивных АОС на основе та, группы студентов, так и всевозможных дан- единых международных спецификаций;

ных по изучению всего курса, по каждому про- 2. Развитие аудиовизуальных средств в раз веденному занятию, каждой решенной задаче. работке АОС;

Статистические данные по курсу включают: 3. Интеграция с другими автоматизирован общее время на изучение данного курса;

время на ными системами;

изучение информационных кадров;

время на вы- 4. Слияния АОС и экспертных систем. Экс полнение операционных и контрольных кадров;

пертные системы обеспечивают доступ к базам среднее время изучения понятия;

среднее время знаний, что позволяет принимать решения на прохождения шага обучения;

число задач, решен- основе накопленного опыта.

ных по курсу всего;

число задач, решенных верно;

число задач, решенных на контрольных кадрах;

БИБЛИОГРАФИЧЕСКИЙ СПИСОК число учащихся, изучавших данный курс. 1. Аванесов В. С. Теория и методика педагогических Статистические данные по шагу обучения измерений [Электронный ресурс]. – 2004. – Режим досту включают: число учащихся, изучавших данный па: http://www.testolog.

шаг;

число верно и неверно решенных – на ша- 2. Кудряшова Э. Е. Новые информационные техноло гии в автоматизи-рованных системах обработки информа ге задач;

среднее время изучения шага по кон ции и управления: Учеб. пособие (гриф УМО): изд. 2-е, кретной задаче. дополн. / ВолгГТУ. – ООО "ПРИНТ". – Волгоград, 2006. – Информация, хранящаяся в системе по каж- 96 с.

дой задаче: число верных и неверных решений;

3. Системы дистанционного контроля знаний [Элек время решения;

число решений по каждому тронный ресурс]. – 2004. – Режим доступа: http://www.nit.

miem.edu.ru предполагаемому ответу;

число отказов от ре УДК 658.012.011.56:62- В. С. Лукьянов, Е. С. Кузнецова ОЦЕНКА ПАРАМЕТРОВ НАДЕЖНОСТИ АСУ С УЧЕТОМ ДОПУСТИМОГО ВРЕМЕНИ ПРОСТОЕВ СИСТЕМЫ Камышинский технологический институт (филиал) ВолгГТУ (cad@vstu.ru) Рассматриваются вопросы оценки количественных и качественных закономерностей процессов моделирования в области исследования надежности каналов передачи данных в автоматизированных системах управлении.

Ключевые слова: моделирование, критерии надежности, передача данных.

V. S. Lukyanov, E. S. Kyznetsova ESTIMATION OF MANAGEMENT PARAMETERS’ RELIABILITY OF THE INFORMATION SYSTEM TAKING INTO ACCOUNT ADMISSIBLE TIME OF SYSTEM’S IDLE TIMES Questions of quantitative and qualitative legitimacies processes of modelling estimation in the field of research of data chan nels’ reliability in the automated systems handle are considered.

Modelling, criteria of reliability, data transfer.

Настоящее время характеризуется резким рах и отраслях науки и техники. Это обуслов возрастанием роли моделирования во всех сфе- лено созданием все более сложных техниче 58 ИЗВЕСТИЯ ВолгГТУ ских систем, требующих комплексного иссле- новленной для каждого объекта АСУ перио дования. Особую актуальность моделирование дичностью изменения его режимов функцио приобретает в области исследования надежности нирования Тц, т. е. обработка и передача ин каналов передачи данных в автоматизированных формации должны осуществляться с более системах управления (АСУ). При проектирова- высокой скоростью, чем скорость реально про нии этих систем возникают многочисленные за- текающего процесса на управляющем объек дачи, требующие оценки количественных и ка- те. Это создает определенный запас времени = Тц – tр.ц, 0, необходимый для принятия чественных закономерностей процессов функ ционирования и проведения анализа их работы. решения, определяющий качество управле Эти системы относятся к сложным системам, ния в РМВ.

характеризующимся сложностью структуры, не- Процесс функционирования каналов пред однозначностью поведения при различных ставляется в виде последовательности интерва внутренних состояниях и внешних воздействи- лов исправной работы и перерывов связи, мо ях, большом количестве случайных факторов. менты возникновения которых, считаются не Недоработки, ошибочные решения, принимае- зависимыми. Средняя длительность задержки мые на этапе разработки этих систем, приводят к передачи, обусловленная указанными переры большим экономическим затратам после их из- вами связи, будет зависеть:

готовления и внедрения. 1) от установленного для канала связи допус С учетом сложности таких систем, основ- тимого времени перерыва (критерия отказа t*);

ным средством их исследования на раннем эта- 2) от порога сдачи канала связи tсд на вос пе разработки является моделирование, позво- становление предприятию связи;

ляющее создать эффективную систему органи- 3) от стратегии обслуживания отказавших зации оптимальных режимов эксплуатации АСУ. каналов, среди которых можно выделить две.

При выполнении моделирования использу- Таким образом, при использовании кабель ются описания и свойства реальных объектов. ных каналов для обмена информацией между Понятие объекта работающего в реальном объектами АСУ среднее время задержки пере масштабе времени (РМВ), тесно связано с дли- дачи определенного объема информации при тельностью реакции, под которой понимается каждом возникновении самоустраняющихся интервал времени между моментом наступле- и устойчивых отказов составляет 3–5 мин и су ния события от управляющего объекта АСУ щественно зависит от надежности каналов свя и моментом ответа на это событие управляемо зи и стратегий их обслуживания.

го или взаимодействующего объекта. Полное Приведенные данные используются при по время реакции определяется длительностью строении имитационных моделей систем рабо циклов обработки информации Тц.о и ее переда тающих в реальном масштабе времени. Для чи Тц.п по средствам обмена данными, т. е. tр.ц = примера приводится структура, и результаты = Тц.о + Тц.п. Для обеспечения управления объ моделирования тракта передачи данных с дву ектами в РМВ значение показателя tр.ц должно кратным резервированием рабочего канала.

выдерживаться в строгом соответствии с уста а б Рис. 1. Структура тракта ПД с двукратным резервированием рабочего канала (а), и его граф возможных состояний системы (б) ИЗВЕСТИЯ ВолгГТУ В процессе функционирования такого трак- e12 – отказало ПУ 1-го рода при отказав та выделяются следующие состояния: шем рабочем канале и исправных ре e0 – все оборудование исправно;

зервных, но время восстановления e1 – отказал один резервный канал, ос- канала В(K) и В(ПУ) больше t*;

тальные исправны;

e13 – отказал рабочий канал при одном ис e2 – отказали резервные каналы при ис- правном резервном и tп t*;

правном рабочем;

e14 – отказало ПУ 1-го рода при отказав e3 – отказал рабочий канал при исправных шем рабочем канале и одном исправ резервных;

ном резервном, но В(K) t*, В(ПУ) t*;

e4 – отказал рабочий канал при неисправ e15 – отказало ПУ 2-го рода и В(ПУ) t*;

ных резервных;

e16 – отказал рабочий канал при неисправ e5 – отказало ПУ 1-го рода при отказе рабо ных резервных и В(K) t*.

чего канала и исправных резервных;

Из этого множества состояний E {e0, e1, e2, …, e6 – отказало ПУ 1-го рода при неисправ ном резервном канале и исправных e16} состояния E+ {e0, e1, …, e10} являются рабо остальных каналах;

тоспособными, а E– {e11, e12, …, e16} соответст e7 – отказал рабочий канал при одном ис- вуют отказу тракта.

правном и одном неисправном ре- На основании данной структуры реализо зервных каналах;

вана имитационная модель системы. Выпол e8 – то же самое, что и состояние e7, но от- нены расчеты для основных показателей на казало ПУ 1-го рода;

дежности: принятого критерия отказа канала e9 – отказало ПУ 2-го рода;

t*, который оказывает влияние на среднее e10 – отказало ПУ 1-го рода и все каналы время наработки на отказ Тот, на среднее вре исправны;

мя восстановления Тв и коэффициент готов e11 – отказал рабочий канал при исправных ности канала Кг.

резервных, но tп t*;

Рис. 2. Графики для оценки влияния временной избыточ- Рис. 3. График для оценки влияния интенсивности отказов каналов 0 на коэффициент готовности тракта ПД KГ при ности t* на среднее время наработки на отказ TОТ µ0 = 6 ч–1 и t* = 1 с TОТ = (2µ 0 + 2µ 0 0 + 20 ) / 30 ;

TB = 1 /(3µ 0 );

K Г = [3µ0 (2µ0 + 2µ0 0 + 20 )]/(6µ3 + 6µ0 0 + 3µ0 0 + 30 ).

2 0, 0, 0, 0, Kг 0, 0, 0, 0, 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0, 0, ч- Рис. 4. Зависимость коэффициента готовности KГ от ин- Рис. 5. Зависимость коэффициента готовности KГ от ин тенсивности отказа канала 0 (при µ0 = 10 ч–1) тенсивности восстановления канала µ0 (при 0 = 0,1 ч–1) 60 ИЗВЕСТИЯ ВолгГТУ 3. Результаты расчета показателей надеж Из анализа результатов аналитического ности TОТ и KГ при одинаково выбранных па расчета показателей TОТ, KВ и KГ по формулам раметрах трактов с одним и двумя резервными и их имитационного моделирования программ каналами практически совпадают (до единиц ными средствами можно сделать следующие процентов) по своим значениям с результатами выводы:

оценки аналогичных показателей, полученных 1. Интенсивность отказов и восстановлений экспериментальным путем.

каналов тракта меньше влияет на показатели надежности (в несколько раз), чем интенсив- БИБЛИОГРАФИЧЕСКИЙ СПИСОК ность отказов ПУ;

2. При увеличении кратности резервирова- 1. Рожков Л. И. Средства передачи данных в АСУ. – 1977. – 184 с.

ния рабочего канала в большей степени начи- 2. Лукьянов В. С., Слесарев Г. В. Проектирование ком нает сказываться изменение временной избы- пьютерных сетей методами имитационного моделирования:

точности тракта на показатели его надежности;

Учеб. пособие / ВолгГТУ. – Волгоград, 2001. – 75 с.

УДК 004. Р. Л. Морозов ПОИСКОВЫЕ РЕЙТИНГИ РОССИЙСКОГО ИНТЕРНЕТА Волгоградский государственный технический университет (cad@vstu.ru) В статье рассматриваются поисковые рейтинги российского Интернета. Рассмотрен тематический индекс цитирования и страничный ранг Google. Предложен новый подход к ранжированию страниц на основе среднего индекса цитирования.

Ключевые слова: тематический индекс цитирования, средний индекс цитирования, страничный ранг Google.

R. L. Morozov SEARCH RATINGS OF THE RUSSIAN INTERNET Search ratings of the Russian Internet was represented in the article. The thematic index of citing and Google page rank was considered. The new approach to ranging of page on the basis of an average index of citing is offered.

Thematic index of citing, average index of citing,Google page rank.

это метод вычисления веса страницы путем Ранги в поисковиках подсчета важности ссылок не страницу.

Как ни странно, но среди веб-сайтов тоже PageRank является одним из вспомогательных есть свои советники, асессоры и даже канцле факторов при ранжировании сайтов в результа ры. Поисковые машины ранжируют веб-сайты тах поиска. PageRank не единственный, но в зависимости от их значимости. Информация очень важный способ определения положения на крупных сайтах (Яндекс, МГУ и т. д.) явля сайта в Google. Для упрощения далее PageRank ется более важной, чем информация сайтах, ко будет упоминать как PR. Численное значение торые только недавно появились в сети. На PR можно получить через Google Toolbar ранг сайта влияет мнение поисковой машины (http://toolbar.google.com).

и количество внешних ссылок установленное на сайт. Поисковые машины иногда отдают П р и м е ч а н и я:

предпочтение веб-сайтам участвующим в ката- Google учитывает не все ссылки. Поисковая систе логе, ведь сайты зарегистрированные в катало- ма отфильтровывает ссылки с Free For All (FFA) сайтов, ге проверяются модераторами. Существуют не- т. е. сайтов, предназначенных для скопления ссылок.

сколько видов открытого рейтинга ранга сайтов:

Как вычисляется PageRank? При расчете PR Google Page Rank, ИЦ (Индекс Цитирования, страницы учитывается все входящие ссылки.

Яндекс), СИЦ (Средний Индекс Цитирования).

Попробуем разобраться в данных рейтингах Это ссылки как с самого сайта, так и с других более подробно. сайтов в сети.

PR(A) = (1-d) + d(PR(t1)/C(t1) +... + R(tn)/C(tn)) Google Page Rank Вот это и есть формула PageRank. Изна Что такое PageRank? PageRank – это число чальная формула, утвержденная еще при разра вая величина, характеризующая "важность" ботке алгоритма. Скорее всего, в Google прак страницы в Google. Чем больше ссылок на тикуются измененные варианты формулы, но страницу, тем она становится "важнее". Также, это не столь важно. Данное выражение доста вес страницы А определяется весом ссылки, пе точно хорошо показывает суть PageRank.

редаваемой страницей B. В итоге, PageRank – ИЗВЕСТИЯ ВолгГТУ Значение переменных: лающихся на него сайтов. Значение тИЦ можно t1-tn – страницы, ссылающиеся на страницу A получить используя http://bar.yandex.ru (рис. 2) C – число исходящих ссылок, которые есть или каталог Яндекса http://yaca.yandex.ru.

на странице d – коэффициент затухания, обычно его вы ставляют 0. Можно смотреть на это проще – Рис. PageRank страницы = 0.15 + 0.85 * (Доля PageRank каждой страницы, которая ссылается на нее). Тематический Индекс Цитирования, как "Доля" это PageRank страницы, разделен- средство определения авторитетности ресурсов ный на число исходящих ссылок на странице. призван обеспечить релевантность расположе Ссылающаяся страница передает часть своего ния ресурсов в рубриках каталога Яндекса. тИЦ веса каждой странице, на которую ссылается. не является строго количественной характери При передаче веса существует так называемый стикой. Он дает лишь некоторые округленные коэффициент затухания (равен примерно 0,85) значения, которые помогают определиться в "зна Коэффициент применяется к каждой ссылке. чимости" ("авторитетности") ресурсов в каждой Отсюда кажется верным вывод, что ссылка тематической области.

со страницы c A и на которой 5 исходящих Средний индекс цитирования (СИЦ) ссылок будет весомее, чем ссылка со страницы B со 100 исходящими ссылками. Безусловно, Новое решение было разработано автором PageRank ссылающейся страницы важен, но статьи в 2005 году, разработав свой собствен и число исходящих ссылок на данной странице ный взгляд на ранжирование в сети. Суть идеи также имеет значение. Однако многие считают, заключается в соединение двух рейтингов (Page что значения между PR1 и PR10(максимальное) Rank и тИЦ) в один Средний Индекс Цитиро выставляются по логарифмической шкале. Для вания (СИЦ, адрес проекта: http://pr.addweb.ru таких предположений есть основания. (рис. 3), здесь можно получить СИЦ). В дан ном случае речь идет о логарифмической шка ле (1-100), соединяющей Page Rank и тИЦ.

Рис. Рис. Никто вне Google не знает наверняка, так это или не так, но велики шансы, что шкала Удобство этого подхода заключается в том, что действительно логарифмическая.


Но если шка- пользователь видит общую картину рейтинга ла логарифмическая, то это означает, что необ- того или иного сайта. Это очень удобно для ходимо гораздо больше дополнительного принятия решения о перспективах сотрудниче PageRank, чтобы страница передвинулась на ства с тем или иным проектом, ведь кроме СИЦ следующий уровень PageRank, чем то, что по- счетчик выводит и значения PR и тИЦ. На се требовалось на предыдущем уровне. И тогда годняшний день СИЦ используется многими получается, что ссылка со страницы с PR8, разработчиками систем (glinks.ru, addweb.ru, m имеющая много исходящих ссылок, гораздо links.ru и д.р.), которым необходима оценка ценнее чем ссылка со страницы, имеющей PR4 приоритетности того или иного сайта.

и лишь несколько исходящих ссылок.

Заключение Тематический индекс цитирования (тИЦ) В заключение можно сказать, что поиско Тематический индекс цитирования (тИЦ) – вые машины отлично развиваются. И даже в поисковой системе Яндекс определяет "авто- используют вполне известную поговорку:

ритетность" Интернет ресурсов с учетом качест- "Скажи мне кто твой друг, и я скажу кто ты!".

венной характеристики ссылок на них с других Поисковики смотрят на друзей Интернет сайтов. Качественную характеристику называют проекта и принимают решение о его важно "весом" ссылки. Рассчитывается она по специ- сти в сети. Поэтому надо серьезно отнестись ально разработанному алгоритму. Большую роль к вопросу поиска дружественных сайтов в се играет тематическая близость ресурса и ссы- ти Интернет.

62 ИЗВЕСТИЯ ВолгГТУ 3. Индекс цитирования [Электронный ресурс].

БИБЛИОГРАФИЧЕСКИЙ СПИСОК [2004]. – Режим доступа: http://yandex.ru/cy.

1. Яндекс – Директ. Статистика запросов [Электрон- 4. Жовтенко В. Продвижение веб-сайта – К.: ООО "Де ный ресурс]. [2004]. – Режим доступа: http://direct. ловая книга", 2002 г. – 200 с.

yandex.ru. 5. Ашманов И. С. Продвижение сайта в поисковых 2. Разъясненный Page Rank [Электронный ресурс]. системах. – М.: ООО “И.Д. Вильямс”, 2007 – 304 с. : ил [2004]. – Режим доступа: http://www.вебmasterpro.com.ua. ISBN 5-8459-1155-9.

УДК 004. И. В. Прохоров АВТОМАТИЗАЦИЯ ПОИСКА СЛОВ ИНОЯЗЫЧНОГО ПРОИСХОЖДЕНИЯ В ЛЕКСИЧЕСКИХ СИСТЕМАХ ЕСТЕСТВЕННЫХ ЯЗЫКОВ Волгоградский государственный технический университет ( ilya.prokhorov@gmail.com) В задаче поиска новых слов существует три основные проблемы: лексические ошибки;

поиск синонимов и перево дов слов на другие языки. Для их решения авторами разработан алгоритм, показанный в работе. Так же в работе предла гается модель автоматического этимологического анализатора.

Ключевые слова: этимологический анализ, семантика, нечеткие правила, кластеризация.

I. V. Prohorov AUTOMATION OF SEARCH OF WORDS OF A SPEAKING ANOTHER LANGUAGE ORIGIN IN LEXICAL SYSTEMS OF NATURAL LANGUAGES In a problem of search of new words exists three basic problems: lexical mistakes;

search of synonyms and translations of words into other languages. For their decision authors develop the algorithm shown in work. As in work the model of the auto matic etymological analyzer is offered.

The etymological analysis, semantics, indistinct rules, tracing of words.

Процесс развития современных языков ния новых знаний из массивов данных, позво продолжается в настоящее время. Одним из ляющие сократить область поиска, но большая важных факторов, влияющих на изменение часть работы проводится вручную.

языков, являются процессы заимствования, ко- Учитывая ограничения накладываемые раз торые происходили и происходят по разным мерностью задачи и особенностями современ причинам. Основная – отсутствие в языке под- ных путей заимствования слов, автором была ходящего слова для именования некоторого разработана модель автоматического этимоло понятия или объекта, однако, существенным гического анализатора. Формально модель мо является влияние моды. Так, благодаря моде на жет быть представлена как четверка французский язык в Петровскую эпоху, а затем, V = L, S, C, E, в конце XVIII – начале XIX в., в русском языке где: L – множество исследуемых языков;

появились слова: корсаж, пальто, буфет, са S – обходящий робот, осуществляющий лон, мебель, туалет, бульон, котлета и др.

поиск новых слов в сети;

Пути заимствования со временем меняются.

C – кластеризатор, сужающий пространст На сегодняшний день пополнение лексического во поиска;

состава языков происходит, в основном, через E – анализатор, выявляющий заимствован международные коммуникации по средствам ные слова.

сети Интернет.

L = l1, l2,..., ln, T, G, Для выявления источника и способа заим ствования слова проводится этимологический где: li – описание языка;

анализ, задача которого имеет большую раз- T – множество связей, отражающих пере мерность даже при поиске прямого источника воды слов;

заимствования. Усугубляет ситуацию то, что G – тематические группы.

нередко слова попадают в язык через несколько Описание каждого языка li L представля других, так итальянские слова купол, кавалер, ет собой пятерку бензин, коридор и др. попали в русский язык li = vs, g m, g t, g,, через французский. При этом не разработано ни где: vs – множество слов принадлежащих языку одной специализированной системы автомати и синонимических связей между ними;

зирующей этимологический анализ. Безуслов g m – грамматика морфологического разбора;

но, существуют программные пакеты извлече ИЗВЕСТИЯ ВолгГТУ g t – грамматика построения транскрипций;

блема построения синонимических рядов решает ся введением понятия маски контекста примене g – грамматика транслитерации;

ния, описывающей смысловую нагрузку слова.

– этимологические пометки слов языка.

Кластеризатор C определяет вероятность Обходящий робот S осуществляет обход иноязычного происхождения, а также предпо сайтов, проводя для каждой страницы контент лагаемый язык источник для каждого слова ис анализ, выявляя слова, которых нет в словаре.

следуемого языка.

Язык страницы идентифицируется по зна Кластеризация проводится по следующим чениям параметров lang тегов разметки страни нечетким признакам: буквенный состав слов;

цы. Если таковых не обнаружено, идентификация звуковой состав слов (транскрипции);

морфо осуществляется по буквенному составу и стати логический состав слов;

вероятность иноязыч стике языковой принадлежности известных слов.

ного происхождения;

вероятный источник за Следует отметить, что в рамках данной моде имствования;

вероятный путь заимствования;

ли рассматривается два уровня новизны слова:

принадлежность к тематической группе.

новая семантика известного слова;

новое слово.

В связи с высокими требованиями к быст В задаче поиска новых слов существует три родействию авторами был выбран алгоритм основные проблемы: лексические ошибки;

поиск кластеризации CLOPE и осуществлена его мо синонимов и переводов слов на другие языки.

дификация под нужды задачи.

Для их решения авторами разработан сле Цель работы алгоритма – максимизация дующий алгоритм:

функции оценки качества:

Для каждого слова w j Wk полученного в ре Cl i зультате контент анализа страниц сайтов SU : G (c i, r ) c i 1. Определить язык li L, к которому при- i = fit (C li, r ) =, Cli надлежит слово w j Wk ;

ci i = 2. Выделить подмножество H множества где Cli – множество кластеров, ci – кластер, Wk такое, что [ )] (w )( ) (( ) H, wi li w j = wi t w j = t (wi ), G (ci ) – градиент кластера.

j Рассмотрим шаги алгоритма:

где t () – транскрипция;

1. Построить транскрипции слов языка 3. Если li L ;

H 0 и w j H, wi li, K ( wi ) K ( w j ), 2. Провести морфологический анализ слов где K () – маска контекста применения, занести языка li L, для которых он не проводился;

w j в множество вероятно новых слов N;

(v s ) 3. Вычислить r = 2.6 +, 1, где – 4. Занести все слова w j Wk, w j H в мно- vs коэффициент прироста, (vs ) – количество за жество N;

5. Если некоторое слово wL N применя- имствованных слов в словаре vs li ;

( ( )) ется более чем на 100 S wi % сайтов тема- 4. Поместить каждое слово wi vs, vs li () в новый, существующий или оставить в теку тической группы G S wi то:

() щем кластере сi Сli. Кластер для слова wi 5.1. Занести wL в тематическую группу G S wi выбирается так чтобы fit (Cli, r ) = max ;

языка li ;

5. Если на шаге 4 было перенесено хотя бы 5.2. Пометить wi vs, K ( wi ) K ( w j ) как одно слово, перейти к шагу 4;

синонимы wL ;

Как видно из описания, алгоритм использу 5.3. Найти во всех языках l j L слова wT ет результаты предыдущей работы при очеред ном запуске. В случае появление новой инфор с аналогичными синонимами. Пометить слова мации – новых слов в словаре и/или этимоло wT как переводы слова wL.

гических пометок, данная особенность позво Как видно из описания алгоритма, проблема ляет повысить качество кластеризации при лексических ошибок решается за счет требования минимальных временных затратах.

к частоте использования новых слов (шаг 5). Про 64 ИЗВЕСТИЯ ВолгГТУ Анализатор E ищет слова языка li L за- 3. Если в результате сравнения проведенно го на шаге 2 обнаружен ряд переводов обра имствованные из других языков множества L зующих слово wli с минимальной точностью следующими способами: лексико-словообразо вательное калькирование;

лексико-словообра- более 60 %, или максимальная точность всех зовательное полукалькирование;

семантическое соответствий менее 60 %, то µ h ( wli, wl j ) = 0 ;

калькирование;

транскрипция;

транслитерация.

4. Если в результате сравнения проведенного Под лексико-словообразовательным каль на шаге 2 с точностью 60 % возможно соста кированием понимается буквальный перевод вить только часть слова wli, а оставшаяся часть частей слова: приставки, корня, суффикса при точном повторении способа его образования может быть достроена на основе грамматики мор и значения [1].


фологического разбора языка li, то µ h ( wli, wl j ) =, Лексико-словообразовательное полукаль в противном случае µ h ( wli, wl j ) = 0.

кирование осуществляется путем буквального перевод частей иностранного слова и добавле µ s ( wli, wl j ) – степень родства слов wli li ния к ним частей из исследуемого языка [1].

и wl j l j по семантическому калькированию.

Семантическим калькированием называется наделение слова принадлежащего исследуемо- Значение вычисляется по алгоритму:

му языку новым значением под влиянием дру- 1. Поместить все омонимы слов wli и wl j гого языка [1].

в множества Owl и Owl соответственно;

Для выявления слов заимствованных пере- i j численными способами автором были разрабо 2. Если Owl = 1 и/или Owl = 1, то таны нечеткие критерий: i j µ f ( wli, wl j ) – степень родства слов wli li µ s ( wli, wl j ) = 0 ;

и wl j l j по лексико-словообразовательному 3. Если Owl 1 и Owl 1, то:

i j калькированию. Значение вычисляется по алго Провести нечеткое сравнения синонимов ритму:

всех слов из множества wi O w i и переводов 1. Найти все варианты переводов частей сло синонимов всех слов из множества w j Owl ;

ва wl j полученных в результате морфологиче- j Если в результате сравнения синонимы хотя ского анализа на языке li;

бы двух пар wi и wj совпали с точностью 2. Провести нечеткого сравнение переводов 60%, µ s ( wli, wl j ) =, в противном случае всех частей слова wl j с однотипными частями µ s ( wli, wl j ) = 0.

слова wli ;

µ t ( wli, wl j ) – степень родства слов wli li 3. Если в результате сравнения проведенно го на шаге 2 обнаружен ряд переводов обра- и wl j l j по транскрипции. Значение вычисля зующих слово wli c средней точностью ется следующим образом: если в результате 60%, µ f ( wli, wl j ) = в противном случае сравнения t ( w j ) и t ( wi ), получено совпадение µ f ( wli, wl j ) = 0. с точностью 60% и значения слов идентич ны, то µt ( wli, wl j ) =, в противном случае µ h ( wli, wl j ) – степень родства слов wli li µ t ( wli, wl j ) = 0.

и wl j l j по лексико-словообразовательному µ ( wli, wl j ) – степень родства слов wli li и полукалькированию. Значение вычисляется по алгоритму: wl j l j по транслитерации. Значение вычисляется 1. Найти все варианты переводов частей следующим образом: если в результате сравнения слова wl j полученных в результате морфологи ( w j, li ) и wi, где () – операция транслитера ческого анализа на язык li;

ции, получено совпадение с точностью 60% 2. Провести нечеткого сравнение переводов и значения слов идентичны, то µ ( wli, wl j ) =, всех частей слова wl j с однотипными частями слова wli ;

в противном случае µ ( wli, wl j ) = 0.

ИЗВЕСТИЯ ВолгГТУ всех языков l L слова, семантика которых Вероятность иноязычного происхождения слова вычисляется по формуле: идентичен слову wE. Поместить выделенные ( wi ) = max(µ f ( wi ), µ h ( wi ), µ s ( wi ), µ t ( wi ), µ ( wi )). слова в множество H. w j H, µ t ( wE, w j ). На Вероятность заимствования по каждому основе проверки сформировать этимологиче способу µ f ( wi ), µ h ( wi ), µ s ( wi ), µ t ( wi ), µ ( wi ) вы ские пометки.

числяется как произведение нормализованного 6. Если наиболее вероятным способом за расстояние от ближайшего слова с соответст- имствования является µ ( wE ), то выделить из вующим способом заимствования до wi. всех языков l L слова, семантика которых Процедуру осуществления этимологическо- идентичен слову wE. Поместить выделенные го анализа языка li L блоком E можно опи слова в множество H. w j H, µ ( wE, w j ). На сать следующим алгоритмом:

основе проверки сформировать этимологиче Для каждого кластера ci Cli :

ские пометки.

1. Вычислить вероятность иноязычного Работа модели в целом заключается в син происхождения ( wi ), wi ci ;

хронизированном взаимодействии параллельно 2. Если wi ci, ( wi ) 0, то выбрать слово работающих элементов.

Обходящий робот S работает непрерывно.

wE, ( wE ) = max ;

Кластеризатор C и этимологический анализатор 3. Если wi ci, ( wi ) = 0, то выбрать слово E функционируют только в начале работы мо wE ci случайным образом. дели (процесс поиска этимологических связей в начальном словаре), а затем при появлении 4. Если вероятным способом заимствования в словаре новых слов. Итерации последова является µ f ( wE ) и/или µ h ( wE ), и/или µ s ( wE ), тельной работы C затем E повторяются до тех то выделить из всех языков l L слова w j, та- пор, пока в исследуемых языках присутствуют вероятно заимствованные слова.

кие что G ( w j ) = G ( wi ). Поместить выделенные Описанная в статье модель способна функ слова в множество H. w j H проверить по ционировать на распределенных серверных кластерах с ведением параллельных вычисле наиболее вероятному(ым) способам заимство ний, что позволяет существенно повысить ско вания: µ f ( wE, w j ), µ h ( wE, w j ), µ s ( wE, w j ). На рость решения задачи.

основе проверки сформировать этимологиче ские пометки ;

БИБЛИОГРАФИЧЕСКИЙ СПИСОК 5. Если наиболее вероятным способом за- 1. Современный русский язык [книга] / Д. Э. Розен имствования является µt ( wE ), то выделить из таль, И. Б. Голуб, и др. – М.: Айрис-пресс, 2006.

УДК 004.81:159.942. В. Л. Розалиев ПОСТРОЕНИЕ МОДЕЛИ ЭМОЦИЙ ПО РЕЧИ ЧЕЛОВЕКА Волгоградский государственный технический университет (rozaliev_v@mail.ru) Данная работа направлена на рассмотрение одного из видов невербальной коммуникации – передачи эмоций в речи, и связь ее с акустическими и лингвистическими характеристиками. Описывается аналитическое обеспечение для нахож дения эмоциональности речи и формализованная модель эмоций. Предлагаются основные направления, где может быть использованы полученные результаты.

Ключевые слова: речевые технологии, распознавание речи, акустические параметры, лингвистические переменные, "доминирующая" эмоция, нечеткие правила.

V. L. Rozaliev CONSTRUCTION THE MODEL OF EMOTIONS ON SPEECH OF THE PERSON The given work is directed on consideration of one of kinds the nonverbal communications – transfers of emotions to speeches, and its communication with acoustic and linguistic characteristics. Analytical maintenance is described for a finding emotional speeches and the formalized model of emotions. The basic directions where can be used are offered the received results.

Speech technologies, recognition of speech, acoustic parameters, the linguistic variables, "dominating" emotion, indistinct rules.

Данная работа направлена на рассмотрение скими и лингвистическими характеристиками.

одного из видов невербальной коммуникации – Действительно, воспринимая слухом речь, мы передачи эмоций в речи, и связь ее с акустиче- получаем информацию, как о смысле речи, так 66 ИЗВЕСТИЯ ВолгГТУ и об эмоциональном содержании. Следователь- ляется в виде дискретной последовательности но, эмоции кодируются определенными аку- цифровых значений амплитуды речевой волны, стическими параметрами в речевом сигнале. подвергается спектральному анализу посредст Понимание этих особенностей акустического вом быстрого преобразования Фурье (БПФ).

кодирования эмоций позволит понять сам ме- С помощью БПФ спектры вычисляются после ханизм восприятия эмоций, их выражения. По- довательно по речевому потоку с применением зволит помочь людям, страдающим аутизмом и набора фильтров, соответствующих критиче не способным самостоятельно воспринимать ским полосам. Критическая полоса (ее так же эмоции окружающих. Позволит лекторам, ме- называют полосой равной разборчивости) – это неджерам, публичным ораторам иметь эффек- минимальная полоса частот, которая возбужда тивное средство контроля, того с каким эмоцио- ет одну и ту же часть базилярной мембраны.

нальным настроем подается их речь, и какова В частотном промежутке от 0 до 16 кГц опыт заинтересованность аудитории. Так же данное ным путем были определены 24 критические исследование важно для повышения эффектив- полосы. Для удобства работы с критическими ности распознавания речи. А постепенное по- полосами используется специальная единица всеместное внедрение роботов, делает результа- измерений – Барк. [3;

4] ты данной работы важными для повышения В качестве интегральных спектральных уровня взаимодействия человека и машины. признаков выбраны следующие группы инди Формализованная модель эмоций в речи видуальных признаков:

представима в следующем виде: Model = 1) средние значения спектра анализируемо Prichina, Proavlenie, Emotion, F: Proavlenie го речевого сигнала;

Emotion, где Prichina – это причина эмоцио- 2) нормализованные средние значения нального состояния, примем за причину время спектра;

появления изменений в текущем эмоциональ- 3) относительное время пребывания сигнала ном состоянии, сохраняя таким образом поль- в полосах спектра;

зователю право на окончательное решение;

4) нормализованное время пребывания сиг Proavlenie – это множество параметров, харак- нала в полосах спектра;

теризующих звуковой сигнал речи человека, 5) медианные значения спектра речи в по т. е. все множество акустических, лингвистиче- лосах;

ских параметров, т. е. Proavlenie = {AcusticParam, 6) относительная мощность спектра речи LingvisticParam}, где AcusticParam – это аку- в полосах;

стические параметры;

LingvisticParam – это 7) величины вариации огибающей спектра лингвистические параметры;

Y – множество речи;

эмоциональных состояний;

F – функциональ- 8) нормализованные величины вариации ные зависимости Y от X. огибающих спектра речи;

Известно множество цифровых методов 9) значения коэффициентов кросскорреля выделения признаков из речевого сигнала [1;

2] ции спектральных огибающих между полосами Однако зачастую качество поступающего зву- спектра.

ка, делает невозможным применение некото- Таким образом, признаки 1-7 – отражают рых параметров. Поэтому могут использоваться своеобразие формы спектра голосовых импуль только параметры, инвариантные к действию сов у разных лиц и особенности фильтрующих повышенного уровня сигнала. При вычислении функций их речевых трактов. Признаки 7-8 ха акустических параметров (AcusticParam) рече- рактеризуют особенности речевого потока, свя вой поток рассматривается как некоторый ква- занные с динамикой перестройки артикуляци зистационарный процесс. В качестве инте- онных органов речи говорящего. Коэффициен гральных признаков речевого потока (т. е. при ты кросскорреляции, признак 9 – являются произвольном контексте речи) используются интегральными характеристиками речевого по статистические оценки распределения парамет- тока, отражающими своеобразие взаимосвязи ров текущего спектра речи (спектральные при- или синхронности движения артикуляционных знаки) и частоты основного тона, характери- органов речи говорящего. Фактически, 1-2 оп зующие этот поток в целом за определенный ределяют интенсивность сигнала. Изменение промежуток времени. При вычислении спек- интенсивности речевого сигнала, вызванное как тральных признаков речевой сигнал представ- временными изменениями подсвязного давле ИЗВЕСТИЯ ВолгГТУ ния, так и изменениями формы голосового стиками голосовых связок говорящего, в част тракта, информативны при анализе активности ности, длиной связок, их толщиной и эластич ударных и безударных звуков. ностью.

Все признаки вычисляются на отрезках Формантные частоты F1, F2, F3, F4 являются длительностью 10 с. Время выбрано экспери- первыми по порядку резонансными частотами ментально. Вычисление интегральных призна- спектров гласных звуков. На этих частотах ков на отрезках речи длительностью 10 с вы- концентрируется большая часть энергетическо звано требованием сопоставимости статистиче- го спектра гласных. Частоты формант отража ских оценок при сравнении речевых сигналов ют индивидуальные физиологические особен как очень малой, так и большой длительности. ности речеобразующих органов говорящего, В процедуре вычисления индивидуальных в частности, они связаны с формой и размерами признаков важное место занимает метод отбра- рта, языка, зубов.

ковки участков сигнала, имеющих малый уро- Для вычисления точных значений формант вень, поскольку эти данные не несут информа- ных частот и частоты основного тона их изме ции об индивидуальной речи диктора. Если ряют в середине гласного звука – в ее квазиста энергия спектрального среза меньше некоторо- ционарной части.

го порога отбраковки, то этот спектральный Полное множество лингвистических пере срез не участвует в вычислении интегральных менных (LingvisticParam) для нашего исследо признаков. вания избыточно, выделим необходимые нам Опыт криминалистической практики пока- переменные. Мы выделяем: изменение мелоди зывает, что индивидуальные акустические при- ки (Ml), темп речи (Tm), сила голоса (Fr), эмо знаки, вычисленные на отрезках речи с сопос- циональность речи (Em).

тавимым контекстом, более информативны, Способы выражения эмоций являются об чем признаки, вычисленные на отрезках речи щечеловеческими, то есть можно предположить, с произвольным контекстом. Поэтому мы, вос- что существует некий единый код [5]. Посколь пользовавшись некоторыми лингвистическим ку при речевом общении основной задачей явля параметрами при определении эмоционального ется передача смыслового содержания, то эмо состояния, находим слова, однозначно характе- циональный аккомпанемент является как бы ризующие эмоциональное состояние человека вторым планом, воспринимаемым нашим под и на них вычисляем векторы признаков 1-9 при сознанием. Это связано с тем, что невербальные длительности участков 10 с. способы общения имеют более древнее эволю Введем признаки, характеризующие от- ционное происхождение [6]. Деление эмоций на дельные звуки. Необходимость таких призна- первичные (фундаментальные, базовые, основ ков обусловлена проведением более глубокого ные) и вторичные (производные), основано на микроанализа. И если слова, характеризующие утверждении, что существует некоторое количе эмоциональное состояние мы можем и не най- ство эмоций, которые появились у человека ти, то такие звуки легче найти в речи. Вычис- врожденно (без влияния социума), они являются ление акустических признаков микроанализа универсальными для всех людей и имеют оди проводится на наиболее информативных (с точки наковое выражение, и вторичные – производные зрения проявления индивидуальности гласных от первичных, возникшие в результате смеше звуках [А], [О], [Е], [И]). Немаловажную роль ния первичных. Исследователи отмечают "груп в выборе этих звуков оказывает обстоятельст- повой" характер эмоций, проявляющийся в спо во, что они имеют наибольшую частоту встре- собности эмоциональных состояний к объеди чаемости в устной русской речи. нению, "базированию" вокруг некоторых основ Основными индивидуализирующими пара- ных, "доминирующих" эмоций на основе метрами для звуков являются: когнитивного опыта человека.

1) значение частоты основного тона (F0) на Таким образом, характеристиками таких гласных;

групп будут:

2) значение четырех формантных частот 1) Группировка происходит вокруг одного (F1, F2, F3, F4) гласных звуков;

эмоционального состояния, доминанты, по ко 3) величина длительности гласных (Тг). торому и называется вся группа.

Частота основного тона F0 связана с инди- 2) Доминанты почти всегда лексемы первого видуальными физиологическими характери- плана, наиболее обработанные в языке и наибо 68 ИЗВЕСТИЯ ВолгГТУ Первые параметры показали низкую корреляци лее укорененные во всей отраженной в ней онную зависимость от y. И поэтому были выве словесной культуре.

дены из рассмотрения. Однако эти параметры 3) Эмоциональные состояния внутри груп имеют важное значение для установки индивиду пы связаны отношениями, основанными на се альности диктора и потому их влияние оставлено мантической общности и образуют синонимич на перспективу дальнейших исследований.

ные ряды.

Используя параметры, определенные на глас Основанием для объединения эмоций в пре ных звуках и лингвистические параметры, мы делах единой семантической группы является:

разделяем пространства входных и выходных 1) Синонимичный характер толкования сигналов на области. Вторым шагом является по эмоций.

строение обучающих правил на основе обучаю 2) Общее представление о типовом сцена щих данных. Третьим шагом является создание рии возникновения, развития и протекания базы нечетких правил. Причем при создании мы эмоционального состояния. При этом сценарий учитываем степень истинности нечетких правил.

представляется в виде, причина – проявления.

По нечетким правилам производится вывод и оп 3) Общность причины эмоционального со ределяется эмоциональное состояние.

стояния.

Последовательность определения эмоцио Таким образом, выходными значениями бу нального состояния человека по речи будет сле дут: Emotion = {y1, y2, y3}, где y1 = "Радость". Фак дующей. После квантования и фильтрации гре тически это можно назвать совокупность поло бенкой из 24 фильтров, речевой сигнал пред жительных эмоций;

y2 = "Нейтральное состоя ставляется в виде последовательности значений ние";

y3 = "Отрицательные эмоции" y3 = {y31, y32, кратковременных энергетических спектров, из y33}, где y31 = "Гнев";

y32 = "Страх";

y33 = "Горе".

меренных в моменты времени j = 1, 2, …, J каж Несложно заметить, что положительные дые 5,7 мс. Значение 5,7 мс выбрано экспери эмоции меньше представлены в системе эмо ментально. Таким образом, речевой сигнал циональных состояний, на самом деле, в речи представим в виде: {x(0,j), …, x(i,j), …, x(23,j)}, значительно более выражены и проще опреде j = 1, 2 … J, где х(i,j) – значение сигнала на вы ляемы отрицательные эмоции, а положительные ходе i-го полосового фильтра в j-м кратковре очень сложно выделяемы. Возможно, это связа менном энергетическом спектре;

J – общее ко но с тем, что визуально человек легче и эффек личество спектральных срезов на анализируе тивнее определяет положительные эмоции.

мом отрезке. После разделения на полосы неко Установим функциональные зависимости торые полосы отбраковываются. После этого акустических параметров и выходных парамет находятся параметры, характеризующие речевой ров. Функциональная зависимость от акустиче поток и по функциональной зависимости нахо ских параметров имеет вид:

дится соответствующая параметрам эмоция.

y = 195,097 + 0,353 X Н + 0,614 t Н + + 0,344 PH 0,000162 X Н БИБЛИОГРАФИЧЕСКИЙ СПИСОК 0,0000751 X Н t Н 0,000314 X Н PH 1. Рамашвили, Г. С. Автоматическое опознавание го ворящего по голосу / Г. С. Рамашвили. – М., 1981. – 416 с.

2 0,0146 t Н + 0,00071 t Н PH 0,000189 PH, 2. A tutorial on hidden Markov models and selected appli cations in speech recognition [Электронный ресурс]. – [2000]. – где ХН – нормированные значения спектра;

tH – Режим доступа: http://www.cs.berkeley.edu/~murphyk/ нормированное время пребывания сигнала в по- Bayes/rabiner.pdf.

лосах спектра;

PH – относительная мощность 3. Радзишевский, А. Ю. Основы аналогового и циф спектра речи в полосах. рового звука / А. Ю. Радзишевский. – М.: Издательский дом "Вильямс", 2006. – 288 с.

Таким образом, для каждой полосы мы 4. Noguerias, A. “Speech emotion Recognition Using должны вычислить значение y, найти средне Hidden Markov Models” / A. Noguerias, A. Moreno, A. Bon арифметическое по кадру в целом, и посмотреть afonte. – Paris: Eurospeech, 2001. – 245 p.

какое значение будет принимать y. Если y выхо- 5. Morozov, V. P. Emotional expressiveness of the Sing дит из интервала [–4;



Pages:     | 1 | 2 || 4 | 5 |   ...   | 7 |
 





 
© 2013 www.libed.ru - «Бесплатная библиотека научно-практических конференций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.