авторефераты диссертаций БЕСПЛАТНАЯ БИБЛИОТЕКА РОССИИ

КОНФЕРЕНЦИИ, КНИГИ, ПОСОБИЯ, НАУЧНЫЕ ИЗДАНИЯ

<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ


Pages:     | 1 || 3 | 4 |   ...   | 7 |

«ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ ВОЛГОГРАДСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ »«¬–“» ¬—–  ...»

-- [ Страница 2 ] --

ИЗВЕСТИЯ ВолгГТУ в новой совокупности группируются значе- торого является предоставление пользователь ния параметров регулятора (обычно выбирают- ского интерфейса для задания настроечных па ся комбинации по два значения для применения раметров прикладной задачи. Это приложение генетических операторов, в ГА это называется принимает значения параметров, проверяет их "панмиксией", хотя можно объединять и боль- на допустимость, после чего формирует компо ше значений параметров);

нент данных, описывающих задачу. Далее, кли к каждой группе параметров применяется ентская программа передает этот компонент последовательность генетических операторов данных в РСИП через коммуникационный сер (порядок и параметры которых являются на- вис, согласно спецификации семантики записи строечными в генетических алгоритмах): крос- компонента. Дальнейшая функция клиентской совер, мутация и инверсия [3, 4]. программы сводится к ожиданию появления Для повышения быстродействия управляю- результата выполнения задачи в РСИП. После щей системы с контуром адаптации, в котором его извлечения клиентская программа отобра реализован генетический алгоритм, применяют- жает этот результат на экране – задача считает ся различные методы. В данной работе рассмат- ся решенной.

ривается один из них – распределение алгорит- 3. Решающий сервис – это Java-приложе мов обработки информации и управления между ние, которое посылает запрос системе РСИП на элементами вычислительной системы. поиск компонента данных, описывающего за Под распределенной системой в данной ра- дачу. В случае нахождения компонента система боте понимается система, в которой компонен- РСИП передает его решающему сервису. Зада ты, располагаемые на соединенных посредст- ча этого сервиса – сформировать задания, яв вом сети компьютерах, взаимодействуют и ко- ляющиеся блоками, которые возможно распа ординируют свои действия только с помощью раллелить, и которые содержат данные, подле механизма передачи сообщений [5]. Такое оп- жащие обработке, и/или код, выполняющий ределение ведет к следующим характеристикам обработку этих данных. Сформированные за распределенной системы: параллельность рабо- дания помещаются в РСИП. После этого ре ты компонентов, отсутствие единого времени шающий сервис собирает результаты решения и независимые отказы компонентов. сгенерированных им заданий, формирует об В ходе выполнения работы была создана щий результат решения задачи и помещает его распределенная вычислительная система, кото- в РСИП.

рая состоит из пяти компонентов: распределен- 4. Вычислительный сервис – это Java-при ной совместно используемой памяти, клиент- ложение, функцией которого является вычис ской программы, вычислительного сервиса, ление задачи, сформированной решающим сер решающего сервиса, коммуникационного сер- висом. Он ждет появления задания в РСИП, виса, причем число компонентов в конкретной извлекает его, производит необходимые вычис системе и их физическое расположение в гете- ления и помещает результат вычислений об рогенной сети может быть различным. Компь- ратно в РСИП.

ютеры (или вычислительные устройства), на 5. Коммуникационный сервис – совокуп которых находятся компоненты, могут иметь ность программных средств, предназначенных различную конфигурацию технического и про- для соединения компонентов системы с РСИП, граммного обеспечения, а также различные ти- необходимость которого регламентируется не пы соединений с удаленными ресурсами. однородностью архитектуры подсетей.

Приведем краткое описание каждого ком- Последовательность работы основных ком понента распределенной вычислительной сис- понент распределенного приложения показана темы для гетерогенной сети: на рис. 1.

1. Распределенная совместно используемая В работе проводились две группы вычисли память (РСИП) – это сервис, реализованный тельных экспериментов:

согласно спецификации технологий Jini [6] и определение предельных вычислительных JavaSpaces [7]. Основными функциями сервиса характеристик распределенной системы на спе являются: принимать запросы, поступающие от циально разработанной абстрактной задаче;

вычислительных сервисов, обрабатывать их оценка эффективности реализации алго и возвращать результат. ритма адаптации параметров ПИД-регулятора 2. Клиентская программа представляет со- в процессе управления на базе распределенной бой Java-приложение, основной функцией ко- вычислительной системы.

26 ИЗВЕСТИЯ ВолгГТУ КЛИЕНТСКАЯ ПРОГРАММА РЕШАЮЩИЙ СЕРВИС Время вычислений, мс 1. Ожидание появления Решающих сервисов – компонента данных в РСИП Решающих сервисов – 3. Помещение компонен- 3. Формирование заданий, та данных в РСИП содержащих данные и код 4. Помещение заданий 4. Ожидание результата в РСИП вычисления задачи 1 2 3 4 5 6 Число вычислительных сервисов 5. Получение результата Рис. 2. Зависимость времени решения задачи от количест вычисления задачи и ото бражение его на экране ва вычислительных сервисов (для сравнения, вычисление 6. Формирование результата задачи на одном компьютере без распределенной системы выполнения задачи и поме щение его в РСИП составляет 22054 мс) П р и м е ч а н и е. На рис. 2 время вычислений РАСПРЕДЕЛЕННАЯ СОВМЕСТНО является средним значением, относительная погреш ИСПОЛЬЗУЕМАЯ ПАМЯТЬ ность эксперимента не превышает 5 %.

3. Вычисление задания и 1. Ожидание появления помещение его результа Если же попытаться далее увеличивать ко задания в РСИП та в РСИП личество решающих сервисов по отношению к количеству вычислительных сервисов, то ВЫЧИСЛИТЕЛЬНЫЙ СЕРВИС можно обнаружить, что система будет наращи Рис. 1. Схема работы основных компонентов распреде вать производительность также непропорцио ленного приложения нально – сервис РСИП будет не успевать за ко личеством данных, передаваемых другими сер Вычислительные эксперименты проводи висами. Таким образом, приходится находить лись в локальной сети, объединяющей от двух баланс между количеством всех сервисов.

до восьми персональных компьютеров, как в од- Результаты проведенных экспериментов по нородной среде, так и в гетерогенной. Номи- зволяют сделать следующие выводы. Выбор нальная загрузка трафика сети во время экспе- распределенного алгоритма настройки пара риментов не превышала 8 %. метров определяется следующими параметрами Проводился эксперимент по выявлению тен- и характеристиками:

денции в изменении производительности реше- интервалом дискретизации, принятым в циф ния задачи настройки параметров регулятора ге- ровой системе управления;

нетическим алгоритмом за счет распределения параметрами технических средств реализа его на несколько вычислительных ресурсов в за- ции распределенной системы;

висимости от количества компьютеров. количеством вычислительных, решающих Неизменяемые параметры задачи: парамет- и РСИП сервисов;

ры системы управления, количество итераций – количеством подзадач и объемом переда поколений (параллельных блоков задачи) равно ваемых данных;

10000. Варьируемые параметры задачи – коли- достижимым улучшением показателей ка чество вычислительных сервисов (каждый сер- чества и стоимостью разработки и внедрения вис выполнялся на отдельном компьютере). распределенной системы.

В ходе выполнения эксперимента было вы- Проведенные эксперименты показывают, явлено (рис. 2): увеличение производительно- что применение распределенной вычислитель сти вычислений при добавлении новых вычис- ной системы достаточно эффективно для задач лительных сервисов (компьютеров) происходит настройки параметров ПИД-регулятора, если не линейно, а по кривой с насыщением. Этот используются свободные вычислительные ре эффект объясняется тем, что необходимы за- сурсы уже существующей вычислительной се траты на передачу данных, на координацию ти для систем управления с достаточно боль вычислительных сервисов и организацию рас- шим интервалом дискретизации, измеряемым пределенной системы. Возможна ситуация, в ко- минутами или часами. В этом случае, настрой торой решающий сервис не будет успевать со- ка помогает улучшить значения показателей бирать данные о решении подзадач и коорди- качества на 5–10 %, особенно при сменах ре нировать раздачу новых подзадач. жима управления (задающего воздействия).

ИЗВЕСТИЯ ВолгГТУ 2. Крушель Е. Г. Программный комплекс для иссле В заключение отметим, что в области ис дования цифровых систем управления с информационным пользования распределенных систем имеются запаздыванием [Текст] / Е. Г. Крушель, И. В. Степанченко // огромные резервы снижения стоимости и по- Датчики и системы. 2002. № 11. С.12–14.

вышения качества управления сложными про- 3. Goldberg D. E. Genetic Algorithms in Search, Optimization and Machine Learning [Текст] / D.E. Goldberg, изводственными комплексами. Можно ожидать Addison-Wesley Publishing Company, 1989.

быстрого расширения сферы использования 4. Porter B. Genetic Tuning of Digital PID Controllers распределенных вычислительных систем в ка- [Текст] / B. Porter, A. H. Jones / Electronics Letters. 1992. – честве техники управления. Vol. 28. № 9. – P. 843–844.

5. Coulouris G. Distributed systems. Concepts and design [Текст] / G. Coulouris, J. Dollimore, T. Kindberg. 3-d БИБЛИОГРАФИЧЕСКИЙ СПИСОК edition. Pearson Education Limited, 2001. – 772 p.

6. Edwards W. K. Core Jini. [Текст] / Edwards W. K. 2-d 1. Методы классической и современной теории авто edition. Sun Microsystems Press, 2001. – 1004 p.

матического управления: Учебник в 3-х т. Т. 3: Методы 7. Freeman E. JavaSpaces. Principles, patterns and современной теории автоматического управления [Текст] / practice [Текст] / E. Freeman, S. Hupfer, K. Arnold. Addison Под ред. Н. Д. Егупова. – М.: Изд-во МГТУ им. Н. Э. Бау Wesley Publishing Company, 2001. – 364 p.

мана, 2000. – 748 с.

УДК 621. Н. В. Федотова, Д. А. Кривошеин, В. П. Дмитренко РАЗРАБОТКА МАТЕМАТИЧЕСКОЙ МОДЕЛИ СТОЧНЫХ ВОД, ЗАГРЯЗНЕННЫХ СМАЗОЧНО-ОХЛАЖДАЮЩИМИ ЖИДКОСТЯМИ (СОЖ) "МАТИ" – Российский государственный технологический университет им. К. Э. Циолковского (cad@vstu.ru) Работа посвящена математической модели сточных вод, загрязненных смазочно-охлаждающими жидкостями.

Ключевые слова: математическое моделирование, смазочно-охлаждающие жидкости.

N. V. Fedotova, D. A. Krivoshein, V. P. Dmitrenko DEVELOPMENT OF THE MATHEMATICAL MODEL OF SEWAGE WITH LUBRICANTING COOLING LIQUIDS The paper is devoted to of the mathematical model of sewage with lubricanting cooling liquids.

Mathematical modeling, lubricanting cooling liquids.

Смазочно-охлаждающие жидкости (СОЖ) кости стоков играет важную роль при прогно применяются при обработке деталей на метал- зировании эффективности их очистки.

лорежущих станках. При резании со смазкой и Целью настоящей работы явилась разработ охлаждением достигается многократное увели- ка математической модели вязкости стоков, за чение стойкости режущих инструментов, грязненных СОЖ.

улучшается чистота поверхности и повышается Для исследования были выбраны два типа точность обрабатываемых деталей, уменьша- СОЖ: СОЖ-1 – "Купрол" и СОЖ-2 – "Медьсо ются силы резания и расходуемая мощность, держащая присадка" [2, 3].

обеспечивается надежное удаление стружки из Их использовали в качестве моделей про зоны резания [1]. При реализации оборотной мышленных стоков, полученных путем смеше системы водоснабжения механических цехов ния водопроводной воды и СОЖ в различной предприятий производится очистка стоков от концентрации (%): 5, 10, 20, 30, 40, 50, 60, 70, нерастворимых примесей, в том числе СОЖ. 80, 90, 100. Исследуемые стоки (эмульсии) го Основным методом очистки является седимен- товили с использованием лопастной мешалки.

тация, которая заключается в отстаивании ка- Перемешивание проводили в течение 5 мин со пель СОЖ. скоростью 900 об/мин.

Одним из факторов, замедляющих движе- Кинематический коэффициент вязкости ние капель СОЖ к поверхности воды при от- эмульсий измеряли при комнатной темпера стаивании, является вязкость стоков, которая туре с использованием визкозиметра ВПЖ- в основном зависит от вида присутствующих по методике [4]. Число параллельных опытов составных частиц дисперсной фазы, а также при измерении коэффициента кинематиче разности плотностей дисперсной фазы и дис- ской вязкости составило 6. Ошибка экспери персионной среды. Поэтому исследование вяз- мента при измерении коэффициента вязко 28 ИЗВЕСТИЯ ВолгГТУ сти не превысила 2 %. Кинематический ко- в ней, а также составом дисперсионной среды.

эффициент вязкости пересчитывали в дина- Они предложили следующее уравнение экспо мический по методике [5]. ненциального вида:

Исследование вопроса о вязкости коллоид- µ i + µ в 5 + 3 + 3. (3) 5 ных систем, к которым можно отнести рас- µ = 2, ln сматриваемый нами объект, обычно начинается µ i + µ в µв с анализа работ А. Эйнштейна [6–8]. Он рас сматривал вязкость жидкости, содержащей Величины вязкости эмульсий, рассчитан взвешенные мелкие твердые шарики. Полагая, ные по этому уравнению, хорошо согласуются что упругие шарики имеют малый диаметр по с экспериментальными данными.

отношению к расстоянию между их центрами, Для малых значений это уравнение при но большой по сравнению с молекулярными водится к уравнению (2) Р. Тейлора независимо размерами, А. Эйнштейн предложил следую от состава или вязкости дисперсионной среды.

щее уравнение:

µ = µ(1 + 2,5), Вычисленная по данному уравнению вязкость (1) исследованных эмульсий в пределах ошибок где µ – вязкость суспензии;

µ – вязкость дис опыта совпадает с экспериментальными дан персионной среды и – отношение объема ша- ными при значениях от 0 до 1.

риков к общему объему суспензии (объемная Структура уравнения (3) была использована доля твердой фазы).

нами при установлении зависимости вязкости Следует отметить, что диаметр шариков не эмульсий, состоящих из смазочно-охлаждаю входит в уравнение (1).

щих жидкостей и воды, от объемной доли СОЖ.

Применение рассуждений А. Эйнштейна Выводимое уравнение должно:

к эмульсиям затруднительно, т. к. истинные гра учитывать все физико-химические предпо ничные условия у поверхности раздела фаз не сылки (обоснования), лежащие в основе урав известны, и капли дисперсной фазы могут под нений (1–3);

вергаться деформации под совместным влияни адекватно описывать экспериментальные ем вязких сил и поверхностного натяжения на данные во всем интервале значений (от 0 до границе раздела фаз.

1), переходя при малых значениях в уравне Вопрос о вязкости эмульсий изучал Р. Тей ние Тейлора;

лор [9]. Продолжая вычисления Эйнштейна, он с математической точки зрения уравнение допустил, что: а) радиус капелек настолько должно представлять собой сплайн-функцию, мал, что они всегда остаются шарообразными;

которая наиболее удобна для интерполяции б) скольжение на поверхности капелек равно и других практических расчетов.

нулю;

в) усилие сдвига полностью передается В работах А. Левитона и А. Лейтона [10] от одной жидкости к другой. Р. Тейлор выводит параметр, характеризующий влияние объема следующее уравнение для эмульсий:

дисперсной фазы на вязкость эмульсии µ, µ i + µ в описывается полиномом и зависит от линей 5, µ = µ в 1 + 2,5 (2) ных размеров капель, входящих в состав СОЖ.

µ i + µ в При этом линейный размер капель пропор ционален объему СОЖ в составе эмульсии где µ – вязкость эмульсии;

µ i – вязкость дис- в степени 1/3.

Согласно работам [6-10] искомая зависи персной фазы, µ в – вязкость дисперсионной мость должна представлять собой степенной среды, – отношение объема дисперсной фазы ряд. Для удобства представим его как полином к общему объему эмульсии. бесконечной степени вида ai i / 3 [11].

А. Левитон и А. Лейтон исследовали вяз i = кость эмульсий, полученных при диспергиро Исходя из того, что искомая зависимость вании жиров молока в обезжиренном концен при малых концентрациях должна переходить трированном и разбавленном молоке, а также в формулу (2), коэффициент а0 должен быть ра в очень вязком растворе сахарозы в обезжирен вен 1. Для упрощения зависимости выделим ном молоке [10]. Авторы пытались эмпириче неизвестную полиномиальную часть, обозна ски установить зависимость между вязкостью чив ее :

эмульсии и концентрацией дисперсной фазы, ИЗВЕСТИЯ ВолгГТУ = 1 + ai i / 3, (4) 1, i = = 1 + a1 1 / 3 + a 2 2 / 3 + a 3 3i 3.

где, (5) 0, В выражении (4) ai – коэффициент при со 0, ответствующем члене полинома, i – натураль ное положительное число, которое принимает 0, значение от 0 до. 0, По виду экспериментальных кривых уста новили зависимость экспоненциального вида, 0 аналогично уравнению А. Левитона и А. Лей- 1/ тона. В результате преобразований расчетное уравнение (3), с учетом наложенных ограниче- полином ний принимает вид:

µ 0, 4+µс 2,5 в Рис. 1. Вид полиномиальной зависимости построенной по µ +µ вc µ = µв е (6) экспериментальным данным где µв – динамический коэффициент вязкости воды, Па·с, µ c – динамический коэффициент вязкости чистого СОЖ, Па·с. 2, Для того, чтобы определить вид полинома, преобразуем выражение (6): µ ln э 1, µв = (7) µ в 0,4 + µ с 2, µ + µ в с 0, где µ э – динамический коэффициент вязкости эмульсий, измеренный при разных концентра- 0 5 10 20 30 40 50 60 70 75 80 90 циях СОЖ. % По результатам регрессионного анализа ме тодом наименьших квадратов, проведенного экспериментальные данные теоретическая кривая с помощью программы "Sigma Plot 6.0" был Рис. 2. Экспериментальные данные вязкости эмульсий на выбран полином третьей степени [12]. Вид кри основе СОЖ-1 и рассчитанные по уравнению (8) вой, описываемый данным полиномом, пред ставлен на рис. 1.

3, Ординаты экспериментальных точек на этих графиках определялись как среднее ариф- метическое из 6 измерений. Искомая зависи мость, также построенная с помощью програм- 2, мы "Sigma Plot 6.0" представлена на рис. 2 и 3.

Коэффициенты полинома составили для СОЖ-1 a1 = 0,07;

а2 = 4,34;

а3 = 3,77, для СОЖ- a1 = 0,61, а2 = 5,72 а3 = 4,69. 1, При сравнении экспериментальных и расчет ных данных (рис. 2 и 3) видно, что они практиче- ски совпадают для обеих модельных СОЖ.

Для СОЖ-1 уравнение имеет вид: 0, ( ) µ в 0, 4 + µ с 1+ 0, 071 / 3 4,34 2 / 3 + 3, 773 / µ в е 2,5 = µ (8) µв +µc 0 5 10 20 30 40 50 60 70 75 80 90 µ 0,4 + µ с µ % = 2,5 в ln µ +µ экспериментальные данные теоретическая кривая µв в с ( ) Рис. 3. Экспериментальные данные вязкости эмульсий на 1 + 0,07 4,34 + 3,77 3 / 1/ 3 2/ (9) основе СОЖ-2 и рассчитанные по уравнению (10) 30 ИЗВЕСТИЯ ВолгГТУ Уменьшенная в указанное число раз вели Для СОЖ-2 уравнение имеет вид:

чина w0 дает увеличенную в столько же раз ( ) µв 0, 4+µс 1+0, 611 / 3 5, 722 / 3 + 4, 693 / µ в е 2, 5 µ в +µ c = µ (10) площадь поверхности седиментационной уста новки. В результате этого исключается ошибка µ 0,4 + µ с µ = 2,5 в ln в расчетах седиментационных установок, свя µ +µ µв занная с использованием вязкости чистой воды, в с ( ) а не соответствующей высококонцентрирован 1 + 0,61 1 / 3 5,72 2 / 3 + 4,69 3 / 3. (11) ной эмульсии. Полученные уравнения (9) и (11) Полученные математические модели по позволяют точно рассчитать вязкость иссле зволяют рассчитать с большей точностью (в дуемых эмульсий любых концентраций.

2–3 раза) основные размеры установки для се диментационной очистки стоков от СОЖ [13]. БИБЛИОГРАФИЧЕСКИЙ СПИСОК Повышение точности расчета в указанное чис 1. Смазочно-охлаждающие жидкости при резании метал ло раз может быть обоснованно, данными, лов / под ред. М. И Клушина. – М.: Машингиз, 1961. – 292 с.

представленными на рис. 2 и 3, а также полу- 2. ТУ 0258-002-322.654. ченными нами уравнениями (9) и (11). Из них 3. ТУ 0253-012-069.133. 4. ГОСТ 10028-67. Определение коэффициента ки следует, что при высоких концентрациях СОЖ, нематической вязкости жидкости.

вязкость содержащих их эмульсий увеличива- 5. Перри Дж. Справочник инженера-химика. пер. с англ.

ются в 2–3 раза, по сравнению с вязкостью чис- под ред. Н. М. Жаворонкова, П. Г. Романкова, т. 1, Л., той воды, которую обычно вводят в расчетную 1969. – 471 с.

6. Ландау Л. Д., Лившиц Е. М., Питаевский Л. П.

формулу Стокса (величина µ), для определения Теоретическая физика, т. 6, М., Физматлит, 2000. – 496 с.

скорости всплывания капель СОЖ: 7. Виноградов Г. В., Малкина А. Я. Реология полиме gd 2 (1 ) ров. – М.;

Химия, 1977. – С. 120-235, 490 с.

w0 = (12) 8. Гидродинамика и тепломассообмен течений жид 18µ кости со свободной поверхностью / под ред. И. Р. Шрей бера. – Новосиб., ИТФ, 1985. – 145 с.

где w0 – скорость всплывания частицы;

g – ус 9. Бычков Ю. М. Гидродинамика тонких потоков не корение свободного падения;

d – диаметр час- сжимаемой жидкости. – Кишинев.;

Штиинца, 1981. – 109 с.

тицы;

1 – плотность частицы, – плотность 10. Leviton, Leighton. J. Phys. Chem., 40, p. 71, 1936.

воды;

µ – динамическая вязкость воды. 11. Корн Г., Корн Т. Справочник по высшей матема тике: М., Наука, 1973.

Подставляя в знаменатель формулы вели 12. Дубнов П. Ю. Обработка статистической инфор чину µ, в 2–3 раза большую, чем вязкость воды, мации с помощью SPSS. – М.;

АСТ. 2004. – 224 с.

получаем уменьшенную в только же раз ско- 13. Карелин Я. А. и др. Очистка сточных вод нефтепе рость w0. рерабатывающих заводов: М., Стройиздат, 1982.

СИСТЕМНЫЙ АНАЛИЗ И ОБРАБОТКА ИНФОРМАЦИИ УДК 004. В. И. Аверченков, С. М. Рощин, Ю. М. Казаков, В. А. Шкаберин МОНИТОРИНГ И АНАЛИЗ ИНФОРМАЦИИ В ИНТЕРНЕТЕ Брянский государственный технический университет (aver@tu-bryansk.ru) В настоящее время проблема эффективного использования информации Интернета стоит чрезвычайно остро.

Целью выполненных исследований являлось разработка математических моделей, методов и средств автоматизации мониторинга и системного анализа распределенной информации в сети Интернет для формирования проблемно ориентированных хранилищ данных.

Ключевые слова: мониторинг, системный анализ, проблемно-ориентированная информация, автоматизированная информационная система.

V. I. Averchenkov, S. M. Roschin, U. M. Kasakov, V. A. Shkaberin INFORMATION MONITORING AND ANALYSIS IN THE INTERNET Effective usage of data gained from the Internet is an important problem nowadays. The main goal of the research was the development of mathematical models and methods for monitoring and system analysis of the distributed information network in order to create problem-oriented databases.

Monitoring, system analysis, problem-oriented information, automated information system.

В настоящее время в сети Интернет создано ствующие требуемой предметной области (осо множество разнообразных информационных ре- бенно для узких областей) и перечень информа сурсов. Они используются в повседневной дея- ционных ресурсов в них, как правило, не значи тельности организаций, так как содержат необ- телен. В результатах поиска ИПС, как правило, ходимые для них сведения, например для приня- присутствует значительный информационный тия адекватных управленческих решений. При шум, и анализ результата поиска, количество этом распространение информации носит, зачас- ссылок на документы в котором превышает не тую, неорганизованный и хаотичный характер. сколько сотен, в таких системах сопряжен со Это затрудняет поиск интересующих информа- значительными трудностями. Метапоисковые ционных ресурсов. Проблема эффективного ис- системы обладают теми же недостатками, что пользования информации Интернета стоит чрез- и ИПС, но они более выражены.

вычайно остро. Поэтому, большое значение Для решения описанных проблем доступа приобретает возможность автоматизации мони- к информации сети Интернет авторами была торинга и системного анализа распределенной разработана автоматизированная система мони проблемно-ориентированной информации. торинга и системного анализа распределенной Целью выполненных исследований явля- проблемно-ориентированной информации [2].

лось разработка математических моделей, ме- Структура предлагаемой системы состоит из тодов и средств автоматизации мониторинга следующих частей: многомерного хранилища и системного анализа распределенной инфор- данных, базы знаний, модуля мониторинга, мо мации в сети Интернет для формирования про- дуля индексирования, модуля аналитики, моду блемно-ориентированных хранилищ данных. ля поиска и модуля управления (рис. 1).

Для этого был разработан метод монито- Эффективность работы автоматизирован ринга проблемно-ориентированной информа- ной аналитической информационной системы ции в среде Интернет, в основе которого лежит в значительной степени определяется составом новый подход к индексированию информации, используемых в ней формализованных знаний.

ее классификации, лингвистическому распо- База знаний в системе – это связующее звено знаванию текстов и формализации в виде алго- между хранилищем данных и модулями систе ритмов автоматизированной аналитической ин- мы. В нее включены следующие блоки: мета формационной системы. данные, онтология, лингвистический анализ Возможным подходом к достижению ука- и когнитивное представление.

занной цели могут являться имеющиеся в сети Основная составная часть базы знаний сис Интернет средства информационного поиска, темы – блок метаданных. Здесь содержится к которым относятся каталоги, информацион- информация о том, что представляют собой но-поисковые системы (ИПС) и метапоисковые данные хранилища, как они взаимосвязаны, ка системы [1, 2]. кова структура данных, где хранятся данные, Однако ни одно из перечисленных средств как получить доступ к ним и т. д. Доступ к ме не позволяет решить задачи полностью. В ката- таданным имеют все модули системы, обслу логах не всегда удается найти разделы, соответ- живающие и использующие хранилище данных.

32 ИЗВЕСТИЯ ВолгГТУ Рис. 1. Структура автоматизированной аналитической информационной системы относя их к определенным узлам, и обеспечи Создание и поддержка блока метаданных про вает значительное сужение диапазона поиска изводится администратором системы. Этот блок требуемых документов, что положительно ска является основой для всех процессов в храни зывается на точности результатов поиска.

лище и для обеспечения конечных пользовате Блок лингвистического анализа в базе зна лей доступом к информации в нем.

ний служит для понимания системой содержа Следующий блок базы знаний – онтология.

ния текстовых документов и запросов пользо Этот блок служит для формализации знаний вателя на естественном языке. Содержит зна о группах документов, выделенных экспертом, ния, дающие возможность системе разбивать относящихся к определенной теме. Внутренним документы и запросы на отдельные слова, и вы представлением онтологии является тезаурус делять из них словосочетания. Кроме этого, (рис. 2).

блок решает задачи выделения основ слов (сло Онтология позволяет улучшить процесс по ва без окончаний) и нахождения слов сходных иска информации. Она позволяет более эффек по смыслу – синонимов.

тивно классифицировать документы Интернета, Еще один блок базы знаний – блок когни Tesaurus тивного представления. Он служит для пре (Тезаурус) доставления пользователю найденной с помо щью данной автоматизированной системы ин Entity Relation формации в удобном для просмотра, воспри (Сущности) (Отношения) ятия и анализа виде и включает набор правил, Hierarchical Associative Concept Term необходимых для выполнения этих функций.

(Иерархические) (Ассоциативные) (Концепция) (Термин) Обобщенная процедура работы анали Top Concept тической информационной системы состоит Preferred Term Broader Narrower Antonym Synonym (Концепция (Предпочтительный (Общее) (Частное) (Антонимия) (Синонимия) верхнего уровня) в следующем:

термин) 1. Периодически с использованием модуля управления системы запускаются на выполне Broader Generic Broader Partitive Narrower Generic Narrower Partitive (Более общее) (Целое) (Более частное) (Часть) ние модули мониторинга и индексирования.

Broader Instance Narrower Instance Цель работы данных модулей – найти новые (Класс) (Экземпляр) и измененные информационные ресурсы в сети Рис. 2. Объекты тезауруса ИЗВЕСТИЯ ВолгГТУ Интернет, относящиеся к тематике предметной Структурно модуль мониторинга представ области, на которую ориентирована система, ляет собой многофункциональный программ и скорректировать многомерное хранилище ный продукт. При этом можно выделить функ данных системы в соответствии с текущим со- ции обеспечивающие сканирование WEB-ре стоянием информационных ресурсов. сурсов Internet и занесение найденной инфор 2. Параллельно с модулями мониторинга мации в хранилище данных. При запуске и индексирования и независимо от них в систе- модуля эти функции реализуют автоматическое ме выполняются другие два модуля – модуль определение операционной системы, форми аналитики и модуль поиска. Задача этих моду- руют многоагентный поиск, используя различ лей – используя многомерное хранилище дан- ные ИПС, а также обеспечивают информаци ных и базу знаний, отобрать данные, соответст- онное наполнение ХД и ее администрирование.

вующие запросам пользователей, и произвести Настройка на конкретную ИПС выполняется их аналитическую обработку. При этом в ответ в конфигурационном файле. Обработка файла на запрос выдаются только те данные, инфор- описания поисковых систем производится на мация о которых уже известна системе к мо- этапе составления запросов к ПС и загрузки менту поступления запроса, т. е. эти данные ПС. При этом на этапе создания запросов к ПС, проиндексированы и занесены в многомерное используется параметр описания каждой из ПС, хранилище данных. а на этапе обработки запросов используются Рассмотрим более подробно основные про- регулярные выражения, предназначенные для цессы, лежащие в основе функционирования выявления информации о найденных страни данной автоматизированной аналитической цах. Также процедура модуля мониторинга информационной системы. обеспечивает возможность редактирования Одним из важных процессов в системе яв- входного файла запросов. Изменение (добавле ляется мониторинг информации. Под монито- ние информации) данного файла может произ рингом в работе будем понимать процесс по- водиться динамически во время работы модуля.

стоянного сбора релевантной системе инфор- Пользователю доступно редактирование вспо мации из сети Интернет с целью дальнейшего могательных файлов используемых при работе ее исследования методами системного анализа.

модуля. Для повышения эффективности полу Для обеспечения качественного мониторинга чения релевантной информации в модуле фор проблемно-ориентированной информации в се мируется в полуавтоматическом режиме "чер ти Интернет в разрабатываемой системе реали ный " список не желательных документов и сай зуется два подхода, сущность которых состоит тов. Также модуль позволяет отслеживать и не в следующем. Автоматизированная система которые статистические данные необходимые периодически последовательно взаимодейству для определения, как текущего рабочего со ет со всеми зарегистрированными в системе стояния модуля, так и для получения информа внешними по отношению к ней средствами ин ции об эффективности заданных параметров.

формационного поиска и таким образом отби Оперативное управление отобранными в ре рает проблемно-ориентированную информа зультате сканирования по поисковым запросам цию (рис. 3). Также в системе предусмотрена и скаченными в ХД документами осуществля возможность задания экспертами адресов кон ется с использованием модуля предварительно кретных информационных ресурсов, соответст го администрирования WEB-ресурсов. Модуль вующих предметной области, которые также включает ряд процедур – это просмотр всего исследуются системой.

содержимого ХД, удаление, корректировка, пометка на удаление, занесение в черный спи сок документов и сайтов, поиск документов по различным критериям, локальное занесение до кумента в ХД, статистические данные по типам документов.

Для просмотра ХД разработаны процедуры динамического иерархического формирования каталога документов. Каталог документов представляет собой 4-х уровневой индексиро ванный список. На каждом уровне предусмат Рис. 3. Процесс мониторинга информации 34 ИЗВЕСТИЯ ВолгГТУ ривает введение поискового запроса для доку- вантности. Причем часть параметров выбирает мента – по типу поисковой системы, по реле- ся из списка – тематический блок, поисковая вантности, тематическому блоку, поисковой система, часть заносится пользователем на ес фразе, расширению, дате, размеру, заголовку тественном языке – название, описание.

документа. Для просмотра ХД могут быть ис- В модуле предусмотрены процедуры фор пользованы от одного до 4-х уровней. Это дает мирования статистической информации по ха возможность расширять либо сужать объем рактеристикам документов. Так динамически рассматриваемых документов (рис. 4). Индек- формируется диаграмма по количеству доку сированный список представлен в виде дерева, ментов с различным расширением, временем что обеспечивает возможность перемещаться создания, объемом и т. д.

по различным отсортированным рубрикам. Ок- Таким образом, модули мониторинга и ад но просмотра представляет собой перечень на- министрирования WEB ресурсов реализует ал званий документов с рядом дополнительных горитмы, осуществляющие формирование за параметров – пометкой уже просмотренных до- просов внешним средствам поиска, автомати кументов, пометкой документов на удаление, ческий анализ списка результатов внешних пиктограммами для просмотра документа из средств поиска, проход по ссылкам Web-стра Internet, занесения сайта в черный список и т. д. ниц, проход по структуре каталогов, проверку Процедуры динамического формирования ка- соответствия найденных документов тематике талога позволяют оперативно добавлять и ме- предметной области, а также предварительное нять поисковые запросы для каждого уровня. заполнение семантической сети системы по Просмотр информации содержащейся в до- предметной области, поиска и редактирования кументе может осуществляться непосредствен- документов ХД.

но для документа занесенного в ХД, а также Модуль мониторинга реализован с исполь при закачивания его из Internet (рис. 5). зованием мультиагентных технологий. В этом Модуль администрирования также позволя- случае, каждый из агентов ищет информации ет осуществлять поиск конкретных документов в Интернете только по своей предметной об по ряду параметров: заголовку, размеру, дате ласти. Это позволяет настроить систему для создания, поисковой системе, адресу, расшире- поиска информации одновременно по несколь нию, описанию, тематическому блоку, реле- ким предметным областям.

Рис. 4. Копия экрана интерфейса модуля администрирования ИЗВЕСТИЯ ВолгГТУ Рис. 5. Копия экрана интерфейса модуля администрирования Еще одним основным процессом представ- Процесс индексирования состоит из опера ляемой системы является процесс индексиро- ций: отбор индексационных терминов, исполь вания информации. зуемых для описания содержания документа, Под индексированием информации будем и приписывание этим терминам некоторого ве понимать формирование сведений о тексте до- са, отражающего предполагаемую значимость.

кумента в средстве информационного поиска, При выполнении индексирования выбира основываясь на его содержании, достаточным ются слова, встречающиеся в каждом документе, для его нахождения данным средством. Цель и делаются статистические подсчеты, в основе процесса индексирования – приписать докумен- которых находится частота и место появления ту некоторое множество идентификаторов (по- данного слова в документе. Далее отбрасыва нятий, терминов, ключевых слов), отражающих ются общеупотребительные слова, имеющие содержание документа, т. е. составить ему так высокую частоту, а оставшимся словам припи называемый поисковый образ документа (ПОД).

сываются веса в соответствии с ранее прове На вход метода индексирования поступают денными статистическими подсчетами. На за документы, отобранные средством информаци ключительном этапе документ помещается в мно онного поиска из внешней среды при помощи гомерное хранилище данных и его ПОД – в блок модуля мониторинга.

метаданных БЗ.

На выходе метода индексирования получа Вычисление веса слова в документе осуще ются ПОД, которые необходимы средству по ствляется по формуле[2]:

иска для выбора соответствующих запросу nj nt l пользователя документов (рис. 6).

W (t,Dm ) = kit + ki j, (1) i =1 j =1 i = где: nt – количество вхождений слова t в доку мент Dm;

l – количество синонимов слова t, исполь зуемых в документе Dm;

nj – количество вхождений синонима j сло ва t в документ Dm;

Рис. 6. Процесс индексирования информации 36 ИЗВЕСТИЯ ВолгГТУ kit (kij) – коэффициент, определяющий значи- ненного цикла промышленного изделия", "Ав мость слова t (j), находящегося в до- томатизированные системы". Далее каждый из кументе Dm на позиции i. классов был уточнен множеством подклассов, Также основным процессом в разрабаты- например "Этапы жизненного цикла промыш ваемой автоматизированной аналитической ленного изделия" до "Маркетинг", "Проектиро информационной системе является классифи- вание", "Технологическая подготовка произ кация информации. В основе данного процесса водства", "Производство" и др.

лежит построение и использование онтологии Классы сами по себе не предоставляют дос определенной предметной области. таточно информации для ответа на запросы Начальный этап формирования онтологии пользователей. После определения некоторого осуществляется экспертом с использованием количества классов была описана внутренняя модуля управления системы. На этом этапе структура понятий. Для каждого свойства из формируются основные узлы сети и им сопос- списка определялся описываемый им класс.

тавляются понятия предметной области. Затем Эти свойства являются слотами, привязанными осуществляется сопоставление узлам сети кон- к классам. Таким образом, у класса "Интегри кретных документов из заданной предметной рованные САПР в машиностроении" будут сле области. дующие слоты: название, производитель, гео При построении онтологии предметной об- метрическое ядро, модули. А у класса "Разра ласти, в первую очередь необходимо сформи- ботчик" – название, производитель.

ровать список терминов, на основе которого В онтологии слотами могут стать несколько будет создана модель системы. Например, в чис- типов свойств объектов:

ло важных терминов, связанных с заданной • "внешние" свойства, такие как название предметной областью будут входить такие по- САПР;

нятия как: САПР, система, CALS – технология, • части, если объект имеет структуру;

они модель, проектирование, геометрическое ядро могут быть как физическими, так и абстракт и т. п. Предварительно формируется полный ными "частями" (например, тип модуля для мо список терминов, без оценки пересечения по- дуля конкретной системы);

нятий, которые они представляют, и отноше- • отношения с другими индивидными кон ний между терминами. цептами;

это отношения между отдельными После составления глоссария разрабатыва- членами класса и другими элементами (напри ется иерархия понятий (классов) и определяют- мер, производитель САПР, представляющий от ся свойства понятий (слотов). ношение между конкретной САПР и фирмой).

Для разработки иерархии классов могут Все подклассы класса н а с л е д у ю т слоты быть использованы нисходящий, восходящий родительского класса. Например, все слоты клас и комбинированный подходы са "Интегрированные САПР" будут унаследо • Процесс н и с х о д я щ е й разработки на- ваны всеми подклассами этого класса, включая чинается с определения самых общих понятий "Тяжелого класса", "Среднего класса", "Легкого предметной области с последующей конкрети- класса".

зацией понятий. Слот должен быть привязан к самому об • Процесс в о с х о д я щ е й разработки на- щему классу, у которого может быть данное чинается с определения самых конкретных клас- свойство.

сов, листьев иерархии, с последующей группи- После этого создается база знаний, опреде ровкой этих классов в более общие понятия. ляются отдельные экземпляры этих классов, • Процесс к о м б и н и р о в а н н о й разра- вводятся в определенный слот значение и до ботки – это сочетание нисходящего и восходя- полнительные ограничения для слота.

щего подходов: Предварительно определяются Для проекта была сформирована онтология более заметные понятия, а затем соответст- предметной области "CALS- CAD- CAM- CAE вующим образом проводят их обобщение и ог- технологии", отражающая взаимосвязь классов раничение. "Интегрированные САПР в машиностроении", Следуя принципам разработки онтологий, "Разработчики", "Геометрические ядра", "Эта для заданной предметной области были опре- пы жизненного цикла промышленного изделия" делены следующие классы для наиболее общих ("Проектирование", "Технологическая подго понятий: "CALS – технология", "Этапы жиз- товка производства") и т. д. (рис. 7).

ИЗВЕСТИЯ ВолгГТУ Представленная система универсальна в том Типы модулей основные смысле, что подходы, используемые в ней, не САД САМ зависят от конкретной предметной области.

САЕ Вид модуля Математическое обеспечение дополнительн Система может быть настроена на работу с ин Вид геометрической модели геометрического моделирования Геометрические модели формацией из широкого спектра различных Подходы к представлению геометрических моделей предметных областей.

Методы и алгоритмы Название модуля машинной графики Тип модуля Этап жизненного цикла Разработанная система формирования зна Класс САПР Типы модулей ний значительно облегчает процессы индекси Система рования и поиска самых разнообразных элек тронных информационных ресурсов и позволя Этапы жизненного цикла Проектирование ет повысить эффективность работы специали Эскизное проектирование Модули Техническое проектирование стов на предприятии.

Интегрированные Рабочее проектирование САПР САПР Технологическая подготовка Возможности новой системы позволяют Система Тяжелого класса производства Среднего класса сэкономить пользователям не только время, Легкого класса но и материальные затраты за счет полной ав Геометрическое ядро Производит.

томатизации процесса сбора информации и со Система кращения числа исполнителей.

Производитель В итоге система предоставляет следующие Геометрические ядра функциональные возможности [2]:

Лицензируемые Частные собирать определенную (интересующую с точ Разработчики Свободно ки зрения анализа) информацию из Интернета;

распространяемые накапливать ее в едином хранилище данных;

Рис. 7. Классы и связь классов в онтологии предметной работать с информацией хранилища по бласти CAD-CAM- CAE технологии средством интерфейса пользователя;

Использование созданной онтологии, класси- сохранять полученные в программе отчеты фицирующей документы конкретной предметной на запросы пользователя.

области, конечными пользователями осуществ- Реализация предложенного в данной работе ляется через модуль аналитики. С применением подхода позволила разработать эффективный данного модуля пользователь формулирует за- метод доступа к проблемно-ориентированной прос, откликом системы на который являются информации из больших распределенных не фрагменты построенной онтологии. Эти фраг- структурированных массивов информации, в том менты можно рассматривать в качестве инфор- числе и из сети Интернет.

мационной модели изучаемой пользователем те БИБЛИОГРАФИЧЕСКИЙ СПИСОК мы. Система позволяет осуществлять навигацию 1. Аверченков В. И., Мирошников В. В., Рощин С. М.

по выданным фрагментам сети и просматривать Информационный поиск в сети Интернет: учеб. пособие. – документы, которые им соответствуют. Брянск: БГТУ, 2001. – 204 с.

Возможен доступ к системе и через Web- 2. Аверченков В. И., Рощин С. М. Мониторинг и сис интерфейс, реализованный с использованием пор- темный анализ информации в сети Интернет: монография. – тала. Это позволяет работать с системой удаленно. Брянск: БГТУ, 2006. – 160 с.

УДК 004. С. В. Аверьянов, К. В. Кумунжиев СИСТЕМА ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ ДЛЯ СЕРВИСОВ С МНОГОСТУПЕНЧАТОЙ ОБРАБОТКОЙ ТРАНЗАКЦИЙ Ульяновский государственный университет (cad@vstu.ru) Статья посвящена проблеме планирования производительности системы обработки сообщений (транзакций). Предлагается решение проблемы в виде системы поддержки принятия решений для подобных сервисов. Была построена модель предметной области, формализованы типичные управленческие задачи, разработан алгоритм оптимизации параметров модели.

Ключевые слова: система поддержки принятия решений, модель, оптимизация.

S. V. Averyanov, K. V. Kumunzhiev A DECISION-SUPPORT SYSTEM FOR SERVICES WITH MULTI-STEP PROCESSING OF TRANSACTIONS The paper focuses on the problem of productivity planning for services with multi-step processing of transactions. A new decision-support system gives a solution to the problem. Data domain was created, typical management tasks were formalized, a new algorithm of model’s parameters optimization was created.

Decision-support system, model, optimization.

В последнее время одним из наиболее дина- щихся все большей популярностью) сегментов мично развивающихся (равно как и пользую- рынка информационно-развлекательных услуг 38 ИЗВЕСТИЯ ВолгГТУ тие решений могла бы система поддержки становятся системы обработки сообщений в ре принятия решений для систем подобного рода.

жиме реального времени: разного рода чаты, В рамках данной системы необходимо создать SMS сервисы контент-провайдеров и прочее.

модель предметной области, выделить и фор По мере увеличения доступности коммуни мализовать типичные управленческие задачи кационных оконечных устройств (мобильной по принятию решений для вышеописанных связи, Интернета) вообще и повышения качест систем, а также разработать алгоритмы реше ва их технологической составляющей (посте ния задачи и оптимизации параметров модели.

пенное увеличение доли высокоскоростных Модель состоит из следующих элементов:

подключений к интернету) интерес к подобного 1) Источник сообщений, поступающих в сис рода услугам как со стороны потребителя, так и со стороны контент- и сервис-провайде- тему с максимальной мощностью PIN сообще ров будет только возрастать. ний в единицу времени.

Однако, несмотря на то, что названные ус- 2) Приемник сообщений, отдаваемых сис луги пользуются стабильным и все увеличи- темой вовне и представляющих собой резуль вающимся спросом, перед поставщиками услуг тат обработки абонентского запроса с макси стоит ряд достаточно неприятных технологиче- мальной мощностью POUT сообщений в единицу ских проблем. времени.

Одна из наиболее важных среди них – пла 3) Компонент системы – программный про нирование производительности системы таким цесс, осуществляющий обработку транзакции образом, чтобы она успешно обрабатывала по на определенном этапе.

ток внешних сообщений (транзакций). Ско Основная его характеристика – пропускная рость их поступления в случае массовости сер способность ~i. p виса в настоящее время может достигать десят ков сообщений в секунду. С учетом того, что 4) Узел системы – совокупность однотип каждая транзакция обычно проходит несколько ных компонентов, параллельно осуществляю последовательных этапов обработки, недоста- щих обработку транзакций на одном и том же точная производительность системы на любом этапе. Число компонент в узле – qi. Еще одним из этапов может привести к значительным за атрибутом узла является среднее соотношение держкам в обработке сообщений, и как следст сообщений, входящих в узел, и сообщений, ис вие, к неудовлетворенности конечного пользо ходящих из него – ki, причем ki 1.

вателя, выражающейся в уменьшении числа за В модели присутствует следующее множе просов с его стороны.

ство ф а к т о р о в, влияющих на производи Кроме того, нужно учитывать, что после тельность системы:

рекламной компании, проводимой через сред ства массовой информации (телевидение, ра- • Число параллельно работающих ком дио), следует мгновенный рост нагрузки на понент в составе каждого узла – вектор систему как результат реакции целевой аудито- Q = (q1,..., qn ) ;

рии на рекламное воздействие.

• Время персонала, обслуживающего сис Необходимо отметить, что в настоящее тему, затраченное на ее реконфигурирование – время общего системного подхода к вопросу вектор T1 = (t11,..., t1n ) ;

планирования роста производительности про граммных комплексов, обрабатывающих тран- • Время персонала, обслуживающего сис закции в режиме реального времени, предло- тему, затраченное на ее модификацию – вектор жено не было. Системы поддержки принятия T2 = (t 21,..., t 2 n ).

решений, применимой к данной предметной Таким образом, каждый узел в модели ха области, также не существует. Планирование рактеризуется тремя переменными, две из ко ресурсов осуществляется в основном эмпири ческим путем на основе неформального обоб- торых могут принимать вещественный значе щения предшествующего опыта руководством ния, а одна – только целочисленные. Т. е.

~ = f (t t q ), i = 1..n.

соответствующих технологических подразде- (1) pi 1i, 2 i, i, лений. Отчасти это объясняется относительной Функция, выражающая зависимость произ новизной проблемы, отчасти тем, что в дина водительности i-го узла системы от вышена мичных конкурентных условиях данного рынка званных факторов будет иметь вид:

зачастую приходится принимать пусть даже не ~ = ( p b + p c (t ) + p u (t )) (q b + q ) оптимальные, но быстрые решения. pi i 1i 2i i i Решить проблему качества планирования, i = 1...n. (2) а также уменьшить время и затраты на приня ИЗВЕСТИЯ ВолгГТУ где: pib – начальная производительность i-го min ( F (T1, T2, Q )) T1,T2,Q. (8) узла (константа);


c j (T1, T2, Q ) 0, j = 1..m c p (t ) – функция, выражающая зависимость Авторами на основании модели был разра прироста производительности в ре- ботан программный продукт, позволяющий:

зультате реконфигурирования систе- • Формализовать процесс обработки тран мы от времени (в человекочасах), за- закций в вышеописанных системах;

траченного на него;

• Проанализировать поток транзакций и ана p u (t ) – функция, выражающая зависимость литически выявить их закономерность;

• Оптимизировать параметры системы и спо прироста производительности в ре собствовать принятию управленческих реше зультате модификации кода узла от ний по рациональному распределению ресур времени (в человекочасах), затра сов для повышения ее производительности с уче ченного на нее;

том разного рода ограничений;

qib – начальное количество параллельно • Экспортировать модель для ее дальней работающих в узле компонент (кон- шего исследования внешними средствами ими станта);

тационного моделирования.

qi – дополнительные компоненты, добав- Принятие решений сводится к выбору рацио нального распределения ресурсов для минимиза ленные в узел.

ции функции F с учетом наличных ограничений.

В конечном итоге нам нужно оптимизиро У функции F может быть несколько ло вать производительность системы в целом, ко кальных экстремумов, поэтому традиционные торая может быть записана так:

F ( ~1,..., ~n ) F (T1, T2, Q ). методы выпуклой оптимизации здесь неприме p p (3) нимы. Корректной будет такая последователь Она является функцией от 3n аргументов, ность действий:

2n из которых могут принимать вещественные 1. Найти все локальные экстремумы значения, а оставшиеся n – дискретные. 2. Выбрать из них минимальный, который При этом на множество допустимых значе- является глобальным экстремумом.

ний аргументов могут быть наложены ограни- Для нахождения локального экстремума ав чения: торы разработали следующий а л г о р и т м:

c j (T1, T2, Q ) 0, j = 1..m. (4) 1) Выбираем допустимую стартовую цело численную точку Q0 (например, с нулевыми Рассматриваются два вида ограничений:

Временное (на каждый вид мероприятий координатами – т. е. дополнительных компо • по увеличению производительности нужно за- нент в узле нет);

тратить не более, чем наперед заданное время). 2) При фиксированных целочисленных коор t1i C1. динатах численно решаем задачу оптимизации, (5) i =1..n изменяя действительные параметры. Получаем C2.

t12 (6) оптимум F0 для данной фиксированной Q0.

i =1..n 3) Исследуем целочисленную окрестность Финансовое.

• точки Q0 : (не более, чем 2n точек), вычисляя c u t1i s + t 2i s + qi vi M. (7) i =1..n для каждой допустимой (удовлетворяющей ог где: M – бюджет, выделенный на проведение раничениям) точки оптимум аналогично 2).

мероприятия;

Получаем k значений функции F: { f 01,..., f 0 k } s c – стоимость человеко-часа работы пер (Из 2n точек исключаем недопустимые, полу сонала, задействованного в реконфи чаем k точек, где k=2n). Для n = 2 пример ок гурировании;

рестности показан на рис. 1.

u s – стоимость человеко-часа работы пер 4) Находим такую точку в текущей окрест сонала, задействованного в модифи- ности, значение целевой функции в которой кации кода системы;

меньше текущего оптимума, а также меньше vi – стоимость добавления одной дополни- значения целевой функции во всех остальных точках окрестности (фактически, находим са тельной компоненты в состав i-го узла мое лучшее возможное решение в окрестно (фактически, аппаратная стоимость).

сти), т. е. ищем точку с номером m таким, что:

В общем виде задача оптимизации записы f 0 m F0 and i = 1..k f 0 m f 0 k. (9) вается как:

40 ИЗВЕСТИЯ ВолгГТУ мых значений (но не более чем на заранее за данное число шагов на тот случай, если в вы бранном направлении граница слишком удале на от точки локального экстремума).

2) Для каждой из 2n точек на границе по вторяем описанный выше процесс поиска экс тремума.

3) Получаем 2n локальных экстремумов, из которых выбираем минимальный (рис. 3).

При описанном выше процессе поиска ло кального экстремума из нескольких стартовых точек может сложиться ситуация, когда нам не сколько раз приходится численно выполнить оптимизацию по действительным параметрам Рис. 1. Окрестность целочисленной точки в одной и той же целочисленной точке (если Если такого m не найдено, то F0 – оптимум. мы попадаем в нее разными путями).

Иначе в качестве Q0 выбираем точку, соответ- Для того чтобы не делать лишних вычисле ний, в соответствии с рекомендациями метода ствующую найденной f0m и переходим к 2). Так, табу используется к е ш и р о в а н и е [5]. После переходя от точки к точке, мы получаем ло того, как была выполнена задача оптимизации кальный экстремум (при n = 2 см. рис. 2).

функции при фиксированных целочисленных Необходимо отметить, что в силу специфики значениях, результат сохраняется в памяти (т. е.

задачи функция F (T1, T2, Q ) при фиксированном в кеше, реализованном в виде хеш-функции).

Q является выпуклой. Соответственно ее мини В дальнейшем, прежде чем выполнять такую оп мизация производится при помощи метода гра тимизацию, кеш просматривается на предмет на диента [3]. Граничные условия соблюдаются за личия в нем результата для данной точки.

счет использования штрафных функций [1]. По результатам серии тестов можно утвер После того, как найден один из локальных ждать, что в п. 2 алгоритма нахождение ло экстремумов функции F, эвристически находим кального экстремума (минимизация функции остальные экстремумы (если они есть) с ис- по действительным параметрам при фиксиро пользованием "метода табу" [4]. Для этого: ванном значении целочисленных методом гра 1) Удаляемся от целочисленной точки Q0 диента) с требуемой точностью достигается за в 2n направлениях до границ области допусти- 150–200 шагов метода градиента.

Рис. 2. Последовательность итераций при поиске локаль- Рис. 3. Множественные локальные экстремумы для n = ного экстремума ИЗВЕСТИЯ ВолгГТУ Кроме того, область допустимых значений Таким образом, представленный выше ал целочисленных параметров ограничена (из-за горитм позволяет достаточно эффективно ре наличия ограничений), а само нахождение ло- шать задачи целочисленно-непрерывной опти кального экстремума в среднем занимает не бо- мизации и может быть использован для широ лее 40-50 шагов. Это подтверждается и практи- кого круга задач подобного вида.

ческими соображениями. Целочисленные па- В конечном же итоге практический поло раметры, как было сказано выше – это число жительный эффект от использования системы дополнительных программно-аппартных ком- поддержки принятия решений выразится в:

понент в составе каждого узла, а ограничения, повышении качества принимаемых управ в которых эти параметры фигурируют, в дейст ленческих решений;

вительности носят финансовый характер, за минимизации времени на их принятие и, как счет чего варьирование каждого целочисленно следствие, снижении издержек;

го параметра происходит в пределах десятков.

оптимизации расходования производствен Учитывая, что при решении задачи проис ных ресурсов.

ходит исследование 2n локальных экстремумов (n – число узлов), общее число шагов метода гра БИБЛИОГРАФИЧЕСКИЙ СПИСОК диента составит не более 200*50*2n = 20 000n.

Большинство реально встречающихся на 1. Бахвалов Н. C., Жидков Н. П., Кобельков Г. М.

практике систем последовательной обработки Численные методы. М., Наука, 1987.

сообщений имеют в своем составе не более де- 2. Карпов Ю. Г. Имитационное моделирование сис тем. М., "BHV", 2005.

сятка узлов (т. к. большее их число приводит 3. Самарский А. А., Гулин А. В. Численные методы.

к излишней сложности процесса обработки со М., Наука, 1989.

общений и увеличивает накладные расходы на 4. Glover, F. and M. Laguna (1997) Tabu Search, Klu передачу сообщений между узлами), т. е. n 10, wer Academic Publishers, Boston.

а общее число шагов в худшем случае составит 5. Lokketangen, A. K. Jornsten and S. Storoy (1994).

не более 200 000, что является приемлемой ве- Tabu Search within a Pivot and Complement Framework, In личиной для современных аппаратных вычис- ternational Transactions in Operations Research, Vol. 1, № 3. – лительных средств. Р. 305–316.

УДК 004. В. Л. Бердник ДЕКОМПОЗИЦИЯ ЗАДАЧИ ИДЕНТИФИКАЦИИ СУЩНОСТИ ДЛЯ УЧЕТА НЕЛИНГВИСТИЧЕСКИХ СОСТАВЛЯЮЩИХ Волгоградский государственный технический университет (bwlg@inbox.ru) В статье предлагается представление семантического сравнения имен сущностей как задачи принятия решения и рассматривается частный случай реализации метода сравнения с учетом нелингвистических составляющих.

Ключевые слова: нелингвистические признаки в задаче сравнения высказываний идентификации сущности, семан тическое сравнение как задача принятия решения.

V. L. Berdnik THE DECOMPOSITION OF IDENTIFICATION ESSENCE PROBLEM WITH DUE REGARD FOR NON LINGUISTIC COMPONENTS.

This fast track provides a conception of semantic comparison essence name as decision problem. Particular case of compari son method with non linguistic indication is considered.

Non linguistic indication in comparison identification essence problem, semantic comparison as decision problem.

Эта статья является продолжением работы семантически близких сущностей, восприни [1]. В ней формально ставится задача идентифи- маемых, согласно предметной области, как кации сущности, рассматриваются закономерно- единое явление.

сти и семантический состав используемых есте- Под термином "Издатель", будем понимать ственно-языковых конструкций. Для целостности субъект общества, в котором группа людей по изложения, укажем основные определения. полняет БД высказываний идентификаций Под высказыванием идентификации сущно- сущностей. Под термином "Потребитель" бу сти (далее – высказывание) будем понимать дем понимать компьютерную систему анализа символьную строку конечной длины. Высказы- и сопоставления высказываний различных Из вание идентифицирует сущность, либо группу дателей.


42 ИЗВЕСТИЯ ВолгГТУ Введем следующие обозначения: 3) "кабель" – средство подключения прин U – универсум высказываний, в данном слу- тера к компьютеру.

чае, специальный корпус текстов;

Слова "контролер", "адаптер", "кабель" не S – универсум идентифицируемых сущно- являются лексическими синонимами – каждому стей;

слову соответствует свое семантическое значе U+ – множество высказываний U+U, для ние. В указанном примере между термами и пре которого известно Потребителю соответствие дикатом сущности существуют нечеткие отно f:U+=S;

шения, а именно, используются элементы из Ts+ – множество известных Потребителю группировки объектов с некоторым общим синонимов идентификации заданной сущности свойством (предикатом) сущности [2].

s, так что Ts+ U+ & f:Ts+=s;

Смешанное задание – высказывание содер жит кодовое обозначение, которое неоднознач D – коллекция документов D = {d}, где d – но идентифицирует сущность. Кодовое обозна конкатенация строк всех высказываний множе чение должно сочетаться с указанием дополни ства Ts+. Документ d идентифицирует заданную тельных предикатов.

сущность s. Коллекция документов D соответ Задача идентификации сущности это поиск ствует множеству S+S, и является неполной.

биективного соответствия между коллекцией Дополнение множества S = S \ S + невозможно документов D = {d} и произвольным множест задать в D из-за неопределенности (потенци вом высказываний {V| VU & VU+}. Для каж альности) S. дого высказывания V необходимо выбрать один Существует три способа задания (описания из альтернативных вариантов сущностей S+ высказыванием) сущности. представленный документом из коллекции D, Экстенсиональное задание – высказывание или указать на необходимость пополнения D.

содержит кодовое обозначение (модель изде- Задачу идентификации сущности можно лия, уникальное название (например, книги), отнести к классу задач принятия решения код по классификатору (например, ISBN), и т. д.) (ЗПР). Задача принятия решений представима однозначно идентифицирующее сущность. В этом следующим кортежем:

случае, задача сводится к детерминированному B, К, X, F, Р, г, t, (1) извлечению из высказывания и сопоставлению где: B – множество допустимых альтернатив с образцом кодового обозначения. Допускают ных вариантов;

ся высказывания, состоящие только из кодовых К – множество критериев выбора;

обозначений.

X – множество шкал критериев. Каждая Пример высказывания: "МФУ HP LJ шкала представляет собой множество (Q2660A) лазерный + копир + сканер" – имеет оценок с отношением порядка. Мно кодовое обозначение Q2660A, полностью иден жество X может содержать шкалы раз тифицирующее изделие.

личных типов, их прямое произведе Рассмотрение методов идентификации по кодовому обозначению не входит в цели дан- ние Х1Х2...Хn образует множество ной статьи. векторных оценок;

Интенсиональное задание – высказывание F – множество отображений вида f: B = R, содержит задание предикатов сущностей се- заданных для каждого критерия, F за мантически самостоятельными единицами. В этом дает отображение множества допус случае возможны различные явления естест- тимых альтернатив в множество век венного языка: лексическая полисемия, сино- торных оценок;

нимия, внелингвистическая пресуппозиция, Р – система предпочтений решающего эле и т. д. Рассмотрим пример синонимии иденти мента, которая выражается совокупно фикации изделия "Устройство для подключе стью некоторых множеств с отноше ния принтеров с разъемом LPT к порту USB нием предпочтения и является некото компьютера с кабелем".

рой эмпирической системой с отно 1. Контролер USB-LPT 2.0m.

шениями;

2. Адаптер USB-LPT 2.0m.

r – решающее правило, которое определя 3. Кабель USB-LPT 2.0m.

ет принцип выбора вариантов из мно В примере, для идентификации "устройства жества B;

с кабелем" используются термы:

t – тип ЗПР, который определяет требуе 1) "контролер" – сложное электронное уст мую степень упорядоченности срав ройство;

2) "адаптер" – коробка с проводом;

ниваемых вариантов.

ИЗВЕСТИЯ ВолгГТУ ние, что высказывание V и документ d должны Цель: Поиск наиболее релевантно го документа d для высказывания иметь хотя бы один общий терм.

Определим множество критериев лингвис Критерий 1: Критерий 2: Критерий 3:

тической оценки, для этого воспользуемся эм Лингвистическая Семантическая оценка Оценки релевантности оценка релевантности релевантности по мере включения пирическими наблюдениями:

чем чаще терм встречается в тексте доку мента, тем он более релевантен по отношению к сущности;

d d1 d3 dn чем чаще терм встречается среди всех до кументов коллекции, тем хуже он отражает Рис. 1. Пример иерархии задачи идентификации сущности различие между документами (сущностями);

если некоторый терм высказывания V не Рассмотрим способ решения задачи иден тификации сущности, как декомпозицию зада- встречается в документах, то он указывает на чи на более простые составляющие части (да- вариант z. Наличие в терме цифр или последо лее – составляющие методы) и обработку вательности (более трех) согласных букв ука множества векторных оценок составляющих зывает на смешанный или экстенсиональный методов [3]. способ задания сущности;

Определим множество допустимых альтер- оценку релевантности высказывания V до нативных вариантов: кументу d можно рассматривать как компози B = Dvz, (2) цию оценок релевантности термов V.

где: Dv – множество допустимых вариантов до- Произвольное высказывание состоит из кументов коллекции D, в соответствии с прави- термов V = {v1, v2, …vn,}. Зададим множество лами выбора (например, имеющие общие тер- оценок альтернативных вариантов.

мы с высказыванием V);

k11 k12... k1n z – альтернативный вариант (маркер), ука k k 22... k 2 n зывающий на необходимость участия операто K = 21 (4), ра системы (пополнение коллекции D, анализ............

истинности высказывания V, отнесение выска k m1 k m 2... k mn зывания к совокупности экстенсионально за где: kij – оценка [0,1] альтернативы bj по терму данных, и т. д.).

vj, i = 1..n, j = 1..m;

Для установления относительной важности n – число термов высказывания V;

оценок составляющих методов иерархии ис m – число альтернативных вариантов B.

пользуем обработку суждений лица, прини Альтернативный вариант z имеет порядковый мающего решение, методом парных сравнений номер 1.

по 9-балльной шкале доминирования одного Альтернативный вариант z указывает на не критерия над другим [3]. В результате расчета определенность (для экспертной системы) вы правого собственного вектора матрицы парных сказывания V. Пусть имеется группировка сравнений, получим предпочтения критериев Y = {y | y обладает свойством определенности}, относительно цели.

где: y1 – "терм не встречается в документах или W = {w1, w2,... wn}.

E словарях системы";

Вычисление результирующего вектора при- y2 – "терм встречается в документах, но от оритетов альтернатив относительно цели осу- сутствует в словарях системы";

ществляется путем перемножения вектора WE на y3 – "терм встречается в документах, из вектора приоритетов составляющих методов [3]. вестно его семантическое значение, но [ ] W = W 1,W 2,...,W n.W, A M M M E (3) не известны синонимы";

где: WA – результирующий вектор приоритетов y4 – "терм встречается в документах, из альтернатив относительно цели;

вестно его семантическое значение M Wi – вектор приоритетов альтернатив со- и множество синонимов".

ставляющего метода Mi, i = 1...n;

В этом случае возможно задание шкалы для n – число составляющих методов. zi как дополнение значения определенности Рассмотрим составляющий метод лингвис- терма vi [2]. В данной статье ограничимся зна тической оценки релевантности высказывания чениями верхней и нижней границей значения V документу коллекции D. Введем ограниче- неопределенности.

44 ИЗВЕСТИЯ ВолгГТУ Для j = 1 зададим kij 0, если j = 2...m ki,1 =. (5) kij = 1, если j =2...m 0, Для j = 2…m, значение матрицы d ij d j d ij 0, kij = =, (6) 0, dj dj 8 16 где: dj – документ (множество высказываний) Рис. 2. Зависимость значения gi от мощности множества Di альтернативного варианта bj;

dji – документ (множество высказываний), Векторная модель основана на измерении содержащих терм vi. Документ являет- длины вектора в многомерном евклидовом про ся подмножеством dji dj. Если терм vi странстве. Большая длина вектора соответствует не содержится в документе dj, то dji =, более предпочтительной альтернативе. Матрица K может быть представлена как множество векторов следовательно kij = 0.

альтернатив в пространстве критериев. Вектор Значение kij, для j = 2…m, является мерой приоритетов критериев H масштабирует проекции включения документа dji в документ dj, что от векторов на соответствующие оси, изменяя длину ражает "типичность" использования терма vi для векторов альтернатив. Значения приоритетов аль обозначения bj альтернативного варианта [4].

тернатив рассчитываются по формуле:

Вектор G = {g1,g2…gn}, зададим следующим ( ) образом: wj = kij * hi, j = 1..m. (10) i =1..n Di Q 1, если На рис. 3 рассматриваются два альтерна g i = Q тивных варианта (например, автомобили) и два, (7), если D i Q критерия: "экономичность" и "надежность". На i D левом графике вектор a2 имеет большую длину благодаря высокой надежности. Если критерий где: QN – положительное целое число, опре "экономичность" (h2 = 0.7) является более важ деляющее наибольшее допустимое ным, чем критерий "надежность" (h1 = 0.3), то количество документов, имеющих в результате масштабирования проекций про общий терм. Пороговое значение изойдет поворот векторов в сторону оси "эко Q задается в зависимости от пред номичность", с изменением соотношения их метной области;

длин (на правом графике вектор a1 длиннее, Di – множество документов, содержа чем вектор a2).

щих терм vi.

Сравнение эффективности методов произво Вектор H = {h1, h2 … hn} является ранжирова дилось на тестовом наборе из 800 высказываний нием термов по их способности взаимного разли принадлежащих одному Издателю. В результате чия документов. Вектор обладает свойством прогона программной системы идентификации hi = 1. (8) сущности с разными методами, фиксировалось i =1...n совокупное время анализа и количество реле Нормировав вектор G, получим:

вантных двоек V,d в выборке размером gi hi = пар, имеющих наивысший приоритет.

. (9) gk Наилучший показатель у векторной модели.

k =1...n Неплохой показатель у метода многокритери В качестве правила выбора лучшей альтер- ального выбора альтернатив на основе макси нативы лингвистического анализа рассмотрим минной свертки. Многокритериальный выбор следующие методы: альтернатив на основе нечеткого отношения 1. Многокритериальный выбор альтернатив предпочтения оказался самым медленным и не на основе максиминной свертки [4];

продуктивным. Для одного высказывания, при 2. Многокритериальный выбор альтернатив на наличии 700 альтернатив и 11 критериев (при основе нечеткого отношения предпочтения [4];

мер из эксперимента), объем вычислений со 3. Метод анализа иерархий [4];

ставляет приблизительно 7*106 математических 4. Векторная модель определения приори- операций (квадратичная зависимость объема тетов. вычислений от числа альтернатив).

ИЗВЕСТИЯ ВолгГТУ Рис. 3. Изменение соотношения длин векторов при масштабировании проекций Таблица Количество Совокупное Правило выбора наилучшей альтернативы. Субъективная (неформальная) оценка релевантных двоек время анализа в выборке 1 ч. 55 мин. 13 Плохая "проработка деталей".

Многокритериальный выбор альтернатив на основе максиминной свертки 8 ч. 40 мин. Многокритериальный выбор альтернатив на Метод показал самые худшие ре основе нечеткого отношения предпочтения зультаты.

Метод анализа иерархий 1 ч. 49 мин. 10 Несмотря на "схожесть" с вектор ной моделью, качество выборки значительно ниже.

Векторная модель определения приоритетов 1 ч. 50 мин. 17 "Плотность" релевантных пар упорядочена в соответствии со шкалой приоритетов альтернатив.

Без лингвистического анализа высказываний 1 ч. 46 мин. (используются "прочие методы") У остальных методов объем вычислений, БИБЛИОГРАФИЧЕСКИЙ СПИСОК при тех же исходных данных, составляет при- 1. Бердник В. Л., Заболеева-Зотова А. В. Задача мерно 4*104 математических операций (линей- идентификации сущности заданной слабоструктуриро ная зависимость объема вычислений от числа ванным текстом // Известия Волгоградского государст альтернатив и критериев). Под математически- венного технического университета: межвуз. Сб. научн.

ми операциями здесь понимаются бинарные Ст. № 2(28) / ВолгГТУ. – Волгоград, 2007.

операции сложения, вычитания, умножения, 2. Новак В., Перфильева И., Мочкорж И. Математи возведения в степень и т. д. ческие принципы нечеткой логики / Пер. с англ.;

Под ред.

В ы в о д ы: Аверкина А. Н. – М.: ФИЗМАТЛИТ, 2006. – 352 с.

1. Задача идентификация сущности эффек- 3. Саати Т. Принятие решений. Метод анализа иерархий / пер. с англ. – М.: Радио и связь, 1989. – 316 с.

тивно решается при декомпозиции на состав 4. Андрейчиков А. В., Андрейчикова О. Н. Компью ные части.

терная поддержка изобретательства (методы, системы, 2. Методы многокритериального выбора аль примеры применения). – М.: Машиностроение, 1998. – тернатив применимы для оценки релевантности 476 с.

высказываний.

46 ИЗВЕСТИЯ ВолгГТУ УДК 004. В. Л. Бердник, А. В. Заболеева-Зотова СЕМАНТИЧЕСКИЙ АНАЛИЗ ВЫСКАЗЫВАНИЙ ИДЕНТИФИКАЦИИ СУЩНОСТИ Волгоградский государственный технический университет (bwlg@inbox.ru, zabzot@vstu.ru) В работе выполнена разработка модели высказывания идентификации сущности как сложной строковой системы, рассмот рены практические вопросы автоматического анализа нового информационного объекта – высказывания идентификации сущно сти, такие как выделение подсистем на основе родового признака, представленного определяющим предикатом.

Ключевые слова: домен определяющих предикатов, система понятий идентификации сущности, контейнер опреде ляющего предиката.

V. L. Berdnik, A. V. Zaboleeva-Zotova SEMANTIC ANALYSES OF PREDICATE IDENTIFICATION ESSENCE NAME.

In this work is prepared identification essence expression model as complex string system. The article describes practical problem of automatic analyses of identification essence expression as new information object. Particularly, subsystem selection by generic indication as crucial predicate is considered.

Crucial predicate domain, notion system of identification essence.

Эта статья является продолжением работы [1]. y – идентификатор совокупности альтерна В ней формально ставится задача идентифика- тивных сущностей (далее – домен предиката).

ции сущности, рассматриваются закономерно- Совокупность альтернативных сущностей мо сти и семантический состав используемых есте- жет быть первичной (например, "цвет" прини ственно-языковых конструкций. Для целостно- мает значения {красный, синий, зеленый…}), сти изложения, укажем основные определения. или являться индексом (ссылкой) на подмноже Высказывание идентификации сущности ство S (например, множество принтеров, с ко (далее – высказывание) – символьная строка торыми совместим картридж).

конечной длины, содержащая естественно- Введем множество OC определяющих языковую конструкцию. Такая строка должна предикатов S, следующим образом.

((y x O = {x,y} OC) (s = (Cs)) [OCs ]) идентифицировать сущность, либо группу се мантически близких сущностей, воспринимае- где: Cs – множество предикатов идентифици мых, согласно предметной области, как единое рующих сущность s;

явление. – функция идентификации сущности s, Примеры высказываний идентификации заданной множеством предикатов сущности. : Cs = s.

• Переходник клавиатуры AT-PS/2;

Наиболее важные их свойства:

• Мат. плата Socket-AM2 MSI K9N SLI-2F сущность имеет хотя бы один определяю (nVIDIA nForce 570SLI) ATX. щий предикат;

• Коаксиальный волновод с азимутально- все они принадлежат единому домену опре намагниченным гиротропным наполнителем. деляющих предикатов.

Термины "сущность" и "предикат" в данной В высказываниях маркетинговых исследо работе наиболее точно соответствуют опреде- ваний в качестве определяющего предиката лению термина "сущность", данному в [6]. можно выделить вид продукта или изделия.

"Предикат" понимается здесь только как посто- Например, высказывание "Коаксиальный вол янный предикат сущности, хотя он и синони- новод с азимутально-намагниченным гиро мичен слову "подлежащее". Это обусловлено тропным наполнителем" имеет значение опре особенностью высказывания идентификации деляющего предиката o = {"волновод"}.

сущности, а именно отсутствием в нем указа- Следует отметить, что задача идентифика ния действия, и как следствие, подлежащего. ции сущности тесно связана с задачей поиска Универсальное множество предикатов текстовых единиц на основе поверхностного сущностей C состоит из двоек: синтаксического анализа текста [3]. В частно C ={x,y}, сти, многоцелевая система Alex [2] разработан где: x – унарный предикат, определяющий от- ная Российским НИИ Искусственного Интел ношение "иметь значение", характеризует свой- лекта позволяет выделять на основе шаблонов, ство выбора одной из альтернативных сущно- атрибуты идентифицируемой сущности. Не стей (экземпляр сущности). Например, сущ- смотря на использование для анализа достаточ ность "цвет" определяется значениями (I1 = крас- но сходных корпусов текстов (описание ком ный, I2 = синий, I3 =зеленый), фрагмент текста пьютерных комплектующих), отличается даль "зеленый цвет" – С = I (цвет) (x(I3));

нейшее использование полученных атрибутов:

ИЗВЕСТИЯ ВолгГТУ для описания изделия или его идентификации. [ESS "набор"] Целью данной работы является разработка [ADD "фотобумага"] AND "LOMOND"/AND [/ADD] эффективных методов поиска идентичных вы [ADD "картридж"] сказываний, с целью сопоставления номенкла AND турных списков. Способы выделения текстовых OR "T036140" /OR единиц в статье не указываются.

OR Рассматривая высказывание идентификации [ASS "принтеры"] сущности как систему понятий, можно выде AND "Stylus" /AND лить следующие свойства:

AND 1. Сложноструктурированность [4].

OR "C42Plus"/OR 1.1. Иерархичность. Вершиной иерархии яв OR "C42S"/OR ляется некоторая система определяющих преди OR "C42SX"/OR катов. Листьями иерархии являются первичные OR "C42UX"/OR унарные предикаты. /AND 1.2. Разный состав и система соотношений [ /ASS] предикатов для разных ветвей иерархии. /OR 1.3. Идентификация сущности как система /AND дефиниций согласуется с некоторой более AND "черн." /AND общей системой дефиниции (например, кор- [/ADD] поративными правилами именований), а так- [/ESS] же акцентирует индивидуальные особенности где контейнер – это конструкция вида:

предмета. тег тело контейнера /тег.

2. Избыточность и дефицит указания в вы- Контейнеры, использующие скобки [] отли сказывании различных атрибутов сущности. чаются от обычных контейнеров (использую Между предикатами можно выделить сле- щих скобки ) тем, что они задают область дующие виды отношений: действия определяющего предиката (далее – 1. Аддитивное отношение ADD(o(I);

o1(I), контейнер определяющего предиката, КОП);

o2(I),…). Расширяет функциональный или ком- тег ESS – задает границы контейнера опи понентный состав определяющего предиката сания сущности, и является контейнером опре o(I) сущности на значение предиката oj(I). деляющего предиката;



Pages:     | 1 || 3 | 4 |   ...   | 7 |
 





 
© 2013 www.libed.ru - «Бесплатная библиотека научно-практических конференций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.