авторефераты диссертаций БЕСПЛАТНАЯ БИБЛИОТЕКА РОССИИ

КОНФЕРЕНЦИИ, КНИГИ, ПОСОБИЯ, НАУЧНЫЕ ИЗДАНИЯ

<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ


Pages:   || 2 | 3 | 4 | 5 |   ...   | 7 |
-- [ Страница 1 ] --

Каменистые тропы науки - это горы литературы,

уступы книг, которые нужно прочесть, усвоить.

Но книги - это путеводитель, по которому можно

ориентироваться на дорогах науки.

А.Я. Яншин, академик

А.В. Зубов, И.И. Зубова

Основы искусственного

интеллекта

для лингвистов

Рекомендовано Учебно-методическим объединением

по образованию в области лингвистики

Министерства образования и науки Российской Федерации в качестве учебного пособия для студентов, обучающихся по специальности «Теоретическая и прикладная лингвистика»

И М осква • «Логос» • 2007 УДК 800 (075.8) 8i.i i»i;

k 3-315 Рецензенты:

кафедра теоретической и прикладной лингвистики лингвистического факультета Московского государственного областного университета (зав. кафедрой - доктор филологических наук, профессор Ю.Н. Марчук);

доктор филологических наук, профессор Российского государственного педагогического университета им. А.И. Герцена Р.Г. Пиотровский.

Зубов А.В., Зубова И.И.

3-315 Основы искусственного интеллекта для лингвистов:

Учеб. пособие. — М.: Университетская книга;

Логос, 2007. — 320 с.: ил.

ISBN 5-98704-118-Х Представлено современное понимание искусственного интел­ лекта. Рассмотрены процедуры формализации знаний человека, имеющего дело с текстами, написанными на естественном языке.

Показано, как такие знания можно использовать для построения компьютерных систем, способных синтезировать отдельные состав­ ляющие текста, а также тексты в целом. Особенностью данного по­ собия является его практическая направленность, благодаря кото­ рой читатель-лингвист сам сможет создавать модели порождения тек­ стов, подобные описанным в книге.

Для студентов высших учебных заведений, обучающихся по специальности «Теоретическая и прикладная лингвистика». Может быть полезно для аспирантов и преподавателей как лингвистов, так и филологов.

ББК81. ISBN 5-98704-118-Х © Зубов А.В., Зубова И.И., © «Университетская книга», © «Логос», Оглавление П РЕДИ СЛОВИЕ............................................................................. Глава 1. ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ:

ОПРЕДЕЛЕНИЯ И ОСНОВНЫЕ П О Н Я Т И Я............... 1.1. Интеллект и искусственный интеллект......................... 1.2. Основные задачи искусственного интеллекта............... 1.3. Знания и способы их формального представления 1.3.1. Общие понятия о знаниях........................................... 1.3.2. Способы формального представления знаний........................................................................................ 1.4. Системы общения с компьютером на естественном язы к е............................................................................................. 1.4.1. Общая структура систем ы........................................... 1.4.2. Основные типы систем................................................ Глава 2. ЭКСПЕРТНЫ Е СИ СТЕМ Ы........................................ 2.1. Определение и основные понятия................................... 2.2. Основные этапы создания экспертных систем 2.3. Построение экспертной системы «Определение лексического значения слова “коса” в русском предложении».............................._....................................... 2.3.1. Этап идентификации................................................... 2.3.2. Этап концептуализации. Получение информации для базы зн а н и й............................ 2.3.3. Этап формализации. Построение базы знаний........................................................................................ 2.3.4. Этап реализации. Создание компьютерной программы.............................................. 2.3.5. Этап тестирования экспертной системы.................. ( Основы иекуеетоеннего интеллекта для лингвистов Глава 3. СИСТЕМЫ ОБРАБОТКИ СВЯЗНЫХ ТЕК СТО В................... 3.1. Особенности систем обработки связных текстов.......................................................................... 3.2. Необходимость создания систем обработки связных текстов.......................................................................... 3.3. Текст и его основные характеристики............................ 3.3.1. Подходы к определению понятия «текст»................ 3.3.2. Основные единицы текста........................................... 3.3.3. Текст как последовательность взаимосвязанных абзацев....................................................................................... 3.3.4. Статика текста............................................................... 3.3.5. Динамика текста............................ 3.3.6. Роль вероятностных факторов в организации текста.......................................................... 3.4. Теоретические аспекты порождения текстов 3.4.1. Необходимость порождения текстов с помощью компью тера...................................................... 3.4.2. Психолингвистические теории порождения р е ч и.................................................................. 3.4.3. Писатели и поэты о процессе создания своих произведений......................................................................... 3.4.4. Литературоведы о строении текстов................... 3.4.5. Лингвистические аспекты проблемы порождения текста................................................................ 3.5. Системы порождения прозаических текстов 3.5.1. Подходы к порождению прозаических текстов..................................................................................... 3.5.1.1. Общие п о н яти я..................................................... 3.5.1.2. Порождение единиц текста - предложений и абзацев............................................................................. 3.5.1.3. Порождение пословиц, поговорок и загадок.............................................................................. 3.5.1.4. Порождение связных текстов: технических описаний, рекламных текстов, рассказов, романов.............................................................................. 3.5.2. Порождение на компьютере русской ск а зк и 3.5.2.1. Этап идентиф икации......................................... 3.5.2.2. Этап концептуализации...................................... Оглавление 3.5.2.3 Этап формализации задачи. Алгоритм порождения русской сказки........................................... 3.5.2.4. Этап выполнения и тестирования................ 3.6. Система порождения русских стихотворных текстов....................................................................................... 3.6.1. Подходы к порождению стихотворений.............. 3.6.2. Этап идентиф икации................................................ 3.6.3. Этап концептуализации........................................... 3.6.3.1. Словарь системы порождения стихотворного текста..................................................................................... 3.6.3.2. Тема тек ста........................................................... 3.6.3.3. Предметно-эмоциональное содержание строфы текста..................................................................... 3.6.3.4. База знаний системы порождения стихотворного текста......................................................... 3.6.4. Этап формализации. Алгоритм построения семантико-синтаксической формулы стихотворного текста........................................................................................ 3.6.4.1. Особенности строф, зависящие от их расположения в тексте...................................................... 3.6.4.2. Алгоритм построения формулы текста и его реализация........................................................................... 3.6.4.3. Ритмические особенности исследуемых стихотворных текстов и их формальное представление..................................................................... 3.6.4.4. Заполнение семантико-синтаксической формулы стихотворного текста словам и....................... 3.6.5. Этапы реализации и тестирования.......................... Глава 4. СИСТЕМА МАШИННОГО ПЕРЕВОДА ТЕКСТА КАК СИСТЕМА ИСКУССТВЕННОГО ИНТЕЛЛЕКТА....................................................................... 4.1. Автоматический перевод текстов. Общие пон яти я....................................................................................... 4.2. Создание системы перевода английского текста на русский я з ы к.................................................................... 4.2.1. Этап идентиф икации................................................. 4.2.2. Этап концептуализации. Выделение основной информации............................................................................ 8 Основы искусственного интеллекта для лингвистов 4.2.3. Этап формализации. Создание базы зн а н и й 4.2.4. Этап реализации системы машинного перевода................................................................................ 4.3. Способы применения компьютеров для перевода текстов............................................................. ЗАКЛЮ ЧЕНИЕ........................................................................... ЛИТЕРАТУРА................................................................... Предисловие Философы, футурологи, социальные психологи и другие исследователи отмечают, что в XXI в. человечество будет решать новые глобальные проблемы, связанные с исчерпа емостью мировых природных ресурсов, энергетическими кризисами, экологическими проблемами, проблемами обес­ печения людей необходимыми ресурсами и т.п. В ближай­ шем будущем мощь любого государства будет определяться не уровнем развития промышленности, новизной и эффек­ тивностью ее технической базы, а уровнем информатиза­ ции общества. Стратегический потенциал общества соста­ вят не вещество и энергия, а информация и научные зна­ ния [157;

167]. Ученые утверждают, что в недалеком будущем реально защ ищ енны м в социальном плане,будет только широко образованный человек, способный гибко перестра­ ивать направление и содержание своей деятельности в свя­ зи со сменой технологий или требований рынка. Владение информационными технологиями ставится сегодня в один ряд с такими качествами, как умение читать и писать.

Однако процесс перехода к информационному обществу породил целый ряд новых проблем. К числу важнейших ис­ следователи относят следующие:

1. Наличие огромных и часто не всегда упорядоченных объемов информации, не позволяющих человеку эффектив­ но ориентироваться в растущих информационных потоках.

2. Возникновение научных проблем, связанных с произ­ водством, накоплением, передачей и потреблением инфор­ мации и знаний.

10 Основы искусственного интеллекта для лингвистов Как отмечено в одной из работ [284, с. 6], «информацион­ ный океан в сети Интернет без новых технологий добычи данных остается нетронутой кладовой человеческих знаний, такж е как и Мировой океан - без новых технологий добычи полезных ископаемых». И з сказанного можно сделать вывод о том, что необходима глубокая интеграция информацион­ ных технологий с лингвистическими и психологическими знаниями в рамках искусственного интеллекта. В этих усло­ виях многократно возрастает роль образования. Именно оно является ключом к решению проблем современного мира.

Как отмечают исследователи, современное образование дол­ жно выполнять три главные задачи [42, с. 23]:

во-первых, вырабатывать у человека способность превра­ щать полученные сведения в знания;

во-вторых, создавать основу для того, чтобы человек умел отделять важное от несущественного;

в-третьих, пробуждать любознательность, интерес к но­ вому, умение получать радость от процесса обучения.

В самом общем понимании система искусственного ин­ теллекта - это компьютерная система, способная получать результаты, которые традиционно рождаются в процессе интеллектуальной творческой деятельности человека. Раз­ работка таких систем требует значительных человеческих и материальных ресурсов, которые в целом будут оправданы если [18, с. 280]:

- нет единого алгоритма решения задачи, предлагаемой системе;

- число специалистов (экспертов), способных предста­ вить решение задачи к виду, воспринимаемому компьюте­ ром, очень мало;

- опыт решения задач системой искусственного интел­ лекта получит широкое применение на практике.

Как отмечается в одной из работ по искусственному и н ­ теллекту [88, с. 38], современное состояние исследований по искусственному интеллекту характеризуется нарастани­ ем интереса к этой проблеме со стороны специалистов ш и­ рокого профиля, в том числе и лингвистов. В то же время Предисловие отмечается, что российские вузы выпускают недостаточное количество высококвалифицированных специалистов, спо­ собных решать подобные задачи. Особенно мало специали­ стов, которые могут осуществлять процесс докомпьютерно­ го анализа знаний и построения необходимых для работы систем искусственного интеллекта баз знаний. Одна из причин - это отсутствие учебников и учебных пособий. От­ мечается также, что из двух методов извлечения знаний для компьютерного моделирования текстологические методы являются наименее разработанными [88, с. 124;

397).

Таким образом, растущие информационные потоки тре­ буют не профессионалов узкой специализации (программи­ стов, математиков, физиков и т.п.), а специалистов с высо­ ким базовым уровнем образованности, способных переклю­ чаться с одного вида деятельности на другой, с обширными коммуникативными умениями и навыками [42, с. 23]. Ска­ занное в полной мере относится и к подготовке специали стов-лингвистов. Между тем, в подходе к проблемам ин­ форматизации по-прежнему существует определенное не­ поним ание между компью терщ иками и традиционны м и лингвистами: первые сторонятся проблем, связанных с ком­ пьютерным анализом языка, речи, текстов, а вторые отно­ сятся к этим проблемам с большим скепсисом [284, с. 6).

Чтобы преодолеть отсутствие такого взаимопонимания, в вузах России, Беларуси, Украины для лингвистов вводятся специальности и специализации, направленные на изучение возможностей компьютеров в обработке речи и текстов «Теоретическая и прикладная лингвистика», «Основы при­ кладной лингвистики», «Компьютерная лингвистика», «Ав­ томатическая обработка естественного языка», «Компьютер­ ное обучение языкам», «Лингвистика и новые информаци­ онные технологии» и т.п.

Современный специалист-лингвист должен знать и уметь применять информационные технологии для обработки тек­ ста и речи, моделирования в лингвистических исследова­ ниях, обучения языкам. Студентам-лингвистам важно по­ казать, что все перечисленные умения можно приобрести 12 Основы искусственного интеллекта для лингвистов без знания высшей математики. Как отметил специалист по искусственному интеллекту Терри Виноград, «ЭВМ - это языковые машины: основа их могущества заключается в спо­ собности манипулировать лингвистическим и знаками символами, которым приписывается некоторый смысл» [72, с. 90].

Если для получения словарей разных текстов, автомати­ ческого морфологического и синтаксического анализа, пе­ ревода текстов использование компьютеров становится для лингвистов более или менее привычным делом, то выпол­ нение компьютером интеллектуальных творческих действий с речью и текстом (автоматическое понимание и синтез речи, автоматическое определение значения слова, смысла пред­ ложения, содержания текста, порождение текста и его пре­ образования (перевод, реферирование, аннотирование) - до сих пор задача не до конца понятная. М ногие процессы, свя­ занные с пониманием и порождением речи компьютером, описала Р.К. Потапова [294, с. 293-505]. Как отмечается в этой книге, а также в целом ряде исследований, посвящен­ ных проблемам обработки письменных текстов с помощью компьютера, именно перечисленные выше задачи не име­ ют единых алгоритмов решения, а число специалистов, спо­ собных создавать такие алгоритмы и выделять необходимые для этого знания, минимально.

Предлагаемая книга не просто рассказывает о том, как решаются подобные задачи с помощью компьютера, но при­ водит читателя к пониманию всего процесса решения та­ кой интеллектуальной задачи - от ее формулировки на рус­ ском языке до компьютерной программы, демонстрирую­ щей результат.

Глава Искусственный интеллект:

определения и основные понятия 1.1. Интеллект и искусственным интеллект Ж изнь на Земле развивается свыше двух миллиардов лет.

На первых этапах ее становления во враждебной естествен­ ной среде и в конкуренции с другими живыми организма­ ми выживали сильнейшие. Однако со временем некоторые виды организмов приобрели способность запоминать по­ вторяющиеся сходные события в разных или одинаковых ситуациях. В организмах появились элементы разума, по­ зволяющие в дальнейшем выживать наиболее разумным, умелым (т.е. тем, которые предчувствовали опасность, из­ бегали угроз, пользовались средствами маскировки и т.п.).

Само существование человека является свидетельством того, что его предки в борьбе за выживание смогли превзойти по уму и перехитрить физически более сильных животных (на­ пример, динозавров).

Реагируя на условия окружающей среды и приспосабли­ ваясь к ней, разумные существа начинают открывать черты сходства событий и ситуаций путем самонаблюдения и са­ мооценки. Таким образом, происходит накопление полез­ ной информации о среде, возникает способность индиви­ 14 Основы искусственного интеллекта для лингвистов дуума использовать эту накопленную информацию некото­ рым полезным (целенаправленным) образом. Накопленную полезную информацию стали называть знанием, а указан­ ную способность индивидуума - интеллектом [18, с. 243 246]. Слово «интеллект» является переводом на латынь древ­ негреческого слова нус, т. е. ум. В соврем енны е язы ки оно перешло из латыни в XIV в. {intellectus - понимание, рассудок).

Приведенное наиболее общее определение интеллекта не раскрывает его сути. Существует более 60 определений по­ нятия «интеллект» [262;

66;

328, 111;

33, с. 35-37]. В качестве рабочего определения, удобного для последующего исполь­ зования в разных задачах, примем следующее [360, с. 222):

Интеллект - это: а) способность понимать или обучаться на опыте;

способность приобретать и сохранять знания;

б) спо­ собность быстро и правильно реагировать на новую ситуа­ цию;

умение рассуждать при решении проблем, выборе об­ раза действий и т. д.

Деятельность человека или машины, в процессе которых реализуются перечисленные выше способности и умения, назовем интеллектуальной деятельностью. С давних пор предпринимались попытки научного изучения интеллекта.

Этим занимались и занимаются разные науки - психология, биология, физиология, логика, философия, лингвистика и т.д. Появление компьютеров привело к созданию компью­ терных систем, способных осуществлять действия, которые обычно выполняет с помощью своего интеллекта человек.

Такие системы стали называть системами искусственного интеллекта (И И ). Это достаточно общее определение сис­ тем И И пытались неоднократно уточнять. Более строго оп­ ределение понятия «система искусственного интеллекта»

можно сформулировать следующим образом: система искус­ ственного интеллекта (интеллектуальная система) - это компьютерная система, способная получить такие резуль­ таты, которые традиционно порождаются в процессе интел­ лектуальной творческой деятельности человека [123, с. 169;

200, с. 9-10].

Глава 1. Определения и понятия Под интеллектуальной творческой деятельностью будем понимать интеллектуальную деятельность человека, связан­ ную с выполнением таких задач, решения которых неизве­ стны, или которые нельзя решить с помощью точных алго­ ритмических методов. К их числу не относятся, например, вычисления по формулам, уравнениям, выражающим из­ вестные законы физики, механики, химии и других есте­ ственных наук.

Науку о теориях построения систем искусственного и н ­ теллекта стали называть искусственным интеллектом [351, с. 11]. Это - комплексная наука, включающая достижения как традиционных, так и новых наук, например, лингвис­ тики текста, семиотики, компьютерной лингвистики, ки ­ бернетики. Именно поэтому приведенное выше определе­ ние понятия науки «искусственный интеллект» является лишь одним из большого числа подобных определений [33, с. 37-39;

328, с. 111;

375, с. 9;

351, с. 11;

364, с. 11;

122, с. 10;

148, с. 5 -6 ;

18, с. 246-249;

105, с. 35].

Важная особенность современного подхода к И И заклю­ чается в том, что создаваемые системы И И не обязательно должны имитировать интеллектуальные действия человека.

В основе принципа работы систем И И могут лежать другие методы. Главное, чтобы конечный результат работы систе­ мы И И был аналогичен результату решения этой же задачи человеком [328, с. 111;

122, с. 10].

Идеальная система искусственного интеллекта имеет сле­ дующие особенности [189, с. 415-418]:

1. Наличие внутренней модели внешнего мира. Такая мо­ дель обеспечивает индивидуальность, относительную само­ стоятельность системы в оценке ситуации.

2. Способность к пополнению имеющихся знаний.

3. Способность к дедуктивному выводу, т.е. к генерации информации, которая в явном виде не содержится в сис­ теме.

4. Умение оперировать в ситуациях, связанных с разны­ ми аспектами нечеткости, включая «понимание» естествен­ ного языка.

16 Основы искусственного интеллекта для лингвистов 5. Способность к диалоговому взаимодействию с чело­ веком.

6. Умение адаптироваться к условиям окружающей среды.

Реальная система И И должна обязательно иметь внутрен­ нюю модель внешнего мира и удовлетворять хотя бы одной из особенностей, перечисленных в п. 2-6.

Появление И И как науки объясняется следующими при­ чинами [148, с. 5-6]:

1. Необычайно быстрый прогресс в развитии вычисли­ тельной техники привел к созданию компьютеров с огром­ ным быстродействием и большой памятью. Компьютеры проникают во все сферы человеческой жизни. Однако прин­ цип общения с ними пока остается доступным лиш ь доста­ точно узкому кругу людей - программистам. Кроме того, использование вычислительной техники требует повыше­ ния их интеллектуального уровня.

2. Появление большого числа компьютеров, объединенных в локальные, национальные, межгосударственные сети и сис­ темы, требует разработки новых способов хранения, передачи и извлечения из них информации, написанной на естествен­ ных языках. Это, в свою очередь, ведет к изменению стиля общения человека с компьютерными системами и систем меж­ ду собой. Разработка нового стиля общения заставляет пере­ смотреть законы функционирования языка в новых условиях.

3. В науку, промышленность, сельское хозяйство стали внедряться роботы, которые в неблагоприятных для чело­ века условиях (в космосе, под водой, ядерных реакторах, хи­ мических средах и т.п.) выполняют некоторые действия бы­ стрее и надежнее последнего. Их создание требует разра­ ботки специальных методов оценки ситуаций и принятия решений, которые были бы доступны компьютеру.

4. Увеличение объема информации, которую необходимо освоить в школах, техникумах, вузах, ведет к поиску новых эффективных методов и средств обучения. Применение со­ временных компьютеров для этих целей требует тщательно­ го анализа понятия «знание», правил получения, хранения и преобразования знаний, а также правил их усвоения.

Глава 1. Определения и понятия Показателем все возрастающего интереса к проблемам И И служит рост затрат и вкладов в науку высокоразвитых стран мира. Так, в 1985 г. на развитие И И в США, Западной Евро­ пе и Японии было потрачено 350 млн долл., а уже в 1990 г. 19 млрд долл. (СШ А - 12 млрд, Япония - 5 млрд, Западная Европа - 2 млрд). Растет число научных публикаций об этих проблемах. Только в СШ А издаются 19 журналов по искус­ ственному интеллекту, есть и международные журналы.

Каждые два года, начиная с 1969 г., проходят международ­ ные конференции по ИИ.

В высокоразвитых странах интенсивно готовят кадры по искусственному интеллекту. П очти в 100 университетах СШ А, Я понии, Канады, Западной Европы читают самые разные курсы по ИИ. В этих университетах существует около 10 специализаций, в рамках которых готовятся разработчи­ ки интеллектуальных систем и инженеры знаний.

1.2. Основные задачи искусственного интеллекта Перечень задач, решаемых в рамках И И, достаточно ве­ лик. В различных научных трудах проблемы искусственного интеллекта описываются по-разному [149;

276, с. 27-28;

122, с. 10-11;

85, с. 15-19]. Чтобы понять эволюцию задач, сто­ ящих перед И И, рассмотрим основные этапы развития ис­ кусственного интеллекта, которые можно условно разделить на [108, с. 36-55;

270;

88, с. 9-14;

18, с. 240-242;

288, с. 164 172]:

• классический;

• романтический;

• период модернизма;

• период постмодернизма.

Началом классического периода И И считают 1950 г., ког­ да начались активные разработки решения с помощью пер вых^ЭЗЗМ=ишев№х=зшатгтгтШШШюйок. Типичные приме­ 18 Основы искусственного интеллекта для лингвистов ры решаемых в тот период задач приведены в работах [325, с. 14-90;

438;

401;

351, с. 337-379]. Это - игры в карты и кубики, в шашки и шахматы и т.п. Еще одно направление работ по И И в тот период было связано с доказательством математических теорем [325, с. 90-132;

401]. Окончанием этого периода исследователи считают 1963 г., когда вышел фундаментальный труд американских ученых [401].

Основные идеи, принципы и результаты применения ме­ тодов И И в тот период можно описать следующим образом.

Пусть необходимо полностью собрать кубик Рубика, т.е.

перемещая составляющие его элементы, сделать каждую сторону кубика окрашенной в свой цвет. Кубик попадает к человеку в каком-то начальном или исходном состоянии. Сде­ лав один поворот (одну операцию) составляющих кубика, получаем его первое промежуточное цостояние. Второй обо­ рот дает второе промежуточное состояние и т.д. Когда ко­ нечная задача решена, говорят, что кубик находится в ко­ нечном состоянии. Все множество таких состояний называ­ ется пространством состояний.

Основные результаты исследований в классический пе­ риод можно сформулировать так [108, с. 45]:

1. Любую интеллектуальную задачу можно свести к про­ блеме поиска («правильного хода», «верного действия» и т.п.) в пространстве состояний, если только процедуру та­ кого поиска Можно формализовать в виде перехода от не­ которого начального состояния к конечному состоянию че­ рез конечное число операций перехода из одного промежу­ точного состояния к другому.

2. Поиск операций в пространстве состояний должен на­ правляться знаниями о конкретной предметной области («игра в кубик Рубика», «игра в карты», «игра в шахматы» и т.п.).

Романтический период истории развития И И был связан с попытками формализации процессов восприятия челове­ ком естественного языка и созданием компьютерных про­ грамм, понимающих речь (текст) человека. Понимание мо­ делировалось путем создания различных диалоговых систем, Глава 1. Определения и понятия т.е. программ, которые п о з в о л я л и бы человеку вести диалог с компьютером. В этот период было создано большое число диалоговых систем, отвечающих на вопросы, заданные на ограниченном английском языке. Так, в книге [396] описа­ на компьютерная программ STU D EN T, решающая в диа­ логе со студентом так называемые словесные алгебраиче­ ские задачи. Например [64, с. 245]: «У Тома рыб в два раза больше, чем у М эри - гуппи. Если у М эри есть три гуппи, сколько рыб у Тома?» Более яркой и широко известной сис­ темой подобного типа явилась диалоговая система SH RDLU, разработанная известным специалистом по И И Терри Ви­ ноградом [451;

108, с. 45]. Она имела дело с предметной областью «мир, построенный из деталей (блоков) детского конструктора», и могла отвечать на вопросы о конфигура­ ции и цвете деталей, а также о действиях с этими кубика­ ми. Например, она могла отвечать на вопросы типа «Ка­ кого цвета блок, на котором стоит красная пирамида?» или выполнять действие по команде «Поставь синюю пирами­ ду на зеленый кубик». Эту программу называли «разумной», так как она уже понимала заданный на естественном язы ­ ке вопрос, а такую разумность - процедуральной семан­ тикой.

В тот же период создают компьютерные программы, мо­ делирующие процесс понимания в более реальных ж изнен­ ных ситуациях: посещение ресторана, прием у врача, заня­ тия с преподавателем и т.п. Для решения на компьютере ана­ логичны х задач вводятся понятия «сценарий», «фрейм», «правило», «факт», «сеть», «логическая формула» и т.п. [400;

452;

351;

235].

Анализ результатов применения понимающих программ в романтический период позволил сделать ряд выводов о том, что же представляет собой основа машинного понима­ ния [108, с. 49-50;

51]:

1. Способность человека представлять знания об окру­ жающем мире в виде каких-то фактов, правил и процедур.

2. Умение человека формировать суждения с опорой на такие представления.

20 Основы искусственного интеллекта для лингвистов 3. Способность человека находить эквивалентность или аналогию между разными представлениями в одинаковых ситуациях.

4. Способность человека интерпретировать новую инфор­ мацию в уже имеющихся понятиях формализованного знания.

Периодом модернизма исследователи И И условно считают время с середины 70-х до конца 80-х годов XX в. [108, с. 50 54]. В этот период активно создаются экспертные системы как разновидности систем И И, разрабатываются методы разбиения знаний, которыми владеет человек, на отдельные модули. Вместо экспертных систем, базирующихся на пред­ ставленных в виде правил знаниях, стали использовать дру­ гие методы представления знаний - эвристическую клас­ сификацию, иерархическую проверку гипотез и т.д. [108;

431;

200;

352;

361].

В этот период начинают набирать силу исследования по И И, связанные с обработкой текстов и изображений. П о­ являются компьютерные системы, позволяющие классифи­ цировать тексты и изображения, индексировать тексты, из­ влекать из них информацию [392;

453].

Современный этап развития искусственного интеллекта, связанный с появлением быстродействующих компьютеров с практически неограниченной памятью, активным внедре­ нием во все сферы жизни человека глобальной сети Интер­ нет, можно назвать периодом постмодернизма [108, с. 50]. Фу­ турологи возлагают большие надежды на компьютеры но­ вого типа [378;

46], которые позволят решить целый ряд социально значимых задач: электронный бизнес, медицина и образование, создание интеллектуально-механических ро­ ботов и компьютерных систем распознавания зрительных образов, биофизическое исследование деятельности мозга человека и т.д. [292;

181;

385].

Если ориентироваться на задачи И И периода постмодер­ низма, в решении которых могут сыграть значительную роль лингвисты, то можно отметить следующие проблемы [70;

177;

152;

293;

9;

119;

183;

3;

286;

56;

378;

119;

46;

406;

226;

266;

285;

292;

88, с. 18-19;

284]:

Глава 1. Определения и понятия • поиск способов эффективного представления знаний в памяти компьютера;

• автоматический анализ поверхностной структуры текста;

• автоматическое определение содержания текста;

• поиск информации, написанной на естественном языке;

• распознавание рукописных текстов;

• машинный перевод текстов;

• автоматический синтез текстов;

• автоматическое распознавание устной речи;

• автоматический синтез устной речи;

• создание систем дистанционного обучения и образо­ вания;

• речевое управление сложными механизмами.

1.3. Знания и способы их формального представления 1.3.1. Обшие понятия о знаниях Понятие «знание» рассматривалось выше как полезная информация, накопленная человеком в борьбе с природой за свое существование. В целом этому понятию трудно дать строгое однозначное определение, так как оно включает в себя составляющие понятия таких наук, как философия, психология, логика [257, с. 9-10;

320, с. 5]. В качестве рабо­ чего определения понятия «знание» примем следующее: зна­ ние - это результат процесса познания человеком действи­ тельности, ее адекватное отражение в сознании человека в виде представлений, понятий, определений, умозаключе­ ний, теорий. П о существу знание есть продукт обществен­ ной и духовной деятельности людей [359, с. 118]. Чтобы зна­ ние могло служить средством практического овладения ок­ ружающей действительностью (предметами, процессами), оно должно иметь эти предметы и процессы в своем содер­ жании, отражать свойства и закономерности объективной 22 Основы искусственного интеллекта для лингвистов реальности. Причем в знании предметы и процессы должны отражаться не только такими, какими они есть в природе, но и какими они могут быть в результате практической деятель­ ности человека. Знание - это не просто механическое копи­ рование предметов и процессов окружающей действитель­ ности, а результат субъективной деятельности человека, в итоге которой создается образ, модель или схема предмета или процесса [182, с. 194].

Конкретизируя понятие «знание», можно представить его состоящим из фактов и правил [200, с. 11]. Например:

Факт: Зажженная плита - горячая.

Правило: Если положить руку на зажженную плиту, то можно обжечься.

Факт: В английском слове BEDS перед окончанием - S стоит звонкая согласная - D.

Правило: Если английское существительное в единствен­ ном числе заканчивается на звонкую согласную, то суффикс множественного числа этого существительного произносит­ ся как [Z], Факт: В предложении «Коса затупилась, и мы решили отдохнуть» справа рядом со словом «коса» находится глагол «затупилась».

Правило: Если в каком-либо русском предложении ря­ дом со словом «коса» находится слово «затупиться», то сло­ во «коса» употреблено в значении «инструмент для срезы­ вания травы и злаков».

Факт: Студент по окончании института получил диплом с отличием.

Правило: Если студент по окончании института полу­ чил диплом с отличием, то он может быть принят в аспи­ рантуру.

Знание неразрывно связано с мышлением и памятью (ос­ новны е единицы психологии), значением и семантикой (единицы лингвистики), понятием и суждением (основные единицы логики). Сущность знания можно выявить, изу­ чив его взаимоотнош ения с действительностью, языком, речью, значением и понятием [320, с. 5;

88, с. 99-131].

Глава 1. Определения и понятия Известный философ Спиноза (1632-1677) различал че­ тыре способа получения знаний человеком [336, с. 102]:

1. Понаслышке или через расшифровку каких-либо зна­ ков. Например, понаслышке мы знаем о дне своего рожде­ ния;

читая текст (лингвистические знаки), мы получаем не­ которые знания.

2. Из повседневного (беспорядочного) опыта. Например, каждый знает, что день сменяет ночь.

3. И з сопоставления фактов друг с другом. Например, из своего опыта мы знаем, что один и тот же предмет кажется тем меньше, чем дальше он расположен от нас. Значит, гля­ дя на солнце, мы можем сделать вывод о том, что солнце на самом деле гораздо больше по размеру, чем кажется нам.

4. По интуиции, когда сущность предмета или процесса узнается через специальное познание. Например, нас учи­ ли, что 2+3=5, что если две линии параллельны третьей л и ­ нии, они параллельны между собой и т.д.

С современной точки зрения человек получает знания [283, с. 139;

315, с. 345] в результате житейского опыта, обу­ чения и в результате активной мыслительной деятельности.

Причем такие знания содержат как субъективные элемен­ ты, полученные в результате особенностей индивидуальной психики человека, так и элементы общ езначимые, соци­ альные, передаваемые обществом из поколения в поколе­ ние [344, с. 182]. Более полно возможные методы извлече­ ния знаний изложены в работе [88, с. 99-160].

М ногочисленные исследования показывают, что знания в памяти человека не представляют беспорядочного скоп­ ления фактов, понятий, суждений, теорий. Все это как-то упорядочено [208, с. 335-420;

103, с. 218-252;

368, с. 56 131]. В процессе приобретения знаний человеком в его па­ мяти происходит укрупнение и обобщение событий по не­ которым логическим принципам. Чащ е всего в качестве правил, объединяющих разные составляющие знаний, вы­ ступают различные ассоциации: сходство, совпадение по времени и месту, причина и следствие и т.д. Как происхо­ дит объединение единиц знания (понятий, суждений, фак­ 24 Основы искусственного интеллекта для лингвистов те», теорий) й человеческой памяти, объяснить пока труд­ но. Есть разные теории, раскрывающие принципы органи­ зации знаний в памяти человека. Так, в работах [208, с. 367— 376;

368, с. 62-65] понятия представляются в виде стандарт­ ных схем (рис. 1.1 и 1.2):

Рис. 1.1. Общая схема Рис. 1.2. Схематическое представления понятия представление понятия «пирожное»

Связь разных понятий между собой также может быть представлена в виде схемы (рис. 1.3).

Несколько иной подход предлагается при записи сужде­ ний и фактов. Например, факт (событие) «мать убирает в комнате Петра» может быть условно представлен так [208, с. 378-379] (рис. 1.4 и 1.5).

Представители разных наук, изучающие знание, выде­ ляют следующие его виды: обыденные и научные (специ­ альные знания), содержательные (неформализованные) и формализованные, сложившиеся и развивающиеся, полные и неполные, известные и новые, знания о реальном мире и лингвистические знания и т.д. [320, с. 90-95;

33, с. 22-23;

315, с. 364;

148, с. 262;

18, с. 257-259].

Обыденные знания - это знания, которыми человек опе­ рирует в повседневной ж изни (знание стоимости продук­ тов, места работы или учебы и т.п.). Научные знания пред­ ставляют собой некоторые научные обобщения, выражае­ мые словесно теориями, графиками, таблицами и т.д. Эти знания связаны с той или иной наукой - физикой, химией, медициной, лингвистикой и т.д.

, Глава 1.Определения и понятия Рис. 1.3. Схематическое представление связи различных понятий Содерж ательные объ ект адресат знания - это знания, - -------- -------------* \ использую щ ие д а н ­ аген т врем я Действие ные экспериментов и инструм ент место / наблюдений, вы дви­ Ч ------- ---- гаю щ ие, о б осн овы ­ вающие и опроверга­ ющие научные гипо­ Рис. 1.4. Общая схема представления некоторого действия тезы, пользующиеся догадкам и и и н туи ­ цией. Они не вы ра­ о б ъ ек т н ж ены в виде некото­ р о го а л г о р и т м а и уби рает относятся к знаниям адресат человека. Формализо­ П етр ванные знания - это часть содержательных Рис J 5 Схема ПредСТаВления знаний, представлен- действия «убирает»

26 Основы искусственного интеллекта для лингвистов ная в виде конкретного алгоритма, формулы, закона или не­ которой формальной модели. Такие знания являются осно­ вой системы ИИ.

Понятие «развивающиеся знания» относится к содержа­ тельным знаниям;

они постоянно развиваются, пополняют­ ся. Сложившиеся знания - это знания, которые могут быть представлены в виде алгоритма или формальной системы.

Они зафиксированы в книгах, справочниках, словарях и т.п.

Понятия «полные» и «неполные знания» относительны.

Полные знания - это знания, позволяющие человеку или си­ стеме И И решить некоторую задачу от начала и до конца.

Неполные знания, в противоположность полным, не позво­ ляют найти решение какой-либо задачи.

Известные знания дают возможность человеку найти ре­ шение известной ему задачи, а новые знания открывают путь к решению некоторой новой проблемы или задачи.

Знания о реальном мире - это знания о предметах, про­ цессах окружающего мира и самом человеке. Лингвистиче­ ские знания включают знания о языке общения, правилах порождения речи и диалога, правилах описания на есте­ ственном языке предметов и процессов реальной действи­ тельности.

Чтобы система И И могла решать такие же интеллектуаль­ ные творческие задачи, как и человек, она должна обладать необходимыми для их решения знаниями. Откуда же взять эти знания и как их передать компьютеру? Ответы на эти во­ просы можно получить в процессе выполнения следующих процедур [300, с. 3-178;

297;

389, с. 12-32;

149, с. 7-76]:

• приобретения знаний от человека;

• представления полученных знаний для компьютера (формализации);

• передачи формализованных знаний компьютеру.

Приобретение знаний от человека. В процессе приобрете­ ния знаний принимают участие в простейшем случае два человека: инженер знаний (аналитик) и эксперт. Если стро­ ится очень большая система И И, в процессе приобретения знаний участвуют группы инженеров и экспертов [300, с. 81 Глава 1. Определения и понятия 83]. Инженер знаний - это человек, хорошо изучивший воз­ можности компьютера, имеющий большой опыт общения с ним и знающий способы формального представления зна­ ний в памяти компьютера [352, с. 14-21]. Эксперт - это хо­ роший специалист в некоторой предметной области (шах­ матист, медик, лингвист, специалист по управлению про­ изводством, военный и т. п.) [352, с. 14-21].

К участникам процесса приобретения знаний предъяв­ ляются определенные требования [2, с, 66-67;

300, с. 7 6 80;

297, с. 10]. Так, перед началом работы инженер знаний должен познакомиться со специальной литературой по за­ данной предметной области (чтобы не задавать эксперту глу­ пых вопросов). Он должен уметь слушать и грамотно зада­ вать вопросы. Эксперт, в свою очередь, должен быть не толь­ ко компетентным специалистом, но и как-то заинтересован (материально или морально) в реш ении поставленной за­ дачи, быть доброжелательным к инженеру знаний и уметь объяснить свои знания (наилучший вариант, когда эксперт имеет опыт преподавательской работы). Иногда функции инженера знаний и эксперта выполняет один человек. Тог­ да, кроме своих знаний, он может использовать учебники, монографии, справочники по исследуемой проблеме.

П риобретение знаний происходит в процессе диалога инженера знаний и эксперта. Чаще всего применяются три режима взаимодействия [2, с. 66;

300, с. 83-87;

389, с. 171— 190;

88, с. 71-84]: протокольный анализ, интервью, игровая имитация профессиональной деятельности.

Суть протокольного анализа заключается в фиксации (на бумагу, магнитную или видеопленку) «мыслей вслух» экс­ перта во время решения задачи и в последующем анализе полученной таким образом информации (например, эксперт вслух рассуждает, как он проводит синтаксический анализ сложного английского предложения, а инженер знаний за­ писывает его рассуждения).

В режиме интервью инженер знаний задает эксперту за­ ранее подготовленные вопросы о сути процесса решения конкретной задачи (например, как специалист по англий­ 28 Основы искусственного интеллекта для лингвистов скому языку проводит синтаксический анализ сложного ан­ глийского предложения: «Каков первый шаг такого анали­ за?» - «Я просматриваю предложение и отмечаю, есть ли в нем сочинительные и подчинительные союзы». - «Что вы делаете далее?» и т.д.).

Если для извлечения знаний применяется игровая имита­ ция, эксперта помещают в ситуацию, очень похожую на ту, в которой он действует в своей профессиональной деятельно­ сти. Инженер знаний наблюдает за экспертом, записывает его действия и формирует свои соображения о необходимых для решения задачи знаниях. Эти соображения впоследствии могут быть уточнены с экспертом в режиме интервью (на­ пример, инженер знаний сидит в кабинете врача и наблюда­ ет за тем, как врач обследует больного, задавая ему разные вопросы и используя данные проведенных анализов).

В результате взаимодействия инженера знаний и эксперта последовательно извлекается и уточняется следующая инфор­ мация [2, с. 65-68;

389, с. 28-30;

352, с. 159-168;

148, с. 282 284]:

1. Поле знаний, т.е. основные понятия, используемые при описании исследуемой предметной области, и свойства всех отношений, участвующих в установлении связей между вы ­ деленными основными понятиями. Например, если опре­ деляются знания, необходимые для распознавания значе­ ния многозначного слова «коса» в русском предложении, то в поле знаний будут включены такие понятая как «слово, стоящее слева от слова «коса», «слово, стоящее справа от слова «коса», «первое значение слова «коса» - вид женской прически», «второе значение слова «коса» - инструмент» и т.п. Основные отношения между этими понятиями будут выглядеть, например, так: «Если в предложении слева от сло­ ва «коса» на расстоянии не более четырех слов находится слово, обозначающее ж енский головной убор, то слово «коса» имеет значение «вид женской прически» и т.п.

2. Поле знаний уточняется путем выяснения более тон­ ких признаков и условий, влияющих на решение обсуждае­ мой проблемы. Так, при распознавании значения много­ Глава 1.Определения и понятия значного слова «коса» выявляются все классы слов, кото­ рые могут стоять слева и справа от слова «коса», выясняется расстояние от этих слов до слова «коса» при дифференциа­ ции того или иного значения многозначного слова.

3. В сознании инженера знаний строится полная форма­ лизованная концептуальная модель процесса решения задачи.

Затем эта модель может быть записана в виде иерархиче­ ских структур, диаграмм, схем или словесно. Примеры полу­ чения знаний от экспертов приведены в работах [352, с. 168— 182;

389, с. 185-186).

1.3.2. Способы формального представления знаний Полученные на предыдущем этапе знания должны быть определенным образом подготовлены для их представления в памяти компьютера.

Иногда выделяют два способа представления знаний в памяти компьютера: декларативный и процедурный [291, с. 162-166;

88, с. 19-31;

389, с. 12-26].

При декларативном представлении знания рассматрива­ ются как множество утверждений (фактов и правил) неза­ висимо от того, где и как их используют. Например, пере­ чень аффиксов русского языка и правил их сочетаемости с русскими основами;

правила согласования прилагательно­ го и существительного в зависимости от рода, числа и паде­ жа существительного;

описание переводного эквивалента иностранного слова в двуязычном словаре и т.д.

Процедурное представление задает знания в виде некото­ рых процедур (процессов), действий, которые необходимо выполнить, чтобы достичь какого-то результата. При этом, как правило, указываются какие-то дополнительные усло­ вия или ограничения, при которых процедура может быть выполнена. Например, процедура разбиения словоформы на основу и флексию;

процедура поиска и выделения в пред­ 30 Основы искусственного интеллекта для лингвистов ложении некоторых слов или словосочетаний;

процедура синтеза предложения;

процедура разрешения многозначно­ сти лексической единицы и т.п.

Однако практика создания систем И И показывает, что в процессе представления знаний разделить эти два способа довольно трудно. Поэтому в настоящее время используют­ ся методы, в которых есть элементы и декларативного и про­ цедурного представления знаний [291, с. 163;

18, с. 259-269;

108, с. 62-80]. Чаще для представления знания используют следующие три метода [352, с. 70-85;

200, с. 201-208;

389, с. 12-25;

297;

257, с. 62-73;

18, с. 281-290;

88, с. 21-31]:

- логических правил вывода;

- семантических сетей;

- фреймов.

Если знания представлены в памяти компьютера в виде логических правил вывода (или правил продукции), связь меж­ ду фактами (утверждениями) базы данны х1 передается в виде утверждения (правила продукции) ЕС ЛИ - ТО. Н а­ пример:

ЕСЛИ положить руку на зажженную плиту ТО можно обжечься ЕСЛИ взошло солнце ТО наступил день ЕСЛИ в предложении рядом со словом «коса» стоит глагол «ко­ сить» ТО слово «коса» употреблено в значении «инструмент для резки травы» и т.д.

В общем случае, когда действителен факт, указанный после слова ЕСЛИ, то верен и факт (утверждение, заключе­ ние), стоящий после слова ТО. При этом говорят, что пра­ вило выполнено. В случае следования нескольких условий ЕСЛИ, которым соответствует одно ТО, говорят о цепочке выводов. Например, ЕСЛИ в предложения рядом со словом «коса» стоит глагол «косить» и ЕСЛИ между ним и словом «коса» менее четырех слов ТО слово «коса» употреблено в значении «инструмент для резки травы».

1 Напомним, что база данных - это набор фактов, утверждений и заключений.

Глава 1.Определения и понятия Допустим, что необходимо построить систему И И, ко­ торая бы помогала начальнику отдела кадров любого вуза распределять на работу лиц, окончивших аспирантуру. В принципе возможны три должности, которые может занять выпускник аспирантуры: заведующий кафедрой, старший преподаватель, преподаватель. Естественно, что должность заведующего кафедрой лучше занять человеку, имеющему высокую квалификацию: защитившему диссертацию, опуб­ ликовавш ем у монографию и достаточное число статей, имеющему достаточный стаж работы в вузе. В противополож­ ность сказанному, преподавателем стоит назначить выпуск­ ника аспирантуры, который не защитил диссертацию, не имеет монографии, но опубликовал некоторое число ста­ тей и имеет небольшой стаж работы в вузе. Н а должность старшего преподавателя может претендовать человек, защи­ тивший диссертацию, имеющий достаточный стаж работы в вузе и опубликовавший достаточное число статей. Такая концептуальная модель решения задачи распределения вы­ пускника аспирантуры на работу, сложившаяся в сознании инженера знаний, с помощью правил продукции2 может быть следующим образом представлена для компьютера:


№ П р ав и л а п р ави л а 10 ЕСЛИ аспирант не защ итил диссертацию Т О он не обладает высокой квалификацией 20 ЕСЛИ аспирант защ итил диссертацию Т О он обладает высокой квалификацией 30 ЕСЛИ аспирант обладает высокой квалификацией И ЕСЛИ он опубликовал монографию И ЕСЛИ он опубликовал более статей И ЕСЛИ он им еет стаж работы более 5 лет Т О он может быть назначен заведую щим кафедрой 40 ЕСЛИ аспирант не обладает высокой квалификацией И ЕСЛИ он не опубликовал монографию И ЕСЛИ он опубликовал менее 2 При переходе к любому формальному представлению знаний такие нечеткие понятия, как «достаточное число публикаций», «достаточно боль­ шой стаж», «некоторое число статей», «небольшой стаж», «достаточный стаж», «определенное число статей» и т.д., должны быть четко выражены определенными числовыми показателями.

32 Основы искусственного интеллекта для лингвистов № П р ав и л а п р ави л а 10 статей И ЕСЛИ он им еет стаж работы менее 5 лет ТО он может бы ть назначен преподавателем 50 ЕСЛИ аспирант обладает высокой квалификацией И Е СЛ И он не опубликовал монографию И ЕСЛИ он опубликовал более статей И ЕСЛИ он им еет стаж работы более 5 лет ТО он может быть назначен старш им преподавателем Как же работает эта база знаний? Допустим, в систему И И поступает вопрос: «Кем может работать выпускник ас­ пирантуры, защитивший диссертацию?» Система начинает поочередно проверять правила 10, 20 и т.д. Правило 10 она пропускает, так как там в условии «ЕСЛИ» стоит «не защи­ тил». Проверив правило 20, компьютер сделает вывод, что такой человек обладает высокой квалификацией. Далее она переходит к правилу 30. Первое «ЕСЛИ» в этом правиле вы ­ полняется. А информация, стоящая после других «ЕСЛИ», системе неизвестна. Поэтому она задает последовательно следующие вопросы: «Аспирант опубликовал монографию?»;

«Аспирант имеет стаж работы более 5 лет?», «Аспирант опубликовал более 10 статей?» Если ответы на все эти во­ просы будут положительными, система сделает вывод, сто­ ящий в правиле 30 за словом «ТО»: «Он может быть назначен заведующим кафедрой». Если хотя бы на один из 3-х пере­ численных выше вопросов будет дан отрицательный ответ, то система переходит к правилу 40 и т.д.

При построении базы знаний на семантических сетях ис­ пользуются понятия «узел» и «дуга». Семантические сети со­ стоят из точек, называемых узлами, и связывающих их дуг, описывающих отношение между узлами. Узлы семантической сети соответствуют объектам, фактам или событиям. Опре­ деление дуг зависит от вида представляемых знаний. Обыч­ но дуги выражают между узлами иерархические отношения трех типов: 1) IS, А («является»);

2) HAS («имеет»);

3) PART OF («часть чего-то»). Кроме трех основных типов отноше­ ний в семантических сетях используются и производные этих отношений. Например: уметь («летать») - имеет воз­ Глава 1.Определения и понятия можность («летать»), использовать - имеет возможность применять, работать - имеет возможность работать. Всего выделено около 200 таких отношений.

В семантических сетях, используемых для описания ес­ тественных языков, в виде узлов чаще всего применяются так называемые семантико-синтаксические функции (се­ мантические падежи) типа АГЕНС, П А Ц И ЕН С, ОБЪЕКТ, Р Е Ц И П И Е Н Т и т.д. [357;

38].

Простейш ий элемент семантической сети может быть представлен в виде:

объект ] является объект • • и может быть конкретизирован так [297, с. 105-109]:

попугай является птица • • Если попугаю присвоить како е-л и б о им я, например, Кеша, сеть можно расширить так:

Кеша является попугай является птица • -----------------------Х -----------------------X Отсюда можно сделать простейший вывод, что «Кеша птица». Это свойство сети называется иерархией наследова­ ния: элемент сети более низкого уровня («Кеша») наследует свойства элемента более высокого уровня («попугай»).

С помощью семантических сетей можно представить зна­ ния, касающиеся атрибутов объекта. Например, факт «пти­ ца имеет крылья» можно представить так (дополнив преды­ дущую сеть):

Кеша является попугай является птица • ---------------- имеет крылья И опять здесь можно сделать вывод: «Кеша имеет крылья».

2 О сно вы и с к у с с т в е н н о го интеллекта для л и н гв и сто в 34 Основы искусственного интеллекта для лингвистов Полученную сеть можно пополнить, если ввести в нее факт «Кеша владеет золотой клеткой»:

Кеша является попугай является птица ---------------М ---------------- владеть имеет крылья золотая клетка является клетка Данную сеть можно расширить, введя в нее информацию «Кеша владеет золотой клеткой с весны по осень» (сеть не­ сколько изменена, так как внимание сконцентрировано на глаголе «владеть») (рис. 1.6):

попугаи является птица Кеша Рис. 1.6. Общая сеть системы Наиболее типичный способ использования сети - сопо­ ставление частей сетевой структуры. Это сопоставление происходит следующим образом. Например, в систему по­ ступил запрос: «Чем владеет Кеша?», который представля­ ется в виде подсети (рис. 1.7).

Далее начинается сопоставление двух сетей. Сначала в общей сети система находит вершину «владеть», затем она Глава 1. Определения и понятия определяет, куда ведет дуга «объект владения» (в вершине которой в сети-запросе стоит знак вопроса) при условии, что дуга «владелец» направлена к вершине «Кеша». Дуга «объект владения» направлена к вершине «золотая клетка».

Значит, ответ таков: «Кеша владеет золотой клеткой».

Кеша владелец объект владения '(чем) ' • владеть собственность Рис. 1.7. Сеть запроса Или, например, в систему И И поступил такой запрос:

«Кто владеет золотой клеткой?» Составляется семантиче­ ская сеть запроса (рис. 1.8):

? (кто) владелец объект владения золотая клетка является клетка владеть имеет собственность Рис. 1.8. Сеть запроса Система находит узел «владеть» и проводит последова­ тельное сопоставление дуг сети запроса и общей сети сис­ темы. В данном случае совпадают дуги «объект владения» и «имеет». Следовательно, ответ таков: «Кеша владеет золо­ той клеткой».

Чтобы понять, каким образом семантические сети мож­ но использовать в базе знаний, рассмотрим более сложную семантическую сеть (рис. 1.9) [200, с. 203]. На основании такой семантической сети создаются старшие структуры П ТИ Ц А и САМОЛЕТ:

36 Основы искусственного интеллекта для лингвистов ИМЯ СТРУКТУРЫ = ПТИЦА ЧИСЛО АТРИБУТОВ3 = АТРИБУТ = КРЫЛЬЯ АТРИБУТ = ЛЕТАТЬ АТРИБУТ = АЭРОДИНАМИЧЕСКИЕ ПРИНЦИПЫ АТРИБУТ = КЛЮВ АТРИБУТ = ОПЕРЕНИЕ крылья Рис. 1.9. Семантическая сеть, отражающая взаимоотношения между атрибутами птицы и самолета Аналогично создается старшая структура САМОЛЕТ. На основе старших структур строятся структуры конкретных объектов (например, ОРЕЛ и ВОРОБЕЙ). Так, для объекта 3 Число атрибутов - это число дуг, идущих от узла «птица» («имеет», «умеет», «использует», «имеет», «имеет»).

Глава 1. Определения и понятия ОРЕЛ соответствующая структура выглядит следующим об­ разом:

ИМЯ СТРУКТУРЫ = ПТИЦА ИМЯ ОБЪЕКТА = ОРЕЛ КРЫЛЬЯ = ШИРОКИЕ ЛЕТАТЬ = ВЫСОКО АЭРОДИНАМИЧЕСКИЕ ПРИНЦИПЫ = ПЛАНИРОВАНИЕ КЛЮВ = ДЛИННЫЙ ОПЕРЕНИЕ = ЧЕРНО-СЕРОЕ Сопоставляя старшую структуру и структуру конкретно­ го объекта, можно отметить, что в структуре объекта атри­ буты принимают конкретные, специфичные только для дан­ ного объекта значения.

Такое представление объектов позволяет создавать базу знаний с использованием логических правил вывода. Н а­ пример:

ЕСЛИ АТРИБУТ ОБЪЕКТА = КРЫЛЬЯ ТО ЛЕТАЮЩИЙ ОБЪЕКТ = ПТИЦА ИЛИ ЛЕТАЮЩИЙ ОБЪЕКТ = САМОЛЕТ.

ЕСЛИ АТРИБУТ ОБЪЕКТА = КРЫЛЬЯ И АТРИБУТ ОБЪЕКТА = КЛЮВ И АТРИБУТ = ОПЕРЕНИЕ ТО ЛЕТАЮЩИЙ ОБЪЕКТ = ПТИЦА.

ЕСЛИ ЛЕТАЮЩИЙ ОБЪЕКТ = ПТИЦА И КЛЮВ = ДЛИННЫЙ И КРЫЛЬЯ = ШИРОКИЕ И ЛЕТАЕТ ВЫСОКО ТО ЛЕТАЮЩИЙ ОБЪЕКТ = ОРЕЛ.

Представление знаний в виде фреймов - это расположе­ ние данных также в виде иерархической структуры (рис. 1.10).

К ак видно из рис. 1.10, каждый фрейм имеет уникальное ИМ Я Ф РЕЙ М А и состоит из определенного числа слотов (от англ. slot — «щель, отсек»). Все слоты также получают 38 Основы искусственного интеллекта для лингвистов свои особые (уникальные) имена. Как правило, эти имена даются произвольно, но иногда они могут иметь специфи­ ческий смысл («должность», «возраст», «адрес», «автор», «тема», «дата» и т.п.).

Второй столбец рис. 1.10 описывает типы данных, ис­ пользуемых в базе знаний. Здесь стоит имя, указывающее на тип данных, которые будут располагаться в слоте, или же имя другого фрейма: FRAM E («указатель другого фрейма»), IN T E G E R («целый»), BOOL («булевый, двоичный»), TEXT («текст»), REAL («действительны й»), LIST («список»), TABLE («таблица») и т.д. Конкретные значения слота (сле­ дующая колонка рис. 1.10) должны совпадать с типом дан­ ных, зафиксированным в предыдущей колонке. Демоны это имена процедур, которые запускаются при выполнении некоторого условия, указываемого в соответствующих сло­ тах. Ч ащ е всего использую тся д ем оны с им ен ам и IF N E E D E D (ЕСЛИ НУЖ НО), IF-A D D E D (ЕСЛИ ДОБАВ­ ЛЕН О ), IF-REM O V ED (ЕСЛИ УДАЛЕНО). Первый запус­ кается в тех случаях, когда в момент обращения к слоту его значение не было установлено (т.е. он остается пустым). Вто­ рой используется, когда в слот помещается новая инф ор­ мация. И, наконец, третий демон запускается тогда, когда из слота необходимо удалить какую-либо информацию.

Имя ф рей м а Демон С лот 1 (имя') С лот 2 ( имя') С лот N (имя) / \ \ Имя слота У казатель ти п а дан ны х данны Значение сл ота (имя (текст, число, при соеди ­ другого ф рейма, целое ненная процедура, число, слово, процедура, указатель и т.д.) указатель и т.д.) Рис. 1.10. Общая структура фрейма В системе И И фреймы организуются в некоторую иерар­ хическую структуру: сначала строится фрейм высшего уров­ Глава 1.Определения и понятия ня (фрейм класса или протофрейм [289, с. 13;


18, с. 262-265;

88, с. 23-26]), демонстрирующий наиболее общий вид ка­ кой-либо информации (например, документа), затем при­ водятся так называемые «дочерние» фреймы, представляю­ щие наиболее крупные разновидности документа. В конце структуры содержатся «дочерние» к «дочерним» фреймы.

Они представляют детальное описание конкретных доку­ ментов.

Например, фреймы, описывающие любой научный от­ чет, могут быть представлены в виде следующей иерархи­ ческой структуры, образующей базу знаний на фреймах.

Фрейм Имя: ОТЧЕТ высшего автор: TEXT уровня (фрейм тема: TEXT класса) дата представления: INTEGER, TEXT объем: INTEGER, TEXT «Дочерние» Имя: ТЕХНИЧЕСКИЙ ОТЧЕТ фреймы к автор: Участники проекта фрейму класса тема: TEXT дата представления: INTEGER, TEXT объем: 30 страниц Имя: ОТЧЕТ О ХОДЕ ВЫПОЛНЕНИЯ РАБОТ автор: Руководитель проекта тема: TEXT дата представления: INTEGER, TEXT объем: 2 страницы «Дочерний» Имя: ОТЧЕТ О ХОДЕ ВЫПОЛНЕНИЯ РАБОТ фрейм к № «дочернему» автор: Руководитель проекта IF-ADDED фрейму «Отчет Владимир Петров о ходе тема: TEXT IF-ADDED выполнения «Проект по биологической работ» классификации»

дата представления: INTEGER, TEXT IF-NEEDED 30 сентября объем: INTEGER, TEXT 2 страницы Сопоставляя эти фреймы с общей структурой фрейма, представленной на рис. 1.10, можно отметить, что именами 40 Основы искусственного интеллекта для лингвистов СЛОТОВ здесь являются слова: «автор», «тема», «дата пред­ ставления», «объем». Далее во всех фреймах идут слова, опи­ сывающ ие тип данных. В нашем примере используются лишь два указателя типа данных: TEXT и IN TEG ER. Пер­ вый указатель говорит о том, что «автор» и «тема» должны быть описаны некоторым текстом на естественном языке.

Следующие друг за другом указатели IN TEG ER и TEXT сви­ детельствуют о том, что «дата представления» и «объем» дол­ жны быть представлены в виде целого числа и некоторого текста. Во фрейме низшего уровня с именем «ОТЧЕТ О ХОДЕ ВЫ П О ЛН ЕН И Я РАБОТ №15» указаны имена демо­ нов IF-A D D E D и IF-N E E D E D.

Рассмотрим, как работает эта база знаний. Пусть на вход системы И И подается запрос: «Мне нужен отчет о ходе вы­ полнения «Проекта по биологической классификации».

Анализируя этот запрос, компьютер выделит название «Про­ ект по биологической классификации» и внесет его в слот «тема» «дочернего» фрейма «ОТЧЕТ О ХОДЕ В Ы П О ЛН Е­ Н И Я РАБОТ №15». Далее выполняется демон IF-A D D E D (ЕСЛИ ДОБАВЛЕНО), связанный со слотом «тема», так как в слот была введена новая информация (название проекта).

Эта процедура осуществляет поиск в базе данных системы фамилии и имени руководителя «Проекта по биологиче­ ской классификации». Пусть имя его - Владимир Петров.

Процедура IF-A D D E D вносит это имя в слот «автор» «ОТ­ ЧЕТА О ХОДЕ ВЫ П О ЛН ЕН И Я РАБОТ №15». Далее на­ чинает выполняться связанная со слотом «автор» процеду­ ра IF-A D D ED, так как в слот помещено новое данное (имя руководителя проекта). Эта процедура составляет сообще­ ние, чтобы отправить его автору Владимиру Петрову, но системе И И неясно, когда же распоряжение о представле­ нии отчета должно быть выполнено — свободен слот «дата представления». Поэтому в работу включается связанный с ним демон IF -N E E D E D (ЕСЛИ НУЖНО). Используя ка­ лендарь базы данных системы, эта процедура найдет теку­ щую дату (день запроса), например 10 сентября, и решит, что отчет надо представить к 30 сентября (минимальный Глава 1. Определения и понятия срок написания отчета - 20 календарных дней - также на­ ходится в базе данных). Демон IF -N E E D E D вносит эту дату в пустой слот «дата представления» «ОТЧЕТА О ХОДЕ ВЫ­ П О Л Н ЕН И Я РАБОТ №15». Далее процедура IF-A D D ED, связанная со слотом «автор» (она руководит всеми другими процедурами), обнаружит, что в «ОТЧЕТЕ О ХОДЕ ВЫПОЛ­ НЕН И Я РАБОТ №15» отсутствует еще одно значение - пуст слот «объем отчета». В этом слоте нет демонов и извлечь но­ вую информацию из базы данных нет возможности. Одна­ ко выше, во фрейме более высокого уровня, содержащего общую концепцию «ОТЧЕТА О ХОДЕ ВЫ ПО ЛН ЕНИ Я РА­ БОТ», есть значение объема для отчетов такого типа. Сис­ тема берет это значение («2 страницы») и подставляет его в слот «объем» «ОТЧЕТА О ХОДЕ ВЫ П О ЛН ЕН И Я РАБОТ №15». Таким образом, вся информация найдена, и система И И выдает ответ на поступивший запрос в виде указания, которое будет передано автору отчета: «Владимир Петров, пожалуйста, представьте отчет о ходе выполнения работ по «Проекту по биологической классификации» к 30 сентяб­ ря. Предполагаемый объем отчета равен 2 страницам».

В базах знаний фреймы представляются в следующем виде [389, 20-21;

289, 131]:

И М Я Ф Р Е Й М А [ИМ Я СЛОТА1 (значение слота 1);

ИМ Я СЛОТА 2 (значение слота 2 );

... ИМ Я СЛОТА К (зна­ чение слота К)].

В свою очередь «значение слота» может быть представ­ лено следующей последовательностью:

и м я атрибута 1 = значен и е атрибута 1;

и м я атрибута 2 = зн ачен ие атрибута 2;

...

и м я атрибута S = значен ие атрибута S.

В качестве значений атрибута могут выступать (как уже отмечалось выше) математические выражения, списки, таб­ лицы, тексты естественного языка, правила вывода и про­ 42 Основы искусственного интеллекта для лингвистов цедуры, ссылки на другие слоты данного фрейма или дру­ гие фреймы. При конкретизации фрейма ему и слотам при­ сваиваются конкретные имена, происходит заполнение сло­ тов. Так формируются отмеченные выше «дочерние» фрей­ мы или фреймы-экземпляры. Переход от исходного фрейма высшего уровня (протофрейма) к фрейму-экземпляру мо­ жет быть многошаговым за счет постоянного уточнения зна­ чений слотов. В приведенных выше примерах с фреймами отчетами такой переход выполнен за три шага:

1-й шаг ОТЧЕТ [ТЕХНИЧЕСКИЙ ОТЧЕТ ( FRAME);

ОТЧЕТ О ХОДЕ ВЫПОЛНЕНИЯ РАБОТ (FRAME)] 2-й шаг ОТЧЕТ О ХОДЕ ВЫПОЛНЕНИЯ РАБОТ [ОТЧЕТ О ХОДЕ ВЫПОЛНЕНИЯ РАБОТ №1 (FRAME);

ОТЧЕТ О ХОДЕ ВЫПОЛНЕНИЯ РАБОТ №2 (FRAME);

...

ОТЧЕТ О ХОДЕ ВЫПОЛНЕНИЯ РАБОТ № (FRAME);

...] 3-й шаг ОТЧЕТ О ХОДЕ ВЫПОЛНЕНИЯ РАБОТ № [АВТОР (руководитель проекта) IF-ADDED;

ТЕМА (TEXT IF-ADDED);

ДАТА ПРЕДСТАВЛЕНИЯ (INTEGER, TEXT IF-NEEDED);

ОБЪЕМ (INTEGER, TEXT)] Как видно из вышеизложенного, в качестве значений ат­ рибутов фрейма-экземпляра 3-го уровня выступают и кон­ кретный текст («Руководитель проекта»), и указатели типов данных (TEXT и IN T E G E R ), и демоны (процедуры IF AD D ED, IF-N E E D E D ).

Иногда фреймы делят [389, 21] на фреймы-описания, на­ пример: ОВОЩ И [ПОМ ИДОРЫ (болгарские;

30т);

П ЕРЕЦ (югославский;

20 т);

БАКЛАЖАНЫ (молдавские;

20 т)] и ролевые фреймы, например: П О Х И Щ Е Н И Е [КТО (LIST);

КОГО (LIST);

С ПО М ОЩ ЬЮ ЧЕГО (FRAM E);

ОТКУДА (LIST);

КУДА (LIST);

ЗАЧЕМ (FRAME)].

В последние годы в связи со сложностью решаемых ком­ пьютером задач создаются способы организации знаний, основанные на целом ряде семантических универсалий («пре­ Глава 1. Определения и понятия дикативность», «отрицание», «модальность», «время», «ме­ сто» и т.д.) [188]. Сделаны попытки к автоматизированно­ му формированию лингвистических баз знаний [219].

Передача компьютеру формализованных одним из опи­ санных выше трех способов знаний осуществляется с по­ мощью различных инструментальных средств: универсаль­ ных языков программирования типа Pascal, Quick BASIC, С, Java и т.п. или путем использования специальных язы­ ков инженерии знаний. Причем в зависимости от того, ка­ ким образом представлены знания, последние делятся на [352, с. 330-369]:

• языки, основанные на логических правилах вывода;

• языки, основанные на фреймах;

• язы ки, описывающие смешанное представление зна­ ний.

Более подробно об использовании универсальных алго­ ритмических языков и языков представления знаний в це­ лях создания систем И И см. [150, с. 7-167;

88, с. 203-323;

108, с. 382-409].

1.4. Системы обшения с компьютером на естественном языке 1.4.1. Общая структура системы Одной из существенных особенностей систем И И явля­ ется то, что общение человека с подавляющим большин­ ством из них происходит на обычном естественном языке (русском, английском и т.д.), а не на алгоритмических язы­ ках типа Pascal, С, BASIC, Java и т.п. Такие системы И И называю тся системами естественно-язы кового общ ения (системами ЕЯ-общения) или естественно-языковыми си­ стемами (ЕЯ-системами) [288, с. 9-94].

Проблема общения между людьми до сих пор полностью не раскрыта. Она значительно усложняется при человеко­ 44 Основы искусственного интеллекта для лингвистов машинном общении. При построении ЕЯ-систем на про­ цесс общения накладываются различные ограничения, за­ висящие от типа этих систем. Процесс общения пользова­ теля с компьютером обычно происходит в форме диалога.

Диалог в общем виде - это процесс достижения его участ­ никами определенных согласованных целей путем обмена связанными языковыми вы сказываниями в пределах не­ которой проблемной области (электроники, химии, меди­ цины и т.д.). П ри общении человека с компьютером цель последнего заключается в том, чтобы способствовать дос­ тижению целей пользователя, которые определяются его ин­ формационными потребностями. Учитывая сказанное, под общением человека и компьютера будем понимать процесс обмена взаимосвязанными язы ковы м и высказываниями, направленными на достижение целей пользователя. В наи­ более общем случае процесс общения должен заключаться не в обмене изолированными парами высказываний типа «вопрос-ответ», а в обмене связными текстами.

Схема идеальной системы ЕЯ-общения [109, с. 35] при­ ведена на рис. 1.11. Рассмотрим подробнее компоненты этой схемы [288, с. 9-32;

287;

109, с. 34-42].

Основная задача диалогового компонента - ведение диа­ лога (т.е. поочередный обмен информацией) между систе­ мой И И и пользователем. В зависимости от назначения сис­ темы И И диалоговый компонент формирует (если инициати­ ва принадлежит системе) или определяет (расшифровывает, если инициатива принадлежит пользователю) задание, вы­ полняемое системой на каждом текущем шаге: генерирует вопрос, отвечает на вопрос, генерирует утверждение или правило, выдает подсказку и т.п. Обычно ведение диалога выполняется по одной из двух схем: 1) диалог ведет пользо­ ватель;

2) диалог ведет система ИИ. В первом случае пользо­ ватель задает машине вопросы, сообщает ей некоторую и н ­ формацию, а компьютер определенным образом реагирует на эти сведения. Во втором случае систем а И И задает пользователю вопросы или дает ему некоторую информа­ цию.

Глава 1. Определения и понятия П О Л ЬЗО ВА ТЕЛ Ь А_ КОМ ПЬЮ ТЕР Диалоговый компонент Ф ормирование или Ведение диалога обработка перехватов инициатив К ом понент Ком понент К ом понент «обработка» генерации понимания в ы сказы ван и я в ы ск азы ван и я База данных и способы ее использования Генера­ Синтез Анализ Интер­ ция выска­ выска­ претация зывания смысла зывания выска­ Объяс­ П опол­ зывания выска­ нение нение зывания знаний пути решения задач Рис. 1.11. Обобщенная схема идеальной ЕЯ-системы Тематическая структура диалога обычно реализуется в виде сценария, который представляет собой упорядоченное мно­ жество правил или действий, выполняемых поочередно сис­ темой и человеком. Если роли участников диалогов неизмен­ ны, однозначны и предопределены заранее (одни вопрос один ответ), то структуру диалога называют жесткой. Воз­ можна в принципе и альтернативная структура диалога. Она отражает множество возможных (но заранее предусмотрен­ ных в сценарии) направлений течения диалога. Предполага­ емые направления диалога задаются обычно в виде «меню»

(например, в системе И И, обучающей человека написанию деловых писем на иностранном языке, на каком-то этапе ее работы диалог становится альтернативным - в зависимости 46 Основы искусственного интеллекта для лингвистов от тематики будущего письма направление диалога меняет­ ся;

тематика писем задается в виде меню).

В тех случаях, когда реакция одного из участников диа­ лога (системы или пользователя) была непредвиденной, не­ ожиданной (например, при ответе на вопрос системы чело­ век допустил орфографическую ошибку и машина не при­ няла ответ, а попыталась выяснить, что же хотел сказать пользователь), возникает задача формирования системой пе­ рехвата инициативы (в нашем примере система спросит у человека, что же он имел в виду в своем неправильном от­ вете). Если перехват инициативы в диалоге осуществляет пользователь, то задача системы - обработать его, т.е. рас­ познать, что это - перехват инициативы, а не обычный от­ вет на предыдущий вопрос системы, определить, на какую новую тему или подтему перешел пользователь, и перейти на структуру диалога по новой теме или подтеме.

Компонент понимания высказывания предназначен для оп­ ределения смысла входного высказывания (например, сути вопроса, задаваемого системе И И ) и выражения этого смыс­ ла на внутреннем языке системы. Как видно из приведен­ ной на рис. 1.11 схемы, этот компонент состоит из двух ча­ стей: анализа и интерпретации. В процессе анализа система И И должна определить, когда, где, каким образом, кто или что действует в высказывании, на кого (что) направлено дей­ ствие и т. п. На этом этапе должны быть также установлены свойства субъектов и объектов высказывания, определены отношения между ними. Обычно анализ подразделяется на морфологический (анализ слов), синтаксический (анализ предложения и текста) и прагматический (анализ текста).

Анализ слов сводится к морфологическому анализу, т. е. вы ­ явлению в слове основы и аффиксов. По значению афф ик­ сов система судит о грамматическом значении слова (роде, числе, падеже, времени и т. д.) [287, с. 233-240]. Анализ предложения (вопроса к системе, ответа системе и т. п.) сво­ дится обычно к его синтаксическому и семантическому ана­ лизу [287, с. 240-268]. Анализ текста сводится к определе­ нию его основного содержания и выявлению связей между Глава 1. Определения и понятия предложениями, т. е. выявлению тех лексических единиц, которые связывают предложения между собой (а такие свя­ зи могут быть выражены синонимами, местоименными за­ менами, логико-смысловыми скрепами и т. д.) [287, с. 268— 306]. Например, в тексте «М ашина переехала мост. Этот легковой автомобиль знали все. Он возил директора завода.

Именно поэтому люди его всегда узнавали» предложения связаны между собой следующим образом:

«машина» - «легковой автомобиль» - синонимы;

«легковой автомобиль» - «он» - местоименная замена;

«именно поэтому» - логико-смысловой скреп.

Интерпретация заключается в отображении проанализи­ рованного входного высказывания (предложения, текста) на знания системы. В итоге система И И должна понять обра­ щенный к ней вопрос, найти какое-то правило, сформули­ ровать подсказку и т. п. Другими словами, смысловая ин ­ терпретация - это представление смысла, выявленного в процессе анализа высказывания, в некоторой стандартной канонической форме, пригодной для вызова в системе И И действия, угодного пользователю [75].

Например, если в систему И И поступил запрос в виде вопросительного высказывания: «Сколько каменного угля перевезено железнодорожным транспортом в 1999 году?», то система, проанализировав это предложение, определит, что сказуемым в нем является слово «перевезено», а интер­ претация высказывания сведется к заполнению мест следу­ ющей сети:

А сколько СКОЛЬКО к I перевозить что когда когда перевозить что м ---- --------------- каменный уголь 1999 г.

чем железнодорожным чем ' ' транспортом Узлы, к которым ведут дуги «что», «чем», «когда», при интерпретации будут заполнены из самого высказывания, а 48 Основы искусственного интеллекта для лингвистов узел с дугой «сколько» - из базы данных (части базы зна­ ний), которая, например, будет иметь вид (табл. 1.1).

Таблица 1. Фрагмент базы данных Вид м атер и ал а П еревезено П еревезено сам олетом (чем) (что) ж елезнодорож ны м тран спортом (чем) годы коли ­ годы количество (когда) чество (объем) (когда) (объем), т Уголь 1996 10 000 каменный 1997 20 1998 100 1999 50 2000 40 2001 200 2002 150 2003 100 Нефть Приведенный запрос может быть детально представлен и в виде следующей семантической сети (семантического графа) (рис. 1.12).

объем тонна Г ^ ' ) значение, кол-во мера железно­ дорожный транспорт перевозить каменный уголь У вид объект вид инструмент t год ---- У время значение Рис. 1.12. Семантический граф запроса к системе ИИ Слова между вершинами (узлами) этого графа называ­ ются семантическими функциями или семантическими па­ дежами: «объект», «инструмент», «время», «количество».

Они как бы представляют элементы ситуации: кто действует, Глава 1. Определения и понятия где действует, на что действует, чем действует и так далее.

Разные ученые выделяют от 7 до 50 таких семантических функций.

Компонент генерации высказывания решает две основные задачи [288, с. 26-28;

287, с. 307-327]:

• генерацию (порождение) смысла будущего высказы­ вания (ответа системы, ее вопроса к пользователю и т.п.).

Это происходит на этапе семантического синтеза;

• лингвистический синтез самого высказывания по по­ рожденному смыслу.

Первая из перечисленных проблем разработана с теоре­ тической точки зрения очень слабо. Тем не менее известны те основные задачи, из которых она состоит:

• определение инф орм ации, которую надо сообщить пользователю на его запрос;

• формирование семантической сети (графа) ответа;

• деление сообщаемой пользователю информации на ча­ сти, соответствующие будущим фразам;

определение пра­ вильной последовательности этих частей в соответствии с порядком фраз в выходном тексте;

• определение лексем, которые будут замещать позиции семантической сети (графа) ответа.

В качестве основы для генерации смысла будущего вы­ сказывания (ответа) может служить семантический граф, по­ лученный на заключительном этапе работы компонента по­ нимания высказывания (вопроса)4 (см. рис. 1.12). Как вид­ но из рис. 1.12, пользователю необходима инф ормация о количестве (объеме) каменного угля, перевезенного желез­ нодорожным транспортом в 1999 г. Такая информация, как уже отмечалось, может быть взята из банка данных (табл. 1.1).

Тогда семантический граф будущего предлож ения-ответа будет выглядеть следующим образом (рис. 1.13).

4 Этот граф построен на основе метода падежной грамматики [38, с. 357]. Возможны и другие подходы к семантическому представлению бу­ дущего высказывания: метод концептуальной зависимости [379], метод рас­ ширенных сетей переходов [80], метод «смысл - текст - цель» [287, с. 118— 130] и др.

50 Основы искусственного интеллекта для лингвистов объем 50 ООО тонна ;

------------------------------------ значение, кол-во мера железно­ дорожный транспорт перевозить уголь каменный объект ^ вид ^ вид инструмент ', год _ь время значение Рис. 1.13. Семантический граф предложения Следующая задача процесса генерации высказывания связана с разбиением информации на части, соответствую­ щие частям будущего высказывания и определением поряд­ ка их расположения. Такое деление возможно с учетом пра­ вил распределения информации в предложениях русского, английского и других языков. И нформация, представлен­ ная на рис. 1.13, может быть разделена на части с ориенти­ ровкой на русское предложение различными способами:

1) «время» + «инструмент» + «действие» + «количество» + «объект»;

2) «инструмент» + «действие» + «время» + «количество» + «объект»;

3) «инструмент» + «время» + «действие» + «количество» + « объект»;



Pages:   || 2 | 3 | 4 | 5 |   ...   | 7 |
 





 
© 2013 www.libed.ru - «Бесплатная библиотека научно-практических конференций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.