авторефераты диссертаций БЕСПЛАТНАЯ БИБЛИОТЕКА РОССИИ

КОНФЕРЕНЦИИ, КНИГИ, ПОСОБИЯ, НАУЧНЫЕ ИЗДАНИЯ

<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ


Pages:     | 1 | 2 || 4 | 5 |   ...   | 7 |

«Каменистые тропы науки - это горы литературы, уступы книг, которые нужно прочесть, усвоить. Но книги - это путеводитель, по которому можно ориентироваться на дорогах науки. ...»

-- [ Страница 3 ] --

91, с. 40]. Все это приводит к тому, что в процессе развертывания содер­ жания отбираются узловые элементы системы референтов, являющиеся существенными для построения данного тек­ ста. Каждый из этих элементов позволяет задавать порядок дальнейшего отбора необходимых элементов в подмноже­ стве связанных с ним референтов [253, с. 70-71]. Так как референтам в тексте соответствуют имена, то формальная структура содержания текста сводится к формальной струк­ туре линейной последовательности материальных знаков слов [253, с. 28].

Анализ большого числа работ по смысловой организации текста показывает, что смысловое единство текста связано с наличием в нем некоторых «опорных слов» («топиков», «смысловых вех», «дескрипторов», «ключевых слов», «фокаль­ ных точек», «ядер» и т.д.) [4, с. 15;

63, с. 201;

323, с. 102;

391], которые пронизывают весь текст от начала до конца.

Существуют достаточно интересные попытки формаль­ ного представления смысла текста через опорные слова и словосочетания [204;

323], связанные с построением разно­ го рода графов. Однако, как утверждают авторы, такая фор­ мальная связь не позволяет полностью решить задачу пост­ роения графа денотативной структуры, соответствующего всему тексту, так как окончательная связь всех верш ин, представляющих текст, осуществляется на содержательном уровне с привлечением не содержащейся в тексте инфор­ мации [253, с. 149-150].

Известно, что в структуре «опорных слов» или «смысло­ вых вех» существует определенная иерархия [207, с. 123].

Часть из них - «главные», «важные» слова, «номенклатур­ 96 Основы искусственного интеллекта для лингвистов ные дескрипторы», «ключевые» слова, «выступающие точ­ ки» всего содержания [207, с. 123;

253, с. 147], определяют главный предмет сообщения и по существу являются свер­ нутым замыслом текста. При этом один и тот же референт может выражаться разными словами - контекстуальными синонимами в тех пределах, при которых возможно их вза­ имное приравнивание [207, с. 138]. И з-за линейности озна­ чающего текста такие слова оказываются разнесенными по разным абзацам текста.

Анализ работ по выделению опорных слов с учетом вы­ шесказанного позволяет предложить два формальных кри­ терия определения главных опорных слов (ГОС): наибольшая частота употребления слова (включая все его контекстуаль­ ные синонимы и местоименные замены) и максимальное число абзацев, в которых встречается слово5. Такие слова в дальнейшем становятся своеобразным центром, вокруг ко­ торого формируются другие элементы, характеризующие составляющие микроситуации (глаголы, прилагательные, наречия и т.п.) [254, с. 53].

Главные референты, которым в тексте соответствуют глав­ ные опорные слова, в рамках той или иной ситуации могут быть связаны с другими референтами, также относительно важными для той же ситуации, но являющимися центром не всей ситуации, а некоторых микроситуаций общей ситуации [254, с. 53]. Соответствующие им слова текста назовем вто­ ростепенными опорными словами (ВОС). Они встречаются реже, чем ГОС, и в меньшем числе абзацев всего текста.

ГОС и ВОС текста входят в специальную таблицу основ­ ного статического содержания текста.

Рассмотрим несколько подробнее проблему смысловой организации абзаца. Отмечая, что эта проблема является в целом семантико-синтаксической [194, с. 137], исследова­ тели в то же время подчеркивают, что синтаксические осо­ 5 Главные опорные слова являются, как правило, именами, отражаю­ щими главные действующие лица или главные предметы описания, пове­ ствования или рассуждения.

Глава 3. Системы обработки связных текстов бенности этой единицы плана содержания не могут быть поняты без детального проникновения в ее лексическую структуру. Для микротемы, так же как и для всей темы, ха­ рактерны иерархия и повторяемость опорных слов и слово­ сочетаний [4, с. 14-15;

264, с. 285]. При этом выделяются два именных ряда соотнесенности: ряд смыслового субъек­ та и ряд смыслового предиката [387, с. 265]. Как отмечалось выше, абзац отражает некоторый фрагмент психической си­ туации. По существу, абзац включает в себя те связи и от­ ношения, которые зафиксированы у главных и второстепен­ ных референтов текста с другими, менее значимыми эле­ ментами ситуации: типы действий и состояний ГОС и ВОС, место действия, время действия, цель, причины действий и состояний и т.п. [254, с. 53-54].

Предлагаются разные подходы к представлению иерар­ хии имен, описывающие в рамках микротемы абзаца все многоаспектные отношения. Один из них связан с исполь­ зованием различного рода дескрипторов. При этом выде­ ляются дескрипторы номенклатурного, предикативного или модального характера, указатели отношений и т. д. При дру­ гом подходе предлагается дифференцировать слова текста по той роли, которую выполняют их денотаты в ситуациях реальной действительности, выделяя, например, такие роли, как «часть», «признак», «целое», «принимающий», «действу­ ющий», «множество», «средство», «цель» и др. [319, с. 112;

287, с. 164-178]. По существу, второй подход связан с ф ик­ сацией тех энциклопедических знаний, которыми владеет автор текста. На наш взгляд, этот подход наиболее рацио­ нален. Ведь создавая тот или иной текст, автор реально (или мысленно) видит некоторую ситуацию. Он может выделять фрагменты этой ситуации, а в пределах фрагментов - эле­ менты ситуации со всеми относящимися к этим элементам признаками в их связи с другими элементами той же ситуа­ ции. А это и есть не что иное, как энциклопедические зна­ ния, и поэтому проблема представления энциклопедических знаний и проблема организации словаря текста должны рас­ сматриваться неразрывно [203, с. 99;

321;

124;

450].

4 О сно вы и с к у с с т в е н н о го интеллекта для л и н гв и с т о в 98 Основы искусственного интеллекта для лингвистов Существует огромное число исследований по пробле­ мам представления знаний в системах, работающих с ес­ тественным языком [98;

165;

236]. Наш им задачам больше соответствует ролевой подход. Будем считать, что в м ик­ роситуации можно выделять некоторые далее неделимые составляющие - элементарные составляющие микроситуа­ ции (ЭСМС). Анализ текстов разного типа позволил выявить такие ЭСМ С, как «действие», «состояние», «место», «время», «средство», «причина», «цель», «характеристика», «детализа­ ция». Каждой ЭСМС в абзаце соответствует слово или соче­ тание слов (глаголы, причастия, существительные и их соче­ тания). Тогда специфика каждой микроситуации будет зада­ ваться о п ред ел ен н ой п ослед овательн остью Э С М С и индивидуальным наполнением каждой из них соответству­ ющими денотатами. В процессе изучения разных текстов выделяются возможные типы абзацев и каждому абзацу в со­ ответствии со сказанным приписываются в определенном порядке группы слов-конкретизаторов, замещающих в абза­ це соответствующие денотаты микроситуаций.

Отражающие ЭСМ С слова в определенной степени до­ страивают костяк содержания текста, заданный таблицей основного содержания, но не завершают полное построе­ ние. Это объясняется тем, что кроме опорных слов и слов конкретизаторов в любом тексте существует еще одна группа слов, которую назовем словами-наполнителями. Они напол­ няют полученное содержание качественными признаками, т.е.

указывают качества предметов, названных именами суще­ ствительными, признаки действий, определяемые в тексте глаголами и причастиями. Качественная детализация осу­ ществляется путем предварительной фиксации наиболее ве­ роятных для текстов определенного типа свободных слово­ сочетании: атрибутивных, адвербиальных, именных.

Глава 3. Системы обработки связных текстов 3.3.5. Динамика текста Переходя к характеристике второго типа составляющих текста, напом ним, что о ни должны характеризовать те от­ нош ения между объектами реальной действительности, которые зафиксированы в конкретной, описанной в тексте ситуации. Точнее, речь идет о фиксации тех событий (про­ цессов, действий, состояний), которые происходят с рефе­ рентами [163, с. 324], имена которых представлены в тексте опорными словами. В связи с ограниченностью оператив­ ной памяти человека и невозможностью полного охвата со­ бытий, человеческое сознание в процессе познания вычле­ няет фрагмент этих событий. Это позволяет последователь­ но рассмотреть признаки одного предмета при подведении каждого из них под общую категорию, известную ранее и зафиксированную в сознании [372, с. 41]. Такое членение действительности на фрагменты проводится не произволь­ но, а в соответствии с социально отработанными моделя­ ми, сформировавшимися в ходе длительного историческо­ го развития человечества [372, с. 42].

Ввиду неразрывности мышления и языка каждому отра­ женному в сознании фрагменту действительности в некото­ рое соответствие ставятся определенные языковые формы [174, с. 44;

372, с. 43]. Одни исследователи отмечают, что раз­ ным элементам реальной действительности в мышлении со­ ответствуют фиксированные слова [68, с. 64], другие ставят им в соответствие словосочетания, предложения и целые тексты [107, с. 16]. Третья группа авторов, не отрицая определенной роли указанных единиц, ведущую роль в отражении фрагмен­ тов реальной действительности отдает логическому аппарату, позволяющему получать выводные знания из известных ин­ дивиду обобщенных эмпирических фактов [159, с. 111].

Ученые самых разных направлений отмечают, что в про­ цессе человеческого познания наиболее важные и часто по­ вторяющиеся отнош ения реальной действительности за­ крепляются в форме синтаксических структур. Эти струк­ 100 Основы искусственного интеллекта для лингвистов туры усваиваются человеком с детства вместе со словами и звуками родного языка. Когда мы говорим, то очень часто не задумываясь, выбираем один из привычных для нас в дан­ ной ситуации языковых шаблонов [5, с. 3;

273, с. 427-428].

Такие шаблоны («синтаксические модели», «структурные схемы предложений», «конструкции», «фразовые стереоти­ пы», «синтаксические формы» и т.д. и т.п.) являются пси­ хическими реальностями, существующими в нашем созна­ нии вместе с единицами других уровней языка, участвую­ щими в процессе создания текста.

Вместе с тем, по данным современной психологии и ли н ­ гвистики, внеязыковое содержание чаще всего передается не одним, а несколькими взаимосвязанными предложени­ ям и. Т.е. для вы раж ения отнош ений между м ы слям и в структурах, выходящих за пределы предложения, в языке существуют определенные структурно-смысловые модели [209, с. 61]. Как правило, цепочку таких взаимосвязанных мыслей называют высказыванием. Основная особенность высказываний заключается в том, что они обладают опре­ деленными и относительно устойчивыми типическими фор­ мами построения целого. Такими единицами мы уверенно пользуемся, но теоретически можем и не знать об их суще­ ствовании. Они приходят к нам в процессе обучения языку и жизни, соотносятся с определенными фрагментами дей­ ствительности и несут в себе не только собственный опыт автора, но и социальный опыт общества [23, с. 257-260;

234, с. 169;

356, с. 95].

Более глубокие исследования позволяют сделать вывод, что наличие таких синтаксических шаблонов, охватываю­ щих несколько предложений, связано с общим положени­ ем об опережающем отражении действительности, разра­ ботанным советскими учеными Д.Н. Узнадзе и П.К. Ано­ хиным [12;

350]. В соответствии с этой теорией человек «обладает способностью на основе врожденного и приоб­ ретенного опыта предвидеть развитие ситуативных обстоя­ тельств и настраиваться на определенную реакцию с некото­ рым упреждением вероятностного хода событий» [174, с. 50].

Глава 3. Системы обработки связных текстов В процессе создания текста это положение реализуется в виде составления некоторой общей схемы развития мысли и, следовательно, ее речевого оформления. Таким образом, подобные синтаксические структуры есть не что иное, как устоявшиеся, отложившиеся в памяти логические образо­ вания, отразившиеся в человеческом мышлении типичес­ кие связи и отношения объективной действительности [182, с. 249]. Наличие речевых шаблонов-высказываний отмечают лингвисты [5, с. 3;

256, с. 40-41;

273, с. 427-428;

334, с. 294 298], психологи и психолингвисты [70, с. 96;

234, с. 169], атак же специалисты по обучению языкам [196, с. 90;

301, с. 89 98]. Причем набор таких шаблонов конечен, относительно невелик и специфичен для текстов одного автора или од­ ной достаточно узкой предметной области [23, с. 259-260;

162, с. 263;

334, с. 297].

Как отмечалось выше, такие синтаксически единые объе­ динения, включающие несколько предложений, были на­ званы «сверхфразовыми единствами» или «сложными син­ таксическими целыми». Исследования последних лет позво­ ляю т допустить, что и абзац письм енного текста также является «логическим слепком» с действительности [4;

162;

209;

269;

318]. Это подтверждают не только лингвистические исследования, но и эксперименты психологов и психолинг­ вистов. Так, в одной серии опытов испытуемым предъявля­ лись одни и те же тексты, но подготовленные по-разному: с разбивкой на авторские абзацы, без абзацев и с абзацами, не учитывающими логическую структуру текста. В итоге первые тексты воспринимались уверенно, легко и быстро.

Во втором и третьем случаях на усвоение таких текстов было потрачено гораздо больше времени и текст усваивался пло­ хо или совсем не усваивался.

В другой серии опытов художественный текст («описа­ ние весеннего дня»), научный текст-описание («волк») и научно-популярный текст («железо») делились на предло­ жения и испытуемым предлагалось объединить их в абза­ цы, а абзацы - в связный текст [45]. Для художественного текста практически все испытуемые объединили предложе­ 102 Основы искусственного интеллекта для лингвистов ния в сходные смысловые группы. Различия касались лишь порядка располож ения предложений внутри смысловых групп. Примерно треть испытуемых сложили текст из смыс­ ловых кусков так же, как и автор. В других случаях наблю­ далась перестановка смысловых групп [45, с. 82-83]. Второй текст - научное описание - отличался строгой логической упорядоченностью фактов, и все варианты текстов, получен­ ных испытуемыми, были близки к оригиналу [45, с. 83]. Н а­ учно-популярный характер третьего текста, наличие в нем нескольких предметов обсуждения привели к тому, что раз­ ные испытуемые относили одно и то же предложение в раз­ ные смысловые группы. Было получено большое разнооб­ разие вариантов текста, но, тем не менее, абзацы испытуе­ мыми объединялись в четко прослеживаемые более крупные смысловые куски, такие как «значение железа», «добыча руды», «выплавка чугуна» и т.п. [45, с. 84].

Наконец, еще одним доказательством того, что абзац яв­ ляется некоторым смысловым и логическим единством, слу­ жит эксперимент, проведенный в М ичиганском универси­ тете [420]. Было показано, что у 80% испытуемых расста­ новка абзацев одного и того же текста совпала. Причем не во всех случаях такая расстановка совпала с авторской.

Таким образом, приведенные факты показывают, что аб­ зацы выделяются автором не произвольно. Они строятся по определенным правилам, более строгим и стереотипным для научных текстов и более свободным и творческим в текстах художественных [45, с. 89;

318]. В то же время в особенно­ стях композиции абзаца отражается семантическая динами­ ка текста. Исследователи отмечают специфичность абзацев каждого автора [162, с. 258-259;

322, с. 210]. Можно пред­ положить, что и тексты разных авторов, относящиеся к до­ статочно узкой предметной области, можно описать в виде определенной последовательности конечного числа специ­ ализированных абзацев [195, с. 64;

263, с. 113;

269, с. 8].

Глава 3. Системы обработки связных текстов 3.3.6. Роль вероятностных факторов в организации текста Известно, что в процессе познания ж изни на нервную систему человека одновременно воздействует огромное чис­ ло различных нервных импульсов, сигнализирующих о вли­ янии на организм бесчисленных факторов окружающей сре­ ды и процессов, протекающих внутри самого организма. П о­ этому трудно сказать с полной определенностью, какова будет реакция организма на то или иное действие среды.

Такую реакцию можно предсказать лишь с некоторой веро­ ятностью, индивидуальной для каждого члена общества [271, с. 164;

363, с. 3-6].

Речевая деятельность человека имеет практически ту же психологическую структуру, что и любая другая форма пси­ хической деятельности [206, с. 101]. Поэтому в речевом по­ ведении человека можно обнаружить такие же вероятност­ ные составляющие, как и в поведении вообще, т.е. индиви­ дуальный речевой опыт имеет вероятностную структуру [88, с. 60;

302, с. 22]. Но «речи для себя» не существует: она кому то адресована и связана с определенной жизненной ситуа­ цией. Как показывают исследования, модель ситуации фор­ мируется говорящим в эталонах восприятия, которые, с од­ ной стороны, зависят от прошлого (социального) опыта человека, а с другой - от задач и мотива совершаемой дея­ тельности [335, с. 19].

Иными словами, в виду того, что психика личности со­ циальна по своей сути, язы к представляет собой средство опосредованного овладения социальным опытом [335, с. 135;

395, с. 238-241]. Следовательно, парадокс языка и идиолекта решается в современной лингвистике таким образом, что все индивидуальное, входя в речь, не перестает быть язы ­ ком до тех пор, пока оно принадлежит другому. Именно по­ этому индивидуальный язы к детерминирован социально [335, с. 15-30;

343, с. 30-33]. Эти отмеченные психологами и психолингвистами особенности речевого поведения были 104 Основы искусственного интеллекта для лингвистов зафиксированы и лингвистами. Так, Л.Б. Щерба говорил, что индивидуальная речевая система является лишь конкретным проявлением языковой системы [386, с. 134], аА.А. Потебня полностью соглашался с мыслью В. Гумбольдта: Sprechen heisst sein besonderes Denken an das allgemeine ankupfen - «Го­ ворить - значит связывать свою личную узкую мысль с мыш­ лением своего племени, народа, человечества» [295, с. 165].

Первым из лингвистов, кто свел все подобные факты в еди­ ное целое, был Г. Хердан, выдвинувший теорию языка как выбора и случайности [412;

413]. Статистически интерпрети­ руя основную дихотомию Ф. де Соссюра la langue — la parole, Г. Хердан на самом деле под la langue понимает le langage и соотносит le langage и la parole как совокупность и выборку, что и. позволяет le langage изучать статистическими методами.

Г. Хердан отмечает, что основной закон языковой коммуни­ кации - стабильность распределения языковых элементов. Эта стабильность не зависит от воли говорящего и объясняется тем, что людям свойственно приобретать речевые навыки постро­ ения фраз путем подражания другим носителям языка. При этом он допускает индивидуальность в языке и объясняет ее правом выбора со стороны носителя языка. Дихотомия языка как выбора и случайности дает возможность проводить иссле­ дование независимо от означаемого, ибо закону случайных чи­ сел подчиняется все, что связано с означающим. Означаемое же предполагает наличие выбора, и поэтому язык как случай­ ность имеет дело с означающим, а язык как выбор - с означа­ емым. Это, по Г. Хердану, делает возможным логическое опи­ сание языка на всех его уровнях, описание формы независи­ мо от содержания. Близкие по смыслу идеи содержатся и в работах французского лингвиста П. Гиро [408].

Большой цикл исследований по обоснованию объектив­ ной значимости вероятностно-статистических отношений в языке и речи был выполнен Р.Г. Пиотровским и его учени­ ками [8;

24;

249;

275;

280]. Исследования показали, что в языке существует некоторый эталон статистического построения и упорядочения текста. Таким эталоном является норма, на­ ходящаяся между системой языка и речью (текстом).

Глава 3. Системы обработки связных текстов Ученые изучали также строение текста и распределение в нем отдельных единиц. В итоге выяснилось, что порожде­ ние единиц заполнения в тексте описывается математиче­ скими моделями - распределениями Гаусса, Пуассона, Фук­ са, логнормальным распределением, кривыми Пирсона и т.п., а ситуативные ключевые элементы таким моделям не подчиняются [279, с. 116-119]. Например, при анализе анг­ лийских технических текстов выяснилось, что нормальному закону подчиняется распределение в тексте артиклей, пред­ логов, частиц, союзов, местоимений и наречий [24, с. 20].

Терминологическая лексика этому закону не подчиняется.

Высказывается предположение, что существуют определен­ ные функции распределения не только для означающих язы ­ кового знака, но и для значений этого знака. Так, В.В. Н а­ лимов пишет: «... как в обыденном языке, так и во многих других языках с каждым знаком вероятностным образом свя­ зано множество смысловых значений. Можно говорить об априорной функции распределения смысловых значений знака» [245, с. 98].

Сравнивая и оценивая изложенные выше вероятностно­ статистические концепции Г. Хердана, П. Гиро, Р.Г. П иот­ ровского и других исследователей [97;

280;

363], ряд авто­ ров приходит к новому варианту статистической интерпре­ тации языка и речи [8;

280]. Суть ее заключается в том, что речь характеризуется вы борочной, относительной часто­ той, язык включает систему и норму. Система описывается парадигматическими и синтагматическими вероятностями, норма - нормирующими вероятностями. Причем, по м не­ нию этих авторов, парадигматические вероятности клас­ сов элементов и синтагматические вероятности элементов системы и их классов не описываю тся общ епризнанной теорией вероятности. Для их описания или предлагается модель в виде неправильного многогранника «с разными по величине и форме гранями» [280, с. 19], или в систему речевой деятельности вводится понятие узуса. Узус пони­ мается как некоторое промежуточное звено между нормой («как следует говорить») и речевым актом («как обычно го­ 106 Основы искусственного интеллекта для лингвистов ворится»), являющееся обобщением конкретных речевых актов и текстов.

В последнем случае очень важно то, что нормирующая вероятность является результатом действия и вероятности ситуации, в которой происходит реализация языка в речь, и результатом действия собственно языковых факторов. Важ­ но также то, что вероятностным законам подчиняется не только распределение отдельных элементов, но и классы та­ ких элементов.

Таким образом, исследования показывают, что в процес­ се функционирования языка действуют вероятностно-ста­ тистические законы. Этот факт ставит перед учеными мно­ го новых вопросов: на каких уровнях действуют эти зако­ ны, какой механизм обеспечивает их функционирование, как обеспечивается необходимое соотношение детермини­ рованных и вероятностных процессов, и т.д. Пока можно лишь предположить, что в сложных многоуровневых и мно­ гофункциональных системах (а язы к является именно та­ кой системой) узкая специализация отдельных уровней, функций и органов может сосуществовать с недетермини­ рованной гибкостью других уровней и частей этих систем [314, с. 123]. Можно надеяться, что анализ конкретных тек­ стов различного типа позволит в определенной степени от­ ветить на поставленные вопросы.

Текст, являясь конечным результатом речевой деятель­ ности, должен, очевидно, содержать какие-то следы дей­ ствия случайных факторов и детерминированных правил.

Являясь результатом взаимодействия порождающей систе­ мы языка и нормы, а также внешней ситуации, текст вклю­ чает два типа языковых элементов - элементов заполнения, которые порождаются системой и нормой языка, и ключе­ вых единиц, которые стимулируются немодулируемой и не­ предсказуемой ситуацией [279, с. 118]. Поэтому некоторые авторы выделяют, соответственно, языковую вероятность, нормирующую вероятность, речевую вероятность и речевую частоту [8]. Помимо этого, сама внешняя ситуация воспри­ нимается автором текста и передается в тексте также с не­ Глава 3. Системы обработки связных текстов которыми вероятностями. Какие именно вероятности за­ фиксированы в тексте?

Для ответа на этот вопрос необходимо вернуться к про­ блеме вероятностной структуры среды и вероятностному восприятию человеком элементов этой среды. В каждой жизненной ситуации устанавливается определенная степень соответствия между субъективной вероятностью наступле­ ния некоторого события и его объективной вероятностью, что и помогает человеку прогнозировать свое будущее по­ ведение. Отмеченный факт лежит в основе так называемого вероятностного прогнозирования - способности человека сопоставлять поступающую информацию о наличной ситу­ ации с хранящейся в памяти информацией о прошлом опыте и использовать эти данные для построения гипотез о пред­ стоящих событиях, приписывая им ту или иную вероятность [170, с. 102-104;

355, с. 8]. Эта общефизиологическая зако­ номерность справедлива и для речевой деятельности, т.е.

человек владеет определенными субъективными представ­ лениями о вероятностях употребления тех или иных элемен­ тов речи, может на основе этого строить субъективную мо­ дель вероятностной структуры предстоящей речевой ситуа­ ции, осуществлять с учетом данной модели субъективный прогноз и строить свою речевую деятельность в соответствии с этим прогнозом [174, с. 50;

302, с. 9-22].

Н о, как было показано выше, психика человека соци­ альна по сути, поэтому речевая способность каждого инди­ видуума также социальна. Как отмечал Г.О. Винокур, в каж­ дом тексте может быть выделено нечто «внеличное, общее, надиндивидуальное» [74, с. 236]. Эта социальность практи­ чески проявляется в том, что человек в процессе порожде­ ния текста использует слова, словосочетания, предложения и даже более крупные единицы не в бесконечных вариан­ тах, а в пределах некоторых границ. Эти границы для каж­ дого человека различны и зависят от большого числа ф ак­ торов, которые действуют на протяжении всей жизни [100, с. 83;

338, с. 202;

417, с. 33]. Ядро, основа такой совокупно­ сти единиц общения, формируется в детстве под влиянием 108 Основы искусственного интеллекта для лингвистов подражания взрослым и активного воздействия со стороны взрослых на речь ребенка [43;

311;

343, с. 26;

444]. В тексте это ядро выражено в явлении стереотипии, проявляющем­ ся на разных уровнях [30;

187;

304;

419]. Стереотипичность или стандартность речевого действия экономит умственные усилия как автора, так и получателя речи [419, с. 223]. М а­ лая вариантность, характерная для стереотипичности, ос­ тавляет все меньше возможностей для свободного выбора нужного языкового средства, и это способствует автоматич­ ности выбора. Отмечается, что стереотип - это прагмати­ ческое средство наиболее целесообразного исторического применения языка, существующее как автоматизированный и всеобщий переносчик смысла. Стереотип усреднен исто­ рически из индивидуальных решений и находится в рамках нормативной грамматики [419, с. 223].

Различают фонематический, словесный, фразовый и тек­ стовый стереотип [301, с. 80-98]. Их объединяет то, что все они являются своеобразным пусковым звеном в разверты­ вании соответствующего фрагмента речевой программы.

Различие между ними заключается в том, что с повышени­ ем уровня стереотип становится менее «жестким», получа­ ет большее разнообразие форм воплощения6.

Фонематический стереотип, действующий на фонетиче­ ском или графическом уровне, приводит к тому, что у чело­ века формируется определенное представление о фонеме (или графеме) на основе многократного употребления раз­ личных аллофонов или рукописных (типографских) вари­ антов графем (аллографов). Точно также на этом уровне для устной речи создается типичное представление о компонен­ те интонации - интонеме [301, с. 90].

Суть словесного стереотипа заключается в том, что для выражения одного и того же понятия в пределах достаточ­ 7 Ср. высказывание Р. Г. Пиотровского о том, что текст строится на сочетании плана (детерминированная составляющая), действующего на коротких текстовых цепочках, и вероятностного прогнозирования - на длинных текстовых дистанциях [429, с. 55].

Глава 3. Системы обработки связных текстов но узкой предметной области и одной и той же ситуации используются одни и те же слова. Это связано с тем, что со­ временная массовая ком муникация породила тенденцию языкового развития - концентрирование речевых средств, основывающееся на принципе экономной затраты сил. К он­ центрация речевых средств заключается в накоплении и си­ стематизации лексических единиц в закрепленных значе­ ниях и речевых отрезков вокруг определенных тематиче­ ских линий [304, с. 32-33]. П о этому принципу строятся лексические минимумы для чтения специальной литерату­ ры, отбираются лексические единицы в базовые языки [131, с. 290-291;

279, с. 58-59].

Проблема фразового стереотипа подробно рассматрива­ лась выше в ходе анализа динамических аспектов текста.

Такие стереотипичные фразовые построения были назва­ ны шаблонами, синтаксическими моделями и т.п. Как по­ казывают исследования психологов и лингвистов, с возрас­ том запоминание материала все больше зависит от грамма­ ти ч еско й структуры. Т аки е структуры о казы ваю тся в сознании наиболее устойчивыми при разного рода оговор­ ках и нарушениях нормальной речевой-деятельности [214, с. 71;

304, с. 33]. С точки зрения речевой деятельности, фра­ зовая стереотипичность - это не что иное, как вызов из па­ мяти некоторой общей схемы развития мысли, а, следова­ тельно, и его речевого оформления [174, с. 46]. Стереоти­ пичность на фразовом уровне приводит к тому, что в каждой фразе текста актуализация одних лексических элементов не­ избежно сопровождается автоматизацией выбора других элементов [425, 73].

Приведенные рассуждения о сути и роли абзаца в общей структуре текста, специфике абзацев подтверждают нали­ чие сверхфразовой стереотипичности. В процессе обучения ж изни и языку в нашем сознании откладываются вероятно­ стные модели, представления о синтаксических структурах самых различных текстов: научных, публицистических, ху­ дожественных, деловых, поэтических и т.д. Стереотипич­ ность на фразовом и сверхфразовом уровнях приводит к 110 Основы искусственного интеллекта для лингвистов тому, что внутри одного вида письменной речи индивиду­ альные различия авторов становятся несравненно менее значимыми, чем различия между разными видами письмен­ ных текстов, созданных одним и тем же автором [263, с. 113].

Можно полагать, что такая сверхфразовая стереотипич­ ность в определенной степени связана с фактом, установ­ ленным специалистами разного профиля: порождение тек­ ста и его восприятие осуществляются не отдельными эле­ ментами, а определенными блоками, квантами, в которых сохранена связь с предшествующим и заложено на некото­ рое семантическое расстояние последующее [44;

174, с. 50;

250, с. 82]. Так как основу речевой деятельности составляет прежде всего вещественное содержание речи, то сама ком­ муникация дискретна и деление текста на какие-то фраг­ менты основано на логическом слепке с действительности путем обобщения человеческого опыта научного познания [95, с. 3;

318;

380, с. 72].

Так как внеш няя и внутренняя деятельность человека имеют одинаковое общее строение и вторая из них проис­ ходит из первой, указанное деление текста на составляю­ щие вполне согласуется с данными биологии и психологии вообще [206, с. 101]. Доказано, что поведение животных сла­ гается из таких элементарных актов, как «убегание», «пре­ следование», «поиск пищи», «ухаживание» и т.д. Притом каждый вид животных обладает своим набором стандарт­ ных двигательных актов, которые, комбинируясь, произво­ дят разнообразные формы сложного поведения [31, с. 29].

Кроме того, также доказано, что сложные формы умствен­ ной деятельности слагаются из элементарных информаци­ онных процессов [208, с. 481;

261, с. 83], различные комби­ нации которых дают различные формы деятельности: игру в шахматы, решение задач, распознавание образов, перевод текстов и т.п. Объединение таких кирпичиков информации в единое целое возможно в общем виде на основе трех прин­ ципов: вероятностном, когда элементы объединяются в це­ лое с помощью вероятностных распределений;

детермини­ рованном, когда порядок следования кирпичиков одиозна Глава 3. Системы обработки связных текстов чен и строго задан;

и, наконец, вероятностно-алгоритмичес­ ком, когда в процессе объединения учитываются связи как случайные, так и детерминированные (алгоритмические).

Вероятностно-алгоритмические процессы объединения со­ ставляющих в единое целое выступают как основной тип процессов объективного мира [309, с. 45]. Как уже отмеча­ лось, наличие вероятностны х составляю щ их в сложных структурах объективного мира позволяет таким системам меняться, развиваться во времени.

Возвращаясь к проблеме организации текста из блоков, квантов смысла, следует отметить, что такое деление зави­ сит от типа текста (научный, художественный и т.п.), его направленности, намерений автора, его языковых знаний и целого ряда других факторов. В процессе изучения семан­ тической структуры текстов вы делялись его различны е смысловые фрагменты. Это - текстовые элементы и бло­ ки-мотивы [382, с. 209], и фрагменты [253, с. 200], и аспек­ ты [94, с. 7], и сгустки [323, с. 132], и абзацы. К ак было от­ мечено выше, абзац как смысловой «квант» и как «застыв­ ший» с и н та к с и ч ес к и й ш аблон м ож ет бы ть п р и н я т за минимальны й логико-сем антический ком понент текста.

Наличие абзацев в тексте помогает его лучшему усвоению, позволяет строить различные варианты одного и того же со­ держания в зависимости от намерений автора и цели созда­ ния текста.

Пока остается неясным, каким образом вероятность ис­ пользуется при формировании единого текста из абзацев.

Для научных текстов, например, в силу преобладания в них логических составляющих выстраивание абзацев происхо­ дит стереотипно, по очень ограниченному числу схем. Ху­ дожественные тексты характеризуются более свободным расположением абзацев [317;

318]. В то же время высказы­ ваются предположения, что каждому автору'в пределах оп­ ределенного функционального стиля свойственны опреде­ ленные структуры абзацев и типы их взаимного расположе­ ния [87, с. 55;

162, с. 258;

305, с. 222;

322, с. 216]. Конечно, в каждом тексте, кроме стереотипичных элементов, обуслов­ 112 Основы искусственного интеллекта для лингвистов ленных социолингвистически, можно обнаружить и инди­ видуальные авторские особенности. Для писателя и поэта они являются средством выражения их «сугубо индивиду­ альной мысли, т.е. аффективного и эстетического содержа­ ния» [19, с. 28], а ученый использует их как индивидуаль­ ное средство усиления связности и логичности текста. В научных текстах индивидуальность авторского почерка мо­ жет заключаться в умении автора владеть слогом в рамках определенного научного стиля (использование образных, субъективно-оценочных средств, разговорной лексики и конструкций и т.п.), в индивидуальном предпочтении того или иного синонимичного варианта, предъявляемого сти­ лем, в особенностях слога, связанных с возрастом, регио­ нальными различиями, и т.д. Однако основная особенность индивидуального в речи заключается в том, что оно огра­ ничено нормами стиля и в целом за каждым текстом стоит система языка.* Что касается текстового стереотипа, то в работе [301] это понятие разработано в отношении восприятия готового текста и текстовой стереотип здесь понимается как «особый самоорганизующийся психологический механизм, способ­ ствующий укладыванию поступающей из текста разнооб­ разной инф ормации в русло разветвленной структурно­ смысловой схемы в условиях взаимодействия ретроспекции и антиципации» [301, с. 93]. В процессе порождения текста под текстовым стереотипом будем понимать особый само­ организующийся психологический механизм, позволяющий строить неоднозначные структурно-смысловые схемы, фор­ мулы текста. Число формул текста, выбираемых для пере­ дачи одного и того же содержания, зависит как от типа тек­ ста, так и от языковых знаний его автора. Последние, как уже отмечалось, зависят от социального опыта личности.

Глава 3. Системы обработки связных текстов 3.4. Теоретические аспекты порождения текстов 3.4.1. Необходимость порождения текстов с помошью компьютера Ш ирокое внедрение компьютеров во все сферы челове­ ческой ж изни привело к значительному возрастанию объе­ ма хранимой в их памяти текстовой информации. Это - кни­ ги, статьи, словари, параллельные тексты, рефераты, патен­ ты и т.д. П оявилась возможность значительно ускорить процесс извлечения написанной на разных естественных языках информации из огромных текстовых массивов. По прежнему существует три вида компьютерных систем, по­ зволяющих извлекать такого рода данные:

• системы автоматического перевода, аннотирования и реферирования текстов;

• авт о м а ти зи р о в а н н ы е и н ф о р м а ц и о н н ы е систем ы (АИС) и информационно-поисковые системы;

• экспертные системы.

Как показывает опыт эксплуатации таких систем (см., на­ пример, [1;

88;

13;

14;

71;

26;

197;

108;

169;

226;

227;

181;

188;

215;

378;

430]), их эффективность во многом зависит оттого, насколько удачно построена функциональная модель того естественного языка (или его отдельной части), на котором работает система. Пока, к сожалению, нет системы, в кото­ рой функционировала бы полная модель какого-либо есте­ ственного языка. Все операции с текстами в таких системах (перевод, реферирование, аннотирование, поиск, порожде­ ние) проводятся по следующему принципу: от значения от­ дельного слова - к смыслу отдельного предложения - к содержанию всего текста. Но известно, что смысл предло­ жения не равен сумме значений входящих в него слов, а со­ держание текста не есть сумма смыслов предложений. Н е­ обходимы новые подходы к построению подобных систем, 114 Основы искусственного интеллекта для лингвистов которые бы моделировали деятельность человека при твор­ ческой работе с текстом. П оиск таких подходов связан с большими трудностями. Объясняется это огромной слож­ ностью языка, а также тем, что создание формализованных моделей функционирования языка является синтетической задачей, в реш ении которой должны принимать участие лингвисты, психолингвисты, психологи, логики, философы, кибернетики, математики и литературоведы.

При изучении языка с целью построения формализован­ ных моделей его функционирования можно выделить три следующих аспекта:

• изучение и описание языка безотносительно к процес­ сам, которые связывают его с автором и адресатом;

• изучение языка в плане его анализа с точки зрения по­ лучателя речи;

• изучение языка в плане его построения с точки зрения производителя речи.

Многие исследователи отмечают, что при теоретическом изучении языка эти три аспекта представляют относитель­ но равный интерес, а создание действующих систем обра­ ботки текстов требует детальной разработки последних двух аспектов.

В последние десятилетия много работ посвящено про­ блемам анализа связного т е к с т а [58;

77;

79;

96;

112;

135;

141;

155;

164;

237;

243;

282;

370]. Не будем останавливаться на их подробном анализе. Однако отметим, что среди множества исследований по лингвистике текста лишь небольшое чис­ ло посвящено синтезу связного текста. Именно такие и с­ следования позволяю т проверить работоспособность тех правил и исключений, которые действуют на разных уров­ нях языка в процессе его ф ункционирования. Процедура именно такого «моделирования с последующей проверкой (верификацией) адекватности модели необходима в линг­ вистике потому, что лингвист не имеет непосредственного дела с предметом своего исследования - языком» [204, с. 44].

В процессе построения порождающих моделей выявляются те отношения, которые существуют между системой языка, Глава 3. Системы обработки связных текстов его нормой, узусом и непосредственно речью [278, с. 85 96]. Подход к тексту с точки зрения его порождения позво­ ляет раскрыть также некоторые закономерности, остающи­ еся в тени при иных методах анализа.

Не менее значимо познание законов динамической орга­ низации текстов и с чисто практической точки зрения.

Развитие разных систем автоматизированного управления требует использования более привычного для человека есте­ ственного языка общения с компьютером. Одной из важ­ нейших задач при этом является поиск таких речевых ме­ ханизмов, которые позволяют системе излагать некоторое за­ ранее заданное содержание. Знание подобных механизмов позволит построить машинные алгоритмы анализа и син­ теза разного рода стандартных описаний, таких, например, как тексты формул изобретений, гражданских и военных де­ ловых документов, метеосводок, ведомостей, отчетов, опи­ саний различной продукции и т.п. [135;

140;

216;

329;

330;

331;

332;

399;

402;

415]. Как отмечает А.П. Ершов, уклонить­ ся от рассмотрения проблем синтеза таких текстов с помо­ щью компьютера нет никакой возможности [115].

С практической точки зрения важно и еще одно приме­ нение знаний законов организации текстов. В последнее де­ сятилетие значительно увеличилось количество информа­ ции, подлежащей усвоению, вырос объем технической ра­ боты, которую необходимо вы полнить для организации процесса обучения как в школе, так и в вузе. Исследователи отмечают, что знание законов построения текстов, умение выделять в них главное и второстепенное поможет, с одной стороны, учащимся правильно и быстро постигать содер­ жание текстов, а с другой - методистам создавать принци­ пиально новые учебники и учебные пособия.

Кроме того, знание законов построения художественных текстов, которое можно получить, строя системы обработ­ ки таких текстов, приблизит человека к познанию природы творчества, а умение вы являть в художественном тексте главное и второстепенное, общечеловеческое и индивиду­ альное будет способствовать созданию искусствометрии 116 Основы искусственного интеллекта для лингвистов науки о количественной оценке произведений искусства (ху­ дожественных произведений).

Проблемами порождения текстов с помощью компью­ теров исследователи занимаются с начала 70-х годов XX в.

За прошедшие годы по этим проблемам написано много книг, сборников и статей в разных журналах. Вопросам ге­ нерации текстов уделяют много внимания известные жур­ налы, например, «Artificial Intelligence Review», «Compu­ tational Linguistics», «International Journal of H um an-C om pu­ ter Studies», «Information Processing in M ind and Machine» и др. Ежегодно в разных странах мира по этим проблемам про­ водятся крупные конференции. Известные университеты мира занимаю тся исследованиям и порож дения текстов.

Среди них Эдинбургский университет в Ш отландии, М ас­ сачусетский, Стэнфордский, Колумбийский университеты в США, М онреальский университет и университет в Торон­ то (Канада) и др. Тем не менее, до сих пор нет единой тео­ рии текстообразования, и она все еще находится в стадии становления [330;

399;

402;

405;

415;

423;

435;

439].

Известны многочисленные подходы к процедуре порож­ дения текстов с помощью компьютера. Зависят они в ос­ новном от того, для какой цели создается текст. Большая часть таких алгоритмов связана с созданием разного рода диалоговых систем, используемых в обучении и информа­ ционном обслуживании. Следующая группа разработок име­ ет целью проверку лингвистических и литературоведческих теорий порождения предложения, абзаца, текста. Значитель­ ная часть работ направлена на генерацию практических до­ кументов (текстов метеосводок, статистических отчетов о занятости населения, инструкций по регулировке механиз­ мов и т.д.) или небольших газетных сообщений о текущих событиях [140;

329;

402;

435;

439]. Обзор и анализ идей, пред­ лагаемых в соответствующих работах, показывает, что при существующих подходах к порождению текста никогда не будет создана единая теория его порождения.

Первая причина, позволяющая обосновать сказанное, связана с неоднозначностью определения в исследованиях Глава 3. Системы обработки связных текстов по текстообразованию понятия «текст». Создатели диало­ говых систем под текстом понимают любую реплику, состо­ ящую из нескольких слов или, максимум, двух-трех пред­ ложений. Исследователи, создающие системы генерации метеосводок и статистических отчетов, понимают текст как некоторую таблицу с заполняемыми словами, строками и столбцами. Для создающих инструкции текст - это цепоч­ ка не связанных между собой предложений, относящихся к одному объекту.

Особо следует остановиться на исследованиях, модели­ рующих некоторые лингвистические теории текстообра зования. Пытаясь как можно полнее учесть все факторы, влияющие на содержание и структуру будущего текста, уче­ ные стремятся максимально учесть в своих моделях особен­ ности не письменного текста, а речи - условий диалога, зна­ ний, мнений, настроений автора текста, его потенциально­ го слушателя, а также их взаимоотношений [415;

392;

400;

401;

405]. Однако доказано, что текстовая коммуникация, рассчитанная на массового адресата (а цод текстом, как пра­ вило, понимаю т публицистические, научно-технические, художественные тексты), имеет преимущественно односто­ ронний характер, и в ней не должны в полной мере учиты­ ваться перечисленные выше факторы [39]. В то же время в таких работах вполне обоснованно сформулированы общие требования, которые должны предъявляться к системам, порождающим текст в его общепринятом понимании, т.е.

текст как сообщение, объективированное в виде письмен­ ного документа, литературно обработанное в соответствии с типом этого документа, состоящее из ряда особых единств, объединенных разными типами лексической, грамматиче­ ской и логической связи и имеющее определенный модаль­ ный характер и прагматическую установку [91, с. 18].

Установлено, что процесс текстообразования состоит из двух этапов: стратегического и тактического [159, с. 121].

На первом этапе должно быть принято решение о том, «что написать», а на втором - «как написать». Результатом вы­ полнения первого этапа должно стать семантическое пред­ 118 Основы искусственного интеллекта для лингвистов ставление будущего текста, результатом второго - текст в язы­ ковой форме.

Существует огромное число способов задания семанти­ ческой структуры предложения и текста. Если говорить о представлении семантической структуры связного текста, следует отметить, что все известные способы такого пред­ ставления имеют один общий недостаток - они не исходят из заранее заданного содержания, темы будущего текста.

Много нерешенных проблем возникает и при реализа­ ции второго этапа. В частности, наиболее активно обсуж­ даются следующие вопросы: что является основной семан тико-синтаксической единицей текста;

что должно высту­ пать в качестве лексической единицы ;

как лексические единицы связываются в единое содержание;

каковы крите­ рии выбора лексических единиц из словаря;

на каком этапе порождения должен подключаться словарь, и т.д.

Отвечая на эти и другие вопросы, связанные с создани­ ем текстов, писатели, поэты, литературоведы, психологи и психолингвисты строят различные схемы процесса созда­ ния текстов.

3.4.2. Психолингвистические теории порождения речи В современной теории речевой деятельности выделяют два направления [335, 36]:

• психолингвистическое исследование внутренних, пси­ хофизиологических условий порождения и восприятия ре­ чевого высказывания;

• психосоциальное изучение условий порождения и вос­ приятия речевого высказывания.

Такой подход объясняется принятым в российской пси­ холингвистике положением о принципиальной структурной изоморфности внутренней (умственной) и внешней деятель­ ности человека [206, с. 94-101]. А это значит, что процесс Глава 3. Системы обработки связных текстов формирования внутренних механизмов речи обуславлива­ ется особенностями внешних механизмов речи. Точнее, при выборе тех или иных речевых вариантов важна не только обстановка (условия), в которой протекает речь, но и мо­ дель этой обстановки, которая формируется у участников общения. Причем модели одного и того же акта общения у разных коммуникантов могут отличаться по полноте [335, с. 21].

Не рассматривая детально существующие гипотезы по­ рождения речевого высказывания (полные обзоры даны в [205;

258, с. 314-376]), выделим то общее, что существует во всех таких теориях.

Преобразуя (применительно к письменной монологической речи) приведенную в работе [17, с. 46] схему, получим струк­ туру речевого акта, которая представлена на рис. 3.5. И з схе­ мы видно, что процесс порождения высказывания (текста) многоуровневый. Как показывают современные психолинг­ вистические исследования, каждый из этих уровней имеет свои единицы и свои правила соединения единиц более низкого уровня в единицы более высокого уровня [17, с. 48].


Под мотивом (первый блок рис. 3.5) в психологии пони­ мается некоторый объект, который отвечает определенной потребности и который, в той или иной форме отражаясь субъектом, определяет его деятельность [206, с. 190]. М оти­ вом для формирования речевого высказывания может быть либо требование, либо обращение информационного харак­ тера, либо, наконец, желание четче сформулировать свою собственную мысль [213, с. 188]. Таким образом, мотив это некоторая прагматическая установка, на фоне которой зарождается содержание текста. Выяснение конкретных ус­ ловий и путей возникновения мотива в нашу задачу не вхо­ дит. Следует лиш ь отметить, что «мотив, мотивация выска­ зывания всегда лежит за пределами речи и, следовательно, за пределами психолингвистической модели порождения высказывания... Следовательно, потребность и удовлетво­ ряющий предмет - мотив - глубоко социальные компонен­ ты деятельности, сразу переносящие нас из сферы интим­ 120 Основы искусственного интеллекта для лингвистов ной, психической, в сферу социальной активности...» [335, с. 23-24].

Под речевой интенцией (см. рис. 3.5) понимается опреде­ ленная мысль или смысл, который говорящий хочет пере­ дать слушателю. Всякое высказывание начинается с очень смутной мысли, которая в сознании обозначена лиш ь в са­ мой общей схематической форме. Эта мысль представлена в виде общего замысла, общей схемы того, о чем хочет ска­ зать автор. Именно эта схема должна воплотиться в развер­ нутое высказывание [213, с. 191]. На данном этапе порож­ дения появляется образ результата [17, с. 46] или некоторая модель будущего [31, с. 288-290].

Рис. 3.5. Общая структура речевого акта (для письменной речи) Многообразна трактовка следующего этапа порождения высказывания - этапа внутреннего программирования. По существу - это процедура, последовательно сужающая круг Глава 3. Системы обработки связных текстов речевых высказываний, возможных в том или ином конкрет­ ном случае. На этом этапе вырабатывается план действия [17, с. 46-47] или конструируется замысел речи [116, с. 15]. При этом будущий текст представляется в виде иерархической сети тем, подтем, субподтем и микротем [116, с. 15]. Последова­ тельность таких смысловых слоев образует семантическую глубину текста7.

Так как каждый текст создается с определенными це­ лями и мотивами в определенных условиях (социальных и физических), то его можно рассматривать, с одной сторо­ ны, как некую копию, оттиск, модель действительности, сформировавшуюся в сознании субъекта в соответствии с целями его деятельности, а с другой - как некоторую сво­ еобразную проекцию индивидуальной языковой системы субъекта, откорректированную условиями данной комму­ никативной ситуации [341, с. 50]. Поэтому важно выяснить те внешние и внутренние факторы, которые влияют на од­ нозначное развертывание замысла высказывания. К ним можно отнести:

• доминирующую мотивацию, т.е. тот основной мотив, который вызывает к жизни речевое высказывание;

• обстановочную афферентацию - совокупность всех внешних воздействий данной обстановки на организм, ко­ торые вместе с исходной мотивацией более полно инфор­ мируют его о выборе нужного в данный момент действия.

Это и есть то, что создает субъективную (внутреннюю) мо­ дель внешнего мира, «нервную модель обстановки или мо­ дель прошедшего-настоящего» [31, с. 288];

• вероятностный опыт. Внешняя среда, создающая об­ становочную афферентацию, настолько сложна, что невоз­ можно однозначно выделить определяющие ее факторы.

Поэтому, в целом, можно считать, что окружающая среда имеет вероятностную структуру. Тогда и организм, сопри­ касаясь со средой, живя в ней, отражает в памяти вероятно­ 7 Ср. отмеченные ниже (с. 127-133) высказывания писателей и поэтов о смысловых опорных вехах и о развертывании плана произведения.

122 Основы искусственного интеллекта для лингвистов стную структуру среды и использует полученные данные для прогноза предстоящей ситуации и корректировки своего поведения. При этом как бы создается вероятностная мо­ дель будущего. Такое моделирование будущего возможно «только путем экстраполирования того, что выбирается шаг за шагом из информации в текущей ситуации, из “свежих следов” непосредственно предшествующих восприятий, из всего прежнего опыта индивида, наконец, из тех активных проб и прощ упываний, которые относятся к классу д ей­ ствий, до сих пор чрезвычайно суммарно обозначаемых, как “ориентировочные реакции...”» [31, с. 290]. Такое соотно­ шение между ситуациями в прошлом и следующими за ними реакциями, «отпечатавшимися», «отложившимися» в памя­ ти человека, и составляют основу «вероятностного прогно­ зирования» [355, с. 8]. Эта мысль в последние годы находит широкое подтверждение в работах физиологов, психологов, психолингвистов и лингвистов;

• задачу действия. Смысл этого фактора состоит в том, чтобы сравнить возможные в данной ситуации варианты выс­ казываний с задачей действия и отобрать из них один, наи­ более вероятный. Т.е. задача действия должна быть представ­ лена в виде целого ряда ограничений на возможные выска­ зывания;

• значимость того или иного действия для общего пове­ дения. Этот фактор действует лишь в экстремальных ситуа­ циях, когда в основе выбора того или иного действия лежит не ж изненный опыт, заставляющий организм выдавать ту или иную реакцию в ответ на уже встречающиеся ранее ре­ акции, а жизненная важность действия8.

Реализация всех этих факторов осуществляется в два эта­ па (две фазы) [17, с. 136-137]. На первом этапе строится «внутриречевая схема, смысл которой адекватно передает 8 Естественно, что мы по-разному конструируем высказывание, если видим пожар рядом с нами («Пожар! Горим!») или рассказываем о пожаре гораздо позже этого события («Иду. Тепло. Тихо. Смотрю, откуда-то идет дым. Присмотрелся, вижу... » и т.д.).

Глава 3. Системы обработки связных текстов существенное для субъекта содержание мысленного пред­ ставления» [17, с. 137]. При этом используются ситуацион­ ные значения так называемых «внутренних слов» [80, с. 380— 381] и ситуативно-смысловой синтаксис. Ины ми словами, это —фаза внутренней речи или опосредование мысли во внут­ реннем слове [80, с. 380-381].

На втором этапе общая речевая схема начинает развора­ чиваться за счет использования правил глубинного синтак­ сиса. П олучаю тся смы словы е структуры, наполненн ы е объективными общеязыковыми (независимо от конкретного языка) значениями [17, с. 137;

206, с. 459]. Это - семанти­ ческая фаза или опосредование в значениях внешних слов [80, с. 380-381].

Процесс перехода от первой фазы ко второй равносилен двустороннему процессу «говорения» и «слушания» или дей­ ствия и контроля [17, с. 130-137]. Точнее, можно говорить о взаимодействии на данном этапе порождения высказывания трех компонентов: эталона, контроля и реализации. На эта­ пе «говорения» мысленное содержание представляется во внутренних словах, т.е. строится некоторая модель будущего высказывания. Далее эта модель сравнивается с некоторым эталоном. В качестве эталона здесь выступает мысленное со­ держание (или «образ результата»), В результате такого конт­ роля («слушания») выясняется полнота и адекватность мо­ дели эталону. Если результат контроля не превосходит неко­ торой допустимой величины, выполняется переход ко второй фазе программирования. Если результат контроля окажется отрицательным, то происходит перестройка программы бу­ дущего высказывания и возврат на контроль.

На второй фазе программирования производится сравне­ ние смысла найденного набора внутренних слов с объектив­ ным языковым значением этого набора (вновь выполняется контроль). «При отрицательной оценке, т.е. в случае, если система объективных значений неполно передает смысловое содержание, последнее подвергается дальнейшему разверты­ ванию, т.е. дополнительному продуцированию и сличению, и так до окончательной положительной оценки. Положитель­ 124 Основы искусственного интеллекта для лингвистов ная оценка означает, что смысловое развертывание окончено и что далее должно производиться лексико-грамматическое развертывание по правилам внешнего языка» [17, с. 130].

Рассматривая более подробно отдельные детали процес­ са внутреннего программирования, необходимо остановить­ ся на следующем. Каждое «внутреннее слово» представляет собой комбинацию некоторых кодов, «универсальных пред­ метных кодов» или «кодов образов и схем» [205, с. 266]. В процессе выполнения первой фазы программирования каж­ дой такой единице в зависимости от ситуации, жизненного опыта, исходного задания, жизненной важности сообщения и других факторов приписывается определенная смысловая нагрузка [17, с. 130-131]. П ри этом все содержание буду­ щего высказывания представляется в виде системы «преди­ кативных высказываний» [17, с. 47;

80, с. 364]. На второй фазе программирования устанавливается функциональная иерархия этих единиц. При таком «семантическом синтак сировании» программа будущего высказывания опирается на определенные смысловые «вехи», в качестве которых вы ­ ступают такие компоненты высказывания, как субъект, пре­ дикат или объект [205, с. 159]. В процедуру установления иерархии входят включение, перечисление, сочленение и не­ которые другие операции.

Следующий этап формирования речевого высказывания состоит из двух психически автономных механизмов: порож­ дения конкретной синтаксической конструкции и ее лексиче­ ского наполнения (см. рис. 3.5). Этот этап наименее всего ис­ следован и опирается в основном на дедуктивные построе­ ния [205, с. 205].

В общем виде первая часть данного этапа может быть представлена в виде следующих шагов [116;

205, с. 205-217].

1. Переход от полученной программы к некоторому на­ бору опорных единиц. В качестве таких опорных единиц выступают предикативные пары. Здесь уже устанавливает­ ся иерархия таких предикативных пар.


2. Распределение семантических признаков и установле­ ние порядка расположения между элементами предикатив­ Глава 3. Системы обработки связных текстов ной пары. При этом происходит перекодирование преди­ кативной пары в сочетание определенного числа единиц конкретного естественного языка. Порядок расположения таких единиц неоднозначен и определяется целым комплек­ сом причин. Исследования показывают, что такой поря­ док во многом зависит от первого слова высказывания [205, с. 208-210].

3. Задание лексико-грамматических признаков элементам высказывания и построение синтаксической схемы выска­ зывания. Иными словами, создается некоторая «система вза­ имосвязанных синтаксических характеристик некоторых слов» [205, с. 210]. Какому-то исходному слову9 (например, первому слева) дается при порождении письменного выска­ зывания следующая информация: место в общей синтакси­ ческой схеме высказывания;

морфологические признаки ко­ довой единицы в зависимости от ее места в высказывании;

полный набор семантических признаков (он может отли­ чаться от набора семантических признаков, присутствую­ щих на первом шаге за счет синтагматического влияния од­ них признаков на другие соединения);

полный набор гра­ фических признаков.

Конкретный набор этих признаков зависит от типа язы ­ ка. Выбор той или иной синтаксической схемы во многом определяется вероятностью тех или иных типов граммати­ ческих конструкций в языке и в данном акте речи, ибо ре­ чевые навыки человека во многом зависят от микроузуса се­ мьи, возрастной и профессиональной группы говорящего (пишущего) и целого ряда других факторов [343, с. 10]. П ри­ чем этот стохастический принцип действует в первые мо­ менты порождения высказывания, а в дальнейшем возни­ кает внутренняя организация высказывания. К ак отмечают многие исследователи, степень стохастичности во многом зависит от уровня развития речевых умений говорящего.

9Под словом на этом этапе понимается совокупность всех семантиче­ ских, грамматических и других признаков, присущих кодовой единице (это еще не звуковое или графическое слово).

126 Основы искусственного интеллекта для лингвистов Имея вышеуказанный набор признаков, с опорой на пер­ вое слово подбирается второе слово высказывания, затем с опорой на первые два слова - третье и т.д. Происходит как бы прогнозирование синтаксической структуры высказы­ вания. Здесь, как и на других этапах порождения, действует механизм контроля. После нахождения каждого следующе­ го слова [17, с. 130;

174, с. 46] строящаяся схема сопоставля­ ется с выработанной ранее программой высказывания, ситу­ ацией и другими внеязыковыми факторами. Если при таком сопоставлении нарушается какое-либо заданное условие, возможны три варианта действий [17, с. 130-136]:

• необходимо приписать исходному слову другую син­ таксическую характеристику;

• пересмотреть сделанный прогноз - приписать выска­ зыванию (предложению) другую синтаксическую схему (дру­ гую иерархию предикативных пар);

• пересмотреть структуру всей программы (заново сде­ лать этап внутреннего программирования).

Выше речь уже шла о факторах, влияющих на выбор той или иной синтаксической схемы при порождении выска­ зывания (тип языка, вероятность употребления конструк­ ции в языке и речи и т.п.). Помимо этого, выбор определен­ ной конструкции или определенного слова будет зависеть также и от следующих причин:

- социолингвистического фактора. Выбор единиц выска­ зывания определяется социальными отношениями говоря­ щего и слушающего (начальник - подчиненный);

- аффективного фактора, не зависящего от формы речи или ф ункционального стиля, но индивидуализирующего высказывание в зависимости от эмоционального состояния говорящего;

- функционально-стилистического фактора, конкретизи­ рующего высказывание в зависимости от его цели, формы речи (устная - письм енная и др.) и тех стилистических средств, которые определяются ситуацией;

- индивидуальных отличий в речевом опыте. Сюда может быть отнесена и степень знания языка говорящим;

Глава 3. Системы обработки связных текстов —речевого контекста. В этом случае выбор единицы вы­ сказывания определяется тем, какая конструкция (или сло­ во) была употреблена до этого самим говорящим или его собеседником.

Таким образом, завершая обзор психолингвистических точек зрения на весь процесс порождения высказывания и его отдельные этапы, данную процедуру можно представить в виде следующего алгоритма (рис. 3.6).

3.4.3. Писатели и поэты о процессе создания своих произведений Основные этапы создания художественного произведения писателем или поэтом с трудом поддаются прямому объектив­ ному анализу. Нет и единого, универсального ключа к раскры­ тию секретов такой работы. Поэтому о том, как создавалось то или иное произведение, можно судить, в основном, по:

• объективным материалам: рукописям, планам, наброс­ кам, эскизам, этюдам, записным книжкам и т.д.;

• субъективным материалам: вы сказы ваниям писате­ лей и поэтов о своей работе, сделанным для печати, дру­ зей и т.д.

Рассмотрим подробнее материалы второго типа.

Сейчас опубликовано огромное число высказываний из­ вестных писателей и поэтов разных времен и стран о своей работе. Поэтому, чтобы каким-либо образом систематизи­ ровать хотя бы часть таких материалов, воспользуемся при­ веденной далее общей схемой (см. рис. 3.6) процесса по­ рождения высказывания. Определим, все ли ее части отра­ ж ены в вы сказы ваниях авторов произведений, с одной стороны, и нет ли среди таких высказываний какого-либо зве­ на, не отраженного в упомянутой схеме, с другой стороны.

Чаще всего признания авторов произведений относятся к проблеме мотивации основной идеи произведения. Сре­ ди мотивов писатели и поэты называют случаи из собствен ^ Начало Основы искусственного интеллекта для лингвистов Развертывание Замена Представление Сравнение мысли во внутренних исходной мысли в модели внутриоечсвую слов наборами определенном будущего схему в виде семантиче­ высказывания с наборе признаков совокупности ских признаков «образом (создание «образа внутренних слов внешних слов (создание модели результата») результата»

будущего высказывания) да 7\ / Распределение Задание Развертывание Сравнение полу­ / Результат \ семантических лексико-грам­ программы ченного набора матических признаков между / \ высказывания в семантических нет / прсвосхо- \ признаков элементами виде иерархии — признаков с — / \ дит вели- предикативных первому слову предикативных «образом \ чину р? / пар и установ­ высказывания пар результата»

/ ление порядка их \ \/ исследования Глава 3. Системы обработки связных текстов Рис. 3.6. Общая схема порождения высказывания с психолингвистической точки зрения 5 Основы искусственного интеллекта для л и н гв и ст о в 130 Основы искусственного интеллекта для лингвистов ной жизни, рассказы знакомых или сочинения других пи­ сателей и поэтов, изучение специальной литературы (исто­ рической, научно-технической и др.), обдумывание обще­ ственных и материальных проблем и многое другое.

Однако, как правило, литературный замысел не возни­ кает сразу легким, ясным и развернутым, он всегда какое то время формируется, развивается. Очевидно, в течение этого периода и происходит создание образа результата, представление исходной мысли в виде набора каких-то ос­ новных признаков. И.А. Бунин по этому поводу писал: «Я часто приступаю к своей работе, не только не имея в голове готовой натуры, но и как-то еще не обладая вполне пони­ манием ее окончательной цели. Только какой-то самый об­ щий смысл брезжит во мне, когда я приступаю к ней... Не готовая идея, а только самый общий смысл произведения владеет мной в этот начальный момент - лишь звук его, если можно так высказаться... Только, повторяю, самое главное какое-то общее звучание всего произведения дается в са­ мой начальной фазе работы...» [32, с. 18].

Следующий шаг в создании произведения - составление его развернутого плана. При этом каким-то образом должно быть зафиксировано движение смысла. Как отмечал А. Блок:

«Всякое стихотворение - покрывало, растянутое на остри­ ях нескольких слов. Эти слова светятся как звезды. И з-за них существует стихотворение. Тем оно темнее, чем отда­ леннее эти слова от текста» [259, с. 321]. Собираясь писать «Холстомера», JI.H. Толстой записывал план будущего про­ изведения в следующем виде: «Севастополь. Венгерская вой­ на, раны. Трусость, храбрость. Зависть (к верховым). П ре­ зрение. Офицер. Откормился пшеницей. В деревню. Про­ дали (огороднику) красноярцу. Захром ал. Не виноват.

Мужику. Выкормил. Я вас видел. Помер.... Ж ить тут...» [244, с. 176]. О том, насколько сложна задача составления плана произведения, отмечали многие писатели и поэты. Н апри­ мер, JI.H. Толстой писал об этом так: «Я тоскую и ничего не пишу, я работаю мучительно. Вы не можете себе предста­ вить, как мне трудна эта предварительная работа глубокой Глава 3. Системы обработки связных текстов пахоты того поля, на котором я принужден сеять. Обдумать и передумать все, что случится со всеми будущими людьми предстоящего сочинения, очень большого, и обдумать ми льон возможных сочетаний, для (того) чтобы выбрать из них 1/1000000, ужасно трудно. И этим я занят» [267, с. 260].

О том, что план нужен не только при создании крупных произведений, отмечают и поэты. Поэты и писатели боль­ шое внимание уделяют ритму произведения. Так, В.П. К а­ таев говорил: «В основе писательства лежит некий импульс, идея, мысль, которая возникает из анализа действительно­ сти... Затем эта мысль обрастает подробностями, облекает­ ся в художественную форму. Появляется ритм - основа ин­ дивидуального почерка...» [259, с. 26]. Дж. Голсуорси пи­ сал: «...Что такое ритм, как не таинственная гармония между частями и целым, создающая то, что называется жизнью;

точное соотношение, тайну которого легче всего уловить, наблюдая, как жизнь покидает одушевленное создание, ког­ да необходимое соотношение частей в достаточной мере нарушено. И я согласен с тем, что это ритмическое соотно­ шение частей между собой и частей и целого - иными сло­ вами, жизненность - и есть единственное свойство, неот­ делимое от произведения искусства» [259, с. 34].

Подчеркивая тот факт, что при создании произведения первым в действие вступает определенный ритм, В. Маяков­ ский писал: «Откуда приходит этот основной гул - ритм неизвестно. Для меня это - всякое повторение во мне зву­ ка, шума, покачивания или даже вообще повторение каж­ дого явления, которое я выделяю звуком» [228, с. 100].

Высказывания поэтов и писателей позволяют в опреде­ ленной степени откорректировать приведенную выше схе­ му порождения высказывания (см. рис. 3.6), введя в нее блок порождения ритма. Весь процесс создания текста с точки зрения писателей и поэтов может быть представлен в виде принципиального алгоритма на рис. 3.7.

Весьма немногочисленны высказывания писателей и по­ этов о конкретном воплощении планов в виде последова­ тельности предложений и слов.

Основы искусственного интеллекта д я лингвистов л Рис. 3.7. Принципиальный алгоритм создания текста с точки зрения писателей и поэтов Глава 3. Системы обработки связных текстов 3.4.4. Литературоведы о строении текстов Как уже отмечалось, одним из источников познания за­ конов создания художественных произведений являются рукописи произведений, планы их создания, наброски, эс­ кизы, этюды к произведениям, наконец, записные книжки писателей и поэтов. Обработку таких материалов осуществ­ ляют, как правило, литературоведы. Другой источник по­ знания - сами художественные произведения. Путем их анализа литературоведы познают законы построения про­ изведений. По результатам исследований литературоведа­ ми написано большое число научных работ. В основном они касаются конкретны х произведений отдельных авторов.

Обобщающие работы затрагивают лиш ь общую структуру произведений.

Большой интерес для нас представляют композиция про­ изведения и его фабула10. Предположения о том, что лите­ ратурные произведения состоят из некоторых повторяю­ щихся инвариантных функций, высказывались еще в нача­ ле XX в. Б. Томашевским и В. Ш кловским. Так, все новеллы К онан-Д ойля о Шерлоке Холмсе В. Ш кловский рассмат­ ривал как один сюжет, состоящий из девяти типовых мо­ ментов («ожидание», «приход клиента», «улица», «выезд на место преступления» и др.). Причем каждый из моментов может реализоваться по-разному [381, с. 125-142]. В. Пропп [303] анализируя 100 русских сказок, выделил в них 31 сю­ жетную функцию («отлучка», «выведывание» и др.) и семь действующих лиц, которые «реализовывали» эти функции («вредитель», «даритель», «помощник», «царевна», «отпра­ витель», «герой», «ложный герой»). Схожие элементы были выделены и при анализе белорусских, румынских и других сказок [82;

308]. Аналогичные выводы были сделаны и при анализе детективных новелл, басен, отдельных прозаиче­ 1 Композицией называется расположение материала внутри произведе­ ния. Фабула - это динамическое воплощение композиции, раскрытие со­ бытий в частностях и деталях вместе с их мотивировкой.

134 Основы искусственного интеллекта для лингвистов ских и поэтических произведений. Некоторые исследова­ тели выдвигают более сильное предположение. Они счита­ ют, что в достаточно большом количестве случаев в разных произведениях одного автора говорится (в каком-то смыс­ ле) одно и то же. Иными словами, в произведениях любого автора можно выделить некоторые постоянные функции и несколько типичных персонажей. Их взаимные комбина­ ции, перестановки в пространстве и во времени в различ­ ных ситуациях дают разные произведения. Если принять эту точку зрения, остается неясным, а что же объединяет эти составные элементы в единое целое?

К ак отмечают многие исследователи, первым фактором, объединяющим отдельные элементы текста в единое целое, является ритм. Под ритмом в художественном произведе­ нии понимается единство двух характеристик: равномер­ ность, закономерность повторения некоторых явлений тек­ ста и постоянные художественно выразительные отклоне­ ния от этой равномерности. Ритм прозы могут составлять слоговой объем кол он ок-си н тагм, акцентная структура внутрифразовых и межфразовых зачинов и окончаний [95, с. 131], ритм сюжетных построений, ритм системы образов персонажей [361, с. 185-186] и ряд других характеристик.

Следовательно, не только писатели и поэты, но и литерату­ роведы доказывают необходимость включения в общую схе­ му порождения высказывания специального блока опреде­ ления ритма, являющегося одним из организаторов текста, как единого целого.

Вторым организующим фактором, объединяющим в еди­ ное целое сюжетные функции действующих лиц, является фабула. Писатель и поэт по-своему объединяют сюжетные функции и действующих лиц для выражения именно своей мысли, для достижения своих целей. Поэтому единых пра­ вил, единого алгоритма такого объединения быть не может.

Это верно отметил украинский писатель и литературовед Олексий Кундзич: «... я всю жизнь приглядываюсь к этим правилам и не могу заметить в них никакой устойчивости:

то и дело один или другой художник (писатель, поэт) на­ Глава 3. Системы обработки связных текстов рушает их, и, главное, теоретики не только не бранят ху­ дожников за это, а еще и выводят из их творчества новые правила жанра, в назидание всем их исследователям, но только последователи усвоят новое правило, как является новый озорной талант и говорит, что оно не обязательно. Так все и идет круговоротом, а точнее сказать - лестницей» [193, с. 71].

М ожно предполагать, что процедура построения фабу­ лы идет методом последовательных приближений. Сначала берется какая-то одна (из многих возможных) последова­ тельность сюжетных функций и действующих лиц. Когда она начинает наполняться конкретными предложениями и словами, оказывается, что получается не то, что хотел вы ­ разить автор. Первоначальная последовательность меняет­ ся, вновь наполняется лексикой и т.д. Эту процедуру под­ тверждают высказывания писателей и поэтов, исследования литературоведов и специалистов по творчеству.

Следуя окончательно определенной схеме, необходимо ос­ тановиться на том, как литературоведение трактует вопросы использования авторами произведений конкретных синтак­ сических конструкций и слов. К ак отмечает В.А. Звегинцев [125, с. 12], «литературоведение неизменно задавалось вопро­ сами о том, как сделаны те или иные художественные произ­ ведения, но вопрос о том, из чего сделано это как, всегда представлялся туманным и поэтому обычно выносился за скобки литературоведческих исследований». И это действи­ тельно так. Поэтому в чисто литературоведческих исследо­ ваниях трудно четко выделить те эксплицитные факты, ко­ торые определяют выбор той или иной конструкции, того или иного слова.

Все индивидуально стилевые характеристики писателей и поэтов проявляются в их произведениях независимо от их воли. Используя те или иные слова, автор, с одной, сторо­ ны, воспроизводит только то из общего языка, что он усво­ ил по данной теме, а с другой стороны, творит новое каче­ ство - и в способе употребления известного, и в создании неизвестного. Совокупность всех индивидуальных характе Основы искусственного интеллекта д я лингвистов л Рис. 3.8. Принципиальный алгоритм порождения художественного текста с точки зрения литературоведов Глава 3. Системы обработки связных текстов ристик текста настолько специфична, что даже далекий от стилистики человек может безошибочно узнать по несколь­ ким фразам или словам автора произведения.

Учитывая все сказанное о строении художественного произведения, его порождение с точки зрения литературо­ ведов может быть представлено в виде принципиального алгоритма на рис. 3.8.

3.4.5. Лингвистические аспекты проблемы порождения текста Большая часть лингвистической литературы как у нас в стране, так и за рубежом, посвящена организации отдельно­ го предложения. И только в последние годы в рамках линг­ вистики текста появились исследования, анализирующие структуру и процесс порождения текста.

Бурно развиваю щ аяся лингвистика текста охватывает широкий круг проблем, связанных с организацией текста.

Это и определение его основных единиц, средств и условий связи между ними, роль темы и ремы в организации содер­ жания текста, строение отдельных типов и видов текстов.

Однако лингвистических теорий порождения текста не су­ ществует. Общий вывод, который может отразить современ­ ная лингвистика, Р.Г. П иотровский сформулировал так:

текст является результатом взаимодействия порождающей системы языка и нормы, а также внешней ситуации;

эле­ менты заполнения порождаются системой и нормой языка, появление в тексте ключевых единиц стимулируется немо дулируемой и непредсказуемой ситуацией [279, с. 118].

Рассмотрим несколько подробнее отдельные лингвисти­ ческие аспекты проблемы порождения текста. Вслед за пси­ холингвистами, лингвисты также приходят к мысли, что в процессе разворачивания общей темы текст членится на иерар­ хическую сеть подтем, субподтем и микротем [253, с. 25-31].

Они отмечают, что дискретный процесс текстообразования 138 Основы искусственного интеллекта для лингвистов строится на принципе обратной связи и сводится к поиску по программе, сложившейся в мозгу автора на основе его субъективно-социального опыта. При этом выбор последу­ ющих элементов (слова, словосочетания, высказывания) детерминируется не жесткой целью следования языковых единиц, а осмысленным выбором из ряда элементов, из со­ вокупности форм [174, с. 46].



Pages:     | 1 | 2 || 4 | 5 |   ...   | 7 |
 





 
© 2013 www.libed.ru - «Бесплатная библиотека научно-практических конференций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.