авторефераты диссертаций БЕСПЛАТНАЯ БИБЛИОТЕКА РОССИИ

КОНФЕРЕНЦИИ, КНИГИ, ПОСОБИЯ, НАУЧНЫЕ ИЗДАНИЯ

<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ


Pages:     | 1 |   ...   | 8 | 9 || 11 | 12 |   ...   | 45 |

«[Эта страница воспроизводит соответствующую страницу книги, подготовленную издательством] Владимир Андреевич Успенский ...»

-- [ Страница 10 ] --

Следуя идее Колмогорова, падежом в статье объявлен класс эквивален тности, то есть класс эквивалентных между собой сущностей. При первой попытке, предпринятой в 1, этими сущностями являются состояния, в ко торых могут пребывать предметы;

при второй, предпринятой в 2, | набо ры слов с пропуском;

при синтетической третьей попытке, предпринятой в 3, | пары, каждая из коих состоит из состояния предмета и набора слов с пропуском. Разумеется, для каждого из трёх названных разрядов сущностей К определению падежа... / Послесловие: III. Дальнейшая дискуссия должно быть предварительно введено надлежащее понятие эквивалентности, что и делается соответственно в 1, 2 и 3.

А. А. Зализняк указывает: «...Как и названия других грамматических ка тегорий, термин «падеж» может употребляться в двух смыслах: а) конкрет ный падеж (например, именительный, родительный и т. д.), которому в дан ном языке противопоставлены другие конкретные падежи;

б) падеж вообще (= грамматическая категория падежа), т. е. грамматическое явление, состо ящее в том, что в данном языке противопоставляются два или более конкрет ных падежей» [ОПТ, с. 54{55]. Применяя это различение к понятиям нашей статьи, приходим к следующему пониманию: каждый класс эквивалентности есть конкретный падеж, или падежная граммема, она же граммема падежа;

категорию же падежа даёт всё разбиение на классы эквивалентности в целом.

Т, что падежную граммему | как и всякую граммему! | можно толко о вать как класс эквивалентности, само по себе достаточно очевидно. Ведь лю бую граммему можно интерпретировать как класс всех словоформ, облада ющих данной граммемой. (Таким образом, каждый падеж представлен сово купностью своих словоформ.) Однако такую интерпретацию затруднитель но использовать с целью определения или, лучше сказать, объяснения какой бы то ни было граммемы и, в частности, граммемы падежа. Действитель но, понятие словоформы уже включает в себя весь набор присущих данной словоформе граммем, так что при определении граммемы через эквивалент ность словоформ неизбежно возникает порочный круг. Попытка же отвлечь ся от грамматического значения словоформы и сосредоточиться только на её внешней форме (хотя бы и наполненной номинативным значением) также не может привести к успеху, поскольку в пределах одной и той же лексемы различные (т. е. несущие различные граммемы) члены её парадигмы могут совпадать внешне. Поэтому для определения понятия ‘падеж’ следует исполь зовать не понятие ‘словоформа’, а понятие ‘сегмент’, означающее единицу внешней стороны текста. (А. А. Зализняк в [РИС, 1.2] различает несколько смыслов слова «слово»;

понятие ‘сегмент’ представляет собою один из них.) Хотя в моей статье о падеже термин «сегмент» и не встречается, в ней ис пользуется, как видно из её текста, именно понятие ‘сегмент’.

Как же разъясняется понятие падежа в лингвистической традиции?

Посмотрим, что говорит о падеже авторитетный словарь [ЛЭС]. На с. читаем:

Падеж | грамматическая категория имени, выражающая его синтаксиче ские отношения к другим словам высказывания или к высказыванию в целом, а также всякая граммема этой категории (конкретный падеж).

Не противоречит ли эта цитата из [ЛЭС] сделанному выше заявлению, что до Колмогорова не существовало никакого определения падежа? Хотя словарь вышел десятилетиями позже колмогоровского определения, только Языкознание что приведённая словарная дефиниция отражает давние представления, и по добные формулировки встречались и прежде. Например | на с. 120 первого тома академической «Грамматики» [ГРЯ]:

...Падеж выражает синтаксические функции существительного, устанавли вая отношение существительного в данной его падежной форме к другим членам предложения.

Всё дело в том, что и формулировка из [ЛЭС], и формулировка из [ГРЯ], и все им подобные не являются определениями в собственном смысле сло ва;

скорее, они суть указания на то, к какому разряду категорий относится категория падежа. Конечно, это вопрос терминологии: при желании и эти указания можно назвать определениями;

но и тогда будет ясно, что это опре деления совсем иного рода, нежели колмогоровское и примыкающие к нему.

Эти формулировки не дают возможности ввести в рассмотрение ни одной падежной граммемы, а тем самым и очертить категорию падежа в целом как совокупность своих граммем. «...Строгого определения падежа в тради ционных лингвистических сочинениях нет», | констатирует А. А. Зализняк [ОПТ, с. 54].

Поэтому мы и называем определение Колмогорова первым подлинно на учным определением падежа. Именно это определение, развитое в статье «К определению падежа по А. Н. Колмогорову», взято за основу и подвергнуто дальнейшему уточнению в монографии А. А. Зализняка [РИС], в её 2.2{2.6;

этот же материал используется при осуществлённом тем же автором в его статье [ОПТ] сравнительном анализе имеющихся описаний падежных систем разных языков.

Другой, но тоже достаточно строгий подход к определению понятия ‘па деж’ изложен в 3 статьи А. В. Гладкого [ПФО]. Пользуюсь случаем выра зить солидарность с высказанным в преамбуле этой статьи мнением о наду манности и даже вредности противопоставления «традиционной лингвисти ки» и «структурной лингвистики» (характерно, что последний термин ныне практически сошёл со сцены) и о том, что главная задача внедрения мате матических методов в языкознание состоит не столько в создании новых понятий, сколько в уточнении традиционных.

IV. Какие есть падежи в русском языке?

Ответ на этот вопрос колеблется от шести падежей школьных учебни ков до одиннадцати падежей монографии [РИС]. Вряд ли можно предъявить общепризнанный список русских падежей. (Да что говорить о падежах: нет и общепризнанного списка родов, и даже общепризнанного списка знаков препинания.) Традиционная школьная грамматика формирует свои шесть падежей при помощи простого и логичного механизма. Она задаёт именным лексемам К определению падежа... / Послесловие: IV. Какие есть падежи в русском языке?

стандартные вопросы, а падежи возникают как ответы на эти вопросы: кто?

что? | именительный;

кого? чего? | родительный и т. д.

Далее к традиционным шести падежам добавляются ещё два: количе ственно§отделительный, или партитив, нередко называемый также 2§м ро дительным, и местный, или локатив, нередко называемый также 2§м пред ложным. Существование этих двух падежей, как правило, не вызывает воз ражений даже у лиц, далёких от лингвистических штудий: достаточно при вести примеры типа напиться чаю для партитива и в лесу для локатива. Но вот все ли имена имеют формы партитива и локатива? Этот вопрос ожи влённо обсуждался на занятиях семинара НПММвЯ. Я отстаивал ту точку зрения, что все. Мне казалось (и кажется), что такое представление даёт бо лее простую модель. Меня поддержал П. С. Кузнецов, заявивший, что даже собственные имена могут иметь форму партитива. В качестве доказатель ства он привёл сон, виденный им в молодости. В этом сне его приятель по имени Серёжа был сервирован на столе в виде блюда, а другой персонаж сна спрашивал сновидца (т. е. Кузнецова): «Хочешь Серёжи?».

В своей монографии [РИС], в 2.8, А. А. Зализняк анализирует словофор мы солдата, часовых и т. п. в сочетаниях типа три солдата, три часовых.

Он обнаруживает, что все эти словоформы принадлежат особому падежу, и заявляет: «Принятая выше процедура выделения падежей обязывает нас признать, таким образом, существование 9-го падежа». Этот падеж он на зывает, вслед за В. В. Виноградовым, счётной формой, отмечая, однако, что сам Виноградов в одном месте называет счётную форму счётным падежом.

Итак, девять падежей русского языка не вызывают сомнений. Далее [РИС, 2.9] А. А. Зализняк вводит в рассмотрение ещё два падежа: «ждатель ный» и «включительный». Однако, как указываает А. А. Зализняк, существо вание этих падежей зависит от решений, которые должны быть приняты относительно 1) допустимости или недопустимости некоторых оборотов речи;

2) совпадения или несовпадения некоторых лексем;

3) тождества или различия некоторых смысловых отношений.

Ждательный падеж представлен однопадежным рядом именных слово форм, встречающихся в оборотах жду мать, жду результата, жду поезд, жду поезда, жду письмо, жду письма и им подобных. Здесь существенно, что в этом ряду отсутствуют такие обороты, как жду матери и жду результат, которые объявляются недопустимыми;

если же допустить такие обороты, то ждательного падежа не возникнет, а окажется просто§напросто, что после глагола ждать всегда возможен как винительный, так и родительный па деж (по аналогичной причине в схеме Зализняка отсутствует лишительный падеж, о чём будет сказано ниже). Ждательный падеж не возникнет и в том случае, если признать актуальным почти стёртое ныне архаичное смысловое различие между оборотами вида ждать письмо и ждать письма;

в этом слу Языкознание чае также окажется, что после глагола ждать возможен как винительный, так и родительный падеж | но не по произволу, как в предыдущем случае, а в зависимости от степени определённости предмета;

именно, для определён ного предмета будет употребляться винительный падеж, а для неопределён ного | родительный (возможно, что «письмо» со значением определённости и «письмо» со значением неопределённости целесообразно считать разными лексемами).

Теперь о включительном падеже. В этом падеже предположительно пре бывают словоформы солдаты и зятья в контекстах идти в солдаты и взять в зятья. Слово «предположительно» означает, что включительный падеж воз никает при выполнении следующих двух предположений. Предполагается, во-первых, что в указанных контекстах словоформы солдаты и зятья при надлежат тем же лексемам, что и словоформы солдат и зять, | а не осо бым лексемам, означающим нерасчленённые совокупности солдат или зятьёв;

при этой противоположной точке зрения падеж имён в рассматриваемых контекстах окажется винительным или именительным. Предполагается, во вторых, что присутствующие в указанных контекстах смысловые отношения тождественны тем, которые присутствуют в словосочетаниях идти в армию и взять в семью;

при отрицании этого второго предположения (но принятии первого) падеж имён оказывается именительным (причём именительным с предлогом!).

В моей статье в качестве возможного был назван также «лишительный падеж». В схеме А. А. Зализняка он отсутствует. Дело в том, что определе ние А. А. Зализняка, помимо многочисленных технических улучшений, отли чается от определения, изложенного в моей статье, в одном принципиальном пункте. А именно, определение Зализняка запрещает считаться самостоя тельным падежом такому претенденту на это звание, у которого множест во соответствующих этому претенденту сегментов является объединением других множеств, каждое из которых образует свой собственный падеж.

А множество сегментов «лишительного падежа» как раз и является объеди нением двух множеств, одно из которых отвечает винительному падежу, а другое родительному: в приведённом в [РИС] в качестве примера контексте «я не узнал...» вместо многоточия можно по произволу поставить слово как в винительном, так и в родительном падеже. Таким образом, определение Зализняка содержит дополнительную запретительную клаузулу, но зато да ёт более экономную картину: вместо того, чтобы вводить в рассмотрение двенадцатый, лишительный падеж, достаточно сказать, что в определённых контекстах можно употреблять как винительный, так и родительный падеж.

Отличия определения А. А. Зализняка от определения моей статьи пере числены в [РИС]: см. подстрочное примечание 12 на с. 42.

Параграф 2.9 из [РИС] называется «Вопрос о существовании других па дежей». Он завершается следующим заявлением:

К определению падежа... / Послесловие: V. Упоминаемая литература Вполне возможно, что внимательный анализ фактов позволит обнару жить и другие подобные явления в системе русского склонения, могущие привести к формированию новых падежей.

V. Упоминаемая литература [ГРЯ] Грамматика русского языка. | Т. 1. | М.: Изд§во АН СССР, 1952. | 720 с.

[ЛЭС] Лингвистический энциклопедический словарь. | М.: «Сов. энциклопедия», 1990. | 685 с.

[ОПТ] Зализняк А. А. О понимании термина «падеж» в лингвистических описа ниях I // [ПГМ]. | С. 53{87.

[ПГМ] Проблемы грамматического моделирования / Ответственный редактор А. А. Зализняк. | М.: «Наука», 1973. | 262 с.

[ПФО] Гладкий А. В. Попытка формального определения понятий падежа и рода существительного // [ПГМ]. | С. 24{53.

[РИС] Зализняк А. А. Русское именное словоизменение. | М.: «Наука», 1967. | 370 с.

К определению части речи в теоретико§множественной системе языка Мы исходим из следующей теоретико§множественной концепции языка (см. доклад О. С. Кулагиной «Об одном способе определения лингвистиче ских понятий» в Ђ 3 настоящего Бюллетеня 1 ).

Дано некоторое множество. Конечные упорядоченные строки, соста вленные из элементов множества, называются кортежами. Задаётся не которое множество кортежей;

кортежи, принадлежащие, называют ся отмеченными. (Лингвистическая интерпретация этих понятий состоит в том, что элементы множества интерпретируются как слова языка, при чём «стол», «столы», «столу» и т. д. считаются разными словами;

отмеченные кортежи интерпретируются как фразы языка. Поскольку эта интерпретация довольно неопределённа, то все делаемые ниже высказывания о применении рассматриваемой формальной системы понятий к реальным языкам следует воспринимать как приблизительные.) Два элемента x и y (из ) назовём S§эквивалентными, если выполняются следующие два утверждения:

Опубликовано в продолжающемся сборнике: Бюллетень Объединения по проблемам ма шинного перевода. | Ђ5 | М.: [I МГПИИЯ], 1957. | С. 22{26.

1 © См.: Бюллетень Объединения по проблемам машинного перевода. | Ђ3. | М.:

1957. | С. 1{18. Публикация содержит изложение доклада, который О. С. Кулаги на сделала на заседании Объединения 21 февраля 1957 г. Расширенная версия ста тьи О. С. Кулагиной была опубликована в следующем году в «Проблемах кибернети ки»: О. С. К у л а г и н а. Об одном способе определения грамматических понятий на базе теории множеств // Проблемы кибернетики / Под ред. А. А. Ляпунова. | Вып. 1. | М.: Физматгиз, 1958. | С. 201{214. Однако и первоначальная публикация в «Бюллетене» не потеряла интереса, так как в ней отражены как вопросы слушате лей, задававшиеся докладчику в течение доклада (см. с. 2, 9{10, 11, 12, 14) и после него (см. с. 16{18), так и выступления в прениях (см. с. 18{19).  К определению части речи в теоретико§множественной системе языка 1. Для любого отмеченного кортежа t1 t2 : : : tk x tk+1 tk+2 : : : tm кортеж t1 t2 : : : tk y tk+1 tk+2 : : : tm также является отмеченным.

2. Для любого отмеченного кортежа u1 u2 : : : ul y ul+1 ul+2 : : : un кортеж u1 u2 : : : ul x ul+1 ul+2 : : : un также является отмеченным.

Множество разбивается на непересекающиеся классы S§эквивалентных друг другу элементов. Эти классы называются семействами. Семейство, со держащее элемент a, обозначается S(a), так что утверждения «x и y явля ются S§эквивалентными» и «S(x) = S(y)» равносильны. (В русском языке семейство слова «столу» состоит из всех существительных мужского рода в дательном падеже единственного числа.) Для дальнейшего задание множеств и оказывается недостаточным.

Необходимо ещё указать, что некоторые слова суть формы друг друга, т. е.

ввести в рефлексивное, симметричное и транзитивное двуместное отно шение «x и y суть формы друг друга». Тогда распадается на множества слов, являющихся формами друг друга. Каждое такое множество называет ся окрестностью. Окрестность элемента a (т. е. окрестность, содержащая a) обозначается `(a). Сказать, что x и y суть формы друг друга, всё равно, что сказать `(x) = `(y). Поэтому вместо того, чтобы вводить отношение «быть формами друг друга», можно сразу задать разбиение множества на окрестности.

Мы хотим теперь при помощи изложенной системы понятий определить, что такое ‘часть речи’. (Выражаясь более осторожно, мы хотим выразить в теоретико§множественных терминах такое формальное понятие, которое можно было бы с некоторым приближением интерпретировать как часть ре чи.) Нужно определить, таким образом, что значит «два слова принадлежат к одной и той же части речи».

Предлагаем следующее определение. Два элемента x и y назовём Т§экви валентными, если имеют место следующие два утверждения:

1. Для любого элемента x из `(x) т. е. для любой формы элемента x — и для любого отмеченного кортежа t1 t2 : : : tk x tk+1 tk+2 : : : tm найдутся такие — элементы t1 ;

t2 ;

: : : ;

tm ;

y, что:

а) ti `(ti ), т. е. ti есть форма элемента ti (при i = 1;

2;

: : : ;

m);

Языкознание б) y `(y), т. е. y есть форма элемента y;

в) кортеж t1 ;

t2 : : : tk y tk+1 tk+2 : : : tm является отмеченным.

2. Для любого элемента y из `(y) т. е. для любой формы элемента y и — для любого отмеченного кортежа u1 u2 : : : ul y ul+1 ul+2 : : : un найдутся такие — элементы u1 ;

u2 ;

: : : un ;

x что:

а) ui `(ui ), т. е. ui есть форма элемента ui (при i = 1;

2 : : : ;

n);

б) x `(x), т. е. x есть форма элемента x;

в) кортеж u1 u2 : : : ul x ul+1 ul+2 : : : un является отмеченным.

Множество разбивается на непересекающиеся классы Т§эквивалентных друг другу элементов. Эти классы называются типами. (В терминах доклада О. С. Кулагиной разбиение на типы можно определить как производное от разбиения на окрестности). Понятие типа и предлагается в качестве одного из формальных приближений к понятию части речи.

Оказывается, однако, что из принадлежности двух элементов к одному и тому же семейству не следует логически их принадлежность к одному и тому же типу (можно построить искусственный пример языка, в котором найдутся два элемента из одного семейства, но из разных типов). В реаль ных языках, с другой стороны, всякие два элемента из одного семейства входят, по§видимому, и в один тип. Это свойство приходится дополнительно постулировать в виде требования п р а в и л ь н о с т и языка.

О п р е д е л е н и е. Назовём язык правильным, если всякие два элемента, принадлежащие к одному семейству, принадлежат и к одному типу.

И. И. Ревзин предложил другой подход к определению части речи. Два элемента x и y назовём R§эквивалентными, если существует цепочка элемен тов r1 ;

r2 ;

: : : ;

rn, обладающая следующими свойствами:

1) при всяком i элементы ri и ri+1 принадлежат либо одной и той же окрестности, либо одному и тому же семейству;

2) r1 = x;

rn = y.

Множество распадается на классы R§эквивалентных элементов, кото рые будем называть разделами.

Т е о р е м а 1. Для правильных языков каждый раздел целиком содер жится в каком§либо типе, т. е., если два элемента принадлежат к одному и тому же разделу, то они принадлежат к одному и тому же типу.

В русском языке раздел, содержащий существительное, совпадает с ти пом существительного (поскольку все существительные во множественном числе образуют одно семейство, независимо от рода;

существительные «стул»

и «лампа» можно соединить цепочкой «стул» | «стулья» | «лампы» | «лам па»).

Во французском языке раздел уже типа (существительные разных ро дов входят в один тип, но в разные разделы, поскольку существительные во множественном числе распадается на разные семейства по родам;

это, в К определению части речи в теоретико§множественной системе языка свою очередь, происходит благодаря тому, что прилагательные во множе ственном числе имеют форму рода).

Т е о р е м а 2. Для правильных языков производное разбиение от раз биения на разделы совпадает с разбиением на типы.

Эта теорема доказывается при помощи следующей леммы:

Л е м м а. Пусть рассматриваемый язык | правильный. Пусть дан от меченный кортеж t1 t2 : : : tk x tk+1 tk+2 : : : tm и пусть элемент y принадлежит к тому же разделу, что и x. Тогда в окрестности `(y) существует такой элемент y, что кортеж t1 t2 : : : tk y tk+1 tk+2 : : : tm | отмеченный.

Доказательство леммы | индукцией по длине цепочки, соединяющей x и y.

О п р е д е л е н и е. Назовём язык согласованным, если для любых элемен тов x и y из непустоты пересечения `(x)S(y) вытекает непустота пересече ния S(x) `(y). Свойство согласованности фигурирует в докладе О. С. Ку лагиной в качестве одного из определяющих свойств простого языка.

Т е о р е м а 3. Всякий согласованный язык правилен.

Французский язык, по§видимому, согласован (по крайней мере, в приме нении к существительным). Русский язык | несогласованный, ибо `(стул) S(лампы) = {стулья} S(стул) `(лампы) = (пусто) Если желать сделать язык согласованным (хотя бы в применении к су ществительным), то можно пойти по одному из следующих путей:

1) считать, что прилагательные во множественном числе имеют «скры тую» форму рода (считать, таким образом, что «большие» в выражении «большие манёвры» и «большие» в выражении «большие надежды» | разные слова, т. е. омонимы);

тогда пересечение `(стул) S(лампы) будет пусто;

2) считать, что каждое существительное имеет формы во всех родах (пополнив язык такими «идеальными» словами, как «стуло», «стула», «ламп», «лампо»);

тогда S(стул) `(лампы) = {ламп}:

Т е о р е м а 4. Для согласованных языков элементы x и y тогда и толь ко тогда принадлежат к одному разделу, когда пересечение `(x) S(y) не пусто ср. определение «класса» в докладе О. С. Кулагиной.

Совещание по статистике речи С 1 по 4 октября 1957 г. в Ленинграде происходило совещание, посвя щённое статистике речи, созванное Секцией речи Комиссии по акустике АН СССР и Ленинградским университетом. В совещании приняли участие так же представители МГУ и МГПИИЯ, НИИ Министерства радиотехнической промышленности, Институтов физиологии и языкознания АН СССР, Лабо ратории электромоделирования ВИНИТИ АН СССР, Военно§воздушной ака демии им. А. Ф. Можайского и ряда других организаций.

Совещание открылось вступительным словом Л. Р. З и н д е р а. В цен тре внимания совещания было два основных круга вопросов: 1) применение статистических исследований устной и письменной речи к разработке про блем, выдвигаемых теми разделами современной техники, которые связаны так или иначе с хранением, обработкой и передачей информации;

2) соотно шение структурных и статистических методов в языкознании.

Доклад «Значение статистических исследований речи для техники» сде лал Л. А. В а р ш а в с к и й. Докладчик указал основные направления в ис следовании устной речи, развитие которых существенно для техники теле фонной (проводной и непроводной) связи. К таким направлениям относится прежде всего исследование (в том числе статистическое) физических харак теристик звуковых и электрических сигналов, служащих для передачи речи.

В этой связи представляется целесообразным развитие общей теории сигна лов, как это подчеркнул в своём докладе «Энергетические характеристики интервалов корреляции электрических сигналов, в частности, речевых сиг налов» Н. А. Ж е л е з н о в.

Другой круг проблем, указанный Л. А. Варшавским, касается восприя тия устной речи, передаваемой по каналам связи. Качество канала изме ряется его артикуляцией, под которой в технике связи понимают процент правильно воспринятых звуковых единиц, переданных по каналу. Для опре деления артикуляции используются специальные звукосочетания, которые и Опубликовано в журнале: Вопросы языкознания. | 1958. | Ђ1. | С. 170{173.

Совещание по статистике речи передаются по каналу. Уже при составлении таблиц таких звукосочетаний необходимо учитывать статистические соотношения. Но наибольший инте рес представляет вопрос о связях между артикуляциями звуковых единиц разного порядка: отдельных звуков, слогов, морфем, слов и т. п. При этом решающую роль играет изучение влияния, которое оказывает на восприятие данного звука восприятие окружающих его звуков. Это влияние обусловлено вероятностной зависимостью (корреляцией), имеющей место между сосед ними звуками.

Изучению подобной корреляции между соседними элементами речи (т. е.

следующими друг за другом звуками, словами и т. п.) был посвящён доклад Л. Р. З и н д е р а «О лингвистической вероятности». Как отмечалось в док ладе, каждый элемент речи несёт определённую информацию (в ряде случаев весьма большую) о непосредственно следующем за ним элементе. Лингвисти ческие вероятности нулевого порядка (т. е. абсолютные вероятности появле ния в речи тех или иных элементов) не совпадают, как правило, с лингви стическими вероятностями первого порядка (т. е. условными вероятностями появления одних элементов после других). Лингвистические вероятности как нулевого, так и высших порядков подразделяются на лексические (вероятно сти появления тех или иных лексем), грамматические (вероятности появле ния тех или иных грамматических форм) и звуковые (вероятности появления тех или иных звуковых единиц). Лингвистические вероятности оказывают значительное влияние на восприятие и, в конечном счёте, понимание устной речи (в большей степени это относится к грамматическим и в меньшей к звуковым вероятностям). Доклад Л. Р. Зиндера сопровождался демонстраци ей трёх таблиц звуковых вероятностей первого порядка для русского языка.

Были показаны составленные на основе статистического обследования тек стов общим объёмом около 90 000 фонем отдельные таблицы для сочетаний звуков внутри слова, на стыке слов и сводная таблица.

Доклад Е. В. П а д у ч е в о й «Статистическое исследование структуры слога (в связи с применением методов теории информации)» был посвящён сравнительному анализу сочетаний фонем внутри слога и на стыке слов. По мнению докладчицы, лишь сочетания фонем внутри слога могут составить предмет фонологического изучения;

сочетания на стыке слогов | скорее следствие словообразования. Естественно ожидать, что на стыке слогов бу дут ослабляться ограничения, накладываемые на сочетаемость фонем вну три слога. В то же время, как показала докладчица на примере испанско го языка, простое деление сочетаний фонем на возможные и невозможные оказывается недостаточным;

к более удовлетворительным результатам (для русского языка) приводят вероятностные соображения.

Из перечисленных в докладе Л. А. Варшавского проблем важнейшими яв ляются, по§видимому, проблемы компрессии, связанные с наиболее эффек тивным использованием каналов связи. Одним из способов повышения про пускной способности канала служит уменьшение времени, затрачиваемого на Языкознание передачу одного звука;

встаёт вопрос, до каких пределов можно сокращать длительность звука. Как показал в своих докладах «Статистика длительно сти глухих согласных и их восприятие» и «Статистика характерных участков звучания гласных звуков русского языка» М. Ф. Д е р к а ч, акустический состав звуков неоднороден во времени. Поэтому, если из временнго проме о жутка, в течение которого произносится некоторый звук, выделить мень ший интервал и воспроизвести звук только в этом интервале, то восприятие может нарушиться. Участники совещания имели возможность прослушать магнитофонную запись слога та, искусственно полученного из слога са по средством «отрезания» начала звука с (в то же время, если в слоге ас отре зать конец звука с, то нарушения восприятия не произойдёт).

Более радикальным путём повышения пропускной способности канала связи явилось бы выделение минимальной информации, необходимой для раз личения единиц устной речи (например, фонем), и передача по каналу только этой минимальной информации. (При этом становится очевидной ведущая роль исследований по выяснению семантической нагрузки речевых единиц, прежде всего фонологических исследований.) Имеется в виду помещение на передающем конце линии связи анализирующего устройства, способного раз личать фонемы и превращающего их в последовательности дискретных сиг налов, а на приёмном конце | синтезирующего устройства, способного пре вращать воспринятые сигналы в звуки. Принципиально более сложным яв ляется создание различающего устройства. Одним из возможных вариантов такого устройства явилось бы устройство, способное определять фонетиче скую принадлежность звука по его спектрограмме.

Новый метод, отличающийся от обычно применяемого формального ана лиза, предложила Л. А. Ч и с т о в и ч в докладе «Применение статистиче ских методов к определению фонетической принадлежности индивидуально го гласного звука». Л. А. Чистович отказалась от поисков в спектрограмме инвариантов, которые позволили бы точно определить фонетическую при надлежность звука;

её идея состоит в том, что ответ на вопрос о фонети ческой принадлежности звука может быть дан не в категорической форме, а с определённой вероятностью. Рассматриваются огибающие спектрограмм разных звуков, произнесённых разными лицами. Для каждого звука произ водится усреднение этих огибающих (разных у разных лиц);

так получается основная кривая для данного звука. Эта основная кривая рассматривает ся как сигнал, а реальная огибающая (для конкретного произносителя) как сигнал, искажённый некоторым шумом, внесённым произносителем. Что бы определить фонетическую принадлежность конкретного произнесённого звука, вычерчивается огибающая его спектрограммы и определяются укло нения её от основных кривых. При этом вычисляются вероятности того, что данная конкретная огибающая получилась искажением той или иной основ ной кривой или, что то же самое, того, что данный конкретный звук есть звук а, о, у и т. д. Метод Л. А. Чистович может быть без изменения приме Совещание по статистике речи нён и к определению фонетической принадлежности звуков связной речи с учётом влияния на их восприятие восприятия соседних звуков.

В докладе «Применение статистических методов в экспериментально§фо нетическом и психологическом изучении речи» В. А. А р т ё м о в расска зал о работах, проводимых в Лаборатории экспериментальной фонетики МГПИИЯ.

Для техники телеграфной связи (проводной и непроводной) большое зна чение имеет статистическое исследование письменной речи, в частности вы числение энтропии распределения сочетаний букв. Как сообщили в своём докладе «Статистика трёхбуквенных сочетаний русского печатного текста»

В. А. Г а р м а ш и Д. С. Л е б е д е в, в Лаборатории по разработке науч ных проблем проводной связи АН СССР был произведён подсчёт частот трёхбуквенных сочетаний, встречающихся в отрывке из романа Л. Н. Тол стого «Война и мир» объёмом в 30 000 букв (пропуск между словами также считается «буквой» и обозначается дефисом «§»). В докладе были приведены частоты некоторых сочетаний, причём наиболее частыми оказались сочета ния «§и§» (частота 82 · 104 ) и «§не» (частота 71 · 104 ). Вычисление соответ ствующей энтропии показало, что подходящим кодированием трёхбуквенных сочетаний объём текста может быть сокращён в среднем в 5=3 раза. Роль статистических методов в языкознании не определяется исключи тельно потребностями технических приложений. Доклад «Соотношение структурных и статистических методов в языкознании» сделал И. И. Р е в з и н, подчеркнувший, что было бы большой ошибкой недооценивать зна чение вероятностных и статистических соображений для развития самой лингвистической теории (хотя бы потому, что структура языка, по мнению докладчика, в значительной степени обусловлена избыточностью языка как кода;

эта избыточность вызвана в свою очередь тем, что язык по необходи мости должен быть помехоустойчивым). Как указал И. И. Ревзин, обычные лингвистические методы должны дополняться статистическими.

В докладе Ю. К. Л е к о м ц е в а «Порядковые и функциональные отно шения вьетнамского глагола» было показано, что во вьетнамском языке по сле выделения некоторых полнозначных глаголов служебные глаголы могут быть опознаны на основе чисто статистических подсчётов их сочетаемости с полнозначными.

1© Чувство ложного приличия помешало мне (о чём я теперь жалею) сообщить в моей статье о факте, произведшем на меня большое впечатление в 1957 г. и продол жающем производить это впечатление до сих пор. На Совещании я спросил доклад чиков, В. А. Гармаша и Д. С. Лебедева, где и как можно ознакомиться с замечатель ным результатом проведённого ими эксперимента | с уникальной таблицей частот трёхбуквенных сочетаний. Оказалось, что нигде и никак: указанные частоты бы ли использованы только для вычисления энтропии, а после вычисления таковой | уничтожены экспериментаторами.  Языкознание Статистические методы с успехом применимы и для получения новых лингвистических результатов. Так, в докладе И. А. М е л ь ч у к а «Приме нение статистики к вопросу о категории рода во французском и испанском языках» было доказано, что во французском языке грамматическая катего рия рода формально выражена окончанием существительного. При этом ав тор доклада выдвинул следующий статистический критерий выраженности категории рода: категория рода в данном языке считается выраженной, если существуют правила не слишком большого объёма (не превосходящие, ска жем, объёма аналогичных правил для испанского языка, выраженность рода в котором не подвергается обычно сомнению), позволяющие узнавать род по окончанию существительного и охватывающие не менее 94% существи тельных рассматриваемого языка (соответствующие правила для испанско го охватывают свыше 98%).

Как отмечалось на совещании, статистика может быть использована и в текстологии, для определения автора того или иного текста.

В докладе «Вероятностное определение лингвистического времени (в свя зи с проблемой применения статистических методов в сравнительно§исто рическом языкознании)» В я ч. В с. И в а н о в продемонстрировал возмож ность применения статистических методов к внутренней реконструкции.

Анализируя состояние языка в данный момент, можно установить направле ние лингвистического времени. Так, часто встречающиеся в текстах языко вые единицы имеют тенденцию встречаться в последующем состоянии язы ка, если они обладают малой степенью изолированности в системе;

если же эти часто встречающиеся единицы имеют высокую степень изолированно сти, то они характерны для предыдущих состояний. Частота встречаемости и степень изолированности определяются статистически. Другой способ ре конструкции и предсказания связан со статистическим исследованием сти лей языка. Родство языков наиболее достоверно определяется в терминах изоморфизма реконструируемых систем. Что же касается часто применя емых для установления степени родства языков подсчётов совпадений, то, как указал докладчик, здесь необходим тщательный вероятностный анализ (так как вероятность случайных совпадений может быть велика и, таким образом, наличие совпадений ни о чем не говорит).

И. И. Ревзин подчеркнул в своём докладе необходимость развития спе циальной отрасли языкознания | лингвистической статистики. Уже сейчас полученные в лингвистической статистике соотношения между такими вели чинами, как частота слова, его ранг (т. е. номер по порядку в частотном сло варе), его длина и т. п., проливают свет на теоретико§информационную при роду языка как кода. Об этом же говорил в докладе «Некоторые вопросы ста тистического обследования лексических групп» Р. Г. П и о т р о в с к и й.

В докладе И. И. Ревзина был выяснен также двусторонний характер со отношения структурных и статистических методов. Не только статистика помогает лучше разобраться в структуре языка, но, в свою очередь, едини Совещание по статистике речи цы, число которых подсчитывается, нуждаются в точном структурном опре делении. Так, по мнению автора доклада, недостатком глоттохронологии является отсутствие точного определения родственных слов. (В. В. Ивнов а в своём докладе указал на недостаточную мотивированность самого выбо ра базисного словаря.) Ясно, что статистическое исследование структуры слога невозможно без строгого определения понятия ‘слог’ (в первой части доклада Е. В. Падучевой было дано такое определение испанского слога, ко торое, по§видимому, позволяет однозначно разбивать слово на слоги). Роль структурных категорий обнаруживается и при проведении статистических работ, имеющих непосредственное практическое приложение. Для создания оптимальных правил машинного перевода необходимо статистическое об следование языков отдельных наук. В докладе «О статистическом слова ре русских математических текстов» И. А. М е л ь ч у к, Т. Н. М о л о ш н а я, А. Л. Ш у м и л и н а, З. М. В о л о ц к а я и И. Н. Ш е л и м о в а со общили о результатах статистического обследования языка математической литературы;

при этом возникла необходимость чёткого определения таких понятий, как ‘синтагма’, ‘тип синтагмы’, ‘связь слов в предложении’ и т. п.

Совещание в Ленинграде, бесспорно, имело принципиальное значение, не ограниченное кругом вопросов, указанных в его названии. На совещании отчётливо выявились два обстоятельства:

1. Проникновение математических, в частности статистических, методов в языкознание, несомненно, плодотворно. Эти методы могут играть очень важную, но всё же подчинённую роль при решении лингвистических проблем.

Полностью формализовать реальный язык в виде некой математической си стемы, по§видимому, никогда не удастся, однако можно ставить вопрос о тех или иных формализованных приближениях к реальному языку, причём расхождение между реальным языком и таким приближением должно оце ниваться статистически.

2. Лингвистические исследования начинают приобретать всё большее и большее практическое значение, не укладывающееся, как раньше, в рамки составления школьных грамматик и орфографических правил. Это не озна чает, что языкознание утрачивает свой теоретический профиль. Наоборот, с развитием техники оказывается, что наиболее тонкие теоретические постро ения наиболее важны для приложений. Положение дел в лингвистике можно сравнить в этом отношении с положением в математике, теоретические от расли которой (такие, как математическая логика) приобрели в последнее время особое прикладное значение.

Большим достоинством совещания явилось разнообразие представленных на нём специальностей, от радиотехники до физиологии. Совещание пока зало необходимость дальнейшей координации деятельности представителей разных наук в области прикладной лингвистики.

Итоги работы секции алгоритмов машинного перевода Основной итог работы секции алгоритмов машинного перевода это то, что машинный перевод, как признано всеми, является реальностью. Сейчас, пожалуй, никого не нужно убеждать, что такой перевод возможен, что это важное и нужное дело.

Около трёх с половиной лет прошло с тех пор, как Изабелла Кузьминична Бельская под руководством Дмитрия Юрьевича Панова, а также Ольга Сер геевна Кулагина и Игорь Александрович Мельчук под руководством Алек сея Андреевича Ляпунова впервые в нашей стране приступили к созданию правил машинного перевода. Однако этот сравнительно небольшой период, несомненно, будет отмечен впоследствии историками машинного перевода как весьма плодовитый.

На сегодняшний день готовы 5 алгоритмов машинного перевода:

англо§русский | вариант Института точной механики и вычислительной техники Академии наук СССР (И. К. Бельская);

французско§русский | вариант Математического института Академии наук СССР (О. С. Кулагина, И. А. Мельчук);

Опубликовано в продолжающемся сборнике: Машинный перевод и прикладная лингви стика. | Ђ1 (8). | М.: [I МГПИИЯ], 1959. | С. 31{62.

1 © Текст статьи представляет собою незначительно отредактированную стено грамму доклада, сделанного 21 мая 1958 г. на заключительном пленарном заседа нии Первой Всесоюзной конференции по машинному переводу, проводившейся Пер вым Московским государственным педагогическим институтом иностранных язы ков (I МГПИИЯ). Конференция проходила с 15 по 21 мая 1958 г. и состояла из пленарных заседаний и заседаний двух секций: теоретической и алгоритмов машин ного перевода. К конференции был выпущен сборник тезисов: Тезисы конференции по машинному переводу (15{21 мая 1958 года). | М.: [I МГПИИЯ], 1958. | 117 с.

Протоколы конференции опубликованы на с. 7{25 указанного выше выпуска сборни ка «Машинный перевод и прикладная лингвистика». Воспоминания автора об этой конференции можно найти на с. 936{939 настоящего издания.  Итоги работы секции алгоритмов машинного перевода англо§русский | вариант Математического института Академии наук СССР (Татьяна Николаевна Молошная);

китайско§русский | вариант Института точной механики и вычисли тельной техники Академии наук СССР (Владимир Алексеевич Воронин);

венгерско§русский | вариант Института языкознания Академии наук СССР (И. А. Мельчук).

Кроме того, интенсивно разрабатываются 15 следующих алгоритмов:

в Институте точной механики и вычислительной техники | японско§рус ский и немецко§русский;

в Ленинградском государственном университете | индонезийско§рус ский, арабско§русский, хинди§русский, японско§русский, бирманско§рус ский, норвежско§русский, англо§русский, немецко§русский, вьетнамско§рус ский, русско§английский;

в Горьковском государственном университете | французско§русский;

в Вычислительном центре Академии наук Армянской ССР | армян ско§русский и русско§армянский.

Наконец, начата работа ещё над следующими алгоритмами: англо§рус ским в Горьковском государственном университете, испанско§русским, ки тайско§русским и турецко§русским в Ленинградском государственном уни верситете и грузинско§русским и русско§грузинским в Институте автома тики и телемеханики Академии наук Грузинской ССР.

Этот перечень, составленный, кстати сказать, на основе заявлений са мих авторов алгоритмов или авторитетных представителей соответству ющих коллективов 2 (ибо докладчик не располагает другой возможностью судить о степени готовности того или иного алгоритма), сам по себе яв ляется несколько упрощённым. Дело в том, что многие из перечисленных 2© Эта оговорка очень существенна. Дело в том, что само понятие ‘алгоритм ма шинного перевода’ не имеет точных очертаний (я пытался показать это в своём докладе, ссылаясь, в частности, на то, что при современном уровне наших знаний никакой реальный алгоритм не в состоянии переводить любые тексты). А потому никакое утверждение о существовании алгоритма перевода не может быть, строго говоря, ни доказано, ни опровергнуто. Не исключено, что в ряде случаев разработ чики иностранно§русского перевода называли алгоритмом такого перевода лишь алгоритм анализа, имея в виду его последующее соединение с алгоритмом синтеза, существования коего предполагалось. В весьма широком диапазоне варьировалась и степень машинной реализации алгоритмов. С учётом сделанных заявлений о рас плывчатости понятий, решусь высказать следующее мнение: на сегодняшний день все вышеперечисленные алгоритмы машинного перевода, кроме французско§русско го алгоритма О. С. Кулагиной, мертвы. Однако, по моему убеждению, разработка алгоритмов перевода | независимо от финального результата | была не напрасна, так как принесла пользу языкознанию.  Языкознание алгоритмов базируются на так называемом независимом анализе, о чём я буду говорить позже. Особенно отчётливо это проявляется в ленинградских алгоритмах. Поэтому слово «русский» после дефиса (например, индонезий ско§русский) я прибавил для удобочитаемости (так же это было сделано и в программе конференции);

более точно было бы сказать: индонезийско{де фис{пустое место, поскольку имеется в виду алгоритм независимого анализа индонезийского языка;

этот алгоритм, соединённый с независимым синтезом любого другого языка, позволяет осуществить перевод с индонезийского на этот другой язык. Так что потенциально здесь даже больше алгоритмов, чем перечислено.

Если поэтому рассматривать особо алгоритмы независимого анализа, то к перечисленным алгоритмам прибавится алгоритм независимого русского анализа, осуществлённый в Институте точной механики и вычислительной техники Татьяной Михайловной Николаевой. Что касается синтеза, то алго ритм русского синтеза, составленный И. К. Бельской и Т. М. Николаевой, был необходимой составной частью всех алгоритмов перевода на русский язык, составленных в Институте точной механики и вычислительной техники, а ал горитм русского синтеза, составленный О. С. Кулагиной и Т. Н. Молошной, был необходимой составной частью всех алгоритмов перевода на русский язык, составленных в Математическом институте и Институте языкозна ния. Оба эти алгоритма синтеза независимы в том смысле, что они не зави сят от входного языка;

однако оба они предполагают отнюдь не независимый анализ, а такой анализ, который заканчивается получением русской лекси ческой и грамматической информации. Поэтому такой независимый синтез (поскольку он отправляется от уже полученной информации, касающейся синтезируемого языка), изготовить, конечно, гораздо легче, чем независи мый анализ. Заметим, впрочем, что самые понятия анализа и синтеза и, особенно, их независимости нуждаются в дальнейшем уточнении.

Значительно продвинуты новые алгоритмы русского и английского неза висимых анализов, разрабатываемые на основе идей И. А. Мельчука совмест но Институтом языкознания, Математическим институтом и Лабораторией электромоделирования Всесоюзного института научной и технической ин формации. На основе тех же идей в Институте языкознания разрабатывают ся алгоритмы независимого анализа для французского и венгерского языков, а в Лаборатории электромоделирования | алгоритм независимого синтеза для русского языка.

Сколько§нибудь детально вникнуть во все эти алгоритмы, слушая до клады на конференции, невозможно. В лучшем случае можно было понять основные принципы. Некоторые замечания, вытекающие из рассмотрения этих основных принципов, и будут изложены в данном сообщении.

Я бы не сумел без посторонней помощи разобраться в многочисленных идеях и точках зрения на эти основные принципы, тем более что сами пред ставители отдельных школ придерживаются разных взглядов не только на Итоги работы секции алгоритмов машинного перевода целесообразность того или иного метода, но и на фактическое наличие в дан ной работе этого метода, причём не всегда в сторону приписывания своей работе какого§либо лучшего метода, чем в ней действительно содержится.

Мне пришлось столкнуться с такой недооценкой собственных работ при под готовке настоящего сообщения. Я бы так и не разобрался во всём этом, если бы не помощь руководителей коллективов и направлений машинного перево да Николая Дмитриевича Андреева, И. К. Бельской, Вячеслава Всеволодови ча Иванова и И. А. Мельчука. Я им очень благодарен 3.

Должен сказать (это для тех моих коллег§математиков, которые при сутствуют здесь в зале), что то дальнейшее, о чем я буду говорить, я сам для себя понимаю не всегда на том уровне, на котором я привык понимать собственные математические высказывания. [Оживление в зале.] Однако я надеюсь, что на лингвистическом уровне это понимается мною правильно.

Уже на пленарных заседаниях, в докладах и выступлениях, выявились основные точки зрения на существующие методы, на целесообразность этих методов в машинном переводе. Это облегчает мою задачу, так как я не буду излагать эти точки зрения, а сошлюсь на первые четыре пленарных заседа ния, продолжением которых и является сегодняшнее заключительное засе дание. Кроме того, сошлюсь на изданные «Тезисы» настоящей конференции и на две книги: на книгу «Автоматический перевод» Д. Ю. Панова и на кни гу «Сессия Академии Наук СССР по научным проблемам автоматизации производства 15{20 октября 1956 года. Пленарные заседания», где опубли кован совместный доклад Д. Ю. Панова, А. А. Ляпунова и Ивана Сергеевича Мухина «Автоматизация перевода с одного языка на другой», достаточно ясно вскрывающий различия в точках зрения. Наконец, есть серия статей по машинному переводу, опубликованных в журнале «Вопросы языкознания» в 1956 и 1957 гг. Я могу сослаться на следующие статьи из этой серии: ста тью Петра Саввича Кузнецова, А. А. Ляпунова и Александра Александровича Реформатского, статью О. С. Кулагиной и И. А. Мельчука, статью Т. Н. Мо лошной. Я не решусь сослаться на статью Н. Д. Андреева из той же серии, потому что не смог понять изложенной там точки зрения автора. А эта точ ка зрения, как выявилось на секции алгоритмов конференции и особенно в её кулуарах, существует, и я попытаюсь несколько позже её изложить.

Как мне кажется, практика машинного перевода позволяет сделать сле дующие основные выводы, с которыми, по§видимому, согласны все, кроме И. К. Бельской и её последователей 4.

3 Автор благодарен также О. С. Кулагиной, любезно согласившейся ознакомиться со стенограммой доклада и указать на отдельные допущенные в докладе неточности, устранённые в настоящем тексте.

4 Докладчик получил следующую записку, которую считает необходимым приобщить к стенограмме:

Языкознание Первый вывод вот какой: машинный перевод не должен быть переводом художественным, т. е. переводом с хорошим стилем. По крайней мере сейчас не следует к этому стремиться. Не случайно я сказал «не должен быть», а не «не может быть». Он может быть, и можно составить сложный, громоздкий алгоритм, чтобы перевод был осуществлён в хорошем стиле. Это показы вают некоторые примеры Института точной механики и вычислительной техники. Но мне кажется, что чем лучше стиль получаемой на выходе фра зы, тем ниже мы должны оценивать алгоритм перевода. Мы все понимаем, как трудно достичь хорошего стиля;

поэтому хороший стиль означает, что в алгоритме перевода массу места занимают громоздкие правила преобра зования стиля. Не этим нужно сейчас заниматься. По§моему, вполне можно допустить последующее редактирование перевода человеком именно пото му, что оно (редактирование) не является в конце концов необходимым. По самому смыслу слова «редактирование» допустимость последующего редак тирования означает, что перевод может быть понят и без него.

Итак, мне кажется, что необходим сознательно упрощённый подход к машинному переводу, о котором я только что говорил.


Ещё нужно иметь в виду, что сейчас проблему машинного перевода це лесообразно ставить для ограниченной совокупности текстов, а именно для научных текстов. Там не очень важен стиль, поскольку он там не несёт се мантической нагрузки. В бытовом разговорном языке стиль имеет всё§таки не только эстетическое, но и семантическое значение. В научном тексте он такового не имеет и о нём не нужно заботиться.

Стремиться переводить при помощи машин научные тексты с выдачей очень хорошего стиля | это проявление такой же некультурности, как де лать вычисления со слишком большим числом десятичных знаков. Так, на пример, как мне рассказывал Николай Дмитриевич Нюберг, лица, произво дящие вычисления числа секций батарей центрального отопления, которое нужно поставить в комнате и которое выражается целым числом, | эти лица в промежутке часто высчитывают ряд величин, скажем, теплопровод ности стен и т. д., причём выражают эти величины числами, содержащими много десятичных знаков.

«В президиум В. А. Успенскому Владимир Андреевич! Я решительно не согласен с Вашей установкой на ограни чение сферы машинного перевода. Может быть, я был невнимателен на конферен ции, но мне не приходилось слышать здесь изложения той точки зрения, которую Вы здесь высказали в столь резкой форме и представили как точку зрения всех, кроме Бельской, сторонником которой Вы, таким образом, меня изображаете. Я не выступаю против Вас лишь потому, что Вы взяли на себя ответственность восполь зоваться для выражения этой точки зрения своим правом последнего доклада.

С уважением Г. Цейтин».

Итоги работы секции алгоритмов машинного перевода Можно ещё более резко поставить вопрос об упрощенчестве перевода | не нужно бояться слова «упрощенчество»: не только разрешить выход на канцелярском, неуклюжем стиле, но и вход ограничить таким стилем, т. е.

требовать, чтобы текст, который подаётся на перевод, был регуляризован ным. Целесообразно строить алгоритмы только для регулярных текстов. Не нужно стремиться перевести всё. Предлагается, иными словами, составлять алгоритмы перевода, годные не для всех фраз языка, с которого мы пере водим, а лишь для правильно составленных регулярных фраз. Нужно пони мать историческое место сегодняшнего дня в развитии машинного перевода (который будет, вероятно, развиваться во время всей последующей цивили зации, пока не будет единого языка), и не стремиться сразу переводить всё;

это может только затормозить развитие машинного перевода. Этот тезис имеет не только теоретическое значение (такая постепенность и последова тельность убыстрит развитие машинного перевода);

он имеет и чисто прак тическое значение. В самом деле, отредактировать текст и привести его к регулярному виду проще, чем перевести, причём это может сделать лицо, не знакомое с тем языком, на который мы переводим. Если англичане, скажем, заинтересованы в том, чтобы мы их переводили (а научные работники, как правило, в этом заинтересованы, для того они и печатают свои статьи, что бы их читали во всём мире), они будут сами перед переводом «причёсывать»

текст, чтобы его можно было быстрее перевести на машине. Я присоединя юсь к мнению Роланда Львовича Добрушина, высказанному с этой трибуны, что машинный перевод окажет своё влияние на развитие научного языка во обще. В связи с этим целесообразно, пожалуй, делать две программы машин ного перевода или одну разветвляющуюся программу. Первая, более простая часть, годится только для регулярных текстов и пытается сначала любой текст, который поступает в машину, перевести регулярным образом;

если же он (текст) окажется нерегулярным | только в этом случае включается более сложная, более громоздкая программа. Есть надежда, что включение более сложной программы будет случаться редко, и таким образом будет получаться экономия во времени.

По§моему, мы ещё недостаточно ясно высказываем некоторые вполне очевидные вещи | прежде всего, что каждый алгоритм перевода, по су ществу, предъявляет определённые требования к структуре переводимого текста. Каждый алгоритм рассчитан на определённую такую структуру. По существу это значит, что те алгоритмы перевода, которые созданы, не мо гут и не должны перевести решительно всё. Вообще мне не ясно, будет ли когда§нибудь создан такой алгоритм, который будет переводить всё, что будет понимать человек, так как ведь и язык развивается, и неизвестно, что будет развиваться быстрее, сам язык или алгоритм перевода. Во вся ком случае ясно, что ни один из тех алгоритмов, которые я перечислил, не претендует на то, чтобы перевести всё. Каждый из них предполагает, к сожалению, лишь молчаливо, требования, которые нужно наложить на пере Языкознание водимый текст. Если текст удовлетворяет этим требованиям, то алгоритм сработает. К сожалению, эти требования трудно получить явно, и они не сформулированы отчётливо (т. е. не сформулировано отчётливо | так же отчётливо, как сам алгоритм перевода, | что именно разрешается иметь в тексте), однако было бы правильно всё же дать такую формулировку. Это было бы принципиально важно и имело бы значение, выходящее за рамки машинного перевода, значение для общего языкознания.

Мне кажется, что регулярность вводимого текста должна касаться не только синтаксической и вообще грамматической регулярности, состоящей в том, что допускаются лишь такие§то и такие§то синтаксически и грамма тически ограниченные обороты речи. Надо требовать и семантической огра ниченности вводимого текста, каждый алгоритм нацеливать на перевод для данной семантической области (т. е., попросту, для данной отрасли науки или техники). Может быть, разные алгоритмы (для одного и того же язы ка, но разных семантических областей) будут очень похожи друг на друга, будут почти одинаковы, но всё§таки каждый раз нужно чётко фиксировать, для какой семантической области это делается. Если ограничена семантиче ская область, то и синтаксические конструкции будут ограничены, меньше будет многозначности. Не следует думать, что при ограничении семантиче ской области многозначность будет совершенно уничтожена. Она останется для слов, употребляемых и в терминологическом и в нетерминологическом значении одновременно. Так что семантическое ограничение не избавит нас от необходимости решать весьма сложные проблемы машинного перевода.

Итак, первый вывод состоит в необходимости сознательного ограниче ния как грамматического, так и семантического круга текстов, подлежащих переводу. При этом вовсе не отрицаются потенциально неограниченные воз можности машинного перевода. Поэтому я и говорю о «сознательном огра ничении». Этот вывод чисто практический, скорее даже организационный (и целиком содержится в универсальном организационном принципе, что на чинать надо с простого). Но он имеет и теоретическое значение, так как его применение поможет лучше разобраться в структуре алгоритмов перевода, да и в структуре самих текстов. Этот вывод отражает тенденцию, которая, быть может, не столько легла, сколько должна лечь в основу дальнейше го развития машинного перевода: алгоритмы перевода должны постепенно усложняться, захватывая всё большее и большее разнообразие (в граммати ческом и семантическом отношениях) текстов на входе и давая всё более и более правильные (в стилистическом отношении) тексты на выходе.

Второй (это не значит, что менее важный) основной вывод, который мож но сделать из доложенных на секции работ, касается уже достаточно отчё тливо проступившей тенденции к независимости анализа и синтеза. Здесь имеется в виду не просто наличие отдельных алгоритмов анализа и синте за | они неизбежны всегда, | имеется в виду независимость анализа пе реводимого языка от того языка, на который переводят, и независимость Итоги работы секции алгоритмов машинного перевода синтеза выходного языка от того языка, с которого переводят. Это обсто ятельство даёт большую экономию в алгоритмах, потому что если имеет ся сто языков и мы хотим переводить с каждого на каждый, то попарных комбинаций будет 9900 и, следовательно, нужно 9900 бинарных алгоритмов.

Если воспользоваться независимыми анализом и синтезом, то достаточно будет сделать сто анализов и сто синтезов и, следовательно, можно будет ограничиться для перевода 200 алгоритмами. Независимые анализ и синтез имеют значение и для совсем других целей, скажем, в применении к постро ению информационных машин, когда при вводе информации в машину про изводится, собственно, только анализ, поскольку информация хранится не на каком§то реальном языке, а в логически проанализированном виде, ес ли угодно, на специальном машинном языке. Соответственно, при выдаче информации происходит чистый синтез. Логическая информация синтези руется в виде обычного языка.

Принципиально труднее достичь независимости анализа (анализ вообще наиболее трудная часть машинного, да и не только машинного, перевода).

В первых алгоритмах, будь то англо§русский алгоритм, составленный в Институте точной механики и вычислительной техники, или француз ско§русский в Математическом институте, | такой независимости анализа ещё не было. При анализе текста иностранным словам сразу приписывались такие грамматические категории, которые типичны для русского языка и отсутствуют в иностранных языках. Так, французским и английским гла голам (где, как известно, отсутствует категория рода) сразу приписывался род (тот род, который будет в русском языке). Про английский глагол в ряде случаев сразу говорилось, что это деепричастие, хотя с точки зрения англий ского языка это не деепричастие (но на русский должно переводиться дее причастием). Быть может, во французско§русском алгоритме регистриро валось несколько больше французских характеристик, чем в англо§русском английских характеристик, но объясняется это главным образом различи ем между французским и английским языком (например, регистрировался род французских существительных, тогда как в английском языке катего рии рода просто нет), и не в этом принципиальное отличие между указанны ми алгоритмами (отличие между ними в том, что англо§русский алгоритм основывался на детальном лексическом анализе, на индивидуальном подходе к каждому слову и обороту, в то время как французско§русский алгоритм стремился «мыслить» более широкими категориями и использовать правила, которые были бы применимы не к отдельным словам, а к целым классам слов).


Следующим этапом был англо§русский алгоритм, составленный Т. Н. Мо лошной, где впервые появляются независимые анализ и синтез. (Насколько они независимые, ещё не очень ясно. С одной стороны, здесь действительно происходит и синтаксический и английский | т. е. идущий внутри англий ского языка | разбор английского предложения, никаких русских категорий Языкознание английским словам не приписывается. Разбор происходит в соответствии с составленными Т. Н. Молошной конфигурациями, которые в определённой последовательности сворачиваются. Но то обстоятельство, что при перево де английские конфигурации соответствуют русским, и в той же иерархии, заставляет предположить, что либо эти английские конфигурации выбраны в соответствии с русскими и тогда не очень независимый анализ, либо рус ские конфигурации выбраны в соответствии с английскими и тогда не очень независимым оказывается синтез. По§видимому, именно анализ здесь всё же является независимым.) Принципы Т. Н. Молошной были очень большим и новым шагом вперёд;

её алгоритм можно считать первым алгоритмом с не зависимым анализом, и, действительно, он лёг в основу всех последующих работ по независимому анализу.

В большей степени независимость достигается в ещё не осуществлённых алгоритмах, именно, в алгоритмах, которые существуют только ещё в про ектах И. А. Мельчука и Н. Д. Андреева и осуществлены лишь частично.

Н. Д. Андреев при разборе фразы иностранного текста пользуется поня тиями формоглифа, тектоглифа и семоглифа. Употребление таких терминов, как «формоглиф», «тектоглиф» и «семоглиф», не способствует доходчивости алгоритма Н. Д. Андреева, но тем не менее это оправдано. Жаль только, что за счёт таких слов многими не совсем отчётливо понимается правильная в об щем идея. Формоглиф | это то, что относится к морфологии, тектоглиф | к синтаксису, семоглиф | к лексике. Предположим, что мы анализируем фразу на каком§либо языке. Сначала мы каждому слову приписываем фор моглиф первой ступени (это такая морфологическая характеристика, кото рая присуща данному языку). Затем мы приписываем слову синтаксическую характеристику | тектоглиф первой ступени (специфический для данного языка). Образовав формоглифы и тектоглифы первой ступени, мы их пре образовываем в некоторые уже не зависящие от языков, с которого и на который мы переводим, характеристики, а именно формоглифы и тектогли фы третьей ступени (иероглифы второй ступени играют чисто техническую роль, и я о них говорить не буду). Формоглифы третьей ступени | это ре зультаты межъязыкового анализа по частям речи (т. е. анализа по межъязы ковым частям речи), а тектоглифы третьей ступени | это результаты меж ъязыкового анализа по членам предложения (т. е. анализа по межъязыковым членам предложения). При синтезе наоборот | от иероглифов третьей сту пени мы переходим к иероглифам первой ступени. Список иероглифов первой ступени даётся свой для каждого языка. Иероглифы третьей ступени дают ся единым списком сразу для всех языков. Этот единый список получается посредством взвешенного усреднения по всем языкам, причём каждый язык берётся с определённым весом. Как образно говорит Н. Д. Андреев, проис ходит «голосование» языков;

язык «голосует» поднятием рук всех говорящих на этом языке людей.

Итоги работы секции алгоритмов машинного перевода У И. А. Мельчука эта независимость анализа и синтеза проявляется по§ другому. Ход его анализа таков. Сначала берётся словосочетание. Далее | синтагма или, поскольку под синтагмой часто понимают конкретное сло восочетание, лучше сказать «конфигурация» (термин, укоренившийся в ма шинном переводе), под которой понимается не конкретное словосочетание, а тип словосочетания (это в известном смысле уже логическое отношение, но ещё в данном языке), затем логическое отношение | уже межъязыковое, чисто логическое, и на этом анализ кончается. Синтез идёт наоборот | от межъязыкового логического отношения к логическому отношению в языке, на который переводят. Таким способом получается конфигурация того язы ка, на который переводят, а затем, с учётом лексики, словосочетание. Эти алгоритмы не осуществлены, но успешно осуществляются.

Таким образом, в обоих изложенных подходах имеется независимость анализа и синтеза. Столь полная независимость анализа от синтеза неизбеж но приводит к какой§то промежуточной субстанции, к чему§то такому, что появляется в конце анализа, но прежде, чем начинается синтез. То, что по является, можно назвать языком§посредником. И действительно, оба автора, столь различные по сути своих методов, употребляют термин «язык§посред ник». Но понимается он ими совсем по§разному.

У Н. Д. Андреева этот язык§посредник мыслится как материальный язык, с определённой лексикой и грамматикой, совсем как у обычного языка.

Но это будет искусственный, непроизносимый язык (хотя, конечно, можно разработать его фонетику);

фразы на этом языке | просто комбинации сим волов, выражающих определённые понятия. Морфологию этого языка обра зуют формоглифы III ступени, синтаксис | тектоглифы III ступени. Ещё не разработанные детально семоглифы III ступени образуют лексику. Фраза на этом языке имеет такое каноническое строение: определение к подлежа щему, подлежащее, сказуемое, прямое дополнение, предложное дополнение, косвенное дополнение, обстоятельство: «Большой мальчик бьёт лошадь по крупу прутом больно».

Грамматику и лексику языка§посредника Н. Д. Андреев собирается стро ить на основе усреднения грамматик и лексик реальных языков. Идею усред нения путём голосования языков Н. Д. Андреев обосновывает тем, что полу чается экономия при программировании. Я не очень берусь судить об этом, но с логической точки зрения мне не нравится подобное усреднение. Грубо говоря, Н. Д. Андреев поступает так | он выписывает все явления, имеющи еся в одном языке, другом, третьем, двадцатом. Затем выбирает наиболее частые, а остальные отбрасывает. Таким образом получается язык, содер жащий лишь наиболее часто встречающиеся грамматические и лексические категории. Язык§посредник получается в виде теоретико§множественного пересечения рассматриваемых реальных языков. Мне представляется, что нужно брать теоретико§множественную сумму с максимальным расщепле нием грамматических категорий. Хочется, чтобы язык§посредник содержал Языкознание все категории всех языков: надо добиваться, чтобы язык§посредник был в состоянии выразить любое отношение, которое выразимо простым и стан дартным способом хотя бы на одном из рассматриваемых языков, чтобы у него был избыток средств выражения по отношению к любому языку, чтобы он был богаче любого из конкретных языков. Вполне естественно, если не всякое отношение языка§посредника будет адекватно переводиться отноше нием рассматриваемого реального языка.

По§моему, на первых порах, пока ещё далеко до программирования, ука занный путь был бы правильнее, а потом уже можно было бы подумать над тем, что и как можно упростить, какие из категорий языка§посред ника можно выбросить. Но вначале желательно иметь общую модель. Если бы оказалось, например, что большинство языков не имеет такой категории, как будущее время глагола, Н. Д. Андреев отказался бы включить катего рию будущего времени в свой язык§посредник. А по§моему, надо исходить из другого. Если хоть один язык имеет категорию будущего времени | это уже достаточное основание, чтобы включить его в язык§посредник. Точно так же обстоит дело с наклонениями. Хотелось бы иметь в языке§посредни ке и причастия будущего времени, имеющиеся, например, в языке эсперанто.

С другой стороны, такую категорию, как грамматический род, нецелесо образно вводить в язык§посредник (если даже она характерна для большин ства языков). Подход Н. Д. Андреева к языку§посреднику имеет значение, выходящее за рамки машинного перевода, опять§таки в применении к ин формационным машинам, потому что его язык§посредник может служить тем самым машинным информационным языком, который ищут все занима ющиеся этим делом.

У И. А. Мельчука язык§посредник выступает как система отношений. На этом основании автору бросали упрёки, что это ещё не язык§посредник, а схема языка§посредника или система отношений ещё не созданного язы ка§посредника и т. д. Может быть, не стоит делать эти упрёки, а считать, что язык может существовать и рассматриваться лингвистикой, не суще ствуя, грубо говоря, в материальной форме, а существуя лишь как система отношений. Это справедливо для языков, не несущих коммуникативной фун кции. Я позволю себе сослаться на такой традиционный для лингвистики факт, как рассмотрение праязыков. Как неоднократно указывал В. В. Ива нов, рассмотрение праязыка в материальной форме некорректно, бессмы сленно. Не имеет смысла, например, говорить о тексте, написанном на пра языке, как пытались делать многие лингвисты. Рассматривать праязык кор ректно лишь как систему отношений. Это не делает его беспредметным с точки зрения лингвистики. В. В. Иванов справедливо заметил, что, подобно праязыку, язык§посредник И. А. Мельчука не несёт коммуникативной функ ции и потому не стоит его «материализовать». Язык И. А. Мельчука не менее целесообразен, чем язык Н. Д. Андреева, и бесспорно очень интересен для общего языкознания.

Итоги работы секции алгоритмов машинного перевода Язык§посредник в обоих смыслах лучшим образом сыграет свою роль для текстов с ограниченной семантикой, т. е. для текстов, выбранных из какой§то конкретной области науки.

Есть и другая точка зрения, которая здесь высказывалась И. К. Бель ской, что в качестве языка§посредника надо брать русский язык. Эта точка зрения здесь уже критиковалась, на мой взгляд, справедливо;

я считаю, что незачем тащить неправильности русского языка за собой: для того и созда ётся язык§посредник, чтобы избавиться от всех неправильностей реальных языков.

Должен сказать, однако, что в этой точке зрения, с которой я не согласен, состоящей в выборе русского или какого§либо другого реального языка в качестве языка§посредника, есть, на мой взгляд, одно здоровое зерно.

Дело в том, что не очень ясно, насколько лингвистическая семантика (лексика) языка§посредника может быть сделана независимой (т. е. межъ языковой, не зависящей ни от какого из реальных языков), по крайней ме ре для лексики семантически неограниченных текстов, для любых текстов (ведь словами в языке§посреднике должны служить сами понятия, а соста вить «словарь» понятий, выразимых в реальных языках, по меньшей мере очень трудно). Неясно, насколько это можно сделать независимым образом до появления объективных методов исследования значений, которые пока что, к сожалению, в лингвистике как будто отсутствуют. Я не согласен с Михаилом Ивановичем Стеблиным§Каменским, который в своём докладе «Значение машинного перевода для языкознания», поставленном первым на этой конференции (этот доклад я считаю замечательным), высказал мысль о том, что лингвистике грозит известная семантизация, и машинный перевод направляет лингвистику в здоровую сторону, к уходу от семантики к фор мальной структуре языка. Мне кажется, что этот уход по пути наименьшего сопротивления. Описывать синтаксическую структуру формальными мето дами легче, чем семантику. И я думаю, что правильней было бы сказать, что машинный перевод должен вызвать появление новых, объективных методов исследования значений, исследований лингвистической семантики такими же объективными, формальными и структурными методами, которые структу рализм и дальнейшее его развитие предлагает нам для исследования, скажем, синтаксиса.

В связи с этим я хочу отметить заслугу коллектива Института точной механики и вычислительной техники, состоящую во внимании этого кол лектива к словарю, к лексике. Этому коллективу принадлежит ряд работ в области лексики и словаря машинного перевода. На мой взгляд, сделано довольно мало, но честь постановки этих специфически лингвистических, семасиологических проблем, и заявление, что они играют большую роль в машинном переводе, | принадлежат указанному коллективу. Думаю, что это важно, особенно при переводе текстов, не ограниченных какой§то точ но очерченной естественнонаучной областью, хотя и там могут встретиться Языкознание и неизбежно встретятся разговорные слова, которые делают необходимым исследование лексики.

Дело в том, что точное значение, в лингвистическом смысле этого слова, есть научная абстракция и притом очень далеко идущая. Недостаточно часто в лингвистике повторяют, что предположение наличия значения у слова есть очень сложная и высокая абстракция. В самом деле, если попытаться гово рить наивно, значение слова | это совокупность зрительных или каких§либо других чувственных образов, воспоминаний каких§то, которые возникают в связи с этим словом. Когда же мы говорим, что слово имеет одно значе ние или несколько чётко очерченных, разграниченных значений | это уже очень большая абстракция, а на самом деле значение | вещь гораздо бо лее приблизительная, и мы знаем, что не только машинный перевод, но и любая коммуникация на любом языке приблизительна, что вытекает из тех многочисленных примеров, когда люди не понимают друг друга, что быва ет, к сожалению, достаточно часто, когда говорят слова одного и того же родного языка и не понимают их.

Поэтому нужно разрабатывать оценки качества перевода. Разумеется, не художественного перевода, об этих оценках я не говорю. Как совершенно правильно показал в своём докладе на теоретической секции В. В. Иванов, оценка художественных качеств перевода вообще лежит за пределами те матики нашей конференции. Здесь говорится о подстрочном переводе. Что значит, перевод хороший? Что значит, он соблюдает смысл, точен и т. д.?

Таких оценок, к сожалению, нет. Поэтому прав, быть может, Н. Д. Андреев, когда он говорит, что, собственно, самое главное не машинный перевод, не автоматический перевод, а автоматическое реферирование;

он говорит, сле довательно, о таком алгоритме перевода, который сам отбрасывает какие§то несущественные детали текста, он желает предоставить алгоритму это пра во. Я не вижу, при современном расплывчатом понимании того, что такое «один текст на одном языке есть перевод другого текста на другом языке», разницы между переводом и реферированием. По существу это есть одно и то же, точной границы тут нет. Но тогда должны быть точные оценки существенного и не существенного в тексте, оценки точности, оценки того, насколько реферат приближается к реферируемому тексту и т. д.

К моему собственному сожалению и, может быть, к радости многих при сутствующих здесь, проблема перевода, и даже машинного перевода, не по ставлена сейчас как математическая проблема. Она даже не поставлена как логическая проблема. Лишь для очень чётко семантически ограниченных текстов, даже не для реальных текстов научных областей, а для искусствен но созданных текстов этих научных областей, она может быть поставлена как логическая проблема, а вообще пока что это проблема лингвистическая, со всеми вытекающими отсюда неприятными последствиями. Конечно, это проблема весьма и весьма специфическая, которую невозможно решать тра диционными лингвистическими средствами.

Итоги работы секции алгоритмов машинного перевода Вот это обстоятельство (отсутствие точной постановки проблемы) и за трудняет создание теории машинного перевода.

Должен сказать, что на секции алгоритмов машинного перевода не было всё§таки теории машинного перевода. Можно думать, что она была в та ком случае на теоретической секции. Но и на теоретической секции также не было теории машинного перевода, там были очень важные теоретиче ские построения, важные не вообще, а для машинного перевода, касающиеся формального описания языка. Эти построения очень существенны, они сами образуют некоторую теорию. Без этой теории, промежуточной между тра диционной лингвистикой и будущей, ещё не созданной теорией машинного перевода, нельзя обойтись. Это тот фундамент, на котором теория машин ного перевода будет построена, но её ещё нет.

Однако отдельные зёрна создаваемой теории машинного перевода были разбросаны в разных докладах, которые мы заслушали на секции алгорит мов. Вот эти зёрна в случайном порядке.

Первое. В совместном докладе Марии Михайловны Ланглебен и Еле ны Викторовны Падучевой была высказана идея, касающаяся устранения омонимии. Омонимия имеет очень большое значение в машинном переводе, где она, кстати, чётче отграничена от проблемы полисемии, чем в обыч ной лингвистике. Типичный пример омонимии: «form» | существительное и «form» | глагол в английском языке. В указанном докладе была высказана идея как можно более позднего устранения подобной омонимии на возможно более позднем этапе машинного перевода. Если так просто сказать, что на до устранять омонимию на возможно более позднем этапе перевода, | это вызвало бы справедливые возражения (зачем же долго обращаться с «form»

как с существительным, когда это на самом деле глагол). Но дело в том, что в докладе предлагается оригинальный метод устранения омонимии | аф фиксальный метод. Именно, предлагается считать, что омонимичные слова есть результат словообразования при помощи нулевого аффикса. Предлага ется считать, что омонимичные слова «form»§существительное и «form»§гла гол различаются суффиксами (нулевыми), подобно тому, как неомонимич ные слова «форма» и «формировать» различаются ненулевыми суффиксами.

Это значит, что нужно применять те же методы, как если бы этот нулевой суффикс (или вообще аффикс) был на самом деле. Некоторое время мы не знаем, что это такое, а потом узнаём, какой же из двух нулевых аффиксов надо поставить.

Вот это обращение к словообразованию с нулевыми аффиксами, выра жает, на мой взгляд, определённую тенденцию, тенденцию к поморфемному анализу и синтезу (настолько поморфемному, что даже нулевые морфемы учитываются).

Другое выражение той же идеи поморфемного исследования, а именно синтеза, прозвучало в докладе Зои Михайловны Волоцкой, где было предло Языкознание жено синтезировать все формы русского глагола от основы несовершенного вида путём прибавления или удаления тех или иных морфем.

Вообще фразу (написанную) можно представлять себе как поток морфем, если в число морфем включить знаки препинания, пропуск между словами и особую морфему прописной буквы. Тогда фразу можно рассматривать как цепочку таких морфем, и можно было бы предложить алгоритм перевода, исходя из такого поморфемного, а не пословного, анализа. (Роль знаков пре пинания как морфем письменной речи при анализе русской фразы была по казана в докладе Т. М. Николаевой.) Аналогично, и синтезируемую фразу можно мыслить как цепочку морфем, и перевод представлять себе как пре образование одной цепочки морфем в другую цепочку морфем (а не цепочки слов в цепочку слов, как это обычно представляют). Поморфемное предста вление фразы, когда единицей считается не слово, а морфема, может, таким образом, стать основой машинного перевода. (Заметим, что отголоски этих идей, элементы поморфемного анализа, имеются и в практике составления наряду со словарём основ особого словаря окончаний;

морфема§основа при равнивается тем самым по значению к морфеме§окончанию.) Следующая группа вопросов, важных для теории, | это независимость анализа от выходного языка и независимость синтеза от входного языка.

Это тот камень, который ляжет в фундамент теории машинного перевода.



Pages:     | 1 |   ...   | 8 | 9 || 11 | 12 |   ...   | 45 |
 





 
© 2013 www.libed.ru - «Бесплатная библиотека научно-практических конференций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.