ВВЕДЕНИЕ
У. Плат
За время, прошедшее после Восьмого международного конгресса лингвистов (1957 г.), интерес к математической лингвистике и количество исследований в этой области сильно возросли как в Америке, так и в Европе.
В последние годы математическая лингвистика стала развиваться также и на Дальнем Востоке, результатом чего было возникновение в Японии журнала «Mathematical Linguistics» (1957) и «Японского общества математической лингвистики». Профессор Джошуа Уотмоу в своем докладе на Международном конгрессе в 1957 г. упомянул, что за два года до этого конгресса начал работать семинар по математической лингвистике в Гарвардском университете, и с этих пор впервые математическая лингвистика появилась в учебном расписании. В течение последующих лет математическая лингвистика стала завоевывать все более важное место как в исследованиях отдельных ученых, так и в университетских курсах — не только в Гарварде[136], но и в других университетах Европы и Соединенных Штатов. Центрами математической лингвистики стали Массачусетский технологический институт, Мичиганский и Пенсильванский университеты в Соединенных Штатах, Боннский университет в Германии, а также Московский и Ленинградский университеты в Советском Союзе. Имеются свидетельства того, что математическая лингвистика получает все большее признание как академическая дис-циплина. Курс по квантитативной лингвистике был введен в Индианском и Калифорнийском университетах, а в 1958 г. Министерство высшего образования СССР вынесла постановление о введении факультативных курсов по математической лингвистике и машинному переводу для студентов-филологов и математиков в Московском, Ленинградском, Горьковском, Саратовском и Томском уни- верситетах.
Задача этой статьи — дать обзор последних достижений в области математической лингвистики, уделяя главное внимание основным теоретическим понятиям и тем сферам применения математической лингвистики, которые вырисовываются наиболее четко в обширной и разнообразной литературе по этому вопросу.
Поскольку времени на изучение материалов у нас было мало, некоторые ценные результаты и даже целые области[137], непосредственно связанные с математической лингвистикой, не отражены в» настоящем обзоре. Мы надеемся, однако, что библиографический список, приложенный к настоящей работе (хотя он и не является ни в какой мере исчерпывающим), будет полезным пособием для тех, кто хотел бы составить себе более полное представление о предмете.Большая часть последних достижений лингвистики была основана на тех возможностях практического и теоретического описания формальных свойств естественного языка, которые заключены в дискретных моделях[138]. Хотя модели отдельных языков, начиная с орфографической системы английского языка и кончая построенными недавно грамматиками экзотических языков, часто подвергались суровой критике за их многочисленные недостатки, никто, как правило, не утверждал при этом, что дискретные модели являются в принципе неадекватными. Напротив, критика чаще всего сводилась к тому, что одна дискретная модель должна быть заменена другой, в большей степени обладающей желательными (с точки зрения критикующего) свойствами.
Если рассматривать языковые модели как абстрактные системы дискретных элементов, то к ним можно применять различные математические понятия и методы, начиная от элементарной идеи числа и кончая сложными логическими, статистическими и теоретико-множественными операциями. Однако представление о том, что всякое привлечение чисел и математических операций для описания таких систем элементов делает утверждения более «точными» или более «научными», является абсолютно ошибочным. Нужно прежде всего показать, что новая система, полученная таким образом, является более удовлетворительной моделью, чем исходная система,— либо в том отношении, что она дает возможность формулировать более простые и более общие теоретические утверждения о некоторых аспектах моделируемой области[139], либо потому, что операции над моделью проливают свет на результаты соответствующих операций в моделируемой области.
Одна из самых больших опасностей, связанных с построением математических моделей языка, в особенности количественных, состоит в том, что неразборчивое использование математического аппарата неизбежно приводит к бессмысленным и даже дезориентирующим результатам. Поэтому необходимо ясно понимать, что предпосылкой обогащения лингвистики с помощью математики является не только знание соответствующих областей математики, но и, кроме того, глубокое понимание сущности лингвистических проблем, на разрешение которых должны быть направлены математические методы.Элементарные математические операции, основанные на счете, применялись при изучении языка еще в древние времена[140]. В последние годы простой подсчет символов уступил место исследованиям, в которых к результатам подсчета применяются методы математической статистики и теории информаций[141]. Эти методы с большим успехом использовались для изучения широкого круга языковых явлений; налицо результаты в самых разных областях — от изучения общих закономерностей дистрибуции слов в тексте до измерения степени генетического родства двух языков.Некоторые из важнейших достижений квантитативной, или статистической, лингвистики будут рассмотрены более подробно в разд. 2.
Современная лингвистика усиленно занимается построением моделей языка, описывающих язык через возможные структурные конфигурации и взаимосвязи элементов на разных уровнях (фонологическом, морфологическом, синтаксическом). Для построения таких систем, ио-видимому, особенно хорошо приспособлены понятия и методы современной алгебры, и большое количество исследований проводится сейчас именно в этом направлении[142]. В разд. 3, посвященном структурным моделям, будет показано, что хотя количественные методы и не имеют в этой области первостепенного значения, они все же могут играть вспомогательную роль в некоторых структурных моделях языка.
Разд. 4, заключительный, содержит краткий перечень важнейших практических приложений математической лингвистики. Интенсивная работа в таких областях, как машинный перевод, переработка информации и построение автоматических программирующих языков для вычислительных машин, уже сейчас оказалась важнейшим стимулом для развития математической лингвистики и в дальнейшем, по всей вероятности, будет сильно влиять на развитие лингвистики в целом.
2.