КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА: МОДЕЛИРОВАНИЕ ЯЗЫКОВОГО ОБЩЕНИЯ
I
Проблемы взаимосвязи науки и практики сегодня преломляются для лингвистики через призму требований глобальной компьютеризации. Яз,ык носит всепроникающий характер. Любая проблема информатики, искусственного интеллекта, экспертных систем и — шире — рационализации человеческой деятельности имеет языковой аспект.
Подобно тому как советские специалисты по информатике ведут сейчас активную разъяснительную работу, направленную на устранение «досадного непонимания существа и растущей экономической значимости проблемы формирования и промышленной эксплуатации национальных информационных ресурсов» [13, с. 8], лингвисты-прикладники озабочены все еще часто встречающимся среди представителей технических наук непониманием сущности и роли вклада лингвистики в компьютеризацию, а также распространенным среди многих языковедов непониманием роли компьютеризации как стимула перестройки лингвистической теории. Постараемся в какой-то мере прояснить эти моменты.Корень многих недоразумений кроется в неточном определении информационной природы естественного языка. Здесь важно иметь в виду, что язык — это не столько «форма выражения» готовых мыслей, сколько способ содержательной организации и представления знаний. Этот способ первичен, универсален, возникает с самим зарождением человеческого интеллекта и служит надежным инструментом его развития. Без широкого целенаправленного моделирования информационного механизма естественного языка и процессов речевой деятельности можно обходиться лишь до поры до времени. Компьютеризация разнообразных видов интеллектуальной деятельности (а это значит — практически любой деятельности человека) рано или поздно приводит к необходимости экспликации языковой способности пользователя ЭВМ с последующим созданием соответствующих банков знаний и машинных программ.
Что же конкретно заставляет уже сегодня говорить об остроте потребности в лингвистическом обеспечении компьютеризации? (Кстати, сама разработка подобного обеспечения являет собой
яркий образец конкретного взаимодействия общественных, естественных и технических наук).
Прежде всего укажем на гигантские объемы накопленной и постоянно создаваемой информации, которая подлежит обработке с помощью ЭВМ. Поскольку эта информация часто организована средствами естественного языка, ее реальное освоение возможно лишь при условии автоматической смысловой обработки текстов, без предварительной препарации их человеком. Лишь тогда откроется доступ в машину большим массивам организационноуправленческой, плановой, научно-технической, социально-политической, правовой, проектной, библиотечной, справочно-бытовой и прочей информации.
Эффективное использование знаний, содержащихся в текстах, требует новых стратегий обработки информации, отличных от традиционных логических подходов. Такие стратегии должны учитывать семантические законы естественного языка. Например, из высказывания Иван вернул мне книгу следует, что книга ранее была у меня (этот вывод мы делаем на основании той части толкования глагола вернуть, которая называется пресуппозицией). Или: из высказывания Он заставил мотор остановиться можно сделать заключение «Он остановил мотор нестандартным способом» (это так называемая коммуникативная импликатура, подсказываемая в данном случае именно тем способом выражения, который выбрал говорящий).
Далее, потребность в лингвистическом обеспечении обусловлена перспективной установкой на создание человеко-машинных систем решения интеллектуальных задач, Заметим, что нередко представители и гуманитарных, и естественных наук грешат рассмотрением компьютера как сугубо внешней силы, абсолютно отчужденной от человека. А между тем серьезный разговор об усилении природных возможностей человеческого разума должен предусматривать налаживание гибкого взаимодействия человека и машины. Оперативная, удобная, развивающаяся кооперация при таком взаимодействии будет опираться на естественный язык (точнее, определенный подъязык, связанный с некоторой сферой общения или классом решаемых задач).
Особо следует подчеркнуть необходимость учитывать лингвистическую семантику при построении языков представления знаний вне системы обработки текстов в ее полном виде.
Даже в этом случае естественный язык служит надежной точкой отсчета: ведь и создатели систем, и пользователи говорят, пишут и думают преимущественно на естественном языке. Учет этого факта поможет в решении таких острых проблем компьютеризации, как унификация создаваемых систем и автоматизация по возможности большего числа процессов.В социальном плане значимость лингвистических проблем компьютеризации связана с возникновением новых видов массовой деятельности, включающих построение искусственных языков и машинных словарей, разработку информационных банков, построение алгоритмов обработки текстов, разработку режимов-общения в системе „человек — компьютер — человек" и т. д Вообще, ЯЗЫКОВОЙ аспект немаловажен для всех основных направлений индустрии обработки знаний, таких, как сбор, создание, хранение, систематизация, распространение, интерпретация информации.
Заметим, что и с исторической точки зрения язык оказывается центральным фактором важнейших этапов развития информационной технологии: вспомним возникновение письменности, изобретение книгопечатания, создание искусственных информационных и алгоритмических языков, являющихся производными от естественного языка и формализующих некоторые из его функций. Наконец, с точки зрения науковедения, можно констатировать, что лингвистика входит в ядро складывающегося в настоящее время комплекса когнитивных наук, объединяемых по их интересу к проблемам организации, представления, обработки и использования знаний.
Итак, лингвистическое обеспечение автоматизированных систем — это совокупность средств, позволяющих осуществлять компьютеризацию языковой деятельности, сопровождающей (в явной или скрытой форме) практически любую интеллектуальную деятельность человека. С технологической и системной точек зрения речь идет о создании того или иного типа автоматизированной системы обработки текста (АСОТ)—некоторого процессора, на входе и на выходе которого присутствует текстовая информация на естественном языке. Типы АСОТ многообразны и могут быть нацелены на моделирование различных языковых процессов, таких, например, как диалоговое взаимодействие, сжатие информации, реферирование текста, логическая обработка содержания, перевод на другой естественный язык и т.
д. С собственно лингвистической точки зрения процессы, осуществляемые в машине при решении подобных задач, сводятся к перезаписи информации на тех или иных (естественных и искусственных) языках. Внешние критерии, которыми руководствуются создатели АСОТ, подводятся под общую формулу «оптимизация общения человека и машины». Именно эту задачу решает такая комплексная научная дисциплина, как компьютерная (вычислительная) лингвистика и ее наиболее существенная часть — вычислительная семантика. Прикладные результаты, получаемые в данной области,— это семантические алгоритмы и семантические метаязыки, то есть модели процессов (извлечения информации из текста и воплощения ее в текст) и соответствующих языков представления знаний (на которых хранится и перерабатывается информация, извлеченная из текстов).Разумеется, прикладные модели отличаются определенным упрощением, огрублением языковой реальности, но эта их черта не имеет ничего общего с упрощенчеством, с игнорированием реальной сложности моделируемого объекта. Как нельзя при осуществлении компьютеризации отмахнуться от языкового фактора, так нельзя отмахнуться и от многоаспектности, многоуровневости, „открытости" языкового механизма. Методология прикладного исследования должна предусматривать неуклонное повышение эффективности создаваемых моделей на основе все более полного учета реальных свойств языка.
Назовем лишь некоторые из наиболее фундаментальных качеств естественного языка: принципиальная нечеткость значения языковых выражений (эта нечеткость в полной мере относится и к деловой сфере общения, и даже к дефинируемым ее элементам — терминам [10] ), динамичность языковой системы, образность номинации (основанная прежде всего на метафоричности), бесконечные творческие потенции в освоении новых знаний, семантическая мощь словаря (позволяющая выражать любую информацию с помощью конечного инвентаря элементов), гибкость в передаче эксплицитной и имплицитной информации, разнообразие функций (включающее коммуникативную, когнитивную, планирующую, управляющую, обучающую, эстетическую, метаязыковую и другие функции), специфическая системность (под которой имеется в виду не только членение языка на уровни, но и членение его на подъязыки — относительно независимые функционально-тематические подсистемы).
В целом по числу своих внутренних диалектических противоречий естественный язык может быть с полным основанием оценен как сложнейший объект для моделирования. Достаточно упомянуть тот факт, что перечисленные С. Маркусом «пятьдесят две оппозиции между научным и поэтическим общением» [38] представляют, по сути, противоположные тенденции, присущие языку в целом (сюда входят: субъективность — объективность; переводимость — непереводимость; отсутствие синонимии — бесконечность синонимических средств; дискретность значения — континуальность значения; информативность — избыточность; логичность — нелогичность; алгебраичность — геометричность и т.д.). Да и сами поэтические и научные подъязыки диалектически связаны: это механизмы, служащие целям открытия, познания мира. Язык — незаменимый помощник в сфере рационального мышления, так же как и в сферах эмоционального общения. Язык — это фактор регулирования практически любой человеческой деятельности.Компьютерное моделирование языка и речевой деятельности нуждается в солидной теоретической базе, и фундаментальная наука должна вплотную заняться соответствующими актуальными проблемами. Нам нужны специальные теории, которые в настоящее время существуют в зачаточном состоянии либо отсутствуют вовсе. Думается, моделирование языков (естественных и искусственных) вписывается в проблему моделирования способностей человека. Языковая способность — это способность, делающая человека человеком, возникающая и развивающаяся под воздействием практических потребностей. Проявления ее многообразны, но в когнитивном плане следует особо подчеркнуть ее роль в речемыслительной деятельности, в организации памяти, в процессах аутокоммуникации. Предстоит развить теорию моделей языкового общения, теорию подъязыков естественного языка, теорию лингвистической семантики в ее связи с „экстралингвистическими" семантиками (упомянем хотя бы логическую, психологическую, социологическую, этическую, эстетическую, этнокультурную семантику). К числу более частных, но не менее важных направлений относятся, например, типология естественных и искусственных языков (заметим, что естественный язык все более впитывает в себя элементы „искусственности"), теория понимания текста, теория вербализации коммуникативного замысла, теория коммуникативных неудач, теория семантической эквивалентности сообщений и другие.
Практические выводы из сказанного очевидны. Лингвистика должна повернуться лицом к новым задачам, выдвигаемым компьютеризацией. У нас в стране начинают предприниматься некоторые меры для расширения подготовки языковедов по специальности „структурная, прикладная и математическая лингвистика", но здесь надо обратить особое внимание на овладение методами представления и обработки знаний. Очевидно, мы должны ставить вопрос и шире: компьютерная грамотность в стране в целом немыслима по большому счету без лингвистической грамотности. По-новому должно вестись и преподавание языковедческих предметов в школе (а у нас уже есть некоторый опыт развития у школьников творческого, самостоятельного, точного подхода к анализу фактов языка [19]). Назрела необходимость и в специальном отечественном журнале по компьютерной лингвистике. В свете очерченных перспектив, диктуемых жизнью, естественны те усилия, которые начинает наращивать издательство „Прогресс" в деле оперативного ознакомления советского читателя с опытом зарубежных коллег, исследующих язык в соответствии с его новым статусом в современном мире [16; 17].
Тематика настоящего сборника обозначена термином „компьтер- ная лингвистика". Именно так можно назвать ту дисциплину, которая разрабатывает лингвистические проблемы компьютеризации. Этот термин все более приобретает права гражданства. Именно так называется одна из секций Научного Совета АН СССР по проблеме „Искусственный интеллект". Выскажем некоторые соображения о целесообразности использования данного термина как более удобного (в ряде отношений), чем термин „вычислительная лингвистика" (который, впрочем, в определенных контекстах должен сохранять все свои права, так как выделяет свои аспекты предмета).
Итак, наши соображения об этих терминах сводятся к следующему. Во-первых, термин „компьютерная лингвистика" задает общую ориентацию на использование компьютеров для решения разнообразных научных и практических задач, связанных с языком, никак не ограничивая способы решения этих задач. Термин же „вычислительная лингвистика" может пониматься более узко, ибо даже при широкой трактовке понятия „вычисление" за его пределами как бы остаются такие стороны решения лингвистических задач, как, например, представление знаний, организация банков языковых данных, психолингвистические аспекты взаимоотношений и взаимодействия человека и компьютера и ряд других аспектов. Тем самым можно считать, что термин „компьютерная лингвистика" (по своей внутренней форме) шире, чем „вычислительная лингвистика". Во-вторых, уже сложились параллельные термины типа „компьютерная грамотность", „компьютерная логика" и т. п. В-третьих, английский эквивалент computational linguistics содержит прилагательное computational, родственное слову computer, и оно может переводиться и как „компьютерный", и как „вычислительный". Отметим, кстати, что в русском языке термины „компьютер", „ЭВМ", „вычислительная машина" употребляются как синонимы и, естественно, используются при рассмотрении проблем компьютерной лингвистики на равных.
Поток зарубежных публикаций по вопросам компьютерной лингвистики огромен (из последних книг упомянем, например, [32; 33; 35; 36; 37; 39; 40; 42]). Выходит много монографий, сборников, издаются журналы „Компьютерная лингвистика" (США), „Искусственный интеллект" (Нидерланды) и ряд других. Раз в два года проводится Международная конференция по компьютерной лингвистике (сокращенно — КОЛИНГ). Десятая конференция состоялась в 1984 г. в Станфордском университете (США), Одиннадцатая — в 1986 г. в Бонне. Кроме того, в промежутках между ними теперь проходят конференции Европейского отделения Ассоциации компьютерной лингвистики. Значительное место эти вопросы занимают на Международных объединенных конференциях по искусственному интеллекту, последняя из которых прошла в 1987 г. в Милане. Ежегодно проводится не менее десятка международных научных симпозиумов по прикладной лингвистике, по машинному переводу, по применению компьютеров в управлении, в гуманитарных науках, в словарном деле, в обучении и т. д.
Компьютерная лингвистика — важная часть прикладного языкознания (об их соотношении см. [9, с. 5—9]). Круг ее задач, проблем, методов широк и разнообразен; во многом он связан со спецификой того или иного вида практической деятельности людей — деятельности, требующей сегодня применения компьютеров. Но существуют, конечно, и типовые исследовательские ситуации, повторяющиеся от задачи к задаче. Надо, правда, признать, что и таких типовых проблем довольно много. Поэтому отразить их все в одном сборнике невозможно. Надеясь на регулярное освещение развития компьютерной лингвистики в последующих выпусках настоящей серии, мы отобрали для данного сборника статьи, которые по своему содержанию близки к фундаментальным теоретическим проблемам языкознания, а таковыми сегодня с полным основанием можно считать проблемы процессуального описания языка, раскрытия механизмов его деятельности, проблемы, связанные с закономерностями речевого общения, с конструктивным моделированием коммуникативной функции языка. Таким образом, в центре внимания настоящего сборника — моделирование языкового, или речевого, общения (речевого — в широком смысле, например по М. М. Бахтину [3]). Работы, включенные в сборник, иллюстрируют тот сдвиг в подходах, который произошел за последние несколько лет по сравнению с теми методами процессуального описания языка, которые нашли отражение в сборнике «Новое в зарубежной лингвистике», вып. XII (1983). Если ряд идей и методик сохранил свою силу и на сегодня, то общий контекст прикладных разработок меняется буквально на глазах. На первый план выдвигаются модели целостного речевого взаимодействия (диалога), и каждый частный процесс или элемент интерпретируется в составе двустороннего коммуникативного акта. И таким образом, если выше мы подробно говорили о роли компьютерной лингвистики в современном мире, в ускорении научно-технического прогресса, то теперь мы можем констатировать существенное методологическое значение компьютерной лингвистики для самой науки о языке: компьютерное моделирование речевого общения представляет собой с этой точки зрения удобный полигон для эффективного испытания общетеоретических концепций и гипотез о природе языка, о принципах его действия; сегодня это одна из важнейших форм «эксперимента в языкознании» (Л. В. Щерба)—эксперимента вычислительного, эксперимента компьютерного.
II
Какова же та общая понятийная парадигма, в которую вписывается указанный выше способ применения компьютеров? Какова та целостная теория, которая, в принципе, не зависит от компьютеров, но сильно выиграет от их использования,— та теория, которая поможет осмыслить и оценить место и роль каждого конкретного эксперимента?..
Всеобщий интерес к коммуникативной природе языка и языковых явлений, к категории коммуникативности вызвал к жизни множество направлений и методов исследования. Среди них особое место занимает та совокупность направлений, которую можно обозначить как теорияшоделей общения [21; 22; 23; 27]. Это наименование означает, что в качестве объекта исследования берется прежде всего особая деятельность, называемая „общением", а в качестве основного метода — общенаучный метод моделирования (в частности, моделирование может быть компьютерным, и это, конечно, чрезвычайно важно!). Сущность рассматриваемого метода заключается в построении некоего искусственного образования, искусственного механизма, например в виде системы правил, так, чтобы эта система отражала, объясняла, имитировала изучаемую деятельность. Разумеется, отдельные модели сильно упрощают и огрубляют действительность, но совокупность разных моделей, особенно по мере их развития и уточнения, будет давать весьма полную картину объекта. Модели бывают глобально-обобщающего уровня (и примером здесь может служить, скажем, экономическая модель капиталистического способа производства) или максимально конкретизированные (как, скажем, компьютерная модель морфологического анализа и синтеза словоформ, построенная М. Г. Мальковским [20, с. 99—122] на базе известного словаря А. А. Зализняка [15], который, кстати, сам по себе является образцом структурной модели в области словоизменения). В рассматриваемой нами сфере — сфере общения — стремление ученых к моделированию велико, но результаты пока еще весьма скромные, хотя и сделан ряд фундаментальных открытий. Важнейшая задача при моделировании того или иного объекта — это точное определение его компонентов, или составных частей, и взаимосвязей между ними. Этой стороне дела уделяется большое внимание в теории моделирования.
Хотя метод моделирования активно развивается именно в наши дни, это вовсе не означает, что, применяя подобный подход к общению, мы должны начинать с нуля. Весьма точные модели социального взаимодействия намечались уже в рамках античной риторики. В отечественной науке обоснование необходимости серьезнейшего изучения общения, и в первую очередь его главной формы — диалога, дал Л. В. Щерба в 1915 г. в своей докторской диссертации „Восточно-лужицкое наречие". Он писал: «Все эти наблюдения лишний раз показывают, что монолог является в значительной степени искусственной языковой формой и что подлинное свое бытие язык обнаруживает лишь в диалоге» (цит. по [30, с. 31]). В 1923 г. появилась удивительная по своей прозорливости и идейной насыщенности работа Л. П. Якубинского „О диалогической речи", в которой, в частности, есть мысль, предвосхищающая сегодняшние искания в области компьютерного моделирования диалога. Яку- бинский пишет: «Диалогическая форма способствует протеканию речи в порядке автоматической деятельности» [30, с. 53]. Отсюда следует, что для успешного общения человека с компьютером при организации этого общения должны быть учтены модели диалога, уже автоматизированны ев человеке и заложенные в его интеллектуальных, в частности языковых, способностях.
Необходимость сознательного, активного развития теории моделей общения диктуется нетерпимостью дальнейшего застоя, который стал очевиден в целом ряде разделов теоретического языкознания. В частности, повторение мысли о коммуникативной природе языка, речи, предложения, высказывания, значения и т. п. стало общим местом курсов по общему языкознанию, монографий о природе языка и речи. Но повторение указанного тезиса в течение десятилетий ни на шаг не сдвинуло решение задачи конструктивного моделирования коммуникативной стороны языковых явлений. Более того, сама реальность, а именно деятельность общения (как в ее внешних проявлениях, так и во внутренних процессах), не стала объектом научного рассмотрения, а слова «общение», «коммуникация», «коммуникативный» обесценились, стали привычно бесцветными. Многие проникновения Л. П. Якубинского, сделанные более 60 лет назад, не были развиты ни на йоту. Но это не должно вселять в нас пессимизм. Наш долг — придать коммуникативной концепции языка ясный и действенный смысл. Жизнь требует точных моделей общения и для кардинального изменения положения в школьном классе (где ученик должен по-иному общаться с учителем), и для включения в сеть человеческого общения компьютеров (обладающих искусственным интеллектом).
Интерес к моделям общения неуклонно растет и в теоретической, и в прикладной лингвистике. Мы имеем на сегодня целый ряд специальных теорий, затрагивающих отдельные аспекты общения: это прагматика в ее многочисленных толкованиях, теория речевых актов, теория речевой деятельности, теория массовой коммуникации, теория диалоговых компьютерных систем, риторика и неориторика, теория аргументации и другие. Тем более важно развитие комплексной теории моделей общения. Ее необходимость определяется единством объекта исследования Она поможет определить предмет более частных дисциплин. Эта комплексная теория направлена на деятельностный аспект языка с полным учетом при этом психического и социального факторов. Эта теория призвана моделировать функцию языка, которая традиционно считается важнейшей. Прикладное значение такой теории состоит в создании единого фундамента для разнообразных приложений функционально-лингвистических знаний.
Основная целостная единица речевого общения — это речевой коммуникативный акт как законченная часть языкового взаимодействия, имеющая естественные границы. Коммуникативный акт (КА) входит в состав некоторого акта совместной деятельности, включающей физическую, интеллектуальную, эмоциональную, бессознательную, а также неречевую семиотическую деятельность. Типовая разновидность КА — диалог, хотя в общем сл>чае сюда может включаться и монолог. Границы КА обычно определяются достижением некоторой стратегической (для данного акта) цели. В случае, если она не достигается, акт общения квалифицируется как неудачный.
Основные компоненты КА, различающиеся по своей сущности, могут быть представлены схематично следующим образом:
1. Коммуниканты: Ki, К2, Кз, Кп- ★
2. Коммуникативный текст (в случае ★ б. Практические
диалога — диалогический текст). 'А'цели (ПЦ).
3. Процессы вербализации и понимания. +6. Коммуникатив-
4. Обстоятельства данного КА. 'А'ные цели (КЦ).
Дадим минимальный комментарий к этой схеме.
1) Коммуниканты рассматриваются как автоматы с определенным внутренним устройством, с особой организацией субъективных банков информации — знаний, представлений, образов, чувств.
2) Коммуникативный текст состоит из речевых произведений (более или менее развернутых реплик), которые поочередно создаются коммуникантами.
3) Психолингвистические процессы общения сводятся к двум принципиально различным, но тесно взаимосвязанным видам — вербализации и пониманию (начальный этап первого из них — формирование коммуникативного замысла — мог бы, видимо, рассматриваться и как относительно самостоятельный процесс).
4) Обстоятельства КА — это общий деятельностный контекст КА, включающий как непосредственный акт совместной деятельности, так и привходящие, фоновые обстоятельства (по своей природе мир обстоятельств распадается на физическую сферу и психосоциосферу) .
Пятый и шестой компоненты КА выделены на схеме особо, так как они являются сквозными, связующими и пронизывают все другие компоненты.
5) Практические цели вытекают из хода той практической деятельности, в которую включен КА.
6) Коммуникативные цели — это намерения, придающие осмысленность обращению коммуниканта к своему партнеру.
По сути, каждое РП — это средство воздействия на окружение (на партнера и через него — на другие элементы действительности, физические или ментальные). ПЦ осуществляются через посредство КЦ. И те и другие могут быть в пределах фикспро- ванного КА стратегическими или тактическими. В соответствии с приведенной схемой КА, мы можем говорить о комплексных моделях КА в целом или моделях его отдельных компонентов. Заметим, что элементарным тактом КА является вербализация или понимание некоторого речевого произведения.
С прикладной, да, пожалуй, и с теоретической точки зрения одним из важнейших принципов моделирования КА следует считать принцип зависимости моделей от т и п а акта общения. Реальные компьютерные системы не претендуют на безграничную универсальность, а моделируют определенные типы общения. Эти последние тесно связаны с принятым в прикладной лингвистике понятием подъязыка, означающим совокупность тех языковых средств, которые необходимы и достаточны для построения и понимания текстов определенной „сферы общения" (термин, часто употребляемый М. М. Бахтиным [3]). Именно в этом смысле и Л. Витгенштейн говорил о „типах языка" в соответствии с „формой жизни" или „типом языковой игры" [8]. Носители определенного подъязыка образуют коммуникативный социум. Его представители гораздо легче понимают друг друга, чем носители данного подъязыка и „неспециалисты". Ниже мы останавливаемся подробнее на принципах типологической систематизации коммуникативных актов. Здесь же остается заметить, что типология диалогов может служить базой и для типологии монологических текстов, создаваемых при так называемом „разорванном общении"; ср. приказы, инструкции, объявления, справочники и т.д. (все они имеют, конечно, и коммуникативно-целевые характеристики). М. М. Бахтин писал по этому поводу: «Сложные по своему построению и специализированные произведения различных научных и художественных жанров при всем их отличии от реплик диалога по своей природе являются такими же единицами речевого общения... Произведение, как и реплика диалога, установлено на ответ другого (других), на его активное ответное понимание, которое может принимать разные формы... Произведение — звено в цепи речевого общения...» [3, с. 445].
Ниже представлены основные группы признаков, которые могли бы служить исходной теоретической базой при осмыслении всего диалогического пространства, а также при разработке детальной типологии КА для тех или иных ограниченных подъязыков. Если стремиться использовать термин „жанр", то его можно приравнять к нашему понятию „тип диалога", или, иначе говоря, к той сущности, которая задается выбором конкретных признаков и их значений (ниже мы приводим примерные группы таких признаков). Заметим, что М. М. Бахтин, говоря о «речевых жанрах» применительно к высказываниям, приравнивал их к «относительно устойчивым типам высказываний» [3, с. 428].
Подчеркнем, что нами предлагаются лишь группы признаков, а исчисление самих конкретных признаков (и тем более их значений)— дело особого кропотливого исследования, причем неизвестно, может ли оно быть выполнено на глобальном уровне (вполне возможно, что перечень признаков и их значений целесообразно создавать, изучая диалогическую реальность отдельно в разных подъязыках). Предлагаемые группы таковы:
1. Сфера общения. Это первый вид признаков не только по номеру, но и по важности; именно его всячески выделял Бахтин; в признаках этой группы прямо или косвенно отражается круг потенциальных участников диалога, виды удовлетворяемых ими жизненных функций (как индивидов и как членов социума).
2. Место, в котором происходит диалог (имеется в виду социальный статус места, например цех завода, справочное бюро, кабинет министра, трибуна пресс-конференции и т. п.).
3. Вид практической деятельности, частью которой является данный диалог.
4. Характеристика коммуникантов и их взаимоотношений (эта группа признаков чрезвычайно богата информацией, которую можно учесть при классификации диалогов; сюда входят: социально-психологический тип каждого коммуниканта, социальные соотношения между ними, степень знакомства и опыт предшествующего взаимодействия, степень активности в данном диалоге, характер активности, эмоциональный настрой).
5. Хронологический период, к которому относится данный диалог.
6. Тип стратегической практической цели каждого коммуниканта (важно, когда эта ПЦ является общей для партнеров, например: выполнить определенную производственную операцию, понять причину взрыва, выработать приемлемое для обеих сторон определение некоторого понятия, как можно больше разозлить друг друга и т. д.).
7. Тип стратегической коммуникативной цели (КЦ) каждого коммуниканта (например: информирование, разъяснение, инструктаж, проверка знаний, уничижение, спор в поисках истины, совместное вспоминание и т. д.).
8. Тематика диалога (здесь, в частности, различаются моно- тематические и политематические диалоги).
9. Характер информации, развертываемой в диалогическом тексте (обобщающая — конкретная; прямая — эвфемическая; качественная— количественная; различная по модальности и т.д.).
10. Объемные характеристики диалогического текста в целом и отдельных составляющих его речевых произведений (измерение может быть в словах, в предложениях, в символах, во времени и др.)*
11. Композиция диалога (схемы диалогического текста, отражающие динамику общения на уровне чередования тактических КЦ).
12. Речевой стиль. (Эта группа признаков связана с принципа-
ми выбора языковых средств из потенциально приемлемых для данной тематики и данной стратегической КЦ, то есть предпочтение одних, а не других из бесчисленных вариантов перифразирования: телеграфный стиль, педантичный стиль, цветастый стиль, мутный стиль и т. п.).
13. Степень искусственности «языковой игры» (в смысле Витгенштейна). (Здесь учитываются различные степени неискренности в проведении диалога, а также, например, принадлежность диалога к реальности или к фантазии художника).
Эти группы признаков предварительно проверялись нами на материале диалогов из художественной литературы, разговорной речи, протоколов человеко-машинного общения.
Названные нами базовые понятия комплексной теории моделей общения и важнейшие признаки типологии коммуникативных актов позволяют последовательно и объективно подходить к тем или иным конкретным компьютерным моделям общения. В целом можно сказать, что интенсивный научный поиск затронул сегодня все основные участки огромного исследовательского пространства, именуемого „моделированием общения". Но продвижение на разных участках идет неравномерно. Во-первых, это связано с ограниченностью сил и часто случайным их распределением. Во-вторых, с разной степенью трудности тех или иных проблем. В-третьих, с многообразием типов общения (ведь решенность какой-то проблемы для одного типа диалога далеко не всегда означает ее решенность для всех других типов). В-четвертых, с изменением приоритетов тех или иных задач в зависимости от сегодняшних интересов общества („социальный заказ").
ill
Как же отразился огромный поток литературы по компьютерному моделированию речевого общения в предлагаемом вниманию читателя сборнике? Из называвшихся выше основных проблем теории моделей общения более всего представлены на страницах этой книги три: проблема понимания, проблема знаний и проблема коммуникативных неудач. Это не случайно. Именно эти аспекты человеко-машинного общения привлекают в последнее время наибольшее внимание ученых и специалистов по внедрению за рубежом. Без работающих моделей этих аспектов коммуникации невозможна реальная эксплуатация никаких промышленных систем. Действительно, компьютер должен прежде всего понимать человека с достаточной степенью полноты и глубины, чтобы быть сметливым, предупредительным, пунктуальным, но не обременительным помощником в разнообразных видах практической деятельности. (Высокая степень мастерства в вербализации, в выражении своих знаний на безупречном естественном языке тоже важна для нормальной эффективной коммуникации, но ее моделирование может быть отодвинуто во времени на несколько более поздний срок: на первых порах компьютер будет чаще реагировать на команды не словом, а действием, а в других случаях выражать свои знания на искусственном или полуискусственном языке.) Столь же неотложной, сколь и проблема понимания, является, конечно, задача организации и представления знаний, участвующих в понимании языковых сообщений и вопросов, и далее — в формировании решения, в выполнении задания. Без знаний не может действовать ни человек, ни компьютер,— во всяком случае, действовать разумно и с опорой на социально отработанный опыт (а последний, как известно, откладывается в виде знаний). Практика создания многочисленных лингвистических процессоров привела в самое последнее время и к осознанию того, что неизменным спутником процесса понимания являются коммуникативные неудачи и что поэтому они должны стать предметом специального исследования. Тем самым наряду с теорией понимания и теорией знаний возникает теория способности противостоять коммуникативным неудачам, или теория коммуникативной надежности. Ясно, что без успехов в этом направлении невозможно внедрение лингвистических процессоров в промышленные системы. Все три указанных проблемы (в общеметодологическом плане давно выделенные нашими выдающимися мыслителями — об этом см. ниже) обострились, повторяем, в самое последнее время лишь благодаря интенсивной (и часто весьма малоутешительной по своим результатам) практической работе, внутренним двигателем которой является требование глобальной компьютеризации — требование современного этапа научно-технического прогресса. (Заметим, кстати, что этот этап был весьма точно предсказан как неизбежный К-Марксом, и нам уже доводилось об этом писать [9, с. 10—11].) Три названных проблемы преобладают в потоке публикаций по компьютерному моделированию общения, и они присутствуют в том или ином виде в каждой из статей, включенных в данный сборник, хотя, конечно, теоретическое и методологическое содержание статей ни в коей мере этим не ограничивается.
Каждая из работ отражает комплексный подход к компьютерному моделированию того или иного коммуникативного явления. Хотя статьи очень разные по широте охвата соответствующих фактов и по глубине их разработки, каждая из них являет собой пример многомерного исследования, каковым и должно быть исследование сложных коммуникативных процессов. По времени своего появления это работы, опубликованные в последние пять лет, а большинство — в последние 2-3 года. Тем самым они показывают логику научного поиска именно на данный момент — момент, являющийся в определенном смысле переломным: доказана принципиальная возможность моделирования понимания на ЭВМ, выявлена решающая роль знаний в этом процессе, установлена необходимость моделировать целостный процесс общения как вид совместной деятельности, осмыслен „японский вызов" (проект машин 5-го поколения), разработана стратегия развития теории и практики искусственного интеллекта, и вот теперь происходит оценка намеченных ранее путей компьютерного моделирования общения и ведется напряженный поиск „болевых точек" и слабых мест в существующих моделях коммуникативных процессов.
Все работы, включенные в сборник, выполнены учеными США. Как правило, это исследования, осуществляемые в рамках весьма серьезных прикладных проектов, хотя в статьях теоретические положения и работа программ иллюстрируются зачастую на „игрушечном материале". Для облегчения ориентации читателя в многоаспектном содержании сборника полезно дать сжатую характеристику идейной основы каждой из представленных статей.
Р. Шенк, один из ведущих зарубежных специалистов по лингвистическим проблемам искусственного интеллекта, вместе со своими соавторами Л. Бирнбаумом и Дж. Меем стремится окончательно утвердить такой подход к моделированию процесса понимания, который основан на интегральном представлении и использовании знаний. Из этого подхода вытекает принципиальная невозможность разделения семантики и прагматики. Хотя Шенк прямо не говорит о коммуникативных неудачах, фактически именно эта опасность заставляет его выдвинуть идею обязательного использования „больших структур" знаний (типа сценариев, так называемых „конфигураций" (или пакетов) организации памяти или других крупных блоков). Именно знания „высших уровней" позволяют делать необходимые умозаключения для того, чтобы связать высказывания, разделенные сплошь и рядом теми или иными „логическими пропусками".
Статья Дж. Карбонелла и Ф. Хейза представляет собой одну из попыток дать общую систематизацию типов коммуникативных неудач, начиная с низших уровней языка (орфографические ошибки) и кончая высшими уровнями семантического анализа. Авторы оценивают эффективность различных инструментов преодоления возникающих неудач, основываясь на опыте своей работы в университете Карнеги—Меллон, где лингвистическое обеспечение разрабатывалось ими для системы управления материально-техническим снабжением. Ученые выделяют те ситуации, когда уместен проясняющий диалог между компьютером и пользователем.
Далее в сборнике помещены шесть статей, посвященных исследованию конкретных путей моделирования понимания с одновременным вниманием к проблеме выявления и преодоления коммуникативных неудач (или, другими словами, к проблеме обеспечения надежности понимания). В. Ленерт, М. Дайер, П. Джонсон, К. Янг и С. Харли знакомят с опытом создания системы понимания коротких рассказов с использованием нескольких типовых структур представления знаний высшего уровня. Статья М. Селфриджа описывает интегральный процесс понимания команд и указаний на естественном языке в ситуации робота, выполняющего сборку некоторого аппарата (в данном случае — рубильника). Более глубокое проникновение в один из частных процессов в подобной ситуации демонстрирует статья Б. Гудмана. Имеется в виду такой частный процесс, как референция (и, соответственно, идентификация референта). Здесь материалом служили реальные сложные диалоги, полученные в экспериментах с участием людей. Оказалось, что компьютерная модель процесса референции должна использовать большое разнообразие типов знаний, но опять же в режиме их интегральной обработки. Весьма существенный источник коммуникативных неудач — неадекватные представления системы о пользователе. Типы таких неадекватностей рассматриваются в статье С. Карберри (применительно к задачам экспертной системы). Стратегия и тактика привлечения пользователя к настройке системы на его знания и задачи исследуется в статье Б. Балларда. Наконец, из работ, рассматривающих прежде всего вопросы понимания (анализа), последняя по порядку статья — это работа Ф. Хейза, А. Гауптмана, Дж. Карбонел- ла и М. Томиты о специфике анализа устной речи. Авторы обосновывают соединение результатов акустического анализа с фреймовым подходом к семантической обработке сообщения. Это позволяет существенно повысить надежность распознавания речи.
В настоящем сборнике, к сожалению, нашлось место только для одной (правда, весьма основательной) статьи по вопросам вербализации коммуникативного замысла (или синтеза текста). Автор ее К- Маккьюин на примере экспертной системы показывает способ моделирования такого важного этапа вербализации, как выбор дискурсивной (или коммуникативно-целевой) структуры синтезируемого текста (в качестве такого текста здесь выступает справочная информация экспертной системы).
Заключает сборник обзорная статья Дж. Слокума по проблематике машинного перевода. Для нас здесь существен итоговый вывод автора о том, что сегодня наметилась тенденция приближения работ по машинному переводу к освоению опыта компьютерной лингвистики в широком смысле слова. И здесь, очевидно, ключевыми явятся все те же проблемы понимания, знаний, коммуникативных неудач. Правда, в случае машинного перевода повышается актуальность проблемы синтеза текста. Впрочем, как отмечает Дж. Слокум, часто машинный перевод ориентируется на активное участие человека- постредактора, который берет на себя задачу окончательного оформления выходного текста.
IV
В заключительных разделах нашей статьи мы считаем полезным специально остановиться на тех трех проблемах, которые, как указано выше, преобладают в потоке литературы по компьютерной лингвистике и в статьях настоящего сборника. Это проблемы коммуникативных неудач, коммуникативных процессов и представления знаний. Мы ставим на первое место коммуникативные неудачи (КН) не случайно. Эта проблема проходит сквозной нитью через все без исключения статьи сборника. Ей уделяется особое внимание во всех крупных зарубежных проектах, связанных с созданием лингвистических процессоров любой ориентации,— будь то интерфейсы к базам данных, работающие в режиме диалога на естественном языке, или системы обработки больших массивов текстов. Техническое преломление этой проблемы сводится к сознательной разработке теории надежности применительно к языковым процессорам. Настало время разобраться в причинах сбоев, которым подвержены системы первых поколений. И вот появляются обобщающие работы по проблеме КН, концентрируются мощные исследовательские усилия, чтобы разработать эффективные «противоядия» для преодоления КН [33]. В настоящем сборнике систематическому рассмотрению КН посвящены статьи Дж. Карбонелла и Ф. Хейза, М. Селфриджа, Б. Гудмана, Сандры Карберри.
Проблема КН носит глобальный характер: фактически все работы по составлению алгоритмов и программ для анализа и синтеза текста направлены на предупреждение, выявление или преодоление КН. Изучение этой проблемы в явном виде позволяет увидеть рельефно наиболее уязвимые места в моделях общения, наметить первоочередные задачи и методы их решения.
В процессе эксплуатации экспериментальных и промышленных систем человеко-машинного общения выяснилось (а точнее, было заново осознано), что язык человека весьма и весьма далек от идеальных логических схем. Подсчеты показали, что более 25% высказываний человека-пользователя, обращающегося к интерфейсу, построены неправильно. Но и в случае правильных высказываний многие свойства человеческих слов и их сочетаний, о которых мы упоминали в начале нашей статьи, создают потенциальные источники для непонимания текста машиной. Каковы наиболее распространенные особенности человеческого общения, заставляющие ученых и программистов форсировать решение проблемы КН? К этим особенностям прежде всего относятся: неточные высказывания, неправильно построенные выражения, слишком сложные по структуре сообщения, разнообразные способы сокращения речи, приблизитель- ность выражения информации, имплицитность многих сведений, существенных для понимания речи- В США работу в области компьютерной лингвистики ведут 67 университетов, и большинство из них включило в свои исследовательские программы проблему КН. Это красноречивое свидетельство в пользу актуальности данной проблемы.
А нова ли эта проблема для отечественной теоретической лингвистики? Вспомним, что в том же 1923 г., когда вышла классическая работа Л. П. Якубинского о диалоге [30], появилась и статья А. М. Пешковского, в которой он писал: «В литературном наречии... все всегда и везде говорят в той или иной степени непонятно. Это может показаться парадоксом, но я прошу вспомнить любое собрание, любой доклад, любой спор. Разве не обращаются всегда к докладчику с просьбой разъяснить то или иное положение (причем вопросы обличают зачастую полное непонимание вопрошателей), разве не занимаемся мы в наших спорах преимущественно выяснением того, что мы «хотим сказать» или «хотели сказать», и разве не расходимся в результате всех этих выяснений часто глубоко непонятыми и непонимающими? Я прошу вспомнить, сколько времени тратится в наших спорах на действительное выяснение истины и сколько на устранение словесных недоразумений, на уговор о значении слов...; прошу вспомнить, сколько времени тратится юристами на выяснение смысла того или иного свидетельского показания, того или иного закона; прошу вспомнить, сколько людей в науке, в поэзии, в философии, в религии заняты исключительно толкованием чужих мыслей, выраженных подчас самими творцами как будто классически ясно и просто, но тем не менее всегда создающих целый ряд толков, сект, течений, направлений и т. д.; прошу все это вспомнить — и читатель согласится со мной, что затрудненное понимание есть необходимый спутник литературно-культурного говорения» [25, с. 56—57].
И вот теперь наступает время, когда мы, наконец, должны не только «согласиться» с А. М. Пешковским, но и строить действующие компьютерные модели языкового взаимодействия, несмотря на этот его постоянный спутник—«затрудненное понимание» [И].
Следует отметить, что, помимо КН в собственном смысле слова, участников общения подстерегают и различного рода недоразумения, шероховатости, связанные с недостаточной внимательностью, предупредительностью, кооперативностью партнеров по общению [2;12;24]. Вот пример человеко-машинного диалога, в котором, казалось бы, все в порядке с грамматической и лексико-семантической точек зрения (здесь П — пользователь, С — система):
П: Кто из студентов получил оценку «удовл.» по курсу программирования весной 1979 года?
С: Никто.
П: Есть ли студенты, которые не сдали программирование весной 1979 года?
С: Нет.
П: Сколько студентов сдало программирование весной 1979 года?
С: Нисколько.
П: Сдавали ли программирование весной 1979 года?
С: Нет.
От теоретического и экспериментального изучения КН к созданию программных средств выявления и преодоления КН в ходе диалога — таков путь совершенствования старых и создания новых практических моделей общения.
Диалог представляет собой чередование речевых произведений (РП), создаваемых коммуникантами (Ki и Кг). Вспомним, что каждое РП — это средство воздействия на окружение (на партнера по коммуникации и через него — на другие элементы действительности). Поэтому коммуникативную неудачу можно определить как такой сбой в общении, при котором определенные РП не выполняют своего предназначения. Иначе говоря, те или иные элементы РП как инструкции по преобразованию окружения не реализуются (в связи с их непониманием, игнорированием, ложным истолкованием и т.д.). Следует отличать собственно КН от фактов употребления неправильно построенных высказываний (такие высказывания не всегда приводят к КН), от коммуникативных трудностей и „неудобств".
Суммируем основные принципы типологии коммуникативных неудач, вытекающие из обобщения существующих классификаций. Следует признать, что задача полного исчисления КН пока не может получить исчерпывающего решения в силу того, что данная проблема теснейшим образом связана со всей теорией моделей общения. А если учесть, что максимально конкретные виды КН во многом зависят от привязки к той или иной сфере человеческого общения, то всеобъемлющее описание ТИПОВ КН вряд ли возможно и в обозримом будущем. Однако важнейшие типы КН ясны уже сейчас, и их планомерная систематизация поможет развитию эффективных методов их преодоления. Множество возможных КН представляет собой многомерное пространство. При характеристике каждой КН ( в составе конкретного диалога) следует учитывать два основных критерия: последствия КН и источники КН. Конкретная КН может быть простой пли сложной (по числу ее последствий и источников).
Например, с точки зрения последствий КН могут быть глобальными и частными. В случае глобальной КН происходит окончательное прерывание развертываемого диалогического текста («Разговора не получилось»), или доведенный до „конца" диалог по своим результатам неудовлетворителен (как в случае некоторых научных дискуссий). Частные КН вызывают временные задержки в развертывании диалога, когда коммуниканты вынуждены отклоняться от главной линии диалогического текста с целью преодоления возникших КН. Для классификации КН существенно различать коммуникативные цели (КЦ) и практические цели (ПЦ), стратегические и тактические цели в диалоге. Например, выделяется класс КН, имеющих следствием невыполнение совместной стратегической ПЦ коммуникантов («Поговорили, поговорили, а воз и ныне там»). Существует и целый ряд других типов.
Разветвленная типология КН с точки зрения их источников строится следующим образом. Прежде всего разграничиваются критерии, связанные с инструментами и процессами общения (хотя это разграничение условно, оно удобно на практике). В первом случае имеются в виду, в частности, расхождения в организации языковых тезаурусов коммуникантов в их словарном запасе, в дефинициях лексических значений, в банках знаний о мире и т. д. С точки зрения процессов КН могут быть связаны с неудачной вербализацией замысла со стороны Кь с несовершенством механизма понимания у К2, а также с соотношением этих процессов. вербализация Ki недостаточно эксплицитна для тех средств, которыми пользуется при понимании К2.
Трудности, приводящие к КН, могут иметь место на разных уровнях понимания: здесь различаются морфологический анализ, синтаксический анализ (включая эллипсис, анафорические связи), разрешение полисемии, установление семантических связей, рефе- ренционная увязка, распознавание истинностных и модальных значений высказываний, определение КЦ партнера, коммуникативная организация смысла высказывания, выявление пресуппозиций, анализ многофакторной прагматической информации высказывания для данной ситуации общения (отношения коммуникантов, различные виды умолчаний, коммуникативные импликатуры, вероятные ПЦ, в частности выражаемые перформативами, а также вытекающие из ПЦ планы партнера). Все эти уровни дают примеры КН в аспекте понимания отдельного высказывания. Ряд уровней понимания имеет и РП в целом (ведь в общем случае РП состоит из нескольких высказываний).
Что касается вербализации, то этот процесс имеет несколько иную этапность. Здесь следует особо выделить большой внутренне разветвленный класс КН, связанных с начальным этапом вербализации. Это КН, обусловленные неправильным выбором замысла, в частности КЦ и ПЦ, которые не соответствуют ситуационному контексту, то есть нарушают различные условия успешности (прежде всего прагматические пресуппозиции: РП становится неуместным).
Кроме упомянутых «ближайших» источников КН, необходимо указать на «отдаленные» источники КН: рассеянность коммуниканта, предвзятость, мнительность, необычность темы и т. д.
Из огромного разнообразия источников КН в настоящем сборнике детально разбираются лишь некоторые, но особенно важные с точки зрения человеко-машинного общения. Эти источники могут быть связаны с процессом референции (см. статью Б. Гудмана) с установлением семантических связей в тексте (см. статьи М. Сел- фриджа, Б.Балларда), с представлениями о знаниях пользователя (см. статью Сандры Карберри), с нечеткостью распознавания отдельных единиц речи (см. статью Ф. Хейза, А. Гауптмана и соавторов) и с рядом других причин.
V
Проблема моделирования коммуникативных процессов охватывает два круга явлений, которые были обозначены выше терминами «понимание» и «вербализация». Хотя мы и говорили о большей прикладной актуальности первого из них, следует подчеркнуть их принципиальную взаимосвязь. Их связывает категория общения, и в то же время само общение зависит от этих двух фундаментальных процессов и складывается из них. В 1940 г. С. О. Карцевский писал: «Фраза есть функция диалога.» [18, с. 86], подчеркивая тем самым зависимость построения и понимания любой фразы от контекста общения. И позже столь же определенно высказался М. М. Бахтин по поводу процесса понимания: «Понимание всегда в какой-то мере диалогично» [4, с. 482]. Это значит, что, моделируя понимание, мы должны постоянно иметь в виду «историю вербализации» данного сообщения и, с другой стороны, часто возникает необходимость «вербализовать наше понимание», чтобы проверить его правильность. Говорение и понимание оказываются связанными через рассмотренную нами выше категорию коммуникативных неудач: потенциальная опасность сбоев общения регулирует оптимальное соотношение этих процессов, которое было точно определено Е. Д. Поливановым еще в 1916 году: «В сущности все, что мы говорим, нуждается в слушателе, понимающем, «в чем дело». Если бы все, что мы желаем высказать, заключалось бы в формальных значениях употребленных нами слов, нам нужно было бы употреблять для высказывания каждой отдельной мысли гораздо более слов, чем это делается в действительности. Мы говорим только необходимыми намеками.» [26, с. 296]..Именно эти идеи и воплощаются в современных компьютерных моделях, описанных, в частности, в настоящем сборнике (см. особенно статьи М. Селфриджа; Кэтлин Маккьюин; Ф. Хейза, А. Гауптмана, Дж. Карбонелла, М. Томиты).
Понимание и вербализация относятся к числу базисных категорий теории моделей общения. Деятельностный подход к естественному языку обрел осязаемую реальность в связи с оформлением компьютерной семантики — дисциплины, моделирующей семантическую способность человека в широком смысле: это и способность понимать текст, и способность вербализовать коммуникативную потребность, и способность осуществлять различные другие процессы речемыслительной деятельности, подчиненные указанным двум главным. Важнейшие практические проблемы компьютерной семантики — разработка семантических алгоритмов (прежде всего блоков анализа и синтеза), а также соответствующих семантических метаязыков. Понимание и вербализация связаны не только с коммуникативной, но и со всеми другими функциями языка (в определенном смысле и познание можно трактовать как чередование процессов понимания и вербализации). Завершенные модели речевой деятельности неизбежно представляют собой описание того комплексного, но единого механизма, который осуществляет взаимосвязь восприятия, мышления и языка.
Понимание и вербализация — два вида функционирования языкового механизма, и трудно говорить о приоритете одного из них: с одной стороны, вербализатор (говорящий или пишущий) вступает в коммуникацию для того, чтобы быть понятым; с другой стороны, понимающий (слушающий или читающий) стремится вычислить то, что хотел вербализовать его партнер по общению. Имеет место закономерное чередование этих двух элементарных тактов диалога. Опорным звеном, соединяющим эти два процесса, является категория знаний: их переработка, хранение осмысление, передача, усвоение и составляют сущность общения.
Несмотря на отмеченную тесную взаимосвязь понимания и вербализации, в разных коммуникативных ситуациях может преобладать один из этих процессов (особенно если мы включим в рассмотрение внутреннюю речь и случаи разорванной коммуникации), и уж, конечно, весьма различной может быть значимость этих процессов для тех или иных прикладных моделей. Чрезвычайно важным и с теоретической, и с практической стороны представляется исследование и моделирование типов понимания и типов вербализации.
Понимание можно определить как извлечение («вычисление») из текста некоторой совокупности знаний. Исходный вопрос типологии понимания: какие факторы и в какой мере задействованы в данном процессе? Человек использует два основных класса когнитивных средств: собственно языковые и прагматические. Первый класс — это знания, закрепленные в семантике языка; второй — это практические цели, направляющие использование неязыковых знаний в сочетании с языковыми. Понимание происходит на разных уровнях и характеризуется разной степенью приблизительности в зависимости от целеустановки (интегральный процесс понимания управляется механизмом «интереса»). Многофакторность и активность понимания составляют его фундаментальные свойства (ср. [1; 29; 36; 41]).
Вербализация (переход от коммуникативной потребности к тексту) также носит активный и многофакторный характер. Типология вербализации должна учитывать генезис и характер коммуникативной потребности (ср. вербализацию прошлого опыта, прочитанного или услышанного, доказательного рассуждения, бессознательных движений психики и т.д.), а также чисто языковые пути воплощения замысла в текст (см., например, [31]).
И в понимании, и в вербализации необходимо разграничивать собственно процессы и инструменты. Последние, видимо, могут быть во многом общими. В качестве моделей таких инструментов выступают, например, семантические сети, информационные тезаурусы, шаблоны умозаключений, сценарии и планы.
Рассматривая виды понимания с точки зрения их реализации, можно говорить, с одной стороны, о практически важных „режимах" понимания, а с другой стороны — о типологии носителей языка по характерному для них виду понимания. Аналогичные соображения применимы и к вербализации. Они же применимы и к общению в целом.
Что касается выбора способов описания рассматриваемых процессов, то здесь стала ясна необходимость четко различать объяснительные и прикладные модели: они выполняют разные функции и поэтому должны подчиняться разным требованиям. Яркий тому пример — компьютеризованный диалог в рамках человеко-машинного симбиоза. Глубина понимания, полнота вербализации, степень взаимной обратимости (зеркальности) этих двух процессов определяются здесь эффективностью практического взаимодействия.
VI
А теперь зададимся вопросом: какая категория оказывается все-таки наиболее фундаментальной при компьютерном моделировании общения? Все предшествующие наши рассуждения, думается, вполне определенно подводят нас к мысли об особой, ключевой, роли категории знаний. Ведь и понимание, и вербализация — это процессы переработки знаний [14; 27]. А коммуникативные неудачи — это нарушения «естественного» процесса обмена знаниями.
Значит, при создании компьютерных моделей общения, любых языковых процессоров должны решаться задачи представления, организации, использования знаний разных типов. И это наглядно видно из материала настоящего сборника. Особенно подробно виды знаний рассматриваются в статье Б. Гудмана. Вопросы представления знаний на разных уровнях их обобщенности обсуждаются в статьях Венди Ленерт и др., а также Кэтлин Маккьюин. Проблема интеграции знаний разных типов исследуется Р. Шенком и его соавторами, а также М. Селфриджем.
Проблема знаний, выдвинутая на передний план теорией искусственного интеллекта [16; 34], на самом деле тесно связана с таким традиционным лингвистическим понятием, как метаязык. Ведь задача представления знаний — это задача создания семантических метаязыков. Это актуальнейшая проблема самой лингвистики как науки. Если мы располагаем сильными метаязыками фонетического и морфологического уровней (ср. фонетические, фонологические, морфонологические транскрипции), то для семантики языка имеется пока еще очень и очень бедный арсенал средств, которые позволяли бы эксплицитно фиксировать содержательную сторону речевых произведений. А ведь семантический метаязык — неотъемлемый инструмент исследования языка в его когнитивном и коммуникативном аспектах. Он есть необходимая составная часть метода моделирования, применяемого к языку.
Разновидностью семантических метаязыков можно считать и информационные языки (ИЯ). Последнее понятие мы трактуем здесь в более широком смысле, чем в старой информатике. Оно включает языки, используемые для обработки информации в широком классе интеллектуальных систем. Именно широкое понимание ИЯ способствует повышению их семантической силы, то есть позволяет развивать параллельно разные варианты ИЯ с их поэтапным совершенствованием, усложнением семантической структуры, что в итоге определяется практическими задачами по внедрению машин в процессы языковой коммуникации.
Знаменательно при этом само включение ИЯ в класс семантических метаязыков. Это означает использование в информационной работе всего арсенала теоретических и методических средств прикладной семантики. Можно утверждать, что главный вывод из теории и практики современных исследований по компьютерной лингвистике состоит в следующем: ключевая проблема машинного моделирования языковых процессов — это проблема метаязыков [5; 6; 7; 28]. Даже такая важнейшая проблема, как автоматизация процесса анализа (понимания) текста должна быть поставлена, на наш взгляд, на второе место. Ибо процессы анализа сводятся к перезаписи информации на тех или иных метаязыках. Все алгоритмы анализа текста — как новейшие, так и двадцатилетней давности,— состоят из двух частей: собственно операционных правил и средств записи двоякого вида информации (константной и переменной, или текущей). Эти средства целиком и полностью определяют содержание, логику и степень сложности системы правил. Более того, наблюдается тенденция еще более тесного слияния метаязыков и правил: для записи языковой информации применяются метаязыки алгоритмического характера, то есть не структурные, а алгоритмические репрезентации. Описание языковой единицы на таком метаязыке читается как программа действий, которые надо совершить с речевым отрезком, включающим данную языковую единицу (ср. программистский подход к описанию семантики в известной книге Т. Винограда [7]). Однако и в таких работах проводится четкое различие между правилами и лежащими в их основе структурными репрезентациями. Иначе говоря, и в метаязыках алгоритмического характера предусматривается базовый метаязык структурной репрезентации. Например, словарная статья глагола быть может быть программой, определяющей по контексту функцию этого слова, но в основе этой программы лежит метаязык, описывающий структуры различных конструкций с глаголом быть.
Упомянутые метаязыковые средства, на которых основывается работа алгоритмов, фиксируются в машинных словарях, таблицах, машинных форматах для записи различных видов информации, в структуре так называемой базы данных.
* * *
Думается, направления научного поиска и результаты компьютерных экспериментов, представленные на страницах настоящего сборника, будут полезны для различных категорий советских читателей: лингвистов, занимающихся вопросами методологии и теории языкознания; лингвистов прикладного профиля, работающих в той или иной сфере практики; лингвистов, стремящихся к компьютеризации своих исследований; студентов и аспирантов, изучающих основы информатики; представителей технических наук, все более опирающихся на данные лингвистики; философов, логиков, психологов, разрабатывающих комплексные модели человека с учетом «таинственного языкового фактора». Сегодня неуклонно растет число тех, кого интересует речевое общение с его неизменным спутником — потенциальными коммуникативными неудачами. Интересует как предмет познания и как предмет совершенствования. Кому-то материалы сборника подскажут решение конкретной проблемы, кому-то дадут пищу для теоретических размышлений, а кого-то заставят по-новому оценить реальную сложность стоящей перед нами задачи — задачи всесторонней компьютеризации делового общения на естественном языке.
Б. Ю. Городецкий
1. Аллен Дж. Ф., П е р р о Р. Выявление коммуникативного намерения, содержащегося в высказывании.— В сб.: „Новое в зарубежной лингвистике", вып. XVII (Теория речевых актов). М., 1986.
2. Арутюнова Н. Д., Падучева Е. В. Истоки, проблемы и категории прагматики.— В сб.: „Новое в зарубежной лингвистике", вып. XVI (Лингвистическая прагматика). М., 1985.
3. Б а х т и н М. М. Проблема речевых жанров.— В кн.: Б а х т и и М. М. Литературно-критические статьи. М., 1986.
4. Бахтин М. М. Проблема текста в лингвистике, филологии и других гуманитарных науках. Опыт философского анализа.— В кн.: Бахтин М. М. Литературно-критические статьи. М., 1986.
5. Белоногов Г. Г., Кузнецов Б. А. Языковые средства автоматизированных информационных систем. М., 1983.
6. Белоногов Г. Г., Новоселов А. П. Автоматизация процессов накопления, поиска и обобщения информации. М., 1979.
7. Виноград Т. Программа, понимающая естественный язык. М., 1976.
8. В итгенштейн Л. Философские исследования.— В сб.: „Новое в зарубежной лингвистике", вып. XVI (Лингвистическая прагматика). М., 1985.
9. Городецкий Б. Ю. Актуальные проблемы прикладной лингвистики.— „Новое в зарубежной лингвистике", вып. XII (Прикладная лингвистика). М., 1983.
10. Городецкий Б. Ю. Термин и его лингвистические свойства.— В сб.: „Структурная и прикладная лингвистика", вып. 3. Л., 1987.
И. Городецкий Б. Ю., Кобозева И. М., Сабурова И. Г. К типологии коммуникативных неудач.— В сб.: „Диалоговое взаимодействие и представление знаний". Новосибирск, 1985.
12. Грайс Г. П. Логика и речевое общение.— В сб.: „Новое в зарубежной лингвистике", вып. XVI (Лингвистическая прагматика). М., 1985.
13. Г р о м о в Г. Р. Национальные информационные ресурсы: проблемы промышленной эксплуатации. М., 1985.
14. „Диалоговое взаимодействие и представление знаний". Под ред. А. С. На- риньяни. Новосибирск, 1985.
15. 3 а л и з н я к А. А. Грамматический словарь русского языка. Словоизменение. М., 1977.
16. Звегинцев В. А. Язык как фактор компьютерной революции.— „Научно- техническая информация", серия 2 (Информационные процессы и системы), 1985, № 9.
17. ЗвегинцевВ.А. Компьютерная революция: проблемы и задачи.— „Вопросы философии", 1987, № 4.
18. К а р ц е в с к и й С. О. Введение в изучение междометий.— „Вопросы языкознания", 1984, № 6.
19. „Лингвистические задачи. Книга для учащихся старших классов". Авторы- составители: В. М. Алпатов, А. Д. Венцель, Б. Ю. Городецкий, А. Н. Журинский, А. А. Зализняк, А. Е. Кибрик, А. К. Поливанова. М., 1983.
20. М а л ь к о в с к и й М. Г. Диалог с системой искусственного интеллекта. М.,
1985.
21 „Модели диалога в системах искусственного интеллекта". („Ученые записки Тартуского гос.университета", вып. 751. „Труды по искусственному интеллекту"). Тарту, 1987.
22. „Модели и системы обработки информации", вып. 4. Киев, 1985.
23. „Моделирование языковой деятельности в интеллектуальных системах". Под ред. А. Е. Кибрика и А. С. Нариньяни. М., 1987.
24. П адучева Е. В. Тема языковой коммуникации в сказках Льюиса Кэрро-
ла.— В кн.: „Семиотика и информатика", вып. 18. М., 1982.
25. П е ш к о в с к и й А. М. Объективная и нормативная точка зрения на язык.— В кн.: Пешковский А. М. Избранные труды. М., 1959.
26. Поливанов Е. Д. По поводу звуковых жестов японского языка.— В кн.: Поливанов Е. Д. Статьи по общему языкознанию. М., 1968.
27. „Принципиальные вопросы теории знаний" („Ученые записки Тартуского гос. университета", вып. 688. „Труды по искусственному интеллекту"). Тарту, 1984.
28. Шемакин Ю. И. Введение в информатику. М., 1985.
29. Шенк Р., Лебовиц М., Бирнбаум Л. Интегральная понимающая система.— «Новое в зарубежной лингвистике», вып. XII (Прикладная лингвистика). М., 1983.
30. Я куб и и с к и й Л. П. О диалогической речи.— В кн.: Якубинский Л. П. Избранные работы. Язык и его функционирование. М., 1986.
31. Appel t D. Е. Planning English Referring Expressions.— "Artificial Intelligence”, 1985, vol. 26, № 1.
32. "Cognitive Constraints on Communication: Representation and Processes”. Ed. by L. Vaina, J. Hintikka. Dordrecht etc., 1984.
33. "Communication Failure in Dialogue and Discourse. Detection and Repair Processes”. Ed. by R. G. Reilly. Amsterdam, 1987.
34. H a у e s - R о t h F., W a t e r m a n D. A., L e n a t D. B. (eds). Building Expert Systems. Reading (Mass.), 1983.
35. "Human-Computer Interaction. Interact’84”. Ed. by B. Shackel. Amsterdam, 1985.
36. "Inside Computer Understanding”. Hillsdale (N.J.), 1981.
37. "Language and Artificial Intelligence”. Ed. by M. Nagao. Amsterdam, 1987.
38. Marcus S. Fifty-two Oppositions Between Scientific and Poetic Communication.— In: "Pragmatic Aspects of Human Communication”. Dordrecht, 1974.
39. "Natural Language Parsing — Psychological, Computational, and Theoretical Perspectives”. Ed. by D. Dowty, L. Karttunen, and A. Zwicky. Cambridge (N. Y.), 1984.
40. "Natural Language Understanding and Logic Programming”. Ed. by V. Dahl and P. Saint-Dizier. Amsterdam, 1985.
41. Norton L. M. Automated Analysis of Instructional Text.— "Artificial Intelligence”, 1983, vol. 20, № 3.
42. "Strategies For Natural Language Processing”. Hillsdale (N.J.), 1982.