1. ВВЕДЕНИЕ
Как утверждается в работе Коэна, Перро и Аллена (см. Cohen, Perrault & Allen, 1981), «пользователи вопросно-ответных систем ожидают от них большего, чем просто ответов на изолированные вопросы — они хотят, чтобы система поддерживала полноценную беседу.
Для этого пользователям нужно позволить не слишком тщательно подбирать слова, выражая свои намерения, и, кроме того, система должна уметь использовать языковую и прагматическую информацию предшествующей части дискурса». Полностью разделяя эту точку зрения, мы ставим перед собою задачу построения надежных систем обработки информации на естественном языке, которые могут обнаруживать и преодолевать неудачи, возникающие в ходе общения. Разработка таких систем требует изучения того, как люди общаются и как они преодолевают неудачи в общении (miscommunication). Изучение коммуникативных неудач необходимо для построения систем понимания естественного языка, так как всякий компьютер, предназначенный для общения с человеком на естественном языке, должен быть устойчив к сложным, неточным, неправильно построенным высказываниям, которые так часто встречаются в речи людей. В настоящей статье представлены результаты диссертации (Goodman, 1984), посвященной исследованию видов неудач, встречающихся в ходе общения между людьми; особое внимание уделено проблемам референции, то есть проблемам, с которыми сталкивается слушающий, пытаясь определить, о ком или о чем идет речь в адресованном ему высказывании собеседника. Для решения этих проблем мы предлагаем алгоритм, расширяющий традиционную трактовку референции. Алгоритм реализован в машинных программах, показывающих, как подобные задачи могли бы решаться в системе понимания естественного языка. В наших исследованиях (Sid пег et al., 1981; 1983) мы исходили из того, что в своем большинстве диалоги основаны на принципе сотрудничества и носят целенаправленный характер. Мы исследуем те случаи, когда говорящий и слушающий предпринимают совместные усилия для достижения общей цели. Для того чтобы слушающий смог проинтерпретировать высказывания собеседника, он должен распознать стоящие за ними цели или планы говорящего (Cohen, 1978; Allen, 1979; Sidner and Israel, 1981; S Ї d n e r, 1985; Carberry, 1985; L і t m a n, 1985; Pollack, 1986). Однако планы редко выражаются прямым текстом на поверхностном уровне предложения. Поэтому центральным в процессе автоматического понимания высказываний является преобразование последовательности сложных, неточных и плохо сформулированных высказываний в правильно построенные планы, которые могут быть реально выполнены участниками диалога. В этом процессе могут возникать коммуникативные неудачи. В настоящей статье они рассматриваются, в основном, с точки зрения слушающего; имеются в виду, например, такие ситуации, когда слушающий был невнимателен, или что-то перепутал, или был введен в заблуждение относительно намерения говорящего.Обычно во время беседы говорящий делает предположения, касающиеся знаний слушающего о предмете разговора, и опускает подробности, которые считает излишними (А р р е 11, 1981;
McKeown, 1983). Но поскольку в действительности говорящему неизвестно, что именно знает слушающий, то сказанное очень часто может быть понято не так или не понято совсем из-за недостатка подробностей. Одним из основных источников затруднений является описание объектов реального мира, которое дает говорящий. Может оказаться, что с точки зрения данного конкретного слушающего предлагаемое описание неэффективно в том или ином отношении: оно или недостаточно точно, или неоднозначно, или перегружено подробностями. Кроме того, оно может быть проинтерпретировано слушающим в рамках неверного контекста, и тогда для слушающего либо возникает одна из упомянутых проблем интерпретации описания, либо он, не заметив своей контекстуальной ошибки, поймет что-то не то. В результате это приведет к неудачам в идентификации референта 2 — слушающий не сможет определить, о каком объекте идет речь.
Подобные описания, которые приводят к неудачам в идентификации референции, составляют особый подтип „неправильно построенных" входных выражений. Виноваты в этих ошибках и говорящий, и слушающий. Говорящий может быть небрежным и невнимательным к собеседнику, а слушающий может отвлечься или не желать признаться, что он не понял говорящего, и не хотеть переспросить его. Возможна и такая ситуация, когда слушающий даже не подозревает, что он неверно понял сказанное.Взаимодействие, которое происходит во время объяснений, контекст, в который погружена данная ситуация общения, вообще мироощущение слушающего, его знания, особенно в проблемной области разговора — все это влияет на процесс референции и усложняет задачу его моделирования. В нашей работе предлагается новая точка зрения на референцию, которая позволяет обосновать более гибкий (учитывающий интроспекцию) способ преодолевать неудачи, возникающие в ходе общения. Мы по-новому трактуем понятие идентификации референта, поскольку традиционная трактовка оказалась неприменима для практических целей (подробнее см. разд. 4).
В составе деятельности по отысканию референта мы выделяем особый процесс — выработка соглашения (negotiation), который учитывает всю лингвистическую и перцептивную информацию о мире, в особенности в тех случаях, когда возникают неудачи в референции. Вычислительная модель, реализующая этот процесс, называется FWIM — от Find What I Mean. ‘Найдите то, что я имею в виду’. Кроме этого, нами разработана теория обработки экстенсиональных описаний, которая успешно объясняет, как людям удается понимать неточные выражения. Мы назвали этот подход теорией коммуникативных неудач, возникающих при экстенсиональной референции.
Ниже в настоящем разделе характеризуется предметная область нашего исследования и общие черты принятой методики. Кроме того, описываются работы других исследователей. В разделе 2 освещаются некоторые вопросы процесса нормального общения, а затем дается общая характеристика типов коммуникативных неудач и более подробное описание неудач, связанных с референцией, даются также примеры этих неудач из протоколов эксперимента. Протоколы показывают сложность процесса референции и помогают выявить типы источников знаний, к которым обращаются люди при осуществлении процесса референции. Раздел 3 посвящен более подробному описанию таких источников, благодаря которым знания о языке и знания о физическом мире активно используются как в ходе нормального процесса идентификации референта, так и в ходе преодоления неудач референции. В разделе 4 даются предварительные решения некоторых проблем, связанных с коммуникативными неудачами. Там же дается некоторое обоснование программной реализации механизма референции. И, наконец, в разделе 5 содержатся выводы и предлагаются перспективы дальнейшей работы в этом направлении.
1.1.