Что такое надежность?
Самое широкое из теоретически мыслимых определений надежности применительно к естественноязыковому интерфейсу должно, по-видимому, предусматривать языковую способность, равную человеческой или превосходящую ее; ясно, что такое понимание данного термина чересчур амбициозно.
В нашей работе термин надежный будет ОТНОСИТЬСЯ К некоторому конкретному подмножеству ЯЗЫКОВЫХ способностей человека. Это подмножество включает, во-первых, способность понимать высказывания, в которых пропущены различные слова и в которых нарушен предпочтительный с грамматической точки зрения порядок слов. Во-вторых, если входное сообщение первоначально не понято или понято неверно, то надежный естественноязыковой интерфейс должен в конечном итоге прийти к правильному его пониманию в ходе процесса вывода наиболее правдоподобных значений на основе самого входного сообщения, а также контекста. Наконец, надежный естественноязыковой интерфейс должен быть способен использовать поправки, вносимые пользователем, чтобы направлять процесс вывода наиболее правдоподобных значений. Поскольку в таком интерфейсе на выходе процесса понимания должно быть некоторое представление значения входного сообщения, то подобный интерфейс будет ограничен, следовательно, в плане своих возможностей прежде всего кругом своих семантических знаний, относящихся к фиксированной информационной области; он не сможет понять высказывание, если значение этого высказывания не представимо в рамках его системы знаний. В противном случае он в конце концов поймет входное высказывание. Эти аспекты надежности подробно рассматриваются ниже.Существует несколько типовых ситуаций, когда в высказывании могут быть пропущены слова. Во-первых, пользователи обычно опускают слова, значения которых могут быть выведены слушающим из общего контекста. Во-вторых, пользователь может сознательно применять эллипсис, имея в виду, что слушающий завершит процесс понимания, опираясь на понятия, восстанавливаемые из истории данного диалога.
В-третьих, высказывание может содержать неизвестные слова, которые можно рассматривать как „пропущенные” с точки зрения осуществления процесса понимания. Наконец, поскольку никто пока не предложил удовлетворительной методики для предсказания того, какие именно слова могут или не могут быть пропущены, то надежный естественноязыковой интерфейс должен быть готов понимать высказывания с произвольно опущенными словами, хотя, может быть, в трудных случаях процесс отыскания нужной интерпретации будет более долгим.Кроме пропуска слов, возможны и другие нарушения в строении высказывания: ведь мы не можем также гарантировать, что входное сообщение будет правильным в синтаксическом отношении. Наоборот, наверняка оно будет иногда построено неправильно, причем нарушения могут принимать разнообразные непредсказуемые формы. В настоящей статье будет рассматриваться только простейший тип синтаксического варьирования, заключающийся в неправильном размещении слов в пределах высказывания. Заметим, что неправильный порядок слов может привести к такому входному сообщению, которое является вполне осмысленным, хотя этот смысл вовсе не тот, который имел в виду говорящий. Более того, с точки зрения высказывания, получившегося случайно, но вовсе не имевшегося в виду, слова могут быть расположены правильно, хотя их порядок неправилен с точки зрения того высказывания, которое имел в виду пользователь. Подробнее этот вопрос рассматривается ниже.
При некоторых условиях, однако, никакая система понимания естественного языка не сможет прийти к правильному осмыслению реплики пользователя, так как альтернативные интерпретации могут оказаться одинаково предпочтительными. Надежный интерфейс должен решать эту проблему путем обращения к пользователю для проверки правильности своего варианта понимания; в случае, если этот вариант оказывается ошибочным, интерфейс должен быть готов „угадывать снова". Такой интерфейс должен быть готов порождать сначала самую правдоподобную (с точки зрения логики системы) интерпретацию, затем следующую по степени правдоподобия и так далее, пока все возможности не будут исчерпаны.
Такой подход гарантирует успешное завершение анализа: в конце концов высказывание будет понято интерфейсом при условии опять же, что значение анализируемого высказывания находится в пределах сферы компетенции понимающей системы. Заметим, что способность систематически перебирать все возможные значения, которые может иметь высказывание, находится за пределами человеческих потенций. Человек может найти много интерпретаций, но у нас нет гарантий, что он породит все возможные интерпретации, и это связано с такими факторами, как ограничения памяти. Мирясь в целом с невозможностью в настоящее время сравняться с языковой способностью человека в ее полном объеме (или тем более превысить ее), надежная понимающая система должна по возможности превосходить человека в указанном конкретном аспекте.Эта способность выводить одно за другим наиболее правдоподобные значения входного сообщения является важной, но еще недостаточной. Если слушающий выведет неправильное значение высказывания говорящего, то говорящий скорее всего не скажет просто «нет», ожидая, пока слушающий выведет следующее значение. Обычно говорящий ведет себя более активно и предлагает слушающему некоторую поправку. Таким образом, желательно, чтобы надежный естественноязыковой интерфейс был не только способен выдвигать предположения об очередной наиболее правдоподобной (с его точки зрения) интерпретации, но и был бы способен учитывать поправки, поступающие от пользователя.
Надежный понимающий процессор должен обладать также рядом других желательных характеристик, кроме тех, которые рассмотрены выше. Например, он должен быть способен обрабатывать многозначные слова. Далее, он должен понимать сообщения, несмотря на оговорки, нерелевантные междометия и незнакомые слова. В-третьих, он должен обеспечивать исправление ошибок в написании слов и необходимый для этого, вывод умозаключений. В-четвертых, он должен обладать способностью вести диалог со смешанной инициативой. Наконец, он должен быть способен усваивать новые значения слов и новые правила синтаксиса. Все эти характеристики находятся за пределами задач настоящей статьи. Однако, как мы показываем в разд. 8, система МЭРФИ, кроме своих основных свойств, обладает также и некоторыми из этих характеристик.
Итак, для целей настоящей статьи мы принимаем следующее определение: надежная понимающая система — это такая система, для которой мы можем гарантировать, что она в итоге понимает входные высказывания, несмотря на пропуски произвольных слов, на любые нарушения порядка слов и на наличие эллипсиса,— как с использованием, так и без использования поправок; при этом она опирается на семантику и синтаксис, знания о предметной области и контекст.
2.2.