ФОНЕТИЧЕСКИЙ звуко-буквенный разбор слов онлайн
 <<
>>

Что такое надежность?

Самое широкое из теоретически мыслимых определений надеж­ности применительно к естественноязыковому интерфейсу должно, по-видимому, предусматривать языковую способность, равную чело­веческой или превосходящую ее; ясно, что такое понимание данного термина чересчур амбициозно.

В нашей работе термин надежный будет ОТНОСИТЬСЯ К некоторому конкретному подмножеству ЯЗЫКО­ВЫХ способностей человека. Это подмножество включает, во-первых, способность понимать высказывания, в которых пропущены раз­личные слова и в которых нарушен предпочтительный с грамма­тической точки зрения порядок слов. Во-вторых, если входное сооб­щение первоначально не понято или понято неверно, то надежный естественноязыковой интерфейс должен в конечном итоге прийти к правильному его пониманию в ходе процесса вывода наиболее правдоподобных значений на основе самого входного сообщения, а также контекста. Наконец, надежный естественноязыковой ин­терфейс должен быть способен использовать поправки, вносимые пользователем, чтобы направлять процесс вывода наиболее правдо­подобных значений. Поскольку в таком интерфейсе на выходе про­цесса понимания должно быть некоторое представление значения входного сообщения, то подобный интерфейс будет ограничен, сле­довательно, в плане своих возможностей прежде всего кругом своих семантических знаний, относящихся к фиксированной инфор­мационной области; он не сможет понять высказывание, если зна­чение этого высказывания не представимо в рамках его системы знаний. В противном случае он в конце концов поймет входное высказывание. Эти аспекты надежности подробно рассматриваются ниже.

Существует несколько типовых ситуаций, когда в высказыва­нии могут быть пропущены слова. Во-первых, пользователи обычно опускают слова, значения которых могут быть выведены слуша­ющим из общего контекста. Во-вторых, пользователь может созна­тельно применять эллипсис, имея в виду, что слушающий завершит процесс понимания, опираясь на понятия, восстанавливаемые из истории данного диалога.

В-третьих, высказывание может содер­жать неизвестные слова, которые можно рассматривать как „про­пущенные” с точки зрения осуществления процесса понимания. Наконец, поскольку никто пока не предложил удовлетворитель­ной методики для предсказания того, какие именно слова могут или не могут быть пропущены, то надежный естественноязыковой интерфейс должен быть готов понимать высказывания с произ­вольно опущенными словами, хотя, может быть, в трудных случаях процесс отыскания нужной интерпретации будет более долгим.

Кроме пропуска слов, возможны и другие нарушения в строе­нии высказывания: ведь мы не можем также гарантировать, что входное сообщение будет правильным в синтаксическом отношении. Наоборот, наверняка оно будет иногда построено неправильно, причем нарушения могут принимать разнообразные непредсказуемые формы. В настоящей статье будет рассматриваться только про­стейший тип синтаксического варьирования, заключающийся в не­правильном размещении слов в пределах высказывания. Заметим, что неправильный порядок слов может привести к такому входному сообщению, которое является вполне осмысленным, хотя этот смысл вовсе не тот, который имел в виду говорящий. Более того, с точки зрения высказывания, получившегося случайно, но вовсе не имев­шегося в виду, слова могут быть расположены правильно, хотя их порядок неправилен с точки зрения того высказывания, кото­рое имел в виду пользователь. Подробнее этот вопрос рассмат­ривается ниже.

При некоторых условиях, однако, никакая система понимания естественного языка не сможет прийти к правильному осмыслению реплики пользователя, так как альтернативные интерпретации мо­гут оказаться одинаково предпочтительными. Надежный интерфейс должен решать эту проблему путем обращения к пользователю для проверки правильности своего варианта понимания; в случае, если этот вариант оказывается ошибочным, интерфейс должен быть го­тов „угадывать снова". Такой интерфейс должен быть готов порож­дать сначала самую правдоподобную (с точки зрения логики систе­мы) интерпретацию, затем следующую по степени правдоподо­бия и так далее, пока все возможности не будут исчерпаны.

Такой подход гарантирует успешное завершение анализа: в конце кон­цов высказывание будет понято интерфейсом при условии опять же, что значение анализируемого высказывания находится в пре­делах сферы компетенции понимающей системы. Заметим, что спо­собность систематически перебирать все возможные значения, ко­торые может иметь высказывание, находится за пределами чело­веческих потенций. Человек может найти много интерпретаций, но у нас нет гарантий, что он породит все возможные интерпре­тации, и это связано с такими факторами, как ограничения памяти. Мирясь в целом с невозможностью в настоящее время сравняться с языковой способностью человека в ее полном объеме (или тем более превысить ее), надежная понимающая система должна по возможности превосходить человека в указанном конкретном ас­пекте.

Эта способность выводить одно за другим наиболее правдопо­добные значения входного сообщения является важной, но еще недостаточной. Если слушающий выведет неправильное значение высказывания говорящего, то говорящий скорее всего не скажет просто «нет», ожидая, пока слушающий выведет следующее зна­чение. Обычно говорящий ведет себя более активно и предла­гает слушающему некоторую поправку. Таким образом, жела­тельно, чтобы надежный естественноязыковой интерфейс был не только способен выдвигать предположения об очередной наиболее правдоподобной (с его точки зрения) интерпретации, но и был бы способен учитывать поправки, поступающие от пользователя.

Надежный понимающий процессор должен обладать также рядом других желательных характеристик, кроме тех, которые рассмотре­ны выше. Например, он должен быть способен обрабатывать много­значные слова. Далее, он должен понимать сообщения, несмотря на оговорки, нерелевантные междометия и незнакомые слова. В-третьих, он должен обеспечивать исправление ошибок в написании слов и необходимый для этого, вывод умозаключений. В-четвер­тых, он должен обладать способностью вести диалог со смешан­ной инициативой. Наконец, он должен быть способен усваивать новые значения слов и новые правила синтаксиса. Все эти характе­ристики находятся за пределами задач настоящей статьи. Однако, как мы показываем в разд. 8, система МЭРФИ, кроме своих основных свойств, обладает также и некоторыми из этих харак­теристик.

Итак, для целей настоящей статьи мы принимаем следующее определение: надежная понимающая система — это такая система, для которой мы можем гарантировать, что она в итоге понимает входные высказывания, несмотря на пропуски произвольных слов, на любые нарушения порядка слов и на наличие эллипсиса,— как с использованием, так и без использования поправок; при этом она опирается на семантику и синтаксис, знания о предметной области и контекст.

2.2.

<< | >>
Источник: Б.Ю. Городец­кий. Новое в зарубежной лингвистике: Вып. XXIV. Компьютерная лингвистика: Пер. с англ./Сост., ред. и вступ, ст. Б. Ю. Городец­кого.— М.: Прогресс,1989.—432 с.. 1989

Еще по теме Что такое надежность?: