Использование в стратегиях преодоления неграмматичности на уровне предложения различных подходов к анализу сообщений.
Мы переходим теперь к вопросу о возможности совмещения рассмотренных стратегий преодоления неграмматичности на уровне предложения с различными подходами к анализу сообщений, упомянутых во введении.
Как мы увидим, существуют значительные расхождения в глубинном соответствии различных подходов в качестве базы для стратегий преодоления неграмматичности. Для рассмотрения этого вопроса следует разделить все подходы к анализу сообщений на три большие группы: подходы, использующие сети переходов (включая синтаксические ATN * и основывающиеся на сетях семантические грамматики), подходы, использующие подбор образцов, и подходы, базирующиеся на актуализации падежных фреймов.3.5.1 Стратегии преодоления неграмматичности, использующие сети переходов. Хотя и предпринимались определенные попытки предусмотреть стратегии преодоления неграмматичности (на уровне предложения) в рамках анализаторов сетевого типа, использующих как синтаксические ATN (Kwasny and Sondheimer, 1981; Weischedel and Sondheimer, 1984; Weischedel and Black, 1980; Woods et al., 1976), так и семантические сетевые грамматики (Hendrix, 1977), однако сама сетевая парадигма не очень подходит к тем видам стратегий преодоления неграмматичности, которые рассматривались в предыдущих разделах. Эти стратегии требуют, вообще говоря, способности «отступить» в ходе интерпретации (когда ожидания анализатора нарушены) и оценить ситуацию с более общей точки зрения, что трудно осуществить, используя сети. Глубинная проблема заключается в том, что значительная часть информации о данном состоянии процесса анализа имплицитно закодирована позицией в сети; в случае ATN в контекстах отдельных регистров содержатся и другие аспекты, касающиеся состояния разбора. Как показывает подход, использующий для распознавания неудач метаправила и описанный Вейшеделем и Зондгеймером (W е і s с h е d е 1 and Sondheimer, 1983), эти и другие трудности, разбираемые ниже, не блокируют процесс преодоления неграмматичности.
Однако они все-таки усложняют этот процесс и часто делают его непрактичным, так как для стратегий преодоления неграмматичности большая часть процедурно закодированной информации о состоянии анализа должна быть представлена в декларативной и эксплицитной форме.Часто анализ, использующий ATN, продолжается и после того места, где встретилось грамматическое отклонение, скажем пропущенное слово, и доходит до узла сети, после которого дальнейший анализ невозможен (то есть отсутствует дуга, по которой можно было бы пройти). В этот момент анализатор не может установить источник ошибки, анализируя свое внутреннее состояние, даже если оно доступно,— анализатор мог незаметно выйти из встроенной подсети или пройти по совершенно случайной последовательности дуг, прежде чем выяснилось бы, что произошла ошибка. Даже если эти проблемы могут быть преодолены и может быть точно определен источник ошибки, то все равно остается главная проблема: ведь для преодоления ошибок и обработки неграмматичного сообщения, сохраняя верность сетевому формализму, анализатор должен динамично — и причем временно — модифицировать сеть, а затем использовать модифицированный вариант для обработки встретившихся трудностей. Нет необходимости говорить, что в лучшем случае это очень сложный процесс, возможность реализации которого на ЭВМ остается открытой. По-видимому, не удивительно, что в одном из наиболее эффективных механизмов преодоления неграмматичности, основывающемся на сетевом анализаторе,— программе обработки эллипсиса в системе LIFER (Hendrix, 1977) — основной этап такой обработки осуществляется полностью вне сетевого формализма.
Как мы видели, семантические ограничения очень важны при преодолении многих видов неграмматичности входных выражений, а такие ограничения по определению невозможны в классическом синтаксическом анализаторе, использующем ATN. Однако семантическая информация может быть привнесена в сетевой анализ либо с помощью семантической грамматики, при которой объединенные семантические и синтаксические категории используются непосредственно в ATN, либо путем введения семантических критериев в условия, налагаемые на дуги ATN (Bob row, 1978; Bob row and Webber, 1980).
При первом методе соответствующую семантическую информацию можно применить для преодоления ошибок только в том случае, если будет найден правильный узел в сети, а иногда, как мы видели, это довольно трудная задача. При втором методе, который иногда называют методом каскадных ATN (W о о d s, 1980), синтаксические и семантические части грамматики разделены, что придает использованию семантической информации потенциально большую интерпретирующую силу. Однако естественное применение этого метода связано с привлечением семантической информации только для подтверждения или опровержения результатов анализа, проведенного на синтаксической основе. Таким образом, жесткость сетевого формализма сильно затрудняет эффективное применение имеющейся семантической информации для обработки неграмматичных входных сообщений.Еще одним недостатком сетевого подхода в плане осуществления гибких стратегий преодоления неграмматичности является то, что для сетей естественно движение в ходе анализа сверху вниз и слева направо. А, как мы видели, для многих стратегий преодоления неграмматичности существенна способность к обработке снизу вверх, и, более того, часто осуществление этих стратегий облегчается и становится более эффективным, если имеется возможность гибко изменять направление анализа. Правда, разбор сверху вниз и слева направо — это свойство сетевого интерпретатора, а не самого сетевого формализма, и была даже предпринята попытка использовать ATN „островным" способом, то есть снизу вверх и из центра к периферии (Woods et al., 1976). Этот эксперимент был проведен при анализе устной речи, когда распознавание (на низшем уровне) многих входных слов было ненадежно, хотя входное сообщение в целом признавалось грамматичным. В такой ситуации было явно выгодно начинать с островков относительной лексической определенности и уже от них вести дальнейший анализ. Сложность возникает, однако, при анализе влево от островка, когда необходимо пройти по сети назад. Допустимость переходов в ATN может зависеть от условий, использующих значения регистров, которые были бы им приданы ранее при проходе по сети вперед, но которые не могли еще быть им приданы при переходе назад.
Это ведет в лучшем случае к увеличению неопределенности, в худшем — к полной блокировке прохода.3.5.2. Стратегии преодоления неграмматичности, использующие подбор образцов. Подход, использующий подбор образцов, является более адекватной концепцией для преодоления ошибок на уровне предложений, чем сетевой подход. В частности, условие, определяющее успешность подбора образцов, может быть ослаблено так, чтобы можно было допускать обработку высказываний с пропущенными или со случайными составляющими. При пропущенных составляющих мы получаем образцы, в которых подобрано соответствие лишь для некоторых, но не для всех компонентов, и тогда они временно могут рассматриваться как совпавшие по всем позициям; а случайные составляющие могут игнорироваться, поскольку они включены в образец, другие компоненты которого совпали с элементами входного высказывания. В этих случаях образцы, взятые как целое, обеспечивают основу, на которой может базироваться умение „отступить", которое выше было квалифицировано нами как важнейшее условие гибкой методики преодоления ошибок. Кроме того, если элементы образца определены семантически, а не формально-лексически, как в системе машинного перевода Уилкса (W і 1 k s, 1975), то семантические ограничения могут быть легко использованы для распознавания. Однако при нарушении порядка следования составляющих подход, основывающийся на образцах, не слишком удобен, поскольку порядок составляющих в образце так же строго фиксирован, как и в сети. Можно разрешить при подборе образцов любые перестановки элементов, но это приведет к такой свободе, что, по-видимому, приемлемыми окажутся наряду с верными и многие случайные составляющие (см. Hayes and Mouradian, 1981).
Глубинная проблема здесь заключается в том, что нет естественного способа установления относительной значимости (или роли для анализа) одного слова в отличие от другого. Так, для обработки многих приведенных нами примеров можно было бы использовать образец следующего типа:
((determiner) (disk-drive-attribute) *(disk-drive))
‘((определитель) (атрибут-накопителя-на-дисках) * (накопительна дисках))’.
Данная цепочка описывает образец, согласно которому в высказывании сначала идет определитель, далее — нуль или более атрибутов накопителя на дисках, а затем — слово или словосочетание, синонимичное выражению „накопитель на дисках".
Следовательно, данный образец распознает выражения типа „а dual ported disk" или „the disk drive”. При использовании вышеописанного метода обработки пропущенных составляющих наличие одного лишь слова the уже будет давать частичное заполнение данного образца, причем это заполнение будет считаться не худшим, чем то, которое дает наличие в тексте выражения disk drive; такое приравнивание, безусловно, нежелательно. Сложность заключается в том, что не существует способа указать гибкому анализатору, какие компоненты образца являются различительными с точки зрения распознавания, а какие — нет. Другое проявление той же проблемы заключается в том, что различные слова и составляющие могут представлять большую или меньшую трудность для распознавания (например, предлоги легче распознать, чем связанные с ними именные группы), и поэтому имеет смысл более или менее учитывать это при попытке преодоления грамматического отклонения.
Таким образом, представленная здесь глубинная проблема сводится к вопросу о единообразии грамматической репрезентации и о возможных методах применения ее к входному выражению. Любая грамматика, предусматривающая единообразную репрезентацию, основывается ли она на образцах или сетях, будет сталкиваться со сложностями при попытке представлять и использовать только что описанные различия и, следовательно, будет менее пригодна для эффективного преодоления многих грамматических отклонений с учетом различия единиц по их роли в высказывании. Более полный разбор этой проблемы см. в: Hayes and Carbonell, 1981.
3.5.3. Стратегии преодоления неграмматичности с опорой на концепцию падежных фреймов. Рекурсивная активизация падежных фреймов представляет, по-видимому, более надежную основу для преодоления неудач, связанных с пропущенными словами, чем подходы, базирующиеся на передвижении по сети или на подборе образцов. Этому есть несколько объяснений.
— Актуализация падежных фреймов по своей сути является в высшей степени интерпретирующим процессом.
Падежные фреймы дают набор синтаксических и семантических ожиданий высокого уровня, которые могут быть по-разному применены к входной цепочке с помощью целого ряда способов. Они также дают общую основу для реализации умения ’’отступить" с целью получения широкого обзора ожиданий анализатора. Как мы подчеркивали, такая способность „отступать" важна в тех случаях, когда входное выражение отклоняется от стандартных ожиданий.— Актуализация падежных фреймов — удобный инструмент, который позволяет привлекать семантическую и прагматическую информацию, способствующую выбору подходящего варианта анализа при отсутствии ожидаемых синтаксических составляющих. Если пропущен предлог (что то и дело встречается в шифроподобных входных сообщениях у небрежных машинисток), то получающееся предложение является синтаксически аномальным. Однако семантические падежные ограничения могут быть достаточно сильными, для того чтобы приписать каждой именной группе правильное место в структуре высказывания. Возьмем, например, следующее предложение, поданное на вход естественноязыкового интерфейса электронной системы обработки почты:
Send message John Smith.
‘Переслать сообщение Джон Смит’.
Опущенный артикль вызывает мало осложнений, но опущение предлога может создать гораздо более серьезную проблему. Имеем ли мы в виду переслать сообщение „Джону Смиту", „о Джоне Смите", „с Джоном Смитом", „для Джона Смита", „от Джона Смита", „на имя Джона Смита", „Джона Смита" и т. п.? Семантика предметной области падежного фрейма исключает три последние возможности и им подобные как бессмысленные. Однако только прагматические знания позволяют выбрать вариант „Джону Смиту" как наиболее предпочтительную интерпретацию (возможно, и нуждающуюся в подтверждении со стороны пользователя) — ведь для выполнения команды падеж адресата глагола обязателен, тогда как другие падежи, если они имеют место, являются факультативными. Это знание о выполняемом действии должно быть привлечено в момент реального анализа для разрешения неоднозначности шифроподобной команды. В системе XCALIBUR кодирование падежных фреймов (Carbon ell et al., 1983) позволяет привлекать именно такого рода прагматические знания, которые представлены в виде предпочтительных ограничений (ср. Wilks, 1975), применяемых к заполнителям падежных ролей в момент реального анализа. Таким образом, сложности, возникающие из-за отсутствия ожидаемых падежных показателей, могут быть преодолены на основе знаний о предметной области.
— Передача семантических знаний с помощью падежного фрейма посредством связанных с ним процедур, как в KRL (Bob row and Winograd, 1977) или SRL (Wright and Fox, 1983), может заполнять значения по умолчанию и дополнять выражения типа dual disks до полных dual ported disks без обращения к пользователю. Этот процесс служит также обнаружению пропущенной или неоднозначно определенной информации, вызывая в этом случае фокусирующий проясняющий диалог (Hayes, 1981).
— Репрезентация падежных фреймов по существу своему не единообразна. Заполнители падежных ролей, падежные показатели и ключевые слова, задающие определенный падежный фрейм,—все репрезентируются отдельно, и это разграничение может использоваться анализатором в ходе интерпретации высказывания для активизации данного падежного фрейма. Например, если какой-то падежный фрейм объясняет не содержащую лишних слов часть входного высказывания, в котором, кроме того, имеются еще и случайные составляющие, то методика преодоления неудач может пропустить нераспознаваемые слова, сразу переключившись на просмотр падежных показателей (а не заполнителей падежей, которые обычно намного труднее обнаружить и обработать). Эта способность использовать разные виды репрезентации гораздо лучше помогает решить проблему обработки неграмматичных выражений, чем методы, использующие единообразную репрезентацию типа описанного в предыдущем разделе метода подбора образцов.
4. ВИДЫ НЕГРАММАТИЧНОСТИ НА УРОВНЕ ДИАЛОГА
Глубинные причины многих неграмматичных явлений, обнаруживаемых на уровне предложения, коренятся в диалоге. Например, эллипсис и другие виды фрагментарных входных выражений явно неграмматичны на уровне предложения, но могут быть поняты в контексте диалога. С точки зрения этого более общего уровня эллипсис нельзя назвать „неграмматичным явлением". Тем не менее для обнаружения эллипсиса и правильной обработки фрагментов с включением их в структуру более высокого уровня требуются те же самые вычислительные механизмы, которые устраняют лексические ошибки и (особенно) ошибки на уровне предложений. Точно так же многие явления диалога с прагматической точки зрения могут быть оценены как случаи неграмматичности.
Кроме умения обрабатывать неграмматичные выражения на уровне диалога, любая надежная анализирующая система должна вовлекать пользователя в диалоговое общение для кооперативного решения любых проблем анализа, которые оказываются слишком трудными для автоматического преодоления. Кооперативное взаимодействие с пользователем необходимо анализатору также для подтверждения любых предположений, выдвигаемых им в ходе интерпретации неграмматичных входных выражений, и для разрешения любых неоднозначностей, с которыми он не может справиться сам. В процессе изложения мы несколько раз ссылались на принцип фокусирующего взаимодействия и утверждали, что эффективные проясняющие диалоги должны быть очень точно сфокусированы на данной конкретной проблеме. В разд. 4.2 приводятся некоторые соображения относительно структуры фокусирующего интерактивного диалога, в частности разбирается вопрос о необходимости строгого фокусирования и о механизмах, которые требуются для достижения такого фокусирования достаточно естественным способом.
4.1