<<
>>

Использование в стратегиях преодоления неграмматичности на уровне предложения различных подходов к анализу сообщений.

Мы переходим теперь к вопросу о возможности совмещения рассмотренных стратегий преодоления неграмматичности на уровне предложения с различными подходами к анализу сообщений, упомя­нутых во введении. Как мы увидим, существуют значительные рас­хождения в глубинном соответствии различных подходов в качестве базы для стратегий преодоления неграмматичности. Для рассмотре­ния этого вопроса следует разделить все подходы к анализу сооб­щений на три большие группы: подходы, использующие сети пере­ходов (включая синтаксические ATN * и основывающиеся на сетях семантические грамматики), подходы, использующие подбор образ­цов, и подходы, базирующиеся на актуализации падежных фрей­мов.

3.5.1 Стратегии преодоления неграмматичности, использующие сети переходов. Хотя и предпринимались определенные попытки пре­дусмотреть стратегии преодоления неграмматичности (на уровне предложения) в рамках анализаторов сетевого типа, использующих как синтаксические ATN (Kwasny and Sondheimer, 1981; Weischedel and Sondheimer, 1984; Weischedel and Black, 1980; Woods et al., 1976), так и семантические сетевые грамматики (Hendrix, 1977), однако сама сетевая парадигма не очень подходит к тем видам стратегий преодоления неграмматич­ности, которые рассматривались в предыдущих разделах. Эти стра­тегии требуют, вообще говоря, способности «отступить» в ходе интерпретации (когда ожидания анализатора нарушены) и оце­нить ситуацию с более общей точки зрения, что трудно осуществить, используя сети. Глубинная проблема заключается в том, что зна­чительная часть информации о данном состоянии процесса анализа имплицитно закодирована позицией в сети; в случае ATN в кон­текстах отдельных регистров содержатся и другие аспекты, каса­ющиеся состояния разбора. Как показывает подход, использующий для распознавания неудач метаправила и описанный Вейшеделем и Зондгеймером (W е і s с h е d е 1 and Sondheimer, 1983), эти и другие трудности, разбираемые ниже, не блокируют процесс пре­одоления неграмматичности. Однако они все-таки усложняют этот процесс и часто делают его непрактичным, так как для стратегий преодоления неграмматичности большая часть процедурно закодиро­ванной информации о состоянии анализа должна быть представлена в декларативной и эксплицитной форме.

Часто анализ, использующий ATN, продолжается и после того места, где встретилось грамматическое отклонение, скажем про­пущенное слово, и доходит до узла сети, после которого дальней­ший анализ невозможен (то есть отсутствует дуга, по которой можно было бы пройти). В этот момент анализатор не может уста­новить источник ошибки, анализируя свое внутреннее состояние, даже если оно доступно,— анализатор мог незаметно выйти из встро­енной подсети или пройти по совершенно случайной последова­тельности дуг, прежде чем выяснилось бы, что произошла ошибка. Даже если эти проблемы могут быть преодолены и может быть точно определен источник ошибки, то все равно остается главная проблема: ведь для преодоления ошибок и обработки неграмматич­ного сообщения, сохраняя верность сетевому формализму, анализа­тор должен динамично — и причем временно — модифицировать сеть, а затем использовать модифицированный вариант для обра­ботки встретившихся трудностей. Нет необходимости говорить, что в лучшем случае это очень сложный процесс, возможность реализации которого на ЭВМ остается открытой. По-видимому, не удивительно, что в одном из наиболее эффективных механизмов преодоления не­грамматичности, основывающемся на сетевом анализаторе,— про­грамме обработки эллипсиса в системе LIFER (Hendrix, 1977) — основной этап такой обработки осуществляется полностью вне се­тевого формализма.

Как мы видели, семантические ограничения очень важны при преодолении многих видов неграмматичности входных выражений, а такие ограничения по определению невозможны в классическом синтаксическом анализаторе, использующем ATN. Однако семан­тическая информация может быть привнесена в сетевой анализ либо с помощью семантической грамматики, при которой объединенные семантические и синтаксические категории используются непосред­ственно в ATN, либо путем введения семантических критериев в усло­вия, налагаемые на дуги ATN (Bob row, 1978; Bob row and Webber, 1980). При первом методе соответствующую семанти­ческую информацию можно применить для преодоления ошибок толь­ко в том случае, если будет найден правильный узел в сети, а иног­да, как мы видели, это довольно трудная задача. При втором методе, который иногда называют методом каскадных ATN (W о о d s, 1980), синтаксические и семантические части грамматики разделены, что придает использованию семантической информации потенциально большую интерпретирующую силу. Однако естественное применение этого метода связано с привлечением семантической информации только для подтверждения или опровержения результатов анализа, проведенного на синтаксической основе. Таким образом, жесткость сетевого формализма сильно затрудняет эффективное применение имеющейся семантической информации для обработки неграмматич­ных входных сообщений.

Еще одним недостатком сетевого подхода в плане осуществ­ления гибких стратегий преодоления неграмматичности является то, что для сетей естественно движение в ходе анализа сверху вниз и слева направо. А, как мы видели, для многих стратегий преодоле­ния неграмматичности существенна способность к обработке снизу вверх, и, более того, часто осуществление этих стратегий облегчается и становится более эффективным, если имеется возможность гибко изменять направление анализа. Правда, разбор сверху вниз и слева направо — это свойство сетевого интерпретатора, а не самого сете­вого формализма, и была даже предпринята попытка использовать ATN „островным" способом, то есть снизу вверх и из центра к периферии (Woods et al., 1976). Этот эксперимент был проведен при анализе устной речи, когда распознавание (на низшем уровне) многих входных слов было ненадежно, хотя входное сообщение в целом признавалось грамматичным. В такой ситуации было явно выгодно начинать с островков относительной лексической определен­ности и уже от них вести дальнейший анализ. Сложность возни­кает, однако, при анализе влево от островка, когда необходимо пройти по сети назад. Допустимость переходов в ATN может зависеть от условий, использующих значения регистров, которые были бы им приданы ранее при проходе по сети вперед, но которые не могли еще быть им приданы при переходе назад. Это ведет в лучшем случае к увеличению неопределенности, в худшем — к полной бло­кировке прохода.

3.5.2. Стратегии преодоления неграмматичности, использующие подбор образцов. Подход, использующий подбор образцов, является более адекватной концепцией для преодоления ошибок на уровне предложений, чем сетевой подход. В частности, условие, опреде­ляющее успешность подбора образцов, может быть ослаблено так, чтобы можно было допускать обработку высказываний с пропущен­ными или со случайными составляющими. При пропущенных состав­ляющих мы получаем образцы, в которых подобрано соответствие лишь для некоторых, но не для всех компонентов, и тогда они времен­но могут рассматриваться как совпавшие по всем позициям; а слу­чайные составляющие могут игнорироваться, поскольку они вклю­чены в образец, другие компоненты которого совпали с элемен­тами входного высказывания. В этих случаях образцы, взятые как целое, обеспечивают основу, на которой может базироваться уме­ние „отступить", которое выше было квалифицировано нами как важнейшее условие гибкой методики преодоления ошибок. Кроме того, если элементы образца определены семантически, а не формаль­но-лексически, как в системе машинного перевода Уилкса (W і 1 k s, 1975), то семантические ограничения могут быть легко использова­ны для распознавания. Однако при нарушении порядка следования составляющих подход, основывающийся на образцах, не слишком удобен, поскольку порядок составляющих в образце так же строго фиксирован, как и в сети. Можно разрешить при подборе образцов любые перестановки элементов, но это приведет к такой свободе, что, по-видимому, приемлемыми окажутся наряду с верными и мно­гие случайные составляющие (см. Hayes and Mouradian, 1981).

Глубинная проблема здесь заключается в том, что нет естест­венного способа установления относительной значимости (или роли для анализа) одного слова в отличие от другого. Так, для обработки многих приведенных нами примеров можно было бы использовать образец следующего типа:

((determiner) (disk-drive-attribute) *(disk-drive))

‘((определитель) (атрибут-накопителя-на-дисках) * (накопи­тельна дисках))’.

Данная цепочка описывает образец, согласно которому в высказы­вании сначала идет определитель, далее — нуль или более атрибутов накопителя на дисках, а затем — слово или словосочетание, синони­мичное выражению „накопитель на дисках".

Следовательно, данный образец распознает выражения типа „а dual ported disk" или „the disk drive”. При использовании вышеописанного метода обработки пропущенных составляющих на­личие одного лишь слова the уже будет давать частичное заполнение данного образца, причем это заполнение будет считаться не худшим, чем то, которое дает наличие в тексте выражения disk drive; такое приравнивание, безусловно, нежелательно. Сложность заключается в том, что не существует способа указать гибкому анализатору, какие компоненты образца являются различительными с точки зрения распознавания, а какие — нет. Другое проявление той же проблемы заключается в том, что различные слова и составляющие могут пред­ставлять большую или меньшую трудность для распознавания (на­пример, предлоги легче распознать, чем связанные с ними именные группы), и поэтому имеет смысл более или менее учитывать это при попытке преодоления грамматического отклонения.

Таким образом, представленная здесь глубинная проблема сво­дится к вопросу о единообразии грамматической репрезентации и о возможных методах применения ее к входному выражению. Лю­бая грамматика, предусматривающая единообразную репрезента­цию, основывается ли она на образцах или сетях, будет сталкиваться со сложностями при попытке представлять и использовать только что описанные различия и, следовательно, будет менее пригодна для эф­фективного преодоления многих грамматических отклонений с учетом различия единиц по их роли в высказывании. Более полный разбор этой проблемы см. в: Hayes and Carbonell, 1981.

3.5.3. Стратегии преодоления неграмматичности с опорой на кон­цепцию падежных фреймов. Рекурсивная активизация падежных фреймов представляет, по-видимому, более надежную основу для преодоления неудач, связанных с пропущенными словами, чем подхо­ды, базирующиеся на передвижении по сети или на подборе образ­цов. Этому есть несколько объяснений.

— Актуализация падежных фреймов по своей сути является в высшей степени интерпретирующим процессом. Падежные фреймы дают набор синтаксических и семантических ожиданий высокого уровня, которые могут быть по-разному применены к входной цепоч­ке с помощью целого ряда способов. Они также дают общую основу для реализации умения ’’отступить" с целью получения широкого об­зора ожиданий анализатора. Как мы подчеркивали, такая способ­ность „отступать" важна в тех случаях, когда входное выражение отклоняется от стандартных ожиданий.

— Актуализация падежных фреймов — удобный инструмент, ко­торый позволяет привлекать семантическую и прагматическую ин­формацию, способствующую выбору подходящего варианта анализа при отсутствии ожидаемых синтаксических составляющих. Если пропущен предлог (что то и дело встречается в шифроподобных входных сообщениях у небрежных машинисток), то получающееся предложение является синтаксически аномальным. Однако семанти­ческие падежные ограничения могут быть достаточно сильными, для того чтобы приписать каждой именной группе правильное место в структуре высказывания. Возьмем, например, следующее предложе­ние, поданное на вход естественноязыкового интерфейса электрон­ной системы обработки почты:

Send message John Smith.

‘Переслать сообщение Джон Смит’.

Опущенный артикль вызывает мало осложнений, но опущение предлога может создать гораздо более серьезную проблему. Имеем ли мы в виду переслать сообщение „Джону Смиту", „о Джоне Смите", „с Джоном Смитом", „для Джона Смита", „от Джона Смита", „на имя Джона Смита", „Джона Смита" и т. п.? Семантика пред­метной области падежного фрейма исключает три последние возмож­ности и им подобные как бессмысленные. Однако только прагмати­ческие знания позволяют выбрать вариант „Джону Смиту" как наи­более предпочтительную интерпретацию (возможно, и нуждающуюся в подтверждении со стороны пользователя) — ведь для выполнения команды падеж адресата глагола обязателен, тогда как другие па­дежи, если они имеют место, являются факультативными. Это знание о выполняемом действии должно быть привлечено в момент реального анализа для разрешения неоднозначности шифроподобной команды. В системе XCALIBUR кодирование падежных фреймов (Car­bon ell et al., 1983) позволяет привлекать именно такого рода прагматические знания, которые представлены в виде предпочтитель­ных ограничений (ср. Wilks, 1975), применяемых к заполнителям падежных ролей в момент реального анализа. Таким образом, слож­ности, возникающие из-за отсутствия ожидаемых падежных показа­телей, могут быть преодолены на основе знаний о предметной области.

— Передача семантических знаний с помощью падежного фрей­ма посредством связанных с ним процедур, как в KRL (Bob row and Winograd, 1977) или SRL (Wright and Fox, 1983), может заполнять значения по умолчанию и дополнять выражения типа dual disks до полных dual ported disks без обращения к пользова­телю. Этот процесс служит также обнаружению пропущенной или неоднозначно определенной информации, вызывая в этом случае фокусирующий проясняющий диалог (Hayes, 1981).

— Репрезентация падежных фреймов по существу своему не единообразна. Заполнители падежных ролей, падежные показатели и ключевые слова, задающие определенный падежный фрейм,—все репрезентируются отдельно, и это разграничение может исполь­зоваться анализатором в ходе интерпретации высказывания для ак­тивизации данного падежного фрейма. Например, если какой-то па­дежный фрейм объясняет не содержащую лишних слов часть входно­го высказывания, в котором, кроме того, имеются еще и случайные составляющие, то методика преодоления неудач может пропустить нераспознаваемые слова, сразу переключившись на просмотр падеж­ных показателей (а не заполнителей падежей, которые обычно намно­го труднее обнаружить и обработать). Эта способность использовать разные виды репрезентации гораздо лучше помогает решить пробле­му обработки неграмматичных выражений, чем методы, использую­щие единообразную репрезентацию типа описанного в предыдущем разделе метода подбора образцов.

4. ВИДЫ НЕГРАММАТИЧНОСТИ НА УРОВНЕ ДИАЛОГА

Глубинные причины многих неграмматичных явлений, обна­руживаемых на уровне предложения, коренятся в диалоге. Напри­мер, эллипсис и другие виды фрагментарных входных выражений явно неграмматичны на уровне предложения, но могут быть поня­ты в контексте диалога. С точки зрения этого более общего уров­ня эллипсис нельзя назвать „неграмматичным явлением". Тем не менее для обнаружения эллипсиса и правильной обработки фраг­ментов с включением их в структуру более высокого уровня тре­буются те же самые вычислительные механизмы, которые устраня­ют лексические ошибки и (особенно) ошибки на уровне предложе­ний. Точно так же многие явления диалога с прагматической точки зрения могут быть оценены как случаи неграмматичности.

Кроме умения обрабатывать неграмматичные выражения на уров­не диалога, любая надежная анализирующая система должна вовле­кать пользователя в диалоговое общение для кооперативного реше­ния любых проблем анализа, которые оказываются слишком труд­ными для автоматического преодоления. Кооперативное взаимодей­ствие с пользователем необходимо анализатору также для подтвер­ждения любых предположений, выдвигаемых им в ходе интерпре­тации неграмматичных входных выражений, и для разрешения любых неоднозначностей, с которыми он не может справиться сам. В процессе изложения мы несколько раз ссылались на принцип фокусирующего взаимодействия и утверждали, что эффективные проясняющие диалоги должны быть очень точно сфокусированы на данной конкретной проблеме. В разд. 4.2 приводятся некоторые соображения относительно структуры фокусирующего интерактив­ного диалога, в частности разбирается вопрос о необходимости строгого фокусирования и о механизмах, которые требуются для до­стижения такого фокусирования достаточно естественным способом.

4.1

<< | >>
Источник: Б.Ю. Городец­кий. Новое в зарубежной лингвистике: Вып. XXIV. Компьютерная лингвистика: Пер. с англ./Сост., ред. и вступ, ст. Б. Ю. Городец­кого.— М.: Прогресс,1989.—432 с.. 1989

Еще по теме Использование в стратегиях преодоления неграмматичности на уровне предложения различных подходов к анализу сообщений.:

  1. СТРАТЕГИИ ПРЕОДОЛЕНИЯ КОММУНИКАТИВНЫХ НЕУДАЧ ПРИ АНАЛИЗЕ НЕГРАММАТИЧНЫХ ЯЗЫКОВЫХ ВЫРАЖЕНИЙ[4]1
  2. Использование в стратегиях преодоления неграмматичности на уровне предложения различных подходов к анализу сообщений.
  3. Анализатор CASPAR.
  4. выводы