Юридическая
консультация:
+7 499 9384202 - МСК
+7 812 4674402 - СПб
+8 800 3508413 - доб.560
 <<
>>

3. ОБЗОР ИССЛЕДОВАНИЙ ПО ПРОБЛЕМЕ НАДЕЖНОСТИ

Предшествующие исследования подходили к проблеме надежного понимания с различных позиций. Хейз и Мурадян (Hayes and Mouradian, 1981) разработали метод гибкого применения грам­матики к реальным высказываниям, что позволяет строить интер­претации для разнообразных отклонений от грамматической нормы.

В этой работе используется анализатор, действующий по принципу „снизу вверх" с применением подбора образцов; существенно, что этот анализатор предусматривает прерывание анализа и продление (parse suspension and continuation) дуг в расширенной сети пере­ходов (Woods, 1970). Помимо использования факультативных эле­ментов в образцах, гибкость достигается за счет ослабления огра­ничений на непротиворечивость и за счет того, что допускаются со­ответствия образцу с нарушением порядка. Квасны и Зондгеймер (Kwasny and Sondheimer, 1981) дополнили модель Хейза и Мурадяна, развив принцип фиксации характера встречающихся грамматических отклонений. Их анализатор применяет к дугам рас­ширенной сети переходов методику ослабления грамматических пра­вил. Когда встретившаяся в ходе анализа дуга нормативной грам­матики, определяющей структуру правильного высказывания, не может быть пересечена (с точки зрения нормы), то делается спе­циальная помета об отклонении, а дуга все же пересекается. Эта помета фиксирует тип отклонения анализируемого высказывания от ожидаемой грамматической формы и позволяет продолжать анализ даже при наличии ненормативных синтаксических вариантов. Кроме того, методика релаксации лексических признаков позволяет прово­дить анализ в тех случаях, когда вместо правильного слова в выска­зывании стоит другое, не обладающее нужным признаком.

Оба названных исследования страдают во многом одними и теми же недостатками. Во-первых, хотя каждое из них стремится скон­центрировать внимание на какой-то конкретной части проблемы, про­верить эффективность того и другого подхода без семантического компонента весьма затруднительно. Во-вторых, ни тот, ни другой подход не обеспечивает вывода очередной интерпретации в случае, если первоначальное предположение оказывается неправильным. В-третьих, эти подходы не дают метода обработки высказываний с пропущенными словами. Наконец, способность каждого из этих под­ходов преодолевать синтаксическое варьирование ограниченна: они предусматривают средства обработки вариативных синтаксических структур лишь для некоторого подмножества типов синтаксических явлений, обрабатываемых в нормативной форме их анализаторами.

В более поздней статье Вейшедель и Зондгеймер (Weische- del and Sondheimer, 1983) описывают исследование, которое значительно расширяет диапазон применения идей, изложенных в работе Kwasny and Sondheimer, 1981. Предлагаемое ими расширение связано с использованием метаправил, служащих для обработки неправильно построенных входных сообщений. Назначе­ние этих метаправил состоит в том, чтобы распознавать каждый дан­ный случай неправильности и предписывать действия, которые могут привести к пониманию сообщения. Хотя идея использования мета­правил применима как будто и для обработки правильных выска­зываний и представляется вполне достойной внимания, все же кон­цепция метаправил отличается от нашего подхода в двух важных аспектах.

Во-первых, Вейшедель и Зондгеймер занимаются только задачей обработки неправильно построенных высказываний и остав­ляют на будущее задачу интеграции этого подхода с методиками обеспечения других аспектов надежности. Во-вторых, что более важ­но, их подход к обработке неправильно построенных сообщений в программном отношении отличается от общего анализа механизма, на который этот подход накладывается, тогда как наше исследова­ние строит обработку неправильно построенных сообщений с при­менением того же механизма, который используется для обработки правильно построенных сообщений.

Хейз и Карбонелл (Hayes and Carbonell, 1981) описывают исследование, более близкое по своим идеям к тому, которое пред­ставлено в настоящей статье. Ими создано два различных экспери­ментальных анализатора, в которых объединено несколько разных подходов. В анализаторе CASPAR представлены принцип поиска семантического падежного фрейма и принцип подбора линейных образцов (в плане выражения), в результате чего строится пред­ставление значения для входного сообщения. В анализаторе DYPAR для построения представления значения высказывания используется объединение следующих механизмов: контекстно свободной семан­тической грамматики, механизма частичного подбора образцов и эк­вивалентных трансформаций. (Заметим, что программа DYPAR, описанная в работе Hayes and Carbonell, 1981, совершенно отлична от программы DYPAR, описанной Дайером в работе Dyer, 1982.) Хотя оба анализатора используют как будто многообеща­ющие методики, ни CASPAR ни DYPAR не обнаруживают надеж­ности в сколько-нибудь высокой степени. Так, программа CASPAR может обрабатывать:

— неожиданные и неопознанные междометия в составе вход­ного сообщения,

— случаи отсутствия показателей семантических падежей,

— нарушения ожидаемого порядка следования семантических падежей в высказывании,

— случаи неоднозначности распознавания падежей, но она не может:

— понимать высказывание, если отсутствует слово, значение которого задает фрейм главного семантического падежа,

— осуществлять повторное распознавание смысла высказывания,

— обрабатывать эллипсис,

— понимать высказывание, если в нем произвольно нарушен порядок слов или если в нем пропущены слова.

тя она функционирует в рамках интересной системы управления ба­зой данных, степень ее надежности неясна.

В работе Carbonell and Hayes, 1983, описывается исследо­вание, развивающее результаты, представленные в статье Hayes and Carbonell, 1981. Они описывают ряд „стратегий преодоле­ния" коммуникативных неудач; эти стратегии позволяют продолжать процесс понимания, несмотря на наличие в сообщении того, что ав­торы называют „внеграмматичностью", которая устанавливается с помощью программ CASPAR, DYPAR, а также анализатора, наз­ванного DYPAR-II. Хотя этот подход напоминает подход, излага­емый в настоящей статье, он все же основан во многом на альтер­нативных принципах решения тех же проблем — принципах, кото­рые сосредоточивают внимание на нескольких различных механиз­мах обработки различных явлений, а не на едином, интегральном механизме, как он представлен в следующем разделе. Более того, по-видимому, не существует никакой единой программы, которая использовала бы все стратегии, описанные в упомянутой статье, и поэтому полезность этих стратегий, взятых в целом, оценить весьма непросто. Наконец, ни одна из предложенных программ, как пред­ставляется, не способна продолжать порождение альтернативных интерпретаций сообщения до момента подтверждения правильности со стороны пользователя; эти программы не дают гарантии, что вход­ное сообщение будет в конце концов понято.

Каждая из понимающих систем, построенных в рамках других парадигм, обладает своей степенью надежности. Так, понимающие системы, которые можно было бы назвать „семантически ориенти­рованными", продемонстрировали высокий уровень понимания, при котором на основе входного высказывания автоматически строится представление значения этого высказывания. Например, системы ELI и SAM (Riesbeck and Schank, 1976; Cull ing ford, 1978), CA (Birnbaum and Sel fridge, 1981), АСЕ (С u 11 і n g f о r d, Krueger, Selfridge and Bienkowski, 1981) близки по духу системе МЭРФИ в том, что каждая из этих систем стремится объе­динить значения слов в представление значения высказывания как целого, а затем предоставить возможность механизмам последующей обработки памяти иметь доступ к результатам этого процесса пони­мания. Однако эти программы в лучшем случае могут мыслиться как демонстрация эффективности понимания, основанного на обра­ботке знаний, в то время как потенциальные возможности интег­ральной обработки им использовать в полной мере не удается. Каж­дая из этих систем довольно чувствительна к пропуску слов и к варь­ированию синтаксиса, хотя каждая обладает в этом плане определен­ными возможностями. Есть и другие системы, имеющие отношение к развиваемому нами подходу: это система NOMAD (Granger, 1984) и системы, описываемые в работах Wilks, 1976, и Fass and

Wilks, 1983. Однако эти системы отличаются существенно иной трактовкой проблемы надежности. Например, хотя система NOMAD и строит альтернативные интерпретации трудного для понимания входного сообщения, а также обеспечивает одновременное исполь­зование синтаксических знаний и знаний о мире в процессе пони­мания, она все же не дает гарантии получения в конечном итоге нуж­ного значения входного сообщения (заметим, что в области функ­ционирования системы NOMAD подобная задача была бы нелегкой в любом случае, ибо входные сообщения здесь строятся не пользо­вателем, а поступают из третьего источника); кроме того, в этой системе обработка языковых выражений и обработка знаний, содер­жащихся в памяти, осуществляются, по-видимому, не одним и тем же, а разными механизмами. То же можно сказать и о системах, описанных в статьях Wilks, 1976, и Fass and Wilks, 1984: бу­дучи близкими к системе МЭРФИ в плане использования методики предпочтений, они не гарантируют получения в конечном итоге нуж­ного понимания высказывания, а также характеризуются использо­ванием разных механизмов для обработки языковых данных и дан­ных, хранящихся в памяти.

Наконец, важно упомянуть механизмы понимания, основанные на знаниях и отличающиеся высокой эффективностью функциони­рования, как, например, в системах, описанных Дайером (Dyer, 1982) и Лебовицем (Lebowitz, 1980). Эти программы демонстри­руют впечатляющие способности понимания, соответственно в об­ласти понимания сложных рассказов о межличностных отношениях и в области газетных сообщений об актах терроризма. Они убеди­тельно демонстрируют и эффективность процессов обработки зна­ний высокого уровня в случае трудных задач на понимание. Одна­ко ни та, ни другая системы не уделяют специального внимания вопросу надежности в том понимании этого термина, как он исполь­зуется в настоящей статье. Конечно, полное решение проблемы на­дежности будет включать высокоэффективные процессы обработки памяти, подобные тем, которые используются в упомянутых систе­мах.

Все системы, рассмотренные в настоящем разделе, обеспечивают определенную надежность в том или ином аспекте, но каждая из них оставляет желать лучшего. Конечно, можно представить себе расши­рение той или иной системы в плане устранения различных ее огра­ничений, но судить об успешности таких расширений при отсутст­вии полной реализации весьма и весьма трудно; на основе подобных гипотетических расширений практически невозможно выносить ка­кую-либо оценку. Таким образом, предшествующие исследования не привели к построению системы, понимающей естественный язык, которая была бы надежной во всех аспектах, интересующих нас в данной статье.

Чтобы построить надежный естественноязыковой интерфейс, не­обходимо определить отношения между синтаксисом и семантикой, а также между пониманием языка и обработкой памяти, ибо реаль­ная работа по созданию такого интерфейса требует опоры на впол­не определенные отношения между этими компонентами.

Шенк и Бирнбаум предлагают решение указанных проблем в рам­ках выдвигаемой ими гипотезы об интегральной обработке (Schank and Birnbaum, 1981). На основе их рассуждений можно обоб­щенно резюмировать сущность этих проблем в виде следующих трех вопросов:

1) Обрабатывается ли синтаксическая структура раньше семан­тической или синтаксис и семантика обрабатываются одно­временно?

2) Разделены ли процессы обработки синтаксиса и семантики или обработка этих структур образует единый процесс?

3) Являются ли обработка языковых сообщений и обработка знаний, содержащихся в памяти, разными процессами или они составляют принципиально один и тот же процесс?

Как отмечается в статье Шенка и Бирнбаума, существуют, грубо говоря, две полярные точки зрения на эти вопросы. Одну из них можно назвать «сепаратистской», а другую — «интегральной». Каж­дую из них можно охарактеризовать с помощью ответов на указан­ные вопросы. Первый вопрос касается временного соотношения се­мантической и синтаксической обработки в ходе процесса понимания. Согласно сепаратистской точке зрения, синтаксический анализ вы­сказывания осуществляется до любого вида семантического анализа, а на его выходе мы получаем синтаксическое описание высказыва­ния. Это описание затем подается на вход семантического анализа. Такому представлению противостоит интегральная концепция, со­гласно которой синтаксический анализ выполняется в то же самое время, что и семантический анализ. Таким образом, временной порядок синтаксического и семантического анализа в ходе обработ­ки языковых сообщений является дискуссионным моментом, и при построении надежного естественноязыкового интерфейса он должен быть предметом сознательного рассмотрения.

Второй вопрос касается природы механизмов, обрабатывающих синтаксические и семантические структуры. В соответствии с сепа­ратистской точкой зрения механизм, строящий синтаксическое описа­ние высказывания, отличен от механизма, строящего представле­ние значения высказывания. Иначе говоря, согласно этому взгляду, синтаксический анализ осуществляется по иному алгоритму, чем се­мантический анализ. Интегральная точка зрения, напротив, утверж­дает, что синтаксис и семантика обрабатываются одним и тем же ме­ханизмом. Этот механизм одинаково успешно оперирует как синтак­сической, так и семантической информацией. Таким образом, мы имеем дело с двумя совершенно различными позициями, и при построении надежного естественноязыкового интерфейса должен быть сделан выбор.

Третий вопрос касается взаимоотношений между обработкой язы­ковых сообщений и обработкой памяти. Сепаратистская позиция со­стоит в том, что обработка языка — это особая, специфическая функция, во многом не связанная с процессами обработки памяти. В рамках этого взгляда память трактуется как относительно пассив­ная сущность, лишь в малой степени затрагиваемая активной обра­боткой. Интегральная позиция, однако, придерживается иной точки зрения на роль памяти в процессах обработки языковых сообщений. Представители этой точки зрения считают, что обработка языковых сообщений — это прежде всего процесс, основанный на операциях с памятью, и далее они приходят к выводу, что обработка языка и обработка памяти составляют единый процесс. Данный вопрос имеет особое значение, потому что надежный интерфейс должен бу­дет, по-видимому, опираться на тот или иной вид обработки памяти.

Заметим, что возможна и промежуточная точка зрения между двумя указанными полюсами. Можно придерживаться интегральной концепции по отношению к одному-двум конкретным вопросам и за­нимать сепаратистскую позицию по отношению ко всем остальным вопросам. Например, Бобров и Веббер (Bobrow and Webber, 1980) описывают естественноязыковый интерфейс, в котором син­таксис и семантика обрабатываются по типу одновременного, логи­чески перемежающегося процесса, но в котором тем не менее синтак­сис и семантика обрабатываются разными механизмами и в котором обработка языка и обработка памяти производятся различными ме­ханизмами. И все-таки разграничение двух указанных точек зрения представляется полезным.

Гипотеза Шенка и Бирнбаума об интегральной обработке — это прежде всего гипотеза о том, что интегральная точка зрения пра­вильно отражает природу обработки языковых сообщений человеком; сущность этой гипотезы можно выразить следующим образом:

Синтаксические и семантические структуры обрабатываются од­новременно.

Синтаксис и семантика обрабатываются в ходе одного и того же процесса.

Обработка языковых сообщений по своей природе тождественна обработке памяти.

Шенк и Бирнбаум приводят подробную аргументацию для обосно­вания данной гипотезы, но для нас здесь главное заключается в ее следствиях для моделирования человеческого понимания, а имен­но: если гипотеза об интегральной обработке действительно описыва­ет обработку языковых сообщений человеком и если учесть, что че­ловек воплощает в себе надежный языковой процессор, то один из путей построения надежного естественноязыкового интерфейса — это включение данной гипотезы в интерфейс, работающий в режиме естественного языка. Это приводит нас к предположению, что «интег­ральная обработка обеспечивает надежное понимание»; для краткос­ти его можно обозначить как гипотезу ИООНП (integrated processing produces robust understanding conjecture — IPPRU conjecture).

Важно понимать, о чем не говорится в данной гипотезе. Ги­потеза ИООНП не утверждает, что принятие гипотезы об интеграль­ной обработке является необходимым для обеспечения надежного понимания, а утверждает только, что это один из подходов, который работает. Хотя установление необходимости гипотезы об интеграль­ной обработке для надежного понимания и представляется нам же­лательным, такая задача в данной статье не ставится. Правда, ис­следование, описываемое нами, относится к первому шагу на пути доказательства этой необходимости. Ни гипотеза об интегральной обработке, ни гипотеза ИООНП не утверждают тождественности син­таксического и семантического знания. Хотя при нашей концепции синтаксис и семантика обрабатываются в одно и то же время и одним и тем же механизмом, в настоящей работе предлагается иное разграничение синтаксиса и семантики. Это разграничение основано на знаниях, а не на процессах обработки. Иначе говоря, согласно этой точке зрения, различие между синтаксисом и семан­тикой кроется в специфике знания, представляемого в соответствую­щих структурах, а не в порядке их применения и не в механизмах их обработки.

Общая оценка гипотезы ИООНП включает несколько вопросов. Как лучше всего учитывать гипотезу об интегральной обработке при построении программы? Какова должна быть предметная область такой программы? Как оценивать ее функционирование?

Прежде чем обратиться к вопросу о способе отражения гипо­тезы об интегральной обработке в конкретной программе, надо провести важное разграничение между:

— программой, которая может иметь несколько модулей, но которая учитывает гипотезу об интегральной обработке благодаря строению используемых ею алгоритмов и способу манипулирования данными, и

— программой, которая не только учитывает гипотезу об интег­ральной обработке, но и сама является интегрированной, то есть не распадается на модули.

В идеальном случае гипотеза об интегральной обработке лучше все­го учитывается в программе, которая и сама является действительно интегральной. Однако построение такой полностью интегрирован­ной программы — длительный процесс, и он требует решения ряда трудных конструкторских задач. Чтобы получить необходимую ин­формацию, на основании которой могли бы разрабатываться эти кон­структорские решения, была создана система МЭРФИ как первый, эскизный прототип, который, не являясь в полной мере интегриро­ванным, все-таки учитывает гипотезу об интегральной обработке. Таким образом, функционирование МЭРФИ имеет прямое отношение к гипотезе ИООНП, хотя сама система МЭРФИ и не является пол­ностью интегрированной.

Второй вопрос касается предметной области, в рамках которой действует программа, работающая в режиме естественного языка. В идеале предметная область должна быть большой и представлен­ной в реальной жизни. Однако, поскольку целесообразность затраты усилий на большую и реальную область должна быть оправдана вы­соким качеством функционирования системы в пределах ограничен­ной области, представляется удобным в качестве первого шага про­водить эксперименты сначала именно на такой ограниченной области. Подобной тактики придерживались и другие исследователи рассмат­риваемых проблем, например: Hayes and Mouradian, 1981; К wasny and Sondheimer, 1981; Hayes and Carbonell, 1981; Dyer, 1982; L e b о w і t z, 1980. Ограниченная семантическая область, избранная для настоящего исследования,— это область действий робота по осуществлению сборочных операций в лабора­торных условиях. Данная область удобна для наших экспериментов, поскольку она является подмножеством более широкой реальной промышленной области и дает критерий итогового понимания — это степень успешности выполнения системой наших команд, построе­ния ответов на вопросы, а также запоминания и использования декларативных сообщений.

Третий из сформулированных вопросов касается критериев оценки исследования в целом (с точки зрения обеспеченности надеж­ности). При каких условиях можно считать его успешным? Пред­ставляется, что наиболее важны два критерия: во-первых, функци­онирует ли интерфейс надежно в пределах своей исходной предметной области? Иначе говоря, отвечает ли он требованиям, описанным в разд. 2? Во-вторых, позволяет ли он определить пути приме­нения соответствующей методики для случая расширенной предмет­ной области или для случая полной смены предметной области? Другими словами, ясны ли его ограничения, очевидны ли проблемы, требующие отдельного исследования, и имеются ли убедительные до­казательства того, что такое дополнительное исследование окажется успешным? Положительные ответы на оба эти вопроса будут озна­чать, что настоящее исследование может считаться успешным.

В данном разделе подробно описывается система МЭРФИ. Она состоит из четырех крупных компонентов. Это следующие программы:

— Анализатор естественного языка (АЕЯ), который обращает­ся к словарю слов и фразеологических единиц и осущест­вляет применительно к словам входного высказывания пони­мание низшего уровня;

— Программа вывода умозаключений (Блок надежного понима­ния — БНП); этот блок завершает процесс понимания, опира­ясь на знания о предшествующей части диалога, на непосред­ственный контекст и на знания о предметной области;

— Программа управления диалогом (ПУД), которая производит вывод умозаключений на основе значений входных высказыва­ний пользователя и обеспечивает способность к диалогу со смешанной инициативой, а также позволяет МЭРФИ взаимо­действовать с робототехнической системой сборки;

— Генератор естественного языка (Концептуальный генератор — КГ), который, отталкиваясь от понятий, выражает их на естественном языке.

Высказывание пользователя, обращенное к МЭРФИ, сначала анализируется программой АЕЯ с максимальной возможной сте­пенью глубины. Затем АЕЯ передает результат своего понимания в БНП, который завершает процесс понимания, используя знания о предметной области и о предшествующей части диалога. Далее БНП проверяет полученное понимание с помощью пользователя и в случае ошибки выводит очередное, наиболее правдоподобное (с точки зре­ния логики этого блока) значение, и так далее до тех пор, пока БНП не выведет нужное значение или не исчерпает свои возможности. В последнем случае управление снова передается АЕЯ, который строит очередное, наиболее правдоподобное понимание на основе доступных ему средств, и это понимание опять передается в БНП для вывода умозаключений. Когда нужное значение подтверждается пользователем, оно передается в ПУД, которая применяет правила типа «тест — действие» и выводит ответную реакцию на входное высказывание. Одни реакции сводятся к уточняющим вопросам, адресованным пользователю, или к ответам на его вопросы, другие заключаются в выводе чисто внутренних умозаключений, а третьи являются командами, которые направляются в робототехническую систему сборки. В любой момент работы интерфейса может подклю­чаться КГ, используемый по мере необходимости для порождения ответных реакций на естественном языке.

Почти каждый компонент МЭРФИ имеет отношение к вопросу о надежном понимании; АЕЯ, БНП, ПУД, словарь, контекст, знания

о предметной области — все эти части системы играют важную роль. В данном разделе мы сначала описываем по очереди каждую из этих частей, а затем показываем, каким образом все эти компонен­ты учитывают гипотезу об интегральной обработке.

5.1.

<< | >>
Источник: Б.Ю. Городец­кий. Новое в зарубежной лингвистике: Вып. XXIV. Компьютерная лингвистика: Пер. с англ./Сост., ред. и вступ, ст. Б. Ю. Городец­кого.— М.: Прогресс,1989.—432 с.. 1989

Еще по теме 3. ОБЗОР ИССЛЕДОВАНИЙ ПО ПРОБЛЕМЕ НАДЕЖНОСТИ:

  1. введение
  2. Технология исследования и создания рекламного образа
  3. БИБЛИОГРАФИЯ
  4. Анализ условий работы и образа жизни
  5. § 4. КРИТЕРИЙ КАЧЕСТВА РЕГУЛИРОВАНИЯ И НАДЕЖНОСТЬ ДЕЙСТВИЯ СИСТЕМЫ
  6. СПИСОК ИСПОЛЬЗОВАННЫХ источников  
  7. ДО — ВО ВРЕМЯ — ПОСЛЕ? (Вместо предисловия)
  8. ОТЗЫВЫ НЕОФИЦИАЛЬНЫХ ОППОНЕНТОВ НА АВТОРЕФЕРАТ ДИССЕРТАЦИИ
  9. ГЛАВА I. ОБЗОР ОСНОВНЫХ ПРОБЛЕМ
  10. § 1. Способы защиты гражданских прав
  11. ВВЕДЕНИ
  12. Важность ввода хороших данных для анализа
  13. Оценка эффективности психологического консультирования
  14. «Третий нефтяной шок» - провозвестник глобальных перемен (1983-1986 гг.)
  15. Предисловие редактора серии
  16. Общие принципы
  17. КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА: МОДЕЛИРОВАНИЕ ЯЗЫКОВОГО ОБЩЕНИЯ
  18. 3. ОБЗОР ИССЛЕДОВАНИЙ ПО ПРОБЛЕМЕ НАДЕЖНОСТИ