<<
>>

ОБЗОР АНАЛИЗАТОРОВ, ОСНОВАННЫХ НА КОНЦЕПТУАЛЬНЫХ ЗАВИСИМОСТЯХ

На протяжении последних десяти лет исследователи, работающие в рамках нашего проекта, разработали и за­программировали большое число анализаторов. Задача этих анализаторов состояла в преобразовании исходных выражений естественного языка в некоторое внутреннее представление.

(Заметим, что первая фаза процесса пони­мания традиционно соотносится с выявлением синтаксичес­кой формы входного сообщения.) Однако термин "анализ" (parsing) с не меньшим основанием может быть применен к первой фазе понимания в любом ее истолковании. В этой статье мы рассмотрим некоторые из проблем, возникших в ходе создания наших анализаторов, и представим новую теорию анализа, моделирующую реальный процесс пони­мания, как он осуществляется в ходе обычного чтения текста; опишем программу, которая реализует эту теорию и понимает газетные сообщения на тему о терроризме.

Все наши анализаторы были программами, которые пре­образовывали английские предложения в представления их значений в рамках теории концептуальных зависимостей (КЗ). В основе их построения всегда лежало методологичес­кое допущение о том, что используемый алгоритм анали­за должен быть как можно более адекватным в психологи­ческом плане. Таким образом, наши анализаторы предназ­начены для моделирования того способа анализа, которым, как мы полагаем, пользуются люди. Это методологическое допущение повлекло за собой операционный принцип, соб­людавшийся, за одним исключением, во всех случаях (кото­рые мы обсудим ниже), а именно, что алгоритм анализа движется по тексту слева направо и осуществляет его про­смотр один раз, не допуская возврата. Эти анализаторы не были рассчитаны на обработку предложений, похожих на настоящие "садовые тропинки", когда в процессе понимания людям приходится осуществлять возврат назад.

Первый анализатор, который мы разработали (Schank and Т е s 1 е г, 1969), использовал так называемые "правила реализации" и преобразовывал английские синтаксические структуры в КЗ. (Этот термин, взятый из Lamb, 1966, означал, что мы соотносили один языковой уровень с дру­гим.) Главный недостаток этого анализатора состоял в том, что он нарушал нашу методологическую установку на моде­лирование процессов, осуществляемых человеком. Для многих английских предложений, которые были неодно­значными, применявшийся нами алгоритм не мог определять предпочтительность одной интерпретации по сравнению с другой, хотя люди явно владеют такого рода предпочте­ниями.

В работе S с h a n k et al., 1970 мы предложили некото­рое решение для устранения этого недостатка и реализо­вали новые принципы при построении нового анализатора, который мы назвали SPINOZA II. SPINOZA II должен был для управления ходом анализа использовать само представление КЗ. Это значит, что в процессе анализа значение любого понятого сегмента (от начала предложе­ния) должно помогать при определении значения остальной части предложения. Эта идея повлекла за собой сопутствую­щую идею о том, что, поскольку анализом будет управлять значение, мы на самом деле, видимо, почти не должны пола­гаться на синтаксис как на средство осуществления нашего анализа. (В то же самое время сходную идею разрабатывал

Уилкс (Wilks, 1973), и его мнение послужило поддерж­кой для нашей веры в возможность осуществления этой идеи.) Мы не считали, что сможем обойтись без синтакси­са.

Наша точка зрения состояла в том, что опора прежде всего на семантические аспекты существенно уменьшит за­висимость наших анализаторов от синтаксиса.

В то время, когда разрабатывались анализаторы ука­занного типа, другие исследователи также создавали методы для преобразования входных предложений на естественном языке во внутреннее представление. Большинство этих ме­тодов основывалось на синтаксисе предложений. Один из наиболее популярных методов состоял в использовании Расширенной сети переходов (Augmented Transition Net­work (ATN)). Анализаторы этого типа обсуждались в рабо­тах: Thorne et al., 1967; Bobrow and Fraser, 1969; Woods, 1969; Kaplan, 1975. Анализатор, очень близ­кий к классу ATN, представлен в работе Винограда (см. Winograd, 1972). Модели типа ATN опирались преиму­щественно на синтаксис, лишь изредка обращаясь к уста­новлению нескольких простых семантических свойств слов. Еще более тесно связаны с синтаксисом анализаторы, базирующиеся на трансформационной грамматике, как, на­пример, в работе: Plath, 1974. Одной из последних пуб­ликаций на эту тему является работа: Marcus, 1979, где описывается анализатор, основанный на предположе­нии о возможности выделения синтаксиса как самостоя­тельной части понимания языка. Важно подчеркнуть, что все эти программы рассматривают синтаксический анализ как процесс, полностью изолированный от остальных сто­рон понимания. Этими системами управлял синтаксис, хотя в некоторых случаях синтаксическому анализатору разрешалось запрашивать семантическую информацию. Некоторые системы понимания речи, в частности Hearsay- II (CMU Computer Science Speech Group, 1976), используют более интегральный подход, но они лишь слегка касаются того уровня анализа, который интересует нас. В рамках нашей концепции мы всегда подчеркивали необходимость интеграции семантики и синтаксиса в процессе ана­лиза.

Анализатор SPINOZA-ІІ был закончен лишь отчасти, когда мы вынуждены были от него отказаться по соображе­ниям не академического порядка. Было предпринято не­сколько попыток продолжить разработку этого анализато­ра, пока Крис Ризбек не создал анализатор, который был похож на SPINOZA-II по идее, но отличался по форме (см. R і е s b е с к, 1975). Программа этого анализатора была основана на так называемых запросах, представляв­ших собой особую форму проверки выполнения заданных условий (см. Newell, 1973). Запросы активизиррвались каждый раз, когда могли быть выдвинуты ожидания о не­которой синтаксической или семантической информации, и выполнялись, если включенные в них ожидания оказыва­лись истинными. Таким образом, анализ направлялся посредством ожиданий, что делало систему Ризбека, позже названную ELI, сильно ориентированной на анализ "сверху вниз" (см. R і е s b е с k and Schank,

1976).

ELI была использована в роли "приставки" к системе SAM, нашей системе понимания, основанной на сценариях (Schank et al., 1975; Cullingford, 1978), и была объединена с работой Гершмана (G е г s h m a n, 1977) по именным группам, что привело к созданию анализа­тора, который мог обрабатывать очень сложные по струк­туре предложения.

Одним из главных недостатков ELI является ее "негиб­кость". Грейнджер (Granger, 1977) создал для ELI дополнительный компонент — FOUL-UP, который опреде­ляет значение неизвестных слов в контексте, и это придало системе некоторый запас прочности. Но в повседневной практике исследователи приходили к выводу, что проще создавать особые анализаторы, предназначенные для спе­циальных целей и построенные по типу ELI, которые яв­ляются менее громоздкими и более удобными при пользо­вании. Например, программа POLITICS Карбонелля (С а г- b о n е 1 1, 1979) — модель субъективного понимания поли­тических событий — использует анализатор, сходный с ELI, но построенный самим Карбонеллем.

Может быть, самый важный итог работы Карбонелля состоит в том, что она выявила для всех нас основную ошибку, характерную для наших рассуждений о построе­нии больших понимающих систем. Мы всегда склонялись к принципу модульности в проектировании наших программ как потому, что это всегда рассматривалось как хороший стиль в программировании, так и потому, что, поскольку наши системы являются очень большими, каждый отдельный модуль часто составлял тему работы отдельного человека.

Однако эта модульность явилась причиной целого ряда трудностей. При таком подходе система, которую мы стро­им, должна, например, в идеале, использовать ELI на пер­вом этапе анализа (в качестве "приставки"). Но на практике ELI оказывается очень большой и громоздкой программой. Далее, возникает еще одна практическая проблема, а имен­но: словарь для любой новой области, в которой должна работать создаваемая система, является, скорее всего, новым для ELI. Поскольку в ELI определения слов явля­ются в известном смысле сами программами, всякая новая система в любом случае потребует написания большой ча­сти соответствующей анализирующей программы с самого начала. Эта практическая проблема приводит, далее, к гораздо более интересному вопросу. Подобно тому как не­сколько лет назад мы осознали, что для построения более интегрированной анализирующей системы важно восполь­зоваться силой имевшихся у нас представлений КЗ, точно так же любой новый анализатор, разрабатываемый для но­вой системы, должен в принципе пользоваться результата­ми, полученными на более высоких уровнях понимания, которые являются частью новой системы. Так, система POLITICS может проводить анализ более эффективно, если она использует не только частично построенное представ­ление КЗ для того фрагмента текста, который она уже по­няла, но также и его место в идеологии, которую использу­ет эта программа, его общую значимость и т. д. С этой точки зрения модульность оказывается весьма серьезным недостатком. Почему не извлекать выгоду из всего, что имеется в нашем распоряжении и может помочь в процессе анализа? Тот факт, что для осуществления анализа люди используют только синтаксис и некоторые конкретные семантические признаки (именно эти, а не другие), являет­ся не более вероятным, чем то, что они используют только чистый синтаксис. Понимание является в полном смысле этого слова интегральным процессом. Приверженность принципу построения модульных систем помешала прогрес­су в автоматизации анализа, потому что эта задача требует использования наших знаний в полном объеме; это, очевид­но, необходимо и для разрешения неоднозначности пред­ложения, и для выявления подходящих смыслов слова, и, что не менее важно (как мы увидим ниже в этой статье), для принятия решений о том, что в тексте следует игнори­ровать.

Необходимо уточнить, что мы имеем в виду, когда объ­являем модульность помехой в развитии систем анализа. Ясно, что с точки зрения программирования наши анали­заторы должны иметь модульный характер. Однако, если на поверку оказывается, что модули тратят все свое время на коммуникацию друг с другом, то данная конкретная схема модульной организации должна вызывать подозре­ния — в реальной действительности модули образуют ин­тегральное единство. Поскольку коммуникация модулей друг с другом, как правило, весьма трудна, наблюдается стремление избегать ее вообще. Это может привести к проектированию таких процедур, которые по замыслу долж­ны взаимодействовать друг с другом, а на практике стано­вятся все более и более изолированными друг от друга. Именно это и произошло со стратегией модульной органи­зации систем, которую мы описали выше.

2.

<< | >>
Источник: В.А. ЗВЕГИНЦЕВ. НОВОЕ В ЗАРУБЕЖНОЙ ЛИНГВИСТИКЕ. ВЫПУСК XII. ПРИКЛАДНАЯ ЛИНГВИСТИКА. МОСКВА «РАДУГА» - 1983. 1983

Еще по теме ОБЗОР АНАЛИЗАТОРОВ, ОСНОВАННЫХ НА КОНЦЕПТУАЛЬНЫХ ЗАВИСИМОСТЯХ:

  1. ОБЗОР АНАЛИЗАТОРОВ, ОСНОВАННЫХ НА КОНЦЕПТУАЛЬНЫХ ЗАВИСИМОСТЯХ