<<
>>

ПРИМЕНЕНИЕ ПАДЕЖНЫХ ФРЕЙМОВ ДЛЯ АНАЛИЗА УСТНОЙ РЕЧИ

Выводы предыдущих двух разделов могут быть резюмированы следующим образом:

— описанный тип падежных фреймов содержит достаточное ко­личество информации, представленной на нужном уровне абстрак­ции, чтобы анализировать устную речь предметно-ограниченного содержания;

— алгоритмы, которые были разработаны для анализа письмен­ной речи методом падежных фреймов, непригодны для обработки устных входных сообщений, так как работа этих алгоритмов в зна­чительной степени основана на присутствии в тексте коротких функциональных слов, а они распознаются на акустическом уровне в лучшем случае ненадежно.

В пробной реализации нашего подхода мы существенным обра­зом используем падежные фреймы, но делаем это по-новому, а именно:

1) в словесной решетке, полученной в результате акустического распознавания речи, ищутся слова, соответствующие заголовкам (headers) падежных фреймов;

2) все падежные фреймы найденных слов комбинируются всеми семантически и синтаксически допустимыми способами;

3) для каждой комбинации падежных фреймов, полученной та­ким образом, делается попытка заполнить разрывы между словами- заголовками путем подбора слов из решетки на вакантные семан­тические и синтаксические роли в данной комбинации падежных фреймов;

4) в качестве окончательного варианта анализа система стре­мится выбрать тот, который объясняет наибольшую часть обра­батываемого высказывания и при котором проанализированные сло­ва имеют наибольшее значение коэффициента достоверности акусти­ческого распознавания (точнее, интерпретирующая сила окончатель­ного варианта анализа определяется с учетом этих двух парамет- ров).

Этот многоступенчатый подход позволяет избежать трудностей, возникающих в работе алгоритма анализа письменного текста мето­дом падежных фреймов за счет привязки анализа к словам-заголов­кам. Заголовки падежных фреймов — это глаголы (в случае падеж­ных фреймов — предложения) и существительные (для номинальных падежных фреймов). Эти слова полнозначные, в речи несут на себе ударение и нередко многосложны, что повышает шансы на их пра­вильное распознавание по сравнению с краткими безударными слу­жебными словами. Таким образом, семантически важные точки при­вязки процедуры анализа коррелируют с наиболее надежно распозна­ваемыми словами.

Идея проведения одного или нескольких вариантов анализа на уровне структурного остова (skeleton level) и последующей окончательной актуализации (instantiating) только того или тех из них, которые соответствуют всем требованиям, вплоть до конкрет­ных ограничений лексического уровня, близка по своей сути к стра­тегии планирующих систем (planners) типа ABSTRIPS (Sacerdo­ti, 1974) и NOAH (Sacerdoti, 1977), которые сначала разра­батывают общий план действий, а затем по мере необходимости уточняют детали. Таким образом, анализатор не теряет время на выдвижение гипотез о локальных деталях, которые, возможно, не будут согласовываться с результатами общего анализа.

Дополнительное преимущество, вытекающее из решения начи­нать обработку с заголовков падежных фреймов, связано с тем, что результирующая комбинация падежных фреймов представляет собой готовую семантическую интерпретацию обрабатываемого высказывания. Обычно эта интерпретация является неполной. Не­достающая информация должна поступить с последующей стадии анализа — заполнения пропусков. Однако даже в том случае, когда все или некоторые из остальных слов распознаны настолько плохо, что невозможно получить полной интерпретации, анализатор может сообщить какие-то полезные сведения. В зависимости от конкретной предметной области интерпретация на уровне структурного остова может оказаться достаточной для ее дальнейшего использования или, по крайней мере, она может послужить основой для обращения к пользователю с целенаправленной просьбой подтвердить интерпре­тацию или разъяснить сомнительные места.

В оставшейся части раздела мы более подробно рассмотрим осуществленную нами на сегодняшний день реализацию изложенно­го выше подхода. Начнем с описания словесной решетки, которую обрабатывает методом падежных фреймов наш анализатор устной речи. Этот анализатор функционирует в составе полной системы понимания речи, распознающей слитную речь без подстройки под диктора. Объем словаря — 200 единиц. Предметная область — электронная почта.

Информация, поступающая на вход нашего анализатора, может быть представлена в виде двумерной решетки слов. Каждому слову приписано время его начала и конца, а также коэффициент правдо­подобия. Время начала/конца задает место данного слова в выска­зывании. Коэффициент правдоподобия показывает, насколько мы уверены в том, что данное слово распознано на акустическом уровне верно. В решетке, приводимой ниже в качестве примера (см. рис. 3), на горизонтальной оси откладывается время, на верти­кальной — величина коэффициента правдоподобия. Эта словесная решетка была построена вручную в целях демонстрации.

Рис. 3. Упрощенный вариант словесной решетки, содержащей различные типы слов.

(Слова-заголовки фреймов подчеркнуты.)

500

2000

Время в миллисекундах 1000 1500

высокое

п

р

А

В

д

о

п

о

д

о

Б

RECEIVED

‘ПОЛУЧЕН­

НЫЙ’

USERS

‘ПОЛЬЗОВА­

ТЕЛИ’

FORWARD

‘ПОСЛАТЬ’

PRINT

‘ПЕЧАТАТЬ’

MESSAGE

‘СООБЩЕНИЕ’

SMITH

RECIPIENTS ‘СМИТ’ ‘ПОЛУЧАТЕ­ЛИ’

CUMA

‘Адрес УКМ’

АТ

‘В’

LINEPRINTER

‘ПЕЧАТАЮЩЕЕ

УСТРОЙСТВО’

COPYING

‘КОПИРОВА­

НИЕ’

THE

(ОПР. АРТИКЛЬ)

4.2.

<< | >>
Источник: Б.Ю. Городец­кий. Новое в зарубежной лингвистике: Вып. XXIV. Компьютерная лингвистика: Пер. с англ./Сост., ред. и вступ, ст. Б. Ю. Городец­кого.— М.: Прогресс,1989.—432 с.. 1989

Еще по теме ПРИМЕНЕНИЕ ПАДЕЖНЫХ ФРЕЙМОВ ДЛЯ АНАЛИЗА УСТНОЙ РЕЧИ:

  1. Использование в стратегиях преодоления неграмматичности на уровне предложения различных подходов к анализу сообщений.
  2. Эллипсис.
  3. СЕМАНТИКО-СИНТАКСИЧЕСКИЙ АНАЛИЗ УСТНОЙ РЕЧИ: ПОДХОД, ОСНОВАННЫЙ НА СЕМАНТИЧЕСКИХ ПАДЕЖНЫХ ФРЕЙМАХ [35]
  4. ПРИМЕНЕНИЕ ПАДЕЖНЫХ ФРЕЙМОВ ДЛЯ АНАЛИЗА УСТНОЙ РЕЧИ
  5. Глава 3 КУЛЬТУРА РЕЧИ СРЕДИ ДРУГИХ ЛИНГВИСТИЧЕСКИХ ДИСЦИПЛИН