ФОНЕТИЧЕСКИЙ звуко-буквенный разбор слов онлайн
 <<
>>

ПРИМЕНЕНИЕ ПАДЕЖНЫХ ФРЕЙМОВ ДЛЯ АНАЛИЗА УСТНОЙ РЕЧИ

Выводы предыдущих двух разделов могут быть резюмированы следующим образом:

— описанный тип падежных фреймов содержит достаточное ко­личество информации, представленной на нужном уровне абстрак­ции, чтобы анализировать устную речь предметно-ограниченного содержания;

— алгоритмы, которые были разработаны для анализа письмен­ной речи методом падежных фреймов, непригодны для обработки устных входных сообщений, так как работа этих алгоритмов в зна­чительной степени основана на присутствии в тексте коротких функциональных слов, а они распознаются на акустическом уровне в лучшем случае ненадежно.

В пробной реализации нашего подхода мы существенным обра­зом используем падежные фреймы, но делаем это по-новому, а именно:

1) в словесной решетке, полученной в результате акустического распознавания речи, ищутся слова, соответствующие заголовкам (headers) падежных фреймов;

2) все падежные фреймы найденных слов комбинируются всеми семантически и синтаксически допустимыми способами;

3) для каждой комбинации падежных фреймов, полученной та­ким образом, делается попытка заполнить разрывы между словами- заголовками путем подбора слов из решетки на вакантные семан­тические и синтаксические роли в данной комбинации падежных фреймов;

4) в качестве окончательного варианта анализа система стре­мится выбрать тот, который объясняет наибольшую часть обра­батываемого высказывания и при котором проанализированные сло­ва имеют наибольшее значение коэффициента достоверности акусти­ческого распознавания (точнее, интерпретирующая сила окончатель­ного варианта анализа определяется с учетом этих двух парамет- ров).

Этот многоступенчатый подход позволяет избежать трудностей, возникающих в работе алгоритма анализа письменного текста мето­дом падежных фреймов за счет привязки анализа к словам-заголов­кам. Заголовки падежных фреймов — это глаголы (в случае падеж­ных фреймов — предложения) и существительные (для номинальных падежных фреймов).

Эти слова полнозначные, в речи несут на себе ударение и нередко многосложны, что повышает шансы на их пра­вильное распознавание по сравнению с краткими безударными слу­жебными словами. Таким образом, семантически важные точки при­вязки процедуры анализа коррелируют с наиболее надежно распозна­ваемыми словами.

Идея проведения одного или нескольких вариантов анализа на уровне структурного остова (skeleton level) и последующей окончательной актуализации (instantiating) только того или тех из них, которые соответствуют всем требованиям, вплоть до конкрет­ных ограничений лексического уровня, близка по своей сути к стра­тегии планирующих систем (planners) типа ABSTRIPS (Sacerdo­ti, 1974) и NOAH (Sacerdoti, 1977), которые сначала разра­батывают общий план действий, а затем по мере необходимости уточняют детали. Таким образом, анализатор не теряет время на выдвижение гипотез о локальных деталях, которые, возможно, не будут согласовываться с результатами общего анализа.

Дополнительное преимущество, вытекающее из решения начи­нать обработку с заголовков падежных фреймов, связано с тем, что результирующая комбинация падежных фреймов представляет собой готовую семантическую интерпретацию обрабатываемого высказывания. Обычно эта интерпретация является неполной. Не­достающая информация должна поступить с последующей стадии анализа — заполнения пропусков. Однако даже в том случае, когда все или некоторые из остальных слов распознаны настолько плохо, что невозможно получить полной интерпретации, анализатор может сообщить какие-то полезные сведения. В зависимости от конкретной предметной области интерпретация на уровне структурного остова может оказаться достаточной для ее дальнейшего использования или, по крайней мере, она может послужить основой для обращения к пользователю с целенаправленной просьбой подтвердить интерпре­тацию или разъяснить сомнительные места.

В оставшейся части раздела мы более подробно рассмотрим осуществленную нами на сегодняшний день реализацию изложенно­го выше подхода.

Начнем с описания словесной решетки, которую обрабатывает методом падежных фреймов наш анализатор устной речи. Этот анализатор функционирует в составе полной системы понимания речи, распознающей слитную речь без подстройки под диктора. Объем словаря — 200 единиц. Предметная область — электронная почта.

Информация, поступающая на вход нашего анализатора, может быть представлена в виде двумерной решетки слов. Каждому слову приписано время его начала и конца, а также коэффициент правдо­подобия. Время начала/конца задает место данного слова в выска­зывании. Коэффициент правдоподобия показывает, насколько мы уверены в том, что данное слово распознано на акустическом уровне верно. В решетке, приводимой ниже в качестве примера (см. рис. 3), на горизонтальной оси откладывается время, на верти­кальной — величина коэффициента правдоподобия. Эта словесная решетка была построена вручную в целях демонстрации.

Рис. 3. Упрощенный вариант словесной решетки, содержащей различные типы слов.

(Слова-заголовки фреймов подчеркнуты.)

500

2000

Время в миллисекундах 1000 1500

высокое

п

р

А

В

д

о

п

о

д

о

Б

RECEIVED

‘ПОЛУЧЕН­

НЫЙ’

USERS

‘ПОЛЬЗОВА­

ТЕЛИ’

FORWARD

‘ПОСЛАТЬ’

PRINT

‘ПЕЧАТАТЬ’

MESSAGE

‘СООБЩЕНИЕ’

SMITH

RECIPIENTS ‘СМИТ’ ‘ПОЛУЧАТЕ­ЛИ’

CUMA

‘Адрес УКМ’

АТ

‘В’

LINEPRINTER

‘ПЕЧАТАЮЩЕЕ

УСТРОЙСТВО’

COPYING

‘КОПИРОВА­

НИЕ’

THE

(ОПР. АРТИКЛЬ)

4.2.

<< | >>
Источник: Б.Ю. Городец­кий. Новое в зарубежной лингвистике: Вып. XXIV. Компьютерная лингвистика: Пер. с англ./Сост., ред. и вступ, ст. Б. Ю. Городец­кого.— М.: Прогресс,1989.—432 с.. 1989

Еще по теме ПРИМЕНЕНИЕ ПАДЕЖНЫХ ФРЕЙМОВ ДЛЯ АНАЛИЗА УСТНОЙ РЕЧИ:

  1. ПОЧЕМУ ДЛЯ ПОНИМАНИЯ УСТНОЙ РЕЧИ НЕОБХОДИМ СЕМАНТИКО-СИНТАКСИЧЕСКИЙ АНАЛИЗ
  2. СЕМАНТИКО-СИНТАКСИЧЕСКИЙ АНАЛИЗ УСТНОЙ РЕЧИ: ПОДХОД, ОСНОВАННЫЙ НА СЕМАНТИЧЕСКИХ ПАДЕЖНЫХ ФРЕЙМАХ [35]
  3. §14. Культура речи как наука. Нормативные, коммуникативные, этические аспекты устной и письменной речи
  4. 1.1. ЖАНРЫ УСТНОЙ РЕЧИ
  5. ЛЕКСИКА УСТНОЙ РЕЧИ (РАЗГОВОРНАЯ, ПРОСТОРЕЧНАЯ)
  6. 45) лексика устной речи
  7. 29. ОСОБЕННОСТИ УСТНОЙ ПУБЛИЧНОЙ РЕЧИ
  8. 21. Особенности устной публичной речи.
  9. 5. Нормативные , коммуникативные, этические аспекты устной и письменно речи.
  10. 1.2. ОСНОВНЫЕ ВИДЫ УСТНОЙ РЕЧИ: СООБЩЕНИЯ, МОЛВА, ФОЛЬКЛОР