<<
>>

НЕКОТОРЫЕ СЛОЖНОСТИ АНАЛИЗА УСТНЫХ ВХОДНЫХ СООБЩЕНИЙ,ОСУЩЕСТВЛЯЕМОГО С ПОМОЩЬЮ МЕТОДИКИ, ОСНОВАННОЙ НА „СЕТЯХ ПЕРЕХОДОВ"

Необходимость принципиальной интеграции методов анализа письменной речи и методов распознавания устной речи очевидна. Вопрос состоит в том, каким образом нужно модифицировать методы обработки письменного текста, чтобы можно было преодолеть спе­цифические трудности устноречевого ввода, очерченные выше. Ос­новные усилия в этом направлении до последнего времени велись в рамках метода анализа, основанного на „сетях переходов": сущ­ность такого подхода заключается в том, что ожидания (expecta­tions) анализатора закодированы с помощью сети переходов, в кото­рой дуги помечаются синтаксическими или семантическими катего­риями слов или непосредственных составляющих, а анализ поступив­шей на вход цепочки слов состоит в обнаружении такого пути в сети переходов, который будет соответствовать именно данной цепочке.

Метки составляющих на дугах связаны с их собственными подсетя­ми, и прохождение дуги в сети верхнего уровня осуществляется путем прохождения через соответствующую подсеть. Типичный режим ра­боты анализатора сетей переходов состоит в движении по сети слева направо, синхронно, с просмотром входной цепочки слов, и обследо­вании подсетей сверху вниз по мере их появления. Хорошо известны такие анализаторы, основанные на сетях переходов, как ATN-анали- затор (W о о d s, 1970), использованный в системе LUNAR (W oods at al., 1972), RUS-анализатор (Bobrow, 1978) и анализатор систе­мы LIFER (Hendrix, 1977). В системе понимания слитной речи HARPY (Lowerre, 1976) используется интегрированная сеть, в которой закодирована и лингвистическая, и акустическая информа­ция.

Основная сложность применения анализаторов сетей переходов для распознавания речи заключается в их неспособности обрабаты­вать входное сообщение, если оно не отвечает их грамматическим ожиданиям. Часто во входной цепочке слов какое-то слово может быть пропущено в результате ошибки распознавания или по оплош­ности самого говорящего. Если просмотр сети осуществляется слева направо, то поиск истинного пути в сети должен предусматривать „перескакивание" через дугу, которая соответствует пропущенному слову. Если бы вся проблема сводилась просто к перескакиванию, то это препятствие можно было бы легко преодолевать. Ситуация осложняется тем, что, как правило, приходится иметь дело одновре­менно с несколькими возможными вариантами разбора, особенно если словесная решетка содержит для одного и того же сегмента ре­чевого сигнала несколько альтернативных слов-кандидатов. Обычно, чтобы обнаружить в процессе поиска ложный вариант разбора, при­меняется следующий критерий: из текущего узла нельзя выйти ни по одной из дуг. Но ведь именно такая ситуация и возникает при про­пуске слова. Таким образом, в контексте реальной речи анализатор сетей лишается возможности использовать стандартные критерии останова при выходе на непродуктивный (нарушающий ограниче­ния) вариант поиска. Проблема осложняется еще больше, если слово, следующее за пропущенным словом, допускает прохождение по „незаконной" дуге, выходящей из того узла сети, в котором должно было бы быть распознано пропущенное слово. В этом случае обычно почти невозможно определить место, где действительно была допу­щена ошибка. Другие формы аграмматичности (вызваны ли они ошибками говорящего или являются артефактами акустического распознавания) приводят к аналогичным проблемам. В результате того, что на этапе акустического анализа не обеспечивается надеж­ное определение словесных границ, число неразрешимых проблем возрастает еще больше.

Неоднократно предпринимались попытки приспособить технику анализа сетей к решению этих проблем. В частности, предполагалось разрешить в случае необходимости вводить в сеть переходов допол­нительные дуги (см., например: Weischedel and Black, 1980; Weischedel and Sondheimer, 1984). Самый перспективный подход к адаптации сети переходов к речевому вводу, как нам пред­ставляется, состоял в отказе от просмотра сети слева направо и пере­ходе к методике анализа от центра к периферии. Суть этого метода состоит в том, что анализ начинается со слов, которые были распоз­наны на акустическом уровне с наибольшей достоверностью (см. W о о d s at al., 1976). Однако при выборе этих „островов достовер­ности" никогда не учитывались совместно критерии семантической значимости и акустической достоверности. Метод ATN-анализа стал­кивается с рядом серьезных проблем при практической реализации методики наращивания островов достоверности, — методики, столь привлекательной в теории. Одна из этих проблем — необходимость выполнения ATN-анализа справа налево. При таком требовании ме­тод интерпретации сетей, основанный на анализе от центра к пери­ферии, не срабатывает в тех случаях, когда тесты зависят от регист­ров, которые еще не были установлены. Ни одна из модификаций ме­тодов анализа сетей не была полностью успешной.

3.

<< | >>
Источник: Б.Ю. Городец­кий. Новое в зарубежной лингвистике: Вып. XXIV. Компьютерная лингвистика: Пер. с англ./Сост., ред. и вступ, ст. Б. Ю. Городец­кого.— М.: Прогресс,1989.—432 с.. 1989

Еще по теме НЕКОТОРЫЕ СЛОЖНОСТИ АНАЛИЗА УСТНЫХ ВХОДНЫХ СООБЩЕНИЙ,ОСУЩЕСТВЛЯЕМОГО С ПОМОЩЬЮ МЕТОДИКИ, ОСНОВАННОЙ НА „СЕТЯХ ПЕРЕХОДОВ":

  1. 5. Понятие и сущность прокурорского надзора за соблюдением порядка приема, регистрации и разрешения сообщений о преступлениях
  2. 3. Анализ заявлений и сообщений организаций и граждан.
  3. § 4. О НЕКОТОРЫХ ПОДХОДАХ К ИНТЕРПРЕТАЦИИ ТАТ: СХЕМЫ С. ТОМКИНСА и М. АРНОЛЬД
  4. Некоторые пути анализа единиц синтаксической системы.
  5. 1. Объективные признаки имущественных преступлений
  6. § 2. Объект и предмет хищения
  7. 1.1. Понятие «педагогический дискурс» в научной литературе
  8. 1.2. ОСНОВНЫЕ ВИДЫ УСТНОЙ РЕЧИ: СООБЩЕНИЯ, МОЛВА, ФОЛЬКЛОР
  9. Схоластический метод при анализе идеи универсалий применялся с XI в.
  10. § 4. СТРУКТУРА И ФУНКЦИИ НАУЧНОЙ ТЕОРИИ. ЗАКОН КАК КЛЮЧЕВОЙ ЕЕ ЭЛЕМЕНТ
  11. Случайные составляющие.
  12. Использование в стратегиях преодоления неграмматичности на уровне предложения различных подходов к анализу сообщений.
  13. Комплексный анализ
  14. Понимание входных сообщений с синтаксическими отклонениями
  15. Понимание входных сообщений с пропущенными словами
  16. СЕМАНТИКО-СИНТАКСИЧЕСКИЙ АНАЛИЗ УСТНОЙ РЕЧИ: ПОДХОД, ОСНОВАННЫЙ НА СЕМАНТИЧЕСКИХ ПАДЕЖНЫХ ФРЕЙМАХ [35]
  17. ПОЧЕМУ ДЛЯ ПОНИМАНИЯ УСТНОЙ РЕЧИ НЕОБХОДИМ СЕМАНТИКО-СИНТАКСИЧЕСКИЙ АНАЛИЗ
  18. НЕКОТОРЫЕ СЛОЖНОСТИ АНАЛИЗА УСТНЫХ ВХОДНЫХ СООБЩЕНИЙ,ОСУЩЕСТВЛЯЕМОГО С ПОМОЩЬЮ МЕТОДИКИ, ОСНОВАННОЙ НА „СЕТЯХ ПЕРЕХОДОВ"
  19. АНАЛИЗ, ОСНОВАННЫЙ НА СЕМАНТИЧЕСКИХ ПАДЕЖНЫХ ФРЕЙМАХ
  20. ПРИМЕНЕНИЕ ПАДЕЖНЫХ ФРЕЙМОВ ДЛЯ АНАЛИЗА УСТНОЙ РЕЧИ