НЕКОТОРЫЕ СЛОЖНОСТИ АНАЛИЗА УСТНЫХ ВХОДНЫХ СООБЩЕНИЙ,ОСУЩЕСТВЛЯЕМОГО С ПОМОЩЬЮ МЕТОДИКИ, ОСНОВАННОЙ НА „СЕТЯХ ПЕРЕХОДОВ"
Необходимость принципиальной интеграции методов анализа письменной речи и методов распознавания устной речи очевидна. Вопрос состоит в том, каким образом нужно модифицировать методы обработки письменного текста, чтобы можно было преодолеть специфические трудности устноречевого ввода, очерченные выше.
Основные усилия в этом направлении до последнего времени велись в рамках метода анализа, основанного на „сетях переходов": сущность такого подхода заключается в том, что ожидания (expectations) анализатора закодированы с помощью сети переходов, в которой дуги помечаются синтаксическими или семантическими категориями слов или непосредственных составляющих, а анализ поступившей на вход цепочки слов состоит в обнаружении такого пути в сети переходов, который будет соответствовать именно данной цепочке. Метки составляющих на дугах связаны с их собственными подсетями, и прохождение дуги в сети верхнего уровня осуществляется путем прохождения через соответствующую подсеть. Типичный режим работы анализатора сетей переходов состоит в движении по сети слева направо, синхронно, с просмотром входной цепочки слов, и обследовании подсетей сверху вниз по мере их появления. Хорошо известны такие анализаторы, основанные на сетях переходов, как ATN-анали- затор (W о о d s, 1970), использованный в системе LUNAR (W oods at al., 1972), RUS-анализатор (Bobrow, 1978) и анализатор системы LIFER (Hendrix, 1977). В системе понимания слитной речи HARPY (Lowerre, 1976) используется интегрированная сеть, в которой закодирована и лингвистическая, и акустическая информация.Основная сложность применения анализаторов сетей переходов для распознавания речи заключается в их неспособности обрабатывать входное сообщение, если оно не отвечает их грамматическим ожиданиям. Часто во входной цепочке слов какое-то слово может быть пропущено в результате ошибки распознавания или по оплошности самого говорящего.
Если просмотр сети осуществляется слева направо, то поиск истинного пути в сети должен предусматривать „перескакивание" через дугу, которая соответствует пропущенному слову. Если бы вся проблема сводилась просто к перескакиванию, то это препятствие можно было бы легко преодолевать. Ситуация осложняется тем, что, как правило, приходится иметь дело одновременно с несколькими возможными вариантами разбора, особенно если словесная решетка содержит для одного и того же сегмента речевого сигнала несколько альтернативных слов-кандидатов. Обычно, чтобы обнаружить в процессе поиска ложный вариант разбора, применяется следующий критерий: из текущего узла нельзя выйти ни по одной из дуг. Но ведь именно такая ситуация и возникает при пропуске слова. Таким образом, в контексте реальной речи анализатор сетей лишается возможности использовать стандартные критерии останова при выходе на непродуктивный (нарушающий ограничения) вариант поиска. Проблема осложняется еще больше, если слово, следующее за пропущенным словом, допускает прохождение по „незаконной" дуге, выходящей из того узла сети, в котором должно было бы быть распознано пропущенное слово. В этом случае обычно почти невозможно определить место, где действительно была допущена ошибка. Другие формы аграмматичности (вызваны ли они ошибками говорящего или являются артефактами акустического распознавания) приводят к аналогичным проблемам. В результате того, что на этапе акустического анализа не обеспечивается надежное определение словесных границ, число неразрешимых проблем возрастает еще больше.Неоднократно предпринимались попытки приспособить технику анализа сетей к решению этих проблем. В частности, предполагалось разрешить в случае необходимости вводить в сеть переходов дополнительные дуги (см., например: Weischedel and Black, 1980; Weischedel and Sondheimer, 1984). Самый перспективный подход к адаптации сети переходов к речевому вводу, как нам представляется, состоял в отказе от просмотра сети слева направо и переходе к методике анализа от центра к периферии. Суть этого метода состоит в том, что анализ начинается со слов, которые были распознаны на акустическом уровне с наибольшей достоверностью (см. W о о d s at al., 1976). Однако при выборе этих „островов достоверности" никогда не учитывались совместно критерии семантической значимости и акустической достоверности. Метод ATN-анализа сталкивается с рядом серьезных проблем при практической реализации методики наращивания островов достоверности, — методики, столь привлекательной в теории. Одна из этих проблем — необходимость выполнения ATN-анализа справа налево. При таком требовании метод интерпретации сетей, основанный на анализе от центра к периферии, не срабатывает в тех случаях, когда тесты зависят от регистров, которые еще не были установлены. Ни одна из модификаций методов анализа сетей не была полностью успешной.
3.