Объединение слов-заголовков
Анализатор начинает обработку решетки с выбора в ней всех заголовочных слов, имеющих величину коэффициента правдоподобия выше некоторого порога. Эти слова-заголовки соответствуют падежным фреймам, но лишь некоторые комбинации гипотетических падежных фреймов возможны в данной предметной области.
Для исчисления разрешенных комбинаций падежных фреймов был получен набор правил НС, которые описывают структуры составляющих и применяются на уровне фреймов, а не на более детализированном уровне слов.Чтобы конкретизировать наше описание, обратимся к примеру решетки слов, представленной на рис. 3. В этой решетке подчеркнутые слова-заголовки будут объединены в такие ядерные предложения, как
Forward message Smith CMUA
‘Послать сообщение Смит адрес УКМ’
Print message lineprinter
‘Печатать сообщение печатающее устройство’
Падежные рамки могут сочетаться подобным образом, если одна из них может заполнить падежную ячейку другой, что определяется атрибутом этого падежа „Заполнитель" (InstanceOf). Когда анализатор подбирает комбинации падежных фреймов, относящихся к словам-заголовкам, он также использует знания о порядке слов, чтобы ограничить число возможных комбинаций. В нашем примере падежный фрейм forward (см. рис. 1) имеет ячейку для семантического падежа MsgObjDesc, реализуемого на синтаксическом уровне как Прямой-Объект. Ограничения на порядок слов, используемые анализатором, допускают, что за глаголом может следовать только прямой объект, Падежный фрейм сообщение (message) (см. рис. 2) отвечает этим требованиям. В словесной решетке message следует за forward. Соответствующие падежные фреймы могут быть объединены, конечно, при условии, что могут быть соблюдены ограничения на обязательный падеж MsgRecipientObj (эти ограничения выполняются словом-заголовком Smith).
Каждый раз, когда находится правдоподобная последовательность заголовочных слов, ей присваивается обобщенный коэффициент правдоподобия и она сливается с ранее установленными последовательностями.
В конце этапа объединения слов-заголовков получается список упорядоченных частичных фраз, содержащий все разрешенные последовательности слов-заголовков, какие могли быть обнаружены в данной словесной решетке. Каждая частичная фраза представлена в виде множества вложенных конкретных реализаций падежных фреймов. Так, например, три комбинации будут образованы из следующих слов-заголовков:Forward message Smith CMUA ‘Послать сообщение Смит адрес УКМ’
Эти комбинации будут иметь следующую структуру вложения (nesting), где в квадратных скобках даны реализации падежных фреймов, а структура вложений передается с помощью текстовых включений (textual inclusion):
[ForwardAction
HeadForm FORWARD MsgObj [MsgObjDesc
HeadForm MESSAGE]
MsgRecipientObj [MailAdrDesc
HeadForm SMITH Host [LocationDesc
HeadForm CMUA] ] ]
[ForwardAction
HeadForm FORWARD MsgObj [MsgObj Desc
HeadForm MESSAGE]
CCRecipientObj [MailAdrDesc
HeadForm SMITH Host [LocationDesc
HeadForm CMUA] ] ]
[ForwardAction
HeadForm FORWARD MsgObj [MsgObj Desc
HeadForm MESSAGE
MsgOriginObj
[MailAdrDesc
HeadForm SMITH Host [LocationDesc
HeadForm CMUA] ] ] ]
На этапе объединения падежных фреймов используется процедура проверки стыка слов. Всякий раз, когда два слова-заголовка объединяются в частичную фразу, проверяется стык между этими словами, чтобы установить:
не перекрываются ли эти слова, что указывало бы на недопустимость данного объединения;
имеют ли они общую границу;
существует ли между ними разрыв, что свидетельствовало бы о присутствии в речевом сигнале на месте разрыва значимой информации.
Эта проверка позволяет также анализатору успешно обрабатывать случаи коартикуляции фонем на стыке слов: например, some messages ‘какие-то сообщения’. Фонемы [т т] сливаются в произношении, что дает пару перекрывающихся, но валидных слов-канди- датов. Проверка стыков слов представляет собой механизм обратной (сверху вниз) связи, позволяющей улучшить результаты распознавания речи.
4.3. Обработка падежных показателей
Как только комбинации падежных фреймов сформированы, анализатор переходит к заполнению разрывов между словами соответствующей частичной фразы. Рассматривается каждая комбинация по порядку, начиная с той, которая имеет максимальную величину коэффициента правдоподобия. Сначала анализатор пытается заполнить разрывы показателями падежа, которые обычно реализуются в виде предлогов.
Продолжим разбор нашего примера, взяв первую комбинацию слов-заголовков, образованную из фразы Forward message Smith CMUA. В этой фразе показатели падежа могут появиться в виде предлогов перед словами Smith и CMUA. Требование, чтобы падежные показатели появлялись между словами-заголовками включающего и включаемого падежного фреймов, является сильным ограничением на возможное местонахождение показателя падежа. Обычно сильно лимитирован и состав слов, которые могут выступать в роли показателя падежа. В нашем примере в соответствии с определениями падежных фреймов, описанными в предыдущих разделах, анализатор попытается верифицировать в разрыве между message и Smith одно из следующих слов: to ‘к’, from ‘от’, ccing ‘копирование под копирку’ или copying ‘копирование’, а между Smith и CMUA — on ‘на’ или at ‘в’.
После того как анализатор предсказал для данного сегмента высказывания некоторый набор слов, в работу вступает модуль верификации слов. Этому модулю известна вся словесная решетка. Слово, которое отвечает предсказанию, ищется в решетке в указанном месте разрыва. Дополнительно анализируются акустико-фонетические данные, чтобы установить, покрывает ли верифицируемое слово полностью разрыв, имеются ли непокрытые отрезки справа или слева, или же они окружают верифицируемое слово. Эта информация позволяет анализатору определить, какая часть высказывания покрывается (объясняется) данной гипотетической частичной фразой.
При каждом успешном верифицировании падежного показателя анализатор порождает еще одну гипотетическую частичную фразу.
Верифицируемое слово может быть получено в результате необоснованной гипотезы, возникшей при распознавании того, что не было произнесено на самом деле (ошибка распознавания типа „ложная тревога"). Поэтому старая частичная фраза (без падежного показателя) сохраняется, а новая фраза, являющаяся копией старой, за исключением разрыва, заполненного падежным показателем, добавляется к существующему списку частичных фраз. Для новой фразы рассчитывается новое значение коэффициента правдоподобия.Текущее значение коэффициента частичной фразы определяется суммой нормализованных во времени вероятностей каждого слова, деленной на длительность всего высказывания. Таким образом, коэффициент правдоподобия каждого слова умножается на длительность этого слова, полученные произведения суммируются и делятся на длительность всего высказывания. Очевидно, что такая процедура отдает предпочтение длинным фразам. Это может приводить к тому, что длинная фраза-кандидат, составленная из слов с очень низкими коэффициентами правдоподобия, будет предпочитаться более короткой фразе, компоненты которой распознаны и проанализированы более надежно. В настоящее время мы исследуем альтернативные подходы к расчету коэффициента правдоподобия частичной фразы, в которых этот эффект будет учтен. Идеальный коэффициент правдоподобия должен отражать также качество семантической и синтаксической правильности построения частичной фразы.
В некоторых случаях верифицируемый падежный показатель может быть не найден в словесной решетке. Это может быть в двух случаях:
а) система распознавания речи не обнаружила показатель. Неозвученные, коартикулированные односложные слова (например, предлоги) часто пропускаются;
б) наиболее вероятный вариант анализа на уровне слов-заголовков на самом деле оказался неправильным. В этом случае следует изучить менее правдоподобный вариант анализа и определить степень его соответствия акустическим данным.
В настоящее время в алгоритме анализа учитывается только второй случай, но с помощью более мощного модуля верификации мы исследуем возможность возвращения к процессам обработки на более низком уровне (акустический анализ или выдвижение гипотез о словах), располагая при этом сильными предсказаниями того, что следует ожидать на определенном отрезке входного речевого сигнала (одно или два слова). Мы надеемся, что такая процедура позволит обнаруживать слова, которые при более грубом акустическом анализе пропускаются. Таким образом будут использованы семантикосинтаксические ожидания для управления процессом распознавания наиболее трудных сегментов входного сообщения. В том случае, когда показатель падежа, распознанный с помощью предсказания верификатора, будет иметь слишком низкий коэффициент правдоподобия, высокое значение обобщенного коэффициента, полученное для следующего варианта анализа, может привести к оценке распознанного падежного показателя как наиболее предпочтительного.
4.4.