Текущие исследования процесса синтеза
Синтез часто рассматривается как последний этап после понимания вопроса и формирования ответа. Важно, однако, помнить о том, что всякий анализируемый нами текст кем-то был синтезирован.
Такой взгляд на синтез помогает выявить истинную роль синтеза — мы синтезируем, чтобы быть понятыми.6.2.1. Интегральный синтез.
В естественноязыковой компьютерной системе с широкой ориентацией мы обнаруживаем задачи, которые предполагают выполнение сходных операций на разных уровнях. С точки зрения программирования анализ текста рассказа и анализ вопроса осуществляются в системе BORIS одной и той же функцией, действующей в несколько отличающихся друг от друга режимах. Разумно предположить, что люди обладают единым механизмом понимания языка, который они применяют ко всем частным задачам, связанным с пониманием. Аналогичным образом разумно предположить, что все задачи, связанные с выражением информации на естественном языке, основываются на единой функции генератора.
Генераторы можно характеризовать в соответствии с тем, какая часть ответственности за выбор нужной формы выражения возлагается на них в сопоставлении с другими компонентами системы. Например, GEN имеет дело только с выражением полных концептуализаций, построенных другими компонентами системы. С этой точки зрения GEN аналогичен преобразователю: концептуальное содержание выражения уже полностью определено до начала процесса синтеза.
В отличие от этой системы BORGEN часто получает на входе просто указатель к эпизодной памяти и данные о вопросно-ответном диалоге, на основе которых он должен определить наилучдиий способ выражения того или иного узла памяти. Например, если дан указатель к ситуационной обстановке РЕСТОРАН 0, то, прежде чем формировать ответ, генератор должен оценить состояние знаний спрашивающего.
А1: «Ресторан.»
А2: «В ресторане.»
АЗ: «В ресторан.»
Если задается такой вопрос:
В.: Куда ехал Ричард, когда он едва не сбил старика?, то в качестве приемлемого ответа следует выбрать АЗ, но не А1 или А2.
В настоящее время в нашей системе синтез остается единственной задачей, которая решается посредством отдельного модуля. Мы полагаем, что такое разделение весьма искусственно, так как люди, отвечая на вопрос, часто начинают синтезировать ответы еще до их полной конкретизации. Подлинно интегральный генератор сможет наделить BORIS способностью синтезировать „интроспективные протоколы" процессов, осуществляемые системой в ходе поиска ответа. В этом случае, правда, мы сталкиваемся с такой трудной задачей, как синтез приемлемых переходных выражений, обеспечивающих „гладкость" промежуточных выходных сообщений. Но и это говорит в пользу объединения процессов синтеза с другими процессами, обеспечивающими вывод умозаключений в памяти, поиск информации и понимание естественноязыковых выражений.
6.2.2. Построение резюме текста.
В системе BORIS выделяются две задачи синтеза. Основной областью применения синтеза является построение ответов на вопросы, но BORGEN применяется также в области построения резюме и перифазирования. Процесс построения резюме основывается на системе сюжетных блоков Ленерта (Lehnert, 1982), которая организует память в соответствии с определенными абстрактными сущностями (положительными актами, отрицательными актами и ментальными состояниями). Сюжетные блоки представляют собой специфические конфигурации этих сущностей, характеризующиеся достаточной различимостью и играющие достаточно важную роль для того, чтобы трактовать их как автономные единицы. Как только программа сформирует память на основе сюжетных блоков, они могут анализироваться с целью формирования резюме рассказа.
6.2.3. Элементарные единицы диалога.
Проводятся также исследования, направленные на расширение существующего набора „элементарных единиц диалога", используемых в системе BORIS. В процессе синтеза ответа элементарные единицы диалога могут учитывать не только конкретное содержание ответа участника диалога, но и его общие намерения. Например, предикат НЕСОГЛАСИЕ представляет побуждения участника диалога к выражению несогласия как в отношении фактов, так и в отношении их интерпретации.
Таким элементарным единицам сопоставлены генерационные фреймы. Так, элементарной единице диалога НЕСОГЛАСИЕ сопоставлен следующий фрейм:„BUT IT WAS (person)WHO (role),
NOT (other person)...”
‘НО ВЕДЬ ЭТО БЫЛ (лицо) КТО (роль),
А НЕ (другое лицо)...’
6.2.4. Синтез тем.
В настоящее время в BORGEN используются в основном КОП и элементарные единицы концептуальных зависимостей. АТБ применяются только при синтезе ответов на вопросы, касающиеся переживания. Однако АТБ содержат также информацию, относящуюся к синтезу тем, которые часто выражаются в пословицах и „изречениях". В будущих исследованиях мы постараемся научить BORIS синтезировать пословицы из АТБ. Например, в ответ на вопрос: „What is a moral of this story?" ‘Какова мораль этого рассказа?’, если в основу ответа будет положен АТБ-НЕЯВНАЯ-УДАЧА, система сможет выдать следующее изречение: „Every cloud has a silver lining", букв. ‘Каждое облако имеет светлый ореол’ [« Нет худа без добра].
7.