ОЦЕНКА ОТВЕТОВ, СИНТЕЗИРУЕМЫХ СИСТЕМОЙ TEXT
Чтобы показать, насколько успешно разработанные нами принципы синтеза могут быть применены для построения связных текстов (а заодно показать и характер недостатков, все-таки присутствующих в тексте), рассмотрим текст, построенный в ответ на вопрос: „Что такое управляемый снаряд?" (см.
пример 14). Этот пример может считаться представительным для демонстрации возможностей системы.Пример 14.
(1) Управляемый снаряд — это самодвижущийся снаряд. (2) В базе данных ONR есть 2 типа управляемых снарядов: торпеды и ракеты. (3) У ракеты цель находится в воздухе или на поверхности земли. (4) У торпеды цель находится под водой. (5) Местонахождение цели ракеты отмечается атрибутом БД ОПИСАНИЕ, а характеристики полета ракеты вводятся атрибутом БД ВЫСОТА. (6) Подводные характеристики торпеды вводятся атрибутами БД под рубрикой ГЛУБИНА (например, МАКСИМАЛЬНАЯ ГЛУБИНА ДЕЙСТВИЯ). (7) Атрибуты БД для управляемого снаряда: ВРЕМЯ ДО ЦЕЛИ & ЕДИНИЦЫ, ГОРИЗ. ДАЛЬНОСТЬ & ЕДИНИЦЫ и НАЗВАНИЕ.
Общая структура этого текста предопределяется схемой состав, а обрамляется отрывок рассуждениями об управляемом снаряде (первое и последнее предложения). Внутренняя часть текста соотносит управляемый снаряд с его разновидностями и по очереди обсуждает каждую из них. Таким образом, вся структура в целом хорошо сбалансирована и предоставляет читателю четко организованную конструкцию.
Теперь обратимся к содержанию текста. Система абсолютно правильно (впрочем, это и неудивительно) включила лишь ту информацию, которая прямо или косвенно связана с управляемым снарядом. Это результат использования фонда релевантных знаний. Гораздо важнее то, что из всей информации, относящейся к управляемому снаряду, которая могла быть включена, система выбрала лишь ту, которая непосредственно служит цели определения объекта. Из 11 элементов информации, связанных с управляемым снарядом (рис.
22), система выбрала только 5 (указание на вышестоящую категорию (предложение (1)), указание подклассов (предложение(2) ) и 3 из его атрибутов (предложение (7))). Из 26 элементов информации, ассоциируемых с ракетой, и такого же, если не большего, объема информации для торпеды система выбрала только 2 элемента для торпеды и 4 — для ракеты (1 дефиниционный атрибут и 1 атрибут базы данных для торпеды и 2 дефиниционных атрибута для ракеты). Одна из причин этого — использование схемы состав. Она как раз и предписывает необходимость идентификации вышестоящего понятия для управляемого снаряда, описания подклассов, включения дефиниционных атрибутов ракеты и торпеды (предложения (3) и (4)). В выборе информации играют роль также фокусные ограничения. Они, например, гарантируют, что в процессе выбора для предложений (5) и (6) атрибутов базы данных отбираются только те атрибуты, которые представляют собой дефини- ционные атрибуты, входящие в предшествующие предложения.
Рис. 22. Элементы информации, связанные с понятием „управляемый снаряд".
Имеющиеся в базе данных 11 элементов информации можно передать на естественном языке следующим образом:
1. Управляемый снаряд — это самодвижущийся снаряд.
2. В число атрибутов, связанных с самопродвижением, входит ТИП ВЗРЫВАТЕЛЯ (этим атрибутом обладают торпеды).
3. Атрибут БД ИНДЕКСЫ СКОРОСТИ (этим атрибутом обладают ракеты) также указывает на свойства самопродвижения.
4—9. Понятию „управляемый снаряд" приписано 6 атрибутов БД (которые мы здесь считаем шестью разными элементами информации): ГОРИЗ. ДАЛЬНОСТЬ & ЕДИНИЦЫ, ВРЕМЯ ДО ЦЕЛИ & ЕДИНИЦЫ, ГОРИЗ. ДАЛЬНОСТЬ, ЕДИНИЦЫ ГОРИЗ. ДАЛЬНОСТИ, ВРЕМЯ ДО ЦЕЛИ, ЕДИНИЦЫ ИЗМЕРЕНИЯ ВРЕМЕНИ ДО ЦЕЛИ.
10. Управляемый снаряд транспортируется средствами водного транспорта.
11. Имеется два типа управляемых снарядов: ракеты и торпеды.
Поверхностная структура текста регулируется фокусными ограничениями, использование которых способствует выбору конструкций, повышающих степень связности.
В данном конкретном тексте использование конструкции с there (в предложении (2)) обусловлено помещением в фокус внимания некоторого множества. Сходным образом в предложениях (5) и (6) пассивная конструкция использована для того, чтобы обеспечить сохранение фокуса на понятиях „ракета" и „торпеда". В некоторых текстах использование определенной риторической техники жестко предопределяет выбор межфра- зовой связки. В данном тексте такого не встретилось.Многие недостатки приведенного текста обусловлены недостаточной разработанностью генератора поверхностной структуры (то есть тактического компонента). Например, этот текст можно было бы улучшить, объединив предложения (2) и (3) и подчеркнув контраст (например: „У ракеты цель находится в воздухе или на поверхности земли, а у торпеды — под водой"). С другой стороны, возвращение фокуса на понятие „управляемый снаряд" можно было бы передать более эксплицитно и в то же время связать пропозицию с ранее сообщенной информацией, употребив такое выражение, как: «В число атрибутов БД, общих для всех управляемых снарядов, входят...» Порождение таких более изощренных способов выражения требует дальнейших теоретических исследований в области тактического компонента, когда будет рассматриваться вопрос предпочтительности этих выражений по сравнению с другими.
Текст можно было бы улучшить с точки зрения его организации, сгруппировав вместе все высказывания о ракете и все высказывания о торпеде. Это потребовало бы изменения схемы состава так, чтобы система могла группировать вместе высказывания о некотором элементе множества в случае наличия в формируемом тексте более одного такого высказывания. Такое изменение позволило бы тактическому компоненту прономинализовать повторное упоминание и ракеты и торпеды, тем самым устранив создаваемое текстом впечатление громоздкости.
Внести в текст более существенные улучшения можно, лишь радикально расширив возможности системы. К числу таких возможностей могли бы относиться: способность выводить умозаключения (например, если система способна узнать и сформулировать местоположение цели ракеты и торпеды, она должна быть в состоянии вывести умозаключение, что, хотя оба снаряда характеризуются некоторыми местонахождениями цели, собственно местонахождение не одно и то же); способность изменять степень подробности (например, всем ли читателям необходимо знать о ракетах и торпедах или будет достаточно информации об одном лишь управляемом снаряде (см. Paris, 1984); способность более тонко определять релевантность (например, если читатель уже знает о бомбах, то управляемый снаряд следовало бы сравнить с этой имеющейся информацией, то есть система должна развить мысль о том, что управляемые снаряды являются самодвижущимися, а бомбы — нет).
10.