<<
>>

ОЦЕНКА ОТВЕТОВ, СИНТЕЗИРУЕМЫХ СИСТЕМОЙ TEXT

Чтобы показать, насколько успешно разработанные нами прин­ципы синтеза могут быть применены для построения связных текстов (а заодно показать и характер недостатков, все-таки присутствую­щих в тексте), рассмотрим текст, построенный в ответ на вопрос: „Что такое управляемый снаряд?" (см.

пример 14). Этот пример может считаться представительным для демонстрации возможностей системы.

Пример 14.

(1) Управляемый снаряд — это самодвижущийся снаряд. (2) В базе данных ONR есть 2 типа управляемых снарядов: торпеды и ракеты. (3) У ракеты цель находится в воздухе или на поверхности земли. (4) У торпеды цель находится под водой. (5) Местона­хождение цели ракеты отмечается атрибутом БД ОПИСАНИЕ, а характеристики полета ракеты вводятся атрибутом БД ВЫСОТА. (6) Подводные характеристики торпеды вводятся атрибутами БД под рубрикой ГЛУБИНА (например, МАКСИМАЛЬНАЯ ГЛУБИНА ДЕЙСТВИЯ). (7) Атрибуты БД для управляемого снаряда: ВРЕМЯ ДО ЦЕЛИ & ЕДИНИЦЫ, ГОРИЗ. ДАЛЬНОСТЬ & ЕДИНИЦЫ и НАЗВАНИЕ.

Общая структура этого текста предопределяется схемой состав, а обрамляется отрывок рассуждениями об управляемом снаряде (первое и последнее предложения). Внутренняя часть текста соотно­сит управляемый снаряд с его разновидностями и по очереди обсуж­дает каждую из них. Таким образом, вся структура в целом хорошо сбалансирована и предоставляет читателю четко организованную конструкцию.

Теперь обратимся к содержанию текста. Система абсолютно правильно (впрочем, это и неудивительно) включила лишь ту инфор­мацию, которая прямо или косвенно связана с управляемым снаря­дом. Это результат использования фонда релевантных знаний. Го­раздо важнее то, что из всей информации, относящейся к управляемо­му снаряду, которая могла быть включена, система выбрала лишь ту, которая непосредственно служит цели определения объекта. Из 11 элементов информации, связанных с управляемым снарядом (рис. 22), система выбрала только 5 (указание на вышестоящую категорию (предложение (1)), указание подклассов (предложение

(2) ) и 3 из его атрибутов (предложение (7))). Из 26 элементов информации, ассоциируемых с ракетой, и такого же, если не боль­шего, объема информации для торпеды система выбрала только 2 эле­мента для торпеды и 4 — для ракеты (1 дефиниционный атрибут и 1 атрибут базы данных для торпеды и 2 дефиниционных атрибута для ракеты). Одна из причин этого — использование схемы состав. Она как раз и предписывает необходимость идентификации выше­стоящего понятия для управляемого снаряда, описания подклассов, включения дефиниционных атрибутов ракеты и торпеды (предло­жения (3) и (4)). В выборе информации играют роль также фокусные ограничения. Они, например, гарантируют, что в процессе выбора для предложений (5) и (6) атрибутов базы данных отби­раются только те атрибуты, которые представляют собой дефини- ционные атрибуты, входящие в предшествующие предложения.

Рис. 22. Элементы информации, связанные с понятием „управляемый снаряд".

Имеющиеся в базе данных 11 элементов информации можно передать на естест­венном языке следующим образом:

1. Управляемый снаряд — это самодвижущийся снаряд.

2. В число атрибутов, связанных с самопродвижением, входит ТИП ВЗРЫВА­ТЕЛЯ (этим атрибутом обладают торпеды).

3. Атрибут БД ИНДЕКСЫ СКОРОСТИ (этим атрибутом обладают ракеты) также указывает на свойства самопродвижения.

4—9. Понятию „управляемый снаряд" приписано 6 атрибутов БД (которые мы здесь считаем шестью разными элементами информации): ГОРИЗ. ДАЛЬ­НОСТЬ & ЕДИНИЦЫ, ВРЕМЯ ДО ЦЕЛИ & ЕДИНИЦЫ, ГОРИЗ. ДАЛЬНОСТЬ, ЕДИНИЦЫ ГОРИЗ. ДАЛЬНОСТИ, ВРЕМЯ ДО ЦЕЛИ, ЕДИНИЦЫ ИЗМЕРЕНИЯ ВРЕМЕНИ ДО ЦЕЛИ.

10. Управляемый снаряд транспортируется средствами водного транспорта.

11. Имеется два типа управляемых снарядов: ракеты и торпеды.

Поверхностная структура текста регулируется фокусными огра­ничениями, использование которых способствует выбору конструк­ций, повышающих степень связности. В данном конкретном тексте использование конструкции с there (в предложении (2)) обусловлено помещением в фокус внимания некоторого множества. Сходным обра­зом в предложениях (5) и (6) пассивная конструкция использо­вана для того, чтобы обеспечить сохранение фокуса на понятиях „ракета" и „торпеда". В некоторых текстах использование опреде­ленной риторической техники жестко предопределяет выбор межфра- зовой связки. В данном тексте такого не встретилось.

Многие недостатки приведенного текста обусловлены недоста­точной разработанностью генератора поверхностной структуры (то есть тактического компонента). Например, этот текст можно было бы улучшить, объединив предложения (2) и (3) и подчеркнув контраст (например: „У ракеты цель находится в воздухе или на поверхности земли, а у торпеды — под водой"). С другой стороны, возвращение фокуса на понятие „управляемый снаряд" можно было бы передать более эксплицитно и в то же время связать пропозицию с ранее сообщенной информацией, употребив такое выражение, как: «В число атрибутов БД, общих для всех управляемых снарядов, входят...» Порождение таких более изощренных способов выражения требует дальнейших теоретических исследований в области такти­ческого компонента, когда будет рассматриваться вопрос предпочти­тельности этих выражений по сравнению с другими.

Текст можно было бы улучшить с точки зрения его организации, сгруппировав вместе все высказывания о ракете и все высказывания о торпеде. Это потребовало бы изменения схемы состава так, чтобы система могла группировать вместе высказывания о некотором элементе множества в случае наличия в формируемом тексте более одного такого высказывания. Такое изменение позволило бы такти­ческому компоненту прономинализовать повторное упоминание и ра­кеты и торпеды, тем самым устранив создаваемое текстом впечатле­ние громоздкости.

Внести в текст более существенные улучшения можно, лишь радикально расширив возможности системы. К числу таких возмож­ностей могли бы относиться: способность выводить умозаключения (например, если система способна узнать и сформулировать место­положение цели ракеты и торпеды, она должна быть в состоянии вывести умозаключение, что, хотя оба снаряда характеризуются некоторыми местонахождениями цели, собственно местонахождение не одно и то же); способность изменять степень подробности (напри­мер, всем ли читателям необходимо знать о ракетах и торпедах или будет достаточно информации об одном лишь управляемом снаряде (см. Paris, 1984); способность более тонко определять релевантность (например, если читатель уже знает о бомбах, то управляемый снаряд следовало бы сравнить с этой имеющейся информацией, то есть система должна развить мысль о том, что управляемые снаряды являются самодвижущимися, а бомбы — нет).

10.

<< | >>
Источник: Б.Ю. Городец­кий. Новое в зарубежной лингвистике: Вып. XXIV. Компьютерная лингвистика: Пер. с англ./Сост., ред. и вступ, ст. Б. Ю. Городец­кого.— М.: Прогресс,1989.—432 с.. 1989

Еще по теме ОЦЕНКА ОТВЕТОВ, СИНТЕЗИРУЕМЫХ СИСТЕМОЙ TEXT:

  1. ОЦЕНКА ОТВЕТОВ, СИНТЕЗИРУЕМЫХ СИСТЕМОЙ TEXT