<<
>>

РАЗРАБОТКА ИНТЕРФЕЙСА ПОЛЬЗОВАТЕЛЯ ДЛЯ ОБРАЩЕНИЯ К ИНФОРМАЦИИ О ПАДЕЖНЫХ ФРЕЙМАХ

В настоящее время в TELI предусмотрены 5 типов выраже­ний:

Адъективные группы, например: researchers associated with TELI

‘исследователи, связанные с TELI’ Группы Существительное — Определение, например:

the COLING presentations ‘доклады КОЛИНГ Глагольные Группы, например: employees working with Brachman

‘служащие, работающие с Брах­маном’

Предложные Группы, например: the researches in Marcus’ department

‘исследователи из отдела Маркуса’ Группы „Относительного" Существительного, например:

the associates of Litman; the sala­ry of Smith

‘коллеги Литмана; зарплата Сми­та’

Рассказывая о том, как, собственно, происходит усвоение падеж­ных фреймов, мы считаем полезным детально разобрать все сведе­ния, связанные с одним из типов выражений, предусмотренных грамматикой системы. Мы выбрали адъективные группы, так как ситуации с ними являются довольно типичными. Рамки данной работы не позволяют нам описать все возможности реально су­ществующей системы, которые (в особенности — в обработке гла­гольных групп) сложнее, чем то, что будет здесь изложено.

Заметим предварительно, что структуры данных, реально ис­пользуемые в TELI, несколько отличаются от представляемых здесь, хотя содержат в точности те же сведения. Следует также ука­зать, что мы используем в изложении термин „разработчик интер­фейса", имея в виду следующее: большая часть описываемой работы вполне может выполняться подготовленным пользователем системы, а не только самими ее создателями.

Прежде чем снабдить TELI сведениями о типах выражений, следует задать лексические сведения о каждой части речи, рас­познаваемой основной грамматикой. Части речи подразделяются на „закрытые" (closed) и „открытые" (open), причем последнее означает, что пользователь может добавлять новые слова такого типа. Например, разработчик системы может принять такие опре­деления:

Открытые = (прилагательное, существительное, глагол, ...) Закрытые = (артикль, предлог, ...)

Эти сведения используются в модуле усвоения знаний при ре­шении вопроса о том, какие слоты падежных фреймов могут за­полняться словарными единицами, не вошедшими на тот момент в лексикон системы.

Первый шаг разработчика интерфейса при сообщении системе информации о типах выражений состоит в указании для каждого слота фрейма (1) имени (метки), которое будет использоваться внутри системы для отождествления этого слота, (2) соответствую­щего типа заполнителя и (3) внешнего имени, которое будет слу­жить меткой на выходе системы. Для адъективных групп этот этап можно представить следующим образом:

(адъектинфо

(хозяин объект „Подлежащее")

(прил прилагательное „Прилагательное")

(предлог предлог „Предлог")

(доп объект „Дополнение"))

Здесь „адъектинфо" — произвольный символ, используемый внутри системы для обозначения фреймов адъективных групп. Имена сло­тов (хозяин, прил, предлог, доп) произвольны; типы заполните­лей (объект, прилагательное, предлог) обычно соответствуют частям речи, хотя „объект" (entity) обозначает подмножество существи­тельных, которые составляют элементарные типы объектов из раз­бираемой сферы. Например, в сфере строительства room ‘комната’ может быть базовым типом объекта (то есть „объектом"), a office ‘контора’ будет просто существительным, обозначающим некоторые из объектов типа room. Наконец, внешние имена (последняя ко­лонка) могут представлять собой любую цепочку, удобную для отождествления ролей.

Затем разработчик интерфейса определяет произвольное число шаблонов, которые система будет сопоставлять с теми текстовыми определениями падежных фреймов, которые будет предоставлять пользователь. Например, шаблон

(адъектинфо (а Хозяин can be Прил Предлог ап Доп)) позволит системе распознать в спецификации

a room can be adjacent to a corridor

‘комната может примыкать к коридору’

указание на фрейм адъективной группы. Вспомним, что эти све­дения задаются разработчиком интерфейса, и не определяют, но лишь отражают описательную силу грамматики, заложенную в ис­ходном грамматическом анализаторе. Следует заметить, что шаб­лоны фреймов задаются в терминах фреймовых меток, а не частей речи. Это позволяет перемещать элементы фрейма, содержащего два или более однотипных элемента.

В случае, если разработчик интерфейса хочет задать какие- либо факультативные позиции, он может предложить либо несколь­ко спецификаций, либо обозначить факультативность скобками. Так, спецификацию глагольной группы

(подл глаг (доп) (постверб) (предлог доп))

можно развернуть в виде восьми наборов, содержащих от двух до шести элементов.

Поскольку разработчик интерфейса укажет имена слотов для каждого типа фреймов, то система легко обнаружит присутствие „шумовых" слов. Вдобавок следует предусмотреть некоторые мело­чи типа эквивалентности артиклей „а" и „ап"; разработчик может задать карту перевода вида

Шумопреобразование = ((an a) (the а))

В результате система произведет замены и в текстовом определе­нии, подлежащем сопоставлению, и во внутренних схемах. Не обя­зательно, чтобы все „шумовые" слова имелись в словаре системы, например слово сап ‘мочь’ в настоящее время отсутствует в нашей подсистеме ответов на вопросы.

6.

<< | >>
Источник: Б.Ю. Городец­кий. Новое в зарубежной лингвистике: Вып. XXIV. Компьютерная лингвистика: Пер. с англ./Сост., ред. и вступ, ст. Б. Ю. Городец­кого.— М.: Прогресс,1989.—432 с.. 1989

Еще по теме РАЗРАБОТКА ИНТЕРФЕЙСА ПОЛЬЗОВАТЕЛЯ ДЛЯ ОБРАЩЕНИЯ К ИНФОРМАЦИИ О ПАДЕЖНЫХ ФРЕЙМАХ:

  1. РАЗРАБОТКА ИНТЕРФЕЙСА ПОЛЬЗОВАТЕЛЯ ДЛЯ ОБРАЩЕНИЯ К ИНФОРМАЦИИ О ПАДЕЖНЫХ ФРЕЙМАХ