РАЗРАБОТКА ИНТЕРФЕЙСА ПОЛЬЗОВАТЕЛЯ ДЛЯ ОБРАЩЕНИЯ К ИНФОРМАЦИИ О ПАДЕЖНЫХ ФРЕЙМАХ
В настоящее время в TELI предусмотрены 5 типов выражений:
Адъективные группы, например: researchers associated with TELI
‘исследователи, связанные с TELI’ Группы Существительное — Определение, например:
the COLING presentations ‘доклады КОЛИНГ Глагольные Группы, например: employees working with Brachman
‘служащие, работающие с Брахманом’
Предложные Группы, например: the researches in Marcus’ department
‘исследователи из отдела Маркуса’ Группы „Относительного" Существительного, например:
the associates of Litman; the salary of Smith
‘коллеги Литмана; зарплата Смита’
Рассказывая о том, как, собственно, происходит усвоение падежных фреймов, мы считаем полезным детально разобрать все сведения, связанные с одним из типов выражений, предусмотренных грамматикой системы.
Мы выбрали адъективные группы, так как ситуации с ними являются довольно типичными. Рамки данной работы не позволяют нам описать все возможности реально существующей системы, которые (в особенности — в обработке глагольных групп) сложнее, чем то, что будет здесь изложено.Заметим предварительно, что структуры данных, реально используемые в TELI, несколько отличаются от представляемых здесь, хотя содержат в точности те же сведения. Следует также указать, что мы используем в изложении термин „разработчик интерфейса", имея в виду следующее: большая часть описываемой работы вполне может выполняться подготовленным пользователем системы, а не только самими ее создателями.
Прежде чем снабдить TELI сведениями о типах выражений, следует задать лексические сведения о каждой части речи, распознаваемой основной грамматикой. Части речи подразделяются на „закрытые" (closed) и „открытые" (open), причем последнее означает, что пользователь может добавлять новые слова такого типа. Например, разработчик системы может принять такие определения:
Открытые = (прилагательное, существительное, глагол, ...) Закрытые = (артикль, предлог, ...)
Эти сведения используются в модуле усвоения знаний при решении вопроса о том, какие слоты падежных фреймов могут заполняться словарными единицами, не вошедшими на тот момент в лексикон системы.
Первый шаг разработчика интерфейса при сообщении системе информации о типах выражений состоит в указании для каждого слота фрейма (1) имени (метки), которое будет использоваться внутри системы для отождествления этого слота, (2) соответствующего типа заполнителя и (3) внешнего имени, которое будет служить меткой на выходе системы. Для адъективных групп этот этап можно представить следующим образом:
(адъектинфо
(хозяин объект „Подлежащее")
(прил прилагательное „Прилагательное")
(предлог предлог „Предлог")
(доп объект „Дополнение"))
Здесь „адъектинфо" — произвольный символ, используемый внутри системы для обозначения фреймов адъективных групп. Имена слотов (хозяин, прил, предлог, доп) произвольны; типы заполнителей (объект, прилагательное, предлог) обычно соответствуют частям речи, хотя „объект" (entity) обозначает подмножество существительных, которые составляют элементарные типы объектов из разбираемой сферы. Например, в сфере строительства room ‘комната’ может быть базовым типом объекта (то есть „объектом"), a office ‘контора’ будет просто существительным, обозначающим некоторые из объектов типа room. Наконец, внешние имена (последняя колонка) могут представлять собой любую цепочку, удобную для отождествления ролей.
Затем разработчик интерфейса определяет произвольное число шаблонов, которые система будет сопоставлять с теми текстовыми определениями падежных фреймов, которые будет предоставлять пользователь. Например, шаблон
(адъектинфо (а Хозяин can be Прил Предлог ап Доп)) позволит системе распознать в спецификации
a room can be adjacent to a corridor
‘комната может примыкать к коридору’
указание на фрейм адъективной группы. Вспомним, что эти сведения задаются разработчиком интерфейса, и не определяют, но лишь отражают описательную силу грамматики, заложенную в исходном грамматическом анализаторе. Следует заметить, что шаблоны фреймов задаются в терминах фреймовых меток, а не частей речи.
Это позволяет перемещать элементы фрейма, содержащего два или более однотипных элемента.В случае, если разработчик интерфейса хочет задать какие- либо факультативные позиции, он может предложить либо несколько спецификаций, либо обозначить факультативность скобками. Так, спецификацию глагольной группы
(подл глаг (доп) (постверб) (предлог доп))
можно развернуть в виде восьми наборов, содержащих от двух до шести элементов.
Поскольку разработчик интерфейса укажет имена слотов для каждого типа фреймов, то система легко обнаружит присутствие „шумовых" слов. Вдобавок следует предусмотреть некоторые мелочи типа эквивалентности артиклей „а" и „ап"; разработчик может задать карту перевода вида
Шумопреобразование = ((an a) (the а))
В результате система произведет замены и в текстовом определении, подлежащем сопоставлению, и во внутренних схемах. Не обязательно, чтобы все „шумовые" слова имелись в словаре системы, например слово сап ‘мочь’ в настоящее время отсутствует в нашей подсистеме ответов на вопросы.
6.