Проблема незнакомых слов.
Слово является правильной лексемой, но отсутствует в словаре системы. Это возможно по трем причинам:
— Слово сознательно не включено в словарь интерфейса. (Например, естественноязыковой интерфейс электронной системы почтового ведомства совершенно не обязан знать слова типа „стул" или „небо", которые не могут быть определены в терминах понятий данной семантической области.)
— Слово относится к понятию или сочетанию понятий, входящему в предметную область, но оно не было включено в словарь.
(Например, слово типа „посылать" [сообщение] может быть определено как команда, его действие может быть четко установлено, и объекты, на которых оно оперирует,— старое сообщение и новый реципиент — являются ранее определенными понятиями предметной области.)— Слово является именем собственным или номенклатурным обозначением (например, именем/номером раздела каталога), не встречавшимся ранее, но поддающимся распознаванию с помощью набора контекстуальных ожиданий и морфологических или орфографических признаков (таких, как прописная буква).
В первом случае не существует какой-либо осмысленной стратегии преодоления коммуникативного сбоя, за исключением фокусирующего взаимодействия (Hayes, 1981), позволяющего проинформировать пользователя о конкретной трудности. В третьем случае требуется в основном лишь распознать имя собственное и занести его в словарь для дальнейших ссылок. Второй случай более сложный; здесь возможны три основные стратегии преодоления возникшего препятствия:
1. Использовать подход, применяемый в системе KLAUS (Haas and Hendrix, 1983), когда система временно перехватывает инициативу у пользователя и, действуя по типу хорошо продуманной игры «20 вопросов», определяет синтаксический класс незнакомого термина и соотносит его семантически с имеющимися в системе понятиями, объединенными в родо-видовую иерархию. Этим методом успешно обрабатываются глаголы, существительные и прилагательные, но только в тех случаях, когда они оказываются представителями заранее определенных общих классов объектов и действий в модели предметной области.
2. Применить метод проецирования и интегрирования (Carbonell, 1979) для выведения значения и синтаксической категории слова из контекста. Этот метод успешно применялся при обработке существительных и прилагательных, значения которых могут рассматриваться как рекомбинация признаков, присутствующих в каком-либо другом месте входного выражения. В отличие от метода, применяемого в системе KLAUS, здесь обработка производится внутри системы, и пользователь не обременен длительностью вычислений. Однако данный метод остается в высшей степени экспериментальным, и, возможно, для практической его реализации потребуется обращение к пользователю.
3. Провести фокусирующее взаимодействие с пользователем для получения перифразы того сегмента входного выражения, которое содержит незнакомое слово. Если такая перифраза приводит к желаемому действию, она заносится в память и становится значением нового слова применительно к тому контексту, в котором оно появилось. В системе LIFER (Hendrix, 1977) имеются рудиментарные средства для определения синонимичных выражений. Более общий метод будет заключаться в обобщении синонимических средств для классификации нового слова или выражения в различных семантических контекстах.
2.2.