ФОНЕТИЧЕСКИЙ звуко-буквенный разбор слов онлайн
 <<
>>

Проблема незнакомых слов.

Слово является правильной лексемой, но отсутствует в словаре системы. Это возможно по трем причинам:

— Слово сознательно не включено в словарь интерфейса. (На­пример, естественноязыковой интерфейс электронной системы поч­тового ведомства совершенно не обязан знать слова типа „стул" или „небо", которые не могут быть определены в терминах понятий данной семантической области.)

— Слово относится к понятию или сочетанию понятий, входяще­му в предметную область, но оно не было включено в словарь.

(Например, слово типа „посылать" [сообщение] может быть опре­делено как команда, его действие может быть четко установлено, и объекты, на которых оно оперирует,— старое сообщение и новый реципиент — являются ранее определенными понятиями предметной области.)

— Слово является именем собственным или номенклатурным обозначением (например, именем/номером раздела каталога), не встречавшимся ранее, но поддающимся распознаванию с помощью набора контекстуальных ожиданий и морфологических или орфогра­фических признаков (таких, как прописная буква).

В первом случае не существует какой-либо осмысленной стра­тегии преодоления коммуникативного сбоя, за исключением фоку­сирующего взаимодействия (Hayes, 1981), позволяющего проин­формировать пользователя о конкретной трудности. В третьем слу­чае требуется в основном лишь распознать имя собственное и за­нести его в словарь для дальнейших ссылок. Второй случай более сложный; здесь возможны три основные стратегии преодоления возникшего препятствия:

1. Использовать подход, применяемый в системе KLAUS (Haas and Hendrix, 1983), когда система временно перехва­тывает инициативу у пользователя и, действуя по типу хорошо продуманной игры «20 вопросов», определяет синтаксический класс незнакомого термина и соотносит его семантически с имеющимися в системе понятиями, объединенными в родо-видовую иерархию. Этим методом успешно обрабатываются глаголы, существительные и прилагательные, но только в тех случаях, когда они оказыва­ются представителями заранее определенных общих классов объек­тов и действий в модели предметной области.

2. Применить метод проецирования и интегрирования (Car­bonell, 1979) для выведения значения и синтаксической кате­гории слова из контекста. Этот метод успешно применялся при обработке существительных и прилагательных, значения которых могут рассматриваться как рекомбинация признаков, присутствую­щих в каком-либо другом месте входного выражения. В отличие от метода, применяемого в системе KLAUS, здесь обработка про­изводится внутри системы, и пользователь не обременен длитель­ностью вычислений. Однако данный метод остается в высшей сте­пени экспериментальным, и, возможно, для практической его реа­лизации потребуется обращение к пользователю.

3. Провести фокусирующее взаимодействие с пользователем для получения перифразы того сегмента входного выражения, которое содержит незнакомое слово. Если такая перифраза приводит к же­лаемому действию, она заносится в память и становится значе­нием нового слова применительно к тому контексту, в котором оно появилось. В системе LIFER (Hendrix, 1977) имеются руди­ментарные средства для определения синонимичных выражений. Более общий метод будет заключаться в обобщении синоними­ческих средств для классификации нового слова или выражения в различных семантических контекстах.

2.2.

<< | >>
Источник: Б.Ю. Городец­кий. Новое в зарубежной лингвистике: Вып. XXIV. Компьютерная лингвистика: Пер. с англ./Сост., ред. и вступ, ст. Б. Ю. Городец­кого.— М.: Прогресс,1989.—432 с.. 1989

Еще по теме Проблема незнакомых слов.: