Проблема незнакомых слов.
Слово является правильной лексемой, но отсутствует в словаре системы. Это возможно по трем причинам:
— Слово сознательно не включено в словарь интерфейса. (Например, естественноязыковой интерфейс электронной системы почтового ведомства совершенно не обязан знать слова типа „стул" или „небо", которые не могут быть определены в терминах понятий данной семантической области.)
— Слово относится к понятию или сочетанию понятий, входящему в предметную область, но оно не было включено в словарь.
(Например, слово типа „посылать" [сообщение] может быть определено как команда, его действие может быть четко установлено, и объекты, на которых оно оперирует,— старое сообщение и новый реципиент — являются ранее определенными понятиями предметной области.)— Слово является именем собственным или номенклатурным обозначением (например, именем/номером раздела каталога), не встречавшимся ранее, но поддающимся распознаванию с помощью набора контекстуальных ожиданий и морфологических или орфографических признаков (таких, как прописная буква).
В первом случае не существует какой-либо осмысленной стратегии преодоления коммуникативного сбоя, за исключением фокусирующего взаимодействия (Hayes, 1981), позволяющего проинформировать пользователя о конкретной трудности. В третьем случае требуется в основном лишь распознать имя собственное и занести его в словарь для дальнейших ссылок. Второй случай более сложный; здесь возможны три основные стратегии преодоления возникшего препятствия:
1. Использовать подход, применяемый в системе KLAUS (Haas and Hendrix, 1983), когда система временно перехватывает инициативу у пользователя и, действуя по типу хорошо продуманной игры «20 вопросов», определяет синтаксический класс незнакомого термина и соотносит его семантически с имеющимися в системе понятиями, объединенными в родо-видовую иерархию. Этим методом успешно обрабатываются глаголы, существительные и прилагательные, но только в тех случаях, когда они оказываются представителями заранее определенных общих классов объектов и действий в модели предметной области.
2. Применить метод проецирования и интегрирования (Carbonell, 1979) для выведения значения и синтаксической категории слова из контекста. Этот метод успешно применялся при обработке существительных и прилагательных, значения которых могут рассматриваться как рекомбинация признаков, присутствующих в каком-либо другом месте входного выражения. В отличие от метода, применяемого в системе KLAUS, здесь обработка производится внутри системы, и пользователь не обременен длительностью вычислений. Однако данный метод остается в высшей степени экспериментальным, и, возможно, для практической его реализации потребуется обращение к пользователю.
3. Провести фокусирующее взаимодействие с пользователем для получения перифразы того сегмента входного выражения, которое содержит незнакомое слово. Если такая перифраза приводит к желаемому действию, она заносится в память и становится значением нового слова применительно к тому контексту, в котором оно появилось. В системе LIFER (Hendrix, 1977) имеются рудиментарные средства для определения синонимичных выражений. Более общий метод будет заключаться в обобщении синонимических средств для классификации нового слова или выражения в различных семантических контекстах.
2.2.
Еще по теме Проблема незнакомых слов.:
- Необходимы ли мелкие стычки перед сражением и как избежать их, желая узнать незнакомого врага
- Проблема классификации слов в «Очерке науки о языке» проф. Н. В. Крушевского
- 1.1. Аспекты изучения проблемы переходности в области неполнозначных слов
- 4. Философские проблемы различаются в соответствии с делением жизненных проблем на проблемы-образы, проблемы-действия и вербальные проблемы
- 35. Порядок слов и актуальное членение предложения. Коммуникативно-стилистические функции порядка слов. Устранение ошибок, связанных с порядком слов в предложении.
- Функции многозначных слов. Использование многозначных слов в художественной литературе. Лексические ошибки, связанные с неудачным употреблением многозначных слов.
- Типология лексических значений слов (по классификации В.В.Виноградова). Проблема основного (главного) значения слова.
- 35. Порядок слов и актуальное членение предложения. Коммуникативно-стилистическая функция порядка слов. Устранение ошибок, связанных с порядком слов в предложениях.
- Теорії походження слов’ян. Розселення стародавніх східних слов’ян.
- § 194. Отличие модальных слов от омонимичных им слов.
- ОБ ОТБОРЕ ВАРИАНТОВ В СОСТАВЕ ФОНЕМ ОТДЕЛЬНЫХ СЛОВ, ГРУПП СЛОВ И ГРАММАТИЧЕСКИХ ФОРМ
- 33. Возникновение новых слов и оборотов. Изменение их значений. Выпадение устаревших слов и оборотов
- 33. Возникновение новых слов и оборотов. Изменение их значений. Выпадение устаревших слов и оборотов
- Лексика русского языка с точки зрения ее деления на активный и пассивный запас (общая классификация). Исторические словари. Словари устаревших слов. Словари новых слов и значений.
- Введение: характеристика проблемы Происхождение вселенной: проблема “самого начала”