<<
>>

Нарушение порядка следования составляющих и фрагмен­тарный вход.

Иногда пользователь употребляет нестандартный порядок слов. Существует целый ряд причин, по которым пользователь нару­шает ожидаемый порядок составляющих. В частности, это может быть связано с нежеланием менять уже напечатанное, особенно при большом объеме перепечатки:

Two fixed head dual ported disk drives add to the order.

‘Два накопителя на дисках с двойными портами и с фиксирован­ными головками добавьте к заказу.’,

или убеждением, что ЭВМ поймет сокращенный псевдовоенный стиль легче, чем стандартный:

Two disk drives fixed head dual ported to my order add.

‘Два накопителя на дисках фиксированные головки с двойными портами к моему заказу добавить’.

Аналогичные мифические представления о том, что компьютеры понимают лучше всего, могут, например, привести к очень фрагмен­тарному и криптографическому стилю, при котором опускаются все функциональные слова:

Add disk drive order букв. ‘Добавить диск накопитель заказ’ вместо „Add a disk drive to my order".

‘Добавьте накопитель на дисках к моему заказу’.

Эти два явления — нарушение порядка следования составляющих и фрагментарное входное сообщение — объединены нами вместе, так как они сходны с точки зрения стратегии обработки. В обоих слу­чаях задача анализатора состоит в том, чтобы объединить в одну группу распознанные фрагменты предложения при отсутствии нор­мальной синтаксической связи, осуществляемой служебными слова­ми или порядком слов, то есть при отсутствии эксплицитных указа­ний на то, как следует объединить эти фрагменты. Поскольку такого рода синтаксическая информация отсутствует, всю тяжесть этой за­дачи принимает на себя семантика. Следовательно, значительным преимуществом обладают те анализаторы, которые могут легко при­влекать семантическую информацию.

Для обнаружения и преодоления трудностей, связанных с про­пущенными и случайными составляющими, возможен анализ струк­туры высказывания как снизу вверх, так и сверху вниз. При ана­лизе снизу вверх все фрагменты распознаются независимо и, для того чтобы собрать их в единую структуру, имеющую смысл в предметной области дискурса, используются чисто семантические ограничения. При достаточно ограниченной предметной области семантические ограничения могут всегда приводить к однозначно­му результату. Это свойство было успешно использовано в систе­ме PLANES (Waltz, 1978), в которой входное высказывание распознавалось как последовательность фрагментов, которые затем собирались в значимое целое на основе лишь семантических крите­риев. Распознавание фрагментов при анализе сверху вниз требует отыскания в высказывании сначала понятия самого верхнего уровня (в приводившихся примерах это add ‘добавить’), а затем — ис­пользования полученных на его основе предсказаний о возможных единицах высказывания для организации процесса распознавания других фрагментов.

И, наконец, следует заметить, что при нарушенном порядке следования составляющих анализатор, осуществляющий поиск стро­го слева направо, будет испытывать гораздо большие затруднения, чем анализатор с более свободно направленным поиском. Для сооб­щения с нарушенным порядком составляющих может не сущест­вовать какого бы то ни было разумного набора ожиданий, который связывал бы единицы высказывания в направлении слева направо, даже если мы допустим, что между этими единицами имеются структурные пробелы и могут быть включены дополнительные со­ставляющие. Например, для преодоления неграмматичности данного типа больше приспособлен анализатор, который использует падеж­ные фреймы и в ходе анализа ищет главное слово фрейма, а затем пы­тается заполнить конкретные падежи на основе входного контекста, чем тот, который зависит от жестких ограничений на порядок слов.

3.4.

<< | >>
Источник: Б.Ю. Городец­кий. Новое в зарубежной лингвистике: Вып. XXIV. Компьютерная лингвистика: Пер. с англ./Сост., ред. и вступ, ст. Б. Ю. Городец­кого.— М.: Прогресс,1989.—432 с.. 1989

Еще по теме Нарушение порядка следования составляющих и фрагмен­тарный вход.:

  1. Нарушение порядка следования составляющих и фрагмен­тарный вход.