Нарушение порядка следования составляющих и фрагментарный вход.
Иногда пользователь употребляет нестандартный порядок слов. Существует целый ряд причин, по которым пользователь нарушает ожидаемый порядок составляющих. В частности, это может быть связано с нежеланием менять уже напечатанное, особенно при большом объеме перепечатки:
Two fixed head dual ported disk drives add to the order.
‘Два накопителя на дисках с двойными портами и с фиксированными головками добавьте к заказу.’,
или убеждением, что ЭВМ поймет сокращенный псевдовоенный стиль легче, чем стандартный:
Two disk drives fixed head dual ported to my order add.
‘Два накопителя на дисках фиксированные головки с двойными портами к моему заказу добавить’.
Аналогичные мифические представления о том, что компьютеры понимают лучше всего, могут, например, привести к очень фрагментарному и криптографическому стилю, при котором опускаются все функциональные слова:
Add disk drive order букв. ‘Добавить диск накопитель заказ’ вместо „Add a disk drive to my order".
‘Добавьте накопитель на дисках к моему заказу’.
Эти два явления — нарушение порядка следования составляющих и фрагментарное входное сообщение — объединены нами вместе, так как они сходны с точки зрения стратегии обработки. В обоих случаях задача анализатора состоит в том, чтобы объединить в одну группу распознанные фрагменты предложения при отсутствии нормальной синтаксической связи, осуществляемой служебными словами или порядком слов, то есть при отсутствии эксплицитных указаний на то, как следует объединить эти фрагменты. Поскольку такого рода синтаксическая информация отсутствует, всю тяжесть этой задачи принимает на себя семантика. Следовательно, значительным преимуществом обладают те анализаторы, которые могут легко привлекать семантическую информацию.
Для обнаружения и преодоления трудностей, связанных с пропущенными и случайными составляющими, возможен анализ структуры высказывания как снизу вверх, так и сверху вниз. При анализе снизу вверх все фрагменты распознаются независимо и, для того чтобы собрать их в единую структуру, имеющую смысл в предметной области дискурса, используются чисто семантические ограничения.
При достаточно ограниченной предметной области семантические ограничения могут всегда приводить к однозначному результату. Это свойство было успешно использовано в системе PLANES (Waltz, 1978), в которой входное высказывание распознавалось как последовательность фрагментов, которые затем собирались в значимое целое на основе лишь семантических критериев. Распознавание фрагментов при анализе сверху вниз требует отыскания в высказывании сначала понятия самого верхнего уровня (в приводившихся примерах это add ‘добавить’), а затем — использования полученных на его основе предсказаний о возможных единицах высказывания для организации процесса распознавания других фрагментов.И, наконец, следует заметить, что при нарушенном порядке следования составляющих анализатор, осуществляющий поиск строго слева направо, будет испытывать гораздо большие затруднения, чем анализатор с более свободно направленным поиском. Для сообщения с нарушенным порядком составляющих может не существовать какого бы то ни было разумного набора ожиданий, который связывал бы единицы высказывания в направлении слева направо, даже если мы допустим, что между этими единицами имеются структурные пробелы и могут быть включены дополнительные составляющие. Например, для преодоления неграмматичности данного типа больше приспособлен анализатор, который использует падежные фреймы и в ходе анализа ищет главное слово фрейма, а затем пытается заполнить конкретные падежи на основе входного контекста, чем тот, который зависит от жестких ограничений на порядок слов.
3.4.