ФОНЕТИЧЕСКИЙ звуко-буквенный разбор слов онлайн
 <<
>>

Будущие исследования

Мы усматриваем много направлений для нашей будущей работы. Немало еще предстоит сделать в области представления типов знаний, необходимых для понимания текстов, аналогичных расска­зам РАЗВОД-1 и РАЗВОД-2, а также в области более детального исследования процессов взаимодействия между используемыми в BORIS источниками знаний (а их у нас более 15).

Кроме того, требуется дальнейшая работа по совершенствованию программного использования наложений структур памяти и одновременного исполь­зования нескольких перспектив, а также и по экспериментирова­нию в области взаимодействия между процессами анализа и дру­гими операциями с содержимым памяти.

В настоящее время BORIS обрабатывает каждый рассказ о разводе изолированно. Что бы произошло, если бы BORIS читала текст РАЗВОД-2 в контексте знаний о рассказе РАЗВОД-1? Лю­ди, которые перед чтением текста РАЗВОД-2 уже читали РАЗВОД-1, вспоминали о последнем при чтении рассказа РАЗВОД-2, а впо­следствии, когда им предлагались задания по пересказу рассказов или построению по нему резюме, часто обнаруживалось, что в памяти читателей смешивались эпизоды разных рассказов. Таким образом, одно из направлений исследований затрагивает происхо­дящие в системе BORIS процессы вспоминания и последствия воспоминаний (Schank, 1982b) для понимания повествователь­ного текста.

Наконец, продолжается работа по изучению абстрактных струк­тур знаний высокого уровня типа сюжетных блоков (Lehnert,

1982) и АТБ (Dyer, 1981b; Dyer, 1982). Такие структуры высо­кого уровня, как ВОЗДАЯНИЯ, НЕЯВНЫЕ-УДАЧИ, ПОИМКИ- С-ПОЛИЧНЫМ и ЗАТРУДНИТЕЛЬНЫЕ-ОБСТОЯТЕЛЬСТВА, не­редко заключают в себе мораль или «суть» рассказа. В этом смысле они представляют наиболее глубинный уровень понимания, выхо­дящий далеко за рамки уровня чистых фактов и отражающий те темы и структуры, благодаря которым рассказ остается в па­мяти читателей и воспроизводится ими в каждом уместном случае.

Литература по анализу и пониманию текстов огромна, поэтому здесь мы ограничимся беглым упоминанием тех работ других ис­следователей, которые нам представляются наиболее близкими нашей собственной работе.

В число таковых мы включаем раз­работки систем, в которых предпринимаются попытки достичь по­нимания (или синтеза) текста в строгом режиме обработки слева направо, с использованием такого же количества уровней обра­ботки и уровней знаний, как в нашем исследовании, с формиро­ванием семантически ориентированного представления текста в ин­тегральном режиме.

Разработанные ранее в Йейле естественноязыковые системы были предназначены для обработки большого числа рассказов. Например, система FRUMP была способна обрабатывать (на поверх­ностном уровне) около 10% сообщений из телеграфных новостей ЮПИ, а система IPP (см. L е b о w і t z, 1981) обрабатывала на­чальные абзацы из нескольких сотен газетных сообщений, посвя­щенных террористическим актам. Однако для достижения подоб­ной надежности этих программ пришлось пожертвовать глубиной понимания. Иными словами, такие программы „просматривают” текст на разных уровнях, стремясь извлечь „суть” из каждого сооб­щения. Так, если имеется „схематичный сценарий” землетрясения, система FRUMP сможет извлечь из сообщения данные о времени, месте, силе, числе жертв и нанесенном ущербе в каждом конкрет­ном случае сообщения о землетрясении. Все остальное будет проигно­рировано. Так, в следующем предположительном отрывке будет проигнорировано все, что касается чисто „человеческого фак­тора”:

Прошлой ночью губернатор Джерри Браун был разбужен мощ­ным землетрясением. Сильный толчок сбросил его с кровати, и он упал на свою собаку, которая укусила его. Официальные источники сообщают, что землетрясение характеризовалось...

Аналогичным образом система IPP при всей своей „надежности” понимает только те части сообщений, которые непосредственно соотносятся со знаниями системы о террористических актах. IPP знает очень много о терроризме, но очень мало о чем-либо еще. В отличие от упомянутых систем в системе BORIS воплощены попытки выявить те знания, которые извлекаются из нескольких довольно сложных рассказов при максимально глубоком понимании.

Поэтому представления текста в памяти BORIS должны быть доста­точно богатыми для отображения детальных запросов в ходе про­цедуры ответов на вопросы. Будучи ориентированы на резюми­рование содержания текста, ни FRUMP, ни IPP не имели дела с задачей формирования ответов на вопросы.

Что касается уровня управления обработкой, то принятый в си­стеме BORIS подход, основанный на демонах, имеет ряд общих черт с исследованиями Аренса (Arens, 1981) и Смолла (Small, 1981). Однако их исследования, как нам кажется, ориентируются в основном на уровень предложения. В противоположность этому главное внимание в наших разработках уделяется взаимодействию и взаимосвязи между многочисленными источниками знаний в целях построения цельного представления исходного повествовательного текста. Значительная часть наших усилий также направлена на определение конкретного содержания различных структур знаний (например, соглашений и содействий). Аналогичным образом в на­шей работе по совершенствованию системы BORIS нас гораздо больше интересуют способы функционирования конкретных типов множественных перспектив в повествовательных текстах, чем ис­пользование множественных перспектив как общего средства про­граммирования (Bobrow, Winograd, 1977).

Генератор системы BORIS имеет ряд общих характеристик с другими системами, синтезирующими цепочки слов в строгом режиме слева направо, такими, как генератор Макдональда MUM­BLE (McDonald, 1980). Однако разработка BORGEN направ­лена в основном на синтез описаний повествовательных эпизодов и тематических конфигураций, а работа Макдональда направлена на синтез текста из исходного материала, имеющего более про­цедурный характер, такого, как запись ходов игроков в некото­рой настольной игре.

7.4.

<< | >>
Источник: Б.Ю. Городец­кий. Новое в зарубежной лингвистике: Вып. XXIV. Компьютерная лингвистика: Пер. с англ./Сост., ред. и вступ, ст. Б. Ю. Городец­кого.— М.: Прогресс,1989.—432 с.. 1989

Еще по теме Будущие исследования: