Будущие исследования
Мы усматриваем много направлений для нашей будущей работы. Немало еще предстоит сделать в области представления типов знаний, необходимых для понимания текстов, аналогичных рассказам РАЗВОД-1 и РАЗВОД-2, а также в области более детального исследования процессов взаимодействия между используемыми в BORIS источниками знаний (а их у нас более 15).
Кроме того, требуется дальнейшая работа по совершенствованию программного использования наложений структур памяти и одновременного использования нескольких перспектив, а также и по экспериментированию в области взаимодействия между процессами анализа и другими операциями с содержимым памяти.В настоящее время BORIS обрабатывает каждый рассказ о разводе изолированно. Что бы произошло, если бы BORIS читала текст РАЗВОД-2 в контексте знаний о рассказе РАЗВОД-1? Люди, которые перед чтением текста РАЗВОД-2 уже читали РАЗВОД-1, вспоминали о последнем при чтении рассказа РАЗВОД-2, а впоследствии, когда им предлагались задания по пересказу рассказов или построению по нему резюме, часто обнаруживалось, что в памяти читателей смешивались эпизоды разных рассказов. Таким образом, одно из направлений исследований затрагивает происходящие в системе BORIS процессы вспоминания и последствия воспоминаний (Schank, 1982b) для понимания повествовательного текста.
Наконец, продолжается работа по изучению абстрактных структур знаний высокого уровня типа сюжетных блоков (Lehnert,
1982) и АТБ (Dyer, 1981b; Dyer, 1982). Такие структуры высокого уровня, как ВОЗДАЯНИЯ, НЕЯВНЫЕ-УДАЧИ, ПОИМКИ- С-ПОЛИЧНЫМ и ЗАТРУДНИТЕЛЬНЫЕ-ОБСТОЯТЕЛЬСТВА, нередко заключают в себе мораль или «суть» рассказа. В этом смысле они представляют наиболее глубинный уровень понимания, выходящий далеко за рамки уровня чистых фактов и отражающий те темы и структуры, благодаря которым рассказ остается в памяти читателей и воспроизводится ими в каждом уместном случае.
Литература по анализу и пониманию текстов огромна, поэтому здесь мы ограничимся беглым упоминанием тех работ других исследователей, которые нам представляются наиболее близкими нашей собственной работе.
В число таковых мы включаем разработки систем, в которых предпринимаются попытки достичь понимания (или синтеза) текста в строгом режиме обработки слева направо, с использованием такого же количества уровней обработки и уровней знаний, как в нашем исследовании, с формированием семантически ориентированного представления текста в интегральном режиме.Разработанные ранее в Йейле естественноязыковые системы были предназначены для обработки большого числа рассказов. Например, система FRUMP была способна обрабатывать (на поверхностном уровне) около 10% сообщений из телеграфных новостей ЮПИ, а система IPP (см. L е b о w і t z, 1981) обрабатывала начальные абзацы из нескольких сотен газетных сообщений, посвященных террористическим актам. Однако для достижения подобной надежности этих программ пришлось пожертвовать глубиной понимания. Иными словами, такие программы „просматривают” текст на разных уровнях, стремясь извлечь „суть” из каждого сообщения. Так, если имеется „схематичный сценарий” землетрясения, система FRUMP сможет извлечь из сообщения данные о времени, месте, силе, числе жертв и нанесенном ущербе в каждом конкретном случае сообщения о землетрясении. Все остальное будет проигнорировано. Так, в следующем предположительном отрывке будет проигнорировано все, что касается чисто „человеческого фактора”:
Прошлой ночью губернатор Джерри Браун был разбужен мощным землетрясением. Сильный толчок сбросил его с кровати, и он упал на свою собаку, которая укусила его. Официальные источники сообщают, что землетрясение характеризовалось...
Аналогичным образом система IPP при всей своей „надежности” понимает только те части сообщений, которые непосредственно соотносятся со знаниями системы о террористических актах. IPP знает очень много о терроризме, но очень мало о чем-либо еще. В отличие от упомянутых систем в системе BORIS воплощены попытки выявить те знания, которые извлекаются из нескольких довольно сложных рассказов при максимально глубоком понимании.
Поэтому представления текста в памяти BORIS должны быть достаточно богатыми для отображения детальных запросов в ходе процедуры ответов на вопросы. Будучи ориентированы на резюмирование содержания текста, ни FRUMP, ни IPP не имели дела с задачей формирования ответов на вопросы.Что касается уровня управления обработкой, то принятый в системе BORIS подход, основанный на демонах, имеет ряд общих черт с исследованиями Аренса (Arens, 1981) и Смолла (Small, 1981). Однако их исследования, как нам кажется, ориентируются в основном на уровень предложения. В противоположность этому главное внимание в наших разработках уделяется взаимодействию и взаимосвязи между многочисленными источниками знаний в целях построения цельного представления исходного повествовательного текста. Значительная часть наших усилий также направлена на определение конкретного содержания различных структур знаний (например, соглашений и содействий). Аналогичным образом в нашей работе по совершенствованию системы BORIS нас гораздо больше интересуют способы функционирования конкретных типов множественных перспектив в повествовательных текстах, чем использование множественных перспектив как общего средства программирования (Bobrow, Winograd, 1977).
Генератор системы BORIS имеет ряд общих характеристик с другими системами, синтезирующими цепочки слов в строгом режиме слева направо, такими, как генератор Макдональда MUMBLE (McDonald, 1980). Однако разработка BORGEN направлена в основном на синтез описаний повествовательных эпизодов и тематических конфигураций, а работа Макдональда направлена на синтез текста из исходного материала, имеющего более процедурный характер, такого, как запись ходов игроков в некоторой настольной игре.
7.4.