Надежная понимающая система
Для исследования проблемы надежного понимания была разработана система МЭРФИ. Она действует в сопряжении с робототехнической системой сборки (Engelberg, 1983; Engel berg, Levas and Sel fridge, 1984; Levas, 1983; Lev as and Selfridge, 1984; Sel fridge, 1983).
И система МЭРФИ, и робототехническая система написаны на языке ФРАНЦ ЛИСП и реализованы на машине VAX-11/780. МЭРФИ дает возможность пользователю задавать вопросы робототехнической системе и управлять ее действиями с помощью естественного языка. Естественный язык может использоваться для спецификации операций низших уровней по уточнению образа ситуации, для формулирования вопросов о знаниях высокого уровня об отношениях между объектами в составе образа ситуации, для описания внешнего вида незнакомых объектов, которые могут использоваться системой в будущем, а также для обучения манипулятора выполнению новых заданий по сборке.Надежность МЭРФИ можно проиллюстрировать следующим примером. Он касается опознания и сборки трех компонентов простого электрического рубильника (switch) — основания, контакта и рычага — с целью получения готового рубильника. МЭРФИ знает значение каждого слова в этом примере и обладает соответствующим знанием предметной области. В частности, система знает, что каждый предмет является физическим объектом и частью рубильника. Она располагает, далее, геометрическими моделями каждого объекта, которые могут потребоваться для планирования движений робота. Наконец, она располагает знанием того, как выглядят основание рубильника и его контакт в графическом изображении. Чтобы продемонстрировать способность МЭРФИ усваивать новое визуальное знание, мы, однако, убрали из системы знание того, как выглядит в графическом изображении рычаг рубильника, а также знание того, каким образом геометрическая модель рычага переводится в визуальную информацию. Как можно видеть (см.
ниже), благодаря этому обстоятельству система участвует в диалоге о рычаге рубильника, не будучи способной распознать его визуально, что позволяет нам легко продемонстрировать возможности МЭРФИ. Входные сообщения пользователя даны обычным шрифтом, а ответы МЭРФИ — прописными буквами; в скобках добавлены описания операций, совершаемых системой.(1) Покажите текущее рабочее пространство изображения.
ВЫ ИМЕЕТЕ В ВИДУ „Покажите текущее изображение рабочего пространства?"
>Да.
ХОРОШО.
(Система показывает изображение.)
(2) >Сдвиньте изображение к отметке „пятьдесят", а затем про
ведите границу, отсекающую области за пределами отметки „тридцать пять".
ВЫ ИМЕЕТЕ В ВИДУ „Сдвиньте изображение рабочего пространства к отметке „пятьдесят", затем проведите границу, отсекающую области за пределами отметки „тридцать пять" в рамках текущего изображения рабочего пространства?"
>Да.
ХОРОШО.
(Система показывает осуществляемые операции.)
(3) >Что мы видим на этом изображении?
ОСНОВАНИЕ РУБИЛЬНИКА И КОНТАКТ РУБИЛЬНИКА. (Основание и контакт обводятся и надписываются.)
(4) >Где находится рубильник?
ВЫ ИМЕЕТЕ В ВИДУ „Где находится рычаг рубильника?" >Нет, контакт.
КОНТАКТ РУБИЛЬНИКА НАХОДИТСЯ РЯДОМ С ОСНОВАНИЕМ РУБИЛЬНИКА.
(5) >Есть ли на этом изображении рычаг рубильника?
КАК ВЫГЛЯДИТ РЫЧАГ РУБИЛЬНИКА?
(6) >Металлический цилиндр длиной в два дюйма.
ВЫ ИМЕЕТЕ В ВИДУ „Рычаг рубильника — это металлический цилиндр длиной в два дюйма?"
>Да.
НА ЭТОМ ИЗОБРАЖЕНИИ РЫЧАГ РУБИЛЬНИКА НАХОДИТСЯ РЯДОМ С КОНТАКТОМ РУБИЛЬНИКА.
(Рычаг обводится и надписывается.)
(7) >Соберите рубильник.
ХОРОШО.
(Программа планирования, оперирующая знаниями высокого уровня, приводит в действие манипуляторы, которые собирают основание, рычаг и контакт в готовый рубильник.)
В этом примере система МЭРФИ позволила пользователю вступить во взаимодействие с робототехнической системой сборки и собрать электрический рубильник. Сначала пользователь указал некоторые конкретные операции низшего уровня по обработке изображения, а затем задал вопрос, относящийся к знаниям высокого уровня, который заставил систему осуществить дополнительный процесс распознания по принципу снизу вверх и сверху вниз, что позволило системе породить ответ.
Потом пользователь запросил дополнительную информацию, которая и была выдана. Далее пользователь спросил о существовании неизвестного системе объекта. Система проявила способность вести диалог со смешанной инициативой: она ответила вопросом о том, как выглядит этот объект. Вместо того чтобы дать описание внешнего вида объекта, пользователь в своем ответе дал описание физической формы объекта. Тогда система сама вывела знания о том, как выглядит этот объект, снова обследовала описание изображения на низшем уровне, нашла этот объект и ответила на исходный вопрос пользователя. Наконец, пользователь дал команду собрать части в готовый рубильник, что система и сделала.Для настоящей статьи, однако, особый интерес представляет тот факт, что в ходе данного диалогового взаимодействия система
МЭРФИ продемонстрировала именно тот вид надежности, который был описан в разд. 2.1. На этапе (1) слова изображение и рабочее пространство поменялись местами. Система поняла сообщение правильно, несмотря на это синтаксическое варьирование. На этапе (4) в сообщении было пропущено слово контакт. Сначала МЭРФИ сделала предположение, что пропущено слово рычаг, но пользователь внес поправку и сказал, что пропущено слово контакт. Еще один пример понимания сообщения, несмотря на пропуски некоторых слов, можно наблюдать в интеракции (2). Далее, в интеракции (5) система демонстрирует смену инициативы в диалоге. В ответ на вопрос пользователя Есть ли в текущем изображении рабочего пространства рычаг рубильника? система отвечает другим вопросом, а именно: Как выглядит рычаг рубильника? В интеракции (6) в ответе пользователя пропущено несколько слов, включая главное слово, обеспечивающее применение конкретного фрейма. МЭРФИ делает умозаключение, что пользователь имел в виду высказывание Рычаг рубильника — это металлический цилиндр длиной в два дюйма. Здесь демонстрируется способность восстанавливать пропущенное слово это (в соответствующей позиции), которое как раз и обеспечивает вывод нужного фрейма, а также способность системы использовать знания о предшествующей части диалога для понимания эллиптической референции к рычагу рубильника.
В указанных случаях система МЭРФИ отвечает критериям, указанным в разд. 2.1.В рамках предметной области, связанной с работой робота по сборке, система МЭРФИ в настоящее время знает около пятидесяти слов и пять устойчивых словосочетаний, а также около семидесяти понятий пятнадцати разных типов. Кроме того, она прошла небольшую проверку в других областях, не связанных с операциями сборки. В ходе типичного диалогового взаимодействия МЭРФИ обычно реагирует на входное сообщение через пять-десять секунд. В отдельных случаях, при длинных тестовых предложениях, выработка ответа занимает более минуты. Время реакции представляется приемлемым для начального этапа реализации, нацеленного на решение теоретических вопросов, и достаточно обнадеживающим в том плане, что в реальных ситуациях промышленной эксплуатации соответствующая настройка МЭРФИ могла бы обеспечить реакцию системы в масштабе реального времени.