Интеллектуализация систем управления и навигации
а). Интеллектуальные системы управления мобильными роботами
Расширение исследований по прикладному использованию методов и технологий искусственного интеллекта в задачах мобильной робототехники позволили создать варианты интеллектуальных систем управления роботами с широким набором возможностей по планированию целесообразных действий и поведения в априорно неизвестных условиях при наличии внешних возмущений случайного характера[68, 73, 94, 99, 130, 131, 156].
Источниками неопределенности являются следующие факторы [129]:
• сложность формализованного описания объекта и задач управления с учетом погрешностей вычислений и измерений;
• нечеткость целей функционирования и задач управления;
• нестационарность параметров объекта и системы управления;
• априорная неопределенность обстановки и условий функционирования;
• наличие случайных воздействий внешней среды.
• Фундаментальную основу концепции построения интеллектуальных систем управления роботами и другими сложными динамическими объектами составляют три ключевых положения [68, 73, 130,131,156]:
• развитие принципа ситуационного управления, когда каждому классу возможных состояний ставится в соответствие определенный класс допустимых решений;
• принцип иерархической организации интеллектуальной СУ, включающей в свой состав стратегический уровень планирования поведения, тактический уровень планирования действий, исполнительный уровень реализации движений и комплекс информационно-измерительных средств;
• принцип обоснованного выбора интеллектуальных технологий, используемых для решения задач отдельных уровней иерархии управления.
Интеллектуальная СУ должна обладать способностью к [129]:
• анализу ситуаций, оценке обстановки и собственного состояния на основе обработки сенсорной информации;
• автоматическому формированию модели внешнего мира и формализации на основе анализа разрозненных фактов;
• планированию целесообразных действий и поведения на основе анализа за- дачно-ориентированных указаний;
• самообучению и проведению самодиагностики;
• обобщению знаний, накопленного опыта и типовых ситуаций;
• логическому выводу на основе знаний, выполнению прогнозов;
• моделированию ситуаций, представленных на уровне естественного языка.
Работы над созданием систем управления интеллектуальных мобильных роботов (ИМР) на базе однородных нейроподобных структур, реализующих нецифровые методы обработки информации, присущие мозгу человека проводятся в НИИ MBC (г. Таганрог) [73]. Бортовая СУ данных ИМР построена на базе нейроподобной структуры, содержащей 4096 элементарных нейропроцессоров. Ввод информации о среде движения в систему осуществляется C ПОМО
щью сканирующего лазерного дальномера и телекамеры. Система обеспечивает автономное движение ИМР по заранее неизвестной пересеченной местности к последовательности из 16 целей со скоростью до 10 км/час.
Групповое управление мобильных роботов
При решении сложных задач (исследование и зондирование поверхности других планет, сборка сложных конструкций в космосе и под водой, участие в боевых и обеспечивающих операциях, разминирование территорий) рационально применение группы MP при их взаимодействии, что обеспечит их большую живучесть и вероятность выполнения задания в неблагоприятных условиях внешних или противодействующих воздействий [72-75]. Каждый ИМР коллектива самостоятельно принимает решение о своих текущих действиях на основе воспринимаемой им информации об окружающей обстановке и решений, принятых остальными ИМР коллектива. Данный подход реализуется распределенной системой планирования действий группы роботов, как совокупность одинаковых модулей планирования действий всех роботов, функционирующих в условиях заранее неизвестной и динамически изменяющейся ситуации. В работе [71] при рассмотрении задачи управления взаимосвязанными действиями группы объектов в условиях заранее неизвестной ситуации предложены принципы организации и функционирования распределенных систем группового управления, реализующих итерационную процедуру оптимизации коллективных действий. В работе [191] сформулированы принципы групповой организации и управления коллектива роботов, среди которых:
1. Структуры групп роботов должны быть иерархическими с функциональной специализацией по уровням и оптимальными значениями численности на каждом уровне.
2. Одни и те же объекты управления могут входить в состав двух и более структур, преследующих разные, но не антагонистические цели
3. Управление этими структурами должно быть иерархическим и комбинированным, сочетая принципы централизованного (вертикального) и децентрализованного (горизонтального) управления. Первый реализует общесистемные цели, а второй осуществляет координацию действий членов своей группы и адаптацию к местным условиям.
4. Эволюция развития технических систем группового управления идет в направлении увеличения децентрализации (управления на местах) с сохранением за центром только обеспечения общесистемных (пока не поддающихся декомпозиции) функций группы.
При навигации, действующие совместно в некоторой области роботы могут уточнять друг у друга свои координаты, сравнивать взаимное положение и быстро передвигаться. Для управления группой роботов в режиме передвижения («движение цепочкой», «гонка за лидером»), и в режиме исследования местности («расхождение», «схождение», «свободный поиск») могут использоваться алгоритмы, основанные на методе потенциалов [151].
Управление при неопределенности знаний о внешних условиях или состоянии MP
Задача управления движением при неопределенности внешних условий и неполном измерении вектора состояния объекта является одной из актуальных задач мобильной робототехники[33]. C оператора MP можно снять целый ряд однообразных, повторяющихся функций (выполнение типовых маневров, движение в установившихся режимах) поручив ему задачи задания цели, выбора режима движения, точного позиционирования, объезда внезапно появившихся препятствий, т. е. работы MP в нестандартных ситуациях. В такой полуавтоматической системе появляется возможность для накопления и использования положительного и негативного опыта оператора по управлению объектом в различных ситуациях. Подсистема автоматического управления движением может аккумулировать решения в режиме «off-line», полученные от оператора, а также с помощью компьютерного моделирования и приобретать интеллектуальные свойства, которые впоследствии могут передаваться другому оператору [87, 159], что позволит обеспечить качество управления почти такое же, как и в случае «оператора - эксперта».
В работе [171] для MP, функционирующих в недетерминированных условиях, когда поведение среды заранее неизвестно, предлагается использование принципов самообучения с подкреплением. В случае успешной работы системы подкрепление растет, в противном случае - падает. Алгоритм такой подстройки известный как SSA (Success Story Algorithm), предлагается реализовать на основе принципа SMP (Self-Modifying Policies), заключающегося в том, что правила, заложенные в систему, включают в себя правила, изменяющие самих себя [344]. Рассмотренный подход весьма эффективен при управлении MP, перемещающимися в реальной среде с заранее неизвестными препятствиями. В НУЦ «Робототехника» МГТУ им. Н.Э. Баумана разработан гусеничный MP [171] в котором для технической реализации принципа SMP использована двухкомпонентная нейросеть, построенная по топологии т.н. «внутренний учитель». Политика самообучения реализована компонентой УЧИТЕЛЬ. В процессе работы системы эти правила применяются к компоненте управления объек
том РЕШАТЕЛЬ, изменяя его работу. Такая адаптивная система управления позволяет объекту приспосабливаться к определенным препятствиям и быстро перенастраиваться при появлении новых препятствий.
Управление MP в условиях неопределенности с применением аппарата нечетких множеств
Одно из основных направлений, получивших значительное развитие в последнее время при организации управления MP в условиях неопределенности, это применение аппарата нечетких множеств для описания ситуаций и принятия решений [90, 132, 196]. Целесообразность использования такого подхода обусловлена тем, что показания сенсоров робота, как правило, неточны и позволяют только приблизительно, качественно определить ситуацию. При управлении MP оператором, обучении робота и при формировании экспертных оценок и правил поведения, человек также использует нечеткие пространственно-временные отношения, свойственные его восприятию структуры РП, которое существенно отличается от традиционных математических моделей. Применение нечетких представлений дает значительные преимущества при решении сложных задач в условиях неопределенности за счет того, что число нечетких, плохо детализированных правил оказывается существенно меньше, чем число соответствующих правил, определенных обычным путем [157, 194].
В работе [195] подобный подход успешно применен к задаче управления движением MP в условиях неопределенности при движении в соответствии с сигналами инфракрасных маяков, появлявшихся случайным образом в РП робота. Основная информация о положении маяка по отношению к роботу с ПЗС- камерой имела нечеткий характер за счет искривления растра, смещения («смазывания») изображения в фокальной плоскости при движении робота и запаздывания при обработке сигналов СТЗ.Развитие методов управления MP с помощью голоса
Одна из ключевых проблем разработки автономных интеллектуальных роботов связана с организацией человеко-машинного интерфейса, предназначенного для ввода команд с помощью средств естественного или близкого к нему языка с их последующим преобразованием в автоматически реализуемые сценарии поведения и последовательности исполняемых действий [193].
Реализация человеко-машинного интерфейса предполагает поддержание диалога на уровне естественного языка с речевым и символьным вво- дом/выводом и естественно-языкового обучения понятиям и общим закономерностям, признакам объектов и ситуаций, правилам целесообразного поведения
в типовых ситуациях. Для этих задач предложены принципы построения, а также архитектура обучающейся системы семантического анализа и интерпретации текстовой информации [129]. Особенно актуальна проблема управления с помощью голосовых команд для сервисных роботов, которые рассматриваются как потенциальные помощники для обслуживающего персонала социальных учреждений и одиноких престарелых людей [339]. В таких роботах в числе первоочередных наряду с распознаванием образов и создания надежных методов навигации стоят задачи распознавания речи. Например, в работах [304,360] рассматривается методы и технологии, которые могут использоваться для управления поведением интеллектуального мобильного сервисного робота непосредственно голосом или с помощью сотового телефона.
б). Интеллектуальные системы навигации
Интеллектуальный робот строит собственный образ РП, в котором ему приходится действовать, после чего формирует маршрут и движется по нему, постоянно сопоставляя свою карту РП с данными, полученными от устройств навигации.
Существующие интеллектуальные MP умеют строить двумерные карты области, в которой движутся, но из-за ограниченности плоской модели мира роботы нередко попадают в логические тупики. Значительно более перспективно формирование точной трехмерной геометрической модели окружающего пространства. Но для этого надо иметь максимально детальную информацию об окружающей среде, а предоставить ее могут СТЗ высокого разрешения и системы распознавания объектов, которые пока либо очень дороги, либо существуют только в экспериментальных версиях, а базирующиеся на них роботы уверенно двигаются только в простой обстановке. Трехмерные цифровые карты местности требуют для хранения и обработки в тысячи раз больше памяти и вычислительных ресурсов, чем двумерные карты.Большинство разработанных систем навигации и управления MP основываются на клеточном, контурном и графовом способах формирования модели внешней среды (MBC) [76, 149]. Клеточная модель при малой детализации описывает РП робота неточно, но при большей детализации резко увеличиваются вычислительные затраты. Напротив, контурная модель точно описывает местность с помощью аппроксимации однородных областей многоугольниками, но имеет очень сложную структуру карты, в которой существуют разрывы или несовпадающие границы между соседними областями. Из-за этого маршрут MP может быть не найден или быть не оптимальным. MBC на основе графовых представлений является абстрактной и не содержит всей топографической ин
формации о рабочем районе робота [248]. Поэтому найденный на графе маршрут MP не всегда оказывается оптимальным на реальной местности. В работе [50] предлагается формировать оптимальный маршрут путем дополнения к графовой MBC топографической информации о местности в виде линейных ориентиров с использованием методов многомерной градиентной оптимизации.
Несмотря на сложность задачи формирования модели MBC и формирования маршрута некоторые роботы при нахождении внутри типовых зданий с жестко предопределенной геометрией уже способны за секунду создавать вполне точный трехмерный образ окружающей среды. Следующие модели будут уже в обязательном порядке снабжаться функциями построения карты и ее сопоставления с исходным готовым вариантом. Если расположение робота на карте определено, его навигация упрощается.
Существует концепция абстрактного описания окружающего робот пространства. В ее рамках робот исследует мир, не переводя его в формальное, смысловое или топографическое представление (привычных человеку объектов - «холм» или «яма»), но выделяя в ходе исследования характерные признаки наиболее выдающихся элементов внешней среды для идентификации своего местоположения. Эта концепция оказалась работоспособной в экспериментах с роботами, путешествующими внутри зданий, где число внешних объектов ограниченно (стены, коридоры, комнаты, столы, стулья, двери и ступени). В перспективе, эту концепцию можно распространить и на рабочее пространство с визуальными ориентирами различных типов. Взаимное расположение ориентиров определенного типа и их расположение относительно робота может позволить идентифицировать местоположение MP даже в условиях неполного описания рабочего пространства.
Навигация в интеллектуальных MP в условиях неопределенности
Проблема управления и навигации MP в условиях неопределенности является актуальной для современной мобильной робототехники [34, 277].Например, задача навигации и определения положения робота при неопределенных условиях сцепления колес с поверхностью и неполном измерении вектора состояния рассматривалась в работе [33]. Была предложена структура системы управления, для функционирования которой требовалось путем интегрирования уравнений математической модели вычислять оценки абсолютных координат MP, которые периодически необходимо было корректировать.
Одной из важных является проблема автоматической прокладки маршрута MP и эффективного его исполнения в сложной априори неформализованной ес
тественной среде. В работах [76, 187] предложен бионический метод решения данной проблемы на базе нейросетевых систем управления. Метод состоит в том, что в процессе взаимодействия MP с неформализованной внешней средой, в его нейросетевой системе управления периодически перед началом каждого элементарного действия, воспроизводится план среды, формируемый сенсорной системой, который отображается в состояниях нейроэлементов физически реализованной бортовой планирующей нейросети и на ней отыскивается градиент функционала, определяемого множеством возможных траекторий достижения цели. После этого нейросетевой системой принятия решений формируется, а исполнительными устройствами робота отрабатывается элементарное перемещение вдоль вектора антиградиента функционала, найденного на плане среды в нейросетевой системе управления.
В работе [188] рассматривается СУ MP, в которой глобальные маршруты формируются нейросетевым планировщиком стратегического уровня, а локальные траектории формируются в бортовом спецвычислителе и реализуются синергетическим регулятором, рассмотренного в работе [160] типа. При этом глобальные маршруты требуемых перемещений формируются нейросетевой системой принятия решений, а контуры препятствий, при необходимости, извлекаются из плана проходимости среды в виде их бинарных изображений и попадают в бортовой спецвычислитель, где аппроксимируются кривыми второго порядка и представляются в виде предназначенных для отработки локальных траекторий, которые с точками позиционирования в фазовом пространстве робота трансформируются в притягивающие многообразия - аттракторы, т.е. становятся асимптотически устойчивыми в целом решениями замкнутых систем. Предлагаемый подход [188] позволяет увеличить точность исполнения спланированных на нейросетевом стратегическом уровне маршрутов.
1.5.