<<
>>

4.3.3. Реализация навыка отслеживания с помощью обучаемого нейросетевого визуального серворегулятора

а). Постановка задачи обучения управляющего регулятора

При использовании визуального сервоуправления предполагается, что управляющий сигнал вычисляется непосредственно по сигналу рассогласова­ния между текущим и программно заданным сигналами на выходе системы технического зрения (рис.4.11).

В общем виде, выражение для вычисления управляющего сигнала может быть записано как где— текущий сигнал на выходе системы машинного зре­

ния; у d—программно заданное значение сигнала у; е— сигнал рассогласова­ния (ошибки); и u ∈— управляющий сигнал. Функция задает закон управ­

ления Fuв визуальном сервоконтуре.

В нашей задаче обучения управляющего регулятора закон управления Fuи программно заданное значение сигнала ydявляются неизвестными. Тем не ме­нее, представляется возможным обучить нейронную сеть таким образом, чтобы она аппроксимировала некую функцию, неявно содержащую и закон

управления Fuи программный сигнал yd.Обученный нейросетевой регулятор будет тогда обеспечивать нелинейное отображение между векторными про­странствами входного у и управляющего и сигналов, аппроксимирующее тре­буемый закон управления. Следует отметить, что время в функции Fu(у) от­сутствует — предполагается, что каждому входному сигналу у функцией

Fu(y)ставится в соответствие управляющий сигнал и.

Таким образом, в задаче разработки управляющего регулятора способного обучиться навыку отслеживания направляющей следует решить несколько под­задач.

Во-первых, система машинного зрения должна быть способна обнару­жить направляющую линию на полу и описать ее небольшим числом независи­мых параметров, которые будут формировать вектор входных сигналов для нейросетевого регулятора. Во-вторых, следует определить процедуру сбора обучающего набора данных. И, наконец, следует определить структуру нейро­сетевого регулятора и алгоритм его обучения на тренировочном наборе данных.

б) Методика обучения контроллера мобильного робота навыку управления

Сбор обучающего набора данных и его предварительная обработка

Обнаруженная системой машинного зрения направляющая описывается сле­дующим вектором, который используется в качестве входного сигнала для управляющего движением робота регулятора

Управляющий регулятор включает в себя нейронную сеть, которая неявно содержит управляющее уравнение регулятора и должна быть обучена этому уравнению во время тренировочной фазы. Тренировочная фаза включает в себя сбор обучающего набора данных, его предварительную обработку и собственно алгоритм обучения нейронной сети.

Сбор обучающего набора данных производится человеком-оператором, ко­торый обучает робот навыку отслеживания путем ручного управления роботом при движении вдоль нескольких контрольных траекторий. Во время этой опе­рации непосредственно происходит передача навыка отслеживания направ­ляющей линии на полу от оператора к контроллеру робота. Собранный обу­чающий набор данных неявно содержит закон управления регулятора в виде соответствующих друг другу наборов входныхи выходных

векторов. Эти наборы векторов автоматически записываются во время ручного управления роботом вдоль обучающих траекторий. Обучающие траектории должны включать в себя все возможные ситуации, с которыми ро­боту придется столкнуться во время отслеживания направляющей линии: левый и правый повороты, компенсация отклонения от следования линии, траектории сближения с направляющей.

Во время управления роботом при отслеживании

обучающих траекторий важно держать направляющую в поле зрения видеока­меры робота.

После сбора обучающего набора данных необходимо выполнить его обра­ботку, предваряющую обучение нейросетевого регулятора. Целью предвари­тельной обработки является уменьшение размера обучающего набора за счет удаления избыточных данных для сокращения времени обучения нейронной сети регулятора. На первом этапе из обучающего набора удаляются соседние одинаковые пары входных и выходных векторов {y,∙,u,}, которые могут при­сутствовать в наборе из-за небольшого времени квантования системы управле­ния.

Для дальнейшего уменьшения размера обучающего набора данных исполь­зуется простой метод группировки (кластеризации). Алгоритм группировки классифицирует пару входных и выходных векторов {y,∙,u^} в группу к со­гласно следующему критерию

где— евклидова норма разности векторов;- максимальное зна­

чение нормы; п — число пар в исходном обучающем наборе; N- число групп. Если условие (4.30) не выполняется, то создается новая группа векторов. Для каждой &-той группы вычисляется представительная пара

Обучение нейронной сети

Перед обучением нейронной сети обучающий набор данных нормализуется так, чтобы все значения входных и выходных векторов для нейронной сети ле­жали в диапазоне [-1, 1]. Для определения наиболее эффективного метода обу­чения нейронной сети была проведена предварительная серия численных экс­периментов с использованием различных методов обучения нейронных сетей.

Были проведены эксперименты с использованием: стандартного и адаптив­ного методов обратного распространения ошибки, метода с переменной скоро­стью обучения, метода Левенберга-Марквардта. Из перечисленных методов наименьшее число итераций процесса обучения было получено при использо­вании метода Левенберга-Марквардта, однако, время затрачиваемое на одну итерацию было примерно на два порядка больше других методов из-за большо­го размера обучающего набора данных. Наиболее оптимальным по затратам

вычислительного времени оказался метод адаптивного обратного распростра­нения ошибки (resilient backpropagation),который и был выбран в качестве ме­тода обучения нейронной сети для контроллера робота.

в) Эксперимент

Для проверки предложенного метода обучения управляющего контроллера робота навыку отслеживания направляющей линии был проведен эксперимент с использованием мобильного робота. Для проведения эксперимента был ис­пользован имеющийся в лаборатории искусственного интеллекта факультета электроники и электротехники университета г. Оита (Япония) прототип интел­лектуального сервисного мобильного робота, изображенный на рис.4.10. Дан­ный робот приводится в движение двумя ведущими колесами, с приводами от электродвигателей постоянного тока с широтно-импульсным управлением. Бортовая управляющая система робота включает в себя два персональных ком­пьютера, которые могут обмениваться данными по сети Ethernet. Пройденный ведущими колесами путь и их скорость вращения измеряются круговыми им­пульсными датчиками положения, связанными с осью вращения каждого из ко­лес. Мобильный робот оборудован двумя видеокамерами с возможностью по­ворота вокруг вертикальной и горизонтальной оси. Для считывания видеоизоб­ражений в память одного из управляющих компьютеров используются стан­дартные карты покадрового захвата видеоизображений. Габаритные размеры робота составляют 1.3?0.44?0.5 метров (высотах ширинах длина). Видеокаме­ры установлены на высоте hc = 1,06 м над полом под углом φc = 45° к его плоскости, что обеспечивает перспективное изображение пространства перед роботом с «мертвым пространством» 0,56 м перед его передним бампером.

Управляющий вектор нейросетевого регулятора включает в себя угловые скорости вращения левого ωbи правого ®Rведущих колес

В регуляторе для управления отслеживающим движением робота использо­валась многослойная нейронная сеть с входным, выходным и двумя скрытыми слоями. Входной слой содержал 3 нейрона, выходной — 2 нейрона (по числу компонент входного и управляющего векторов), каждый из двух скрытых слоев содержал 30 нейронов. В нейронах скрытых слоев использовались логарифми­ческие сигмоидальные активационные функции, в выходном слое использова­лась тангенциальная сигмоидальная активационная функция [308].

Рис.4.13. Обучающие траектории.

Обучающий набор данных был собран при помощи обучения робота челове­ком-оператором на наборе обучающих траекторий, включающих левые и пра­вые траектории корректировки ошибки отслеживания направляющей и сбли­жения с ней (рис.4.13). Размер обучающего набора данных после предвари­тельной обработки указанным выше алгоритмом составил N= 302 пар векто­ров. Время обучения нейронной сети составило 8 минут.

Результаты эксперимента показаны на рис.4.14 и 4.15. Во время эксперимен­та, робот, после обучения его навыку управления по направляющей линии от­слеживал имеющую вид вопросительного знака цветную направляющую дли­ной 9 м на полу в помещении лаборатории. На рис.4.14 показаны траектории, полученные при отслеживании роботом направляющей в обоих направлениях, на рис.4.15 изображен график абсолютной ошибки в отслеживании направ­ляющей в ходе проведенного эксперимента. На рис.4.14, 4.15 сравниваются ре­зультаты, полученные с использованием обученного регулятора, с результата­ми, полученными для программно заданного регулятора с фиксированным за­коном управления

Рис.4.14.

Траектории, полученные в ходе эксперимента.

Рис.4.15. Абсолютная ошибка отслеживания траектории.

По приведенным на рис.4.14, 4.15 данным можно отметить, что разница в точности отслеживания направляющей между обученным навыку контролле­ром и контроллером с программно-заданным законом управления достаточно мала. Также можно отметить, что обученный на наборе типовых траекторий нейросетевой регулятор хорошо справился с отслеживанием траекторий, на ко­торых он непосредственно не обучался. Таким образом, можно сделать вывод, что регулятор обучился именно навыку отслеживания направляющих линий, а не отслеживанию какой-либо отдельной направляющей линии. Следует заме­тить, что ошибка отслеживания для графика на рис.4.15 измерялась для точки между ведущими колесами. Таким образом, значительная ее величина для обо­их регуляторов объясняется как результат наличия непросматриваемого каме­

рой «мертвого пространства» перед роботом.

В данном разделе представлена методика обучения контроллера мобильного робота простому навигационному навыку отслеживания направляющей линии на полу. Данная методика может быть использована в качестве одной из мето­дик на которых могут основываться самообучаемые системы управления ин­теллектуальных роботов. Методика позволяет системе управления приобрести навык визуального отслеживания без какой-либо предварительной информации о законе управления. Входной сигнал для системы управления вырабатывается системой машинного зрения с использованием предложенного метода обработ­ки изображения. Обучение навыку происходит с помощью человека-оператора, который собирает обучающий набор данных. После предварительной обработ­ки этот набор данных используется для обучения нейронной сети, являющейся центральным элементом регулятора.

Приведенные экспериментальные результаты показывают, что обученный нейросетевой регулятор способен использовать приобретенный навык для от­слеживания направляющей произвольной формы. Однако следует заметить, что стабильность приведенного алгоритма обучения в большой степени зависит от качества данных в обучающем наборе, а следовательно от выбора обучающих траекторий.

4.4.

<< | >>
Источник: ЛУКЬЯНОВ АНДРЕЙ АНАТОЛЬЕВИЧ. МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ В ПРОБЛЕМЕ ОБЕСПЕЧЕНИЯ ТОЧНОСТИ ДВИЖЕНИЯ И ПОЗИЦИОНИРОВАНИЯ МОБИЛЬНЫХ МАНИПУЛЯЦИОННЫХ РОБОТОВ. ДИССЕРТАЦИЯ на соискание ученой степени доктора технических наук. Иркутск - 2005. 2005

Еще по теме 4.3.3. Реализация навыка отслеживания с помощью обучаемого нейросетевого визуального серворегулятора: