<<
>>

1.2.1 Искусственные нейронные сети в системах распознавания

Нейронные сети [46-48] применяются для решения задач классификации или кластеризации многомерных данных. Несмотря на существенные различия, отдельные типы нейронных сетей обладают несколькими общими чертами.

Первая, основу каждой нейронной сети составляют относительно простые, в большинстве случаев - однотипные, элементы (ячейки), имитирующие работу нейронов мозга.

Второй общей чертой присущей нейронным сетям является принцип параллельной обработки сигналов, который достигается путем объединения большого числа нейронов в так называемые слои и соединения определенным образом нейронов различных слоев, а также, в некоторых конфигурациях, и нейронов одного слоя между собой, причем обработка взаимодействия всех нейронов ведется послойно.

Рис.

1.2. Структура связей однослойной нейронной сети

Теоретически число слоев и число нейронов в каждом слое может быть произвольным, однако фактически оно ограничено ресурсами компьютера или специализированной микросхемы, на которых обычно реализуется нейронная сеть. Чем сложнее нейронная сеть, тем масштабнее задачи, подвластные ей.

Процесс функционирования нейронной сети зависит от величин синап- тических связей, поэтому, задавшись определенной структурой нейронной сети, отвечающей какой-либо задаче, необходимо найти оптимальные значения всех переменных весовых коэффициентов (некоторые синаптические связи могут быть постоянными). Этот этап называется обучением нейронной сети, и от того, насколько качественно он будет выполнен, зависит способность сети решать поставленные перед ней проблемы во время эксплуатации.

Нейронные сети давно и успешно применяются для решения многих задач распознавания. Преимуществом использования нейросетей для решения задачи обнаружения лица является возможность получения классификатора, хорошо моделирующего сложную функцию распределения изображений лиц р(х | face).

Недостатком является необходимость в тщательной и кропотливой настройке нейронной сети для получения удовлетворительного результата классификации.

Основные преимущества, которыми обладают нейронные сети следующие.

Настройка нейронной сети для решения определённой задачи производиться в процессе обучения на наборе тренировочных примеров. Таким образом, не требуется вручную определять параметры модели (выбирать ключевые признаки, учитывать их взаимоотношение и т. п.) - нейронная сеть извлекает параметры модели автоматически наилучшим образом в процессе обучения. Необходимо только построить тренировочную выборку. В задачах классификации при этом происходит неявное выделение ключевых признаков внутри сети, определение их значимости и системы взаимоотношений между признаками. В настоящее время разработаны мощные, гибкие и универсальные механизмы обучения различных типов нейронных сетей. Кроме того, архитектура нейронной сети и процедура обучения позволяет гибкую настройку на конкретную решаемую задачу. Для большинства нейронных сетей процедура обучения является эвристическим алгоритмом, что с одной стороны обеспечивает приемлемость получаемых решений, а с другой стороны не требует непомерных вычислительных ресурсов. Существуют три парадигмы обучения: "с учителем", "без учителя" (самообучение) и смешанная. В первом случае нейронная сеть располагает правильными ответами (выходами сети) на каждый входной пример. Веса настраиваются так, чтобы сеть выдавала ответы как можно более близкие к известным правильным ответам. Усиленный вариант обучения с учителем предполагает, что известна только критическая оценка правильности выхода нейронной сети, но не сами правильные значения выхода. Обучение без учителя не требует знания правильных ответов на каждый пример обучающей выборки. В этом случае раскрывается внутренняя структура данных или корреляции между образцами в системе данных, что позволяет распределить образцы по категориям. При смешанном обучении часть весов определяется посредством обучения с учителем, в то время как остальная получается с помощью самообучения.

Нейронные сети обладают хорошей обобщающей способностью.

Это значит, что опыт, полученный в процессе обучения на конечном наборе образов, нейронная сеть может успешно применять на всё множество образов. Кроме интерполяционных обобщающих способностей, нейронные сети, могут хорошо экстраполировать, то есть применять свой опыт на качественно иные образы, чем те, которые встречались в обобщающей выборке.

Нейронные сети не требуют ни наложения каких-либо ограничений на тренировочную выборку, ни полагаются на то, что она обладает какими-либо априорными свойствами, в отличие, например, от статистических методов. Не требуется никакого предварительного изучения характера данных. Нейронная сеть принимает тренировочный набор «как есть» и учится производить правдоподобное решение, не претендуя на абсолютную истину. То есть, строится наилучшая нефизическая модель, которая не является максимально точным соот-ветствием реального процесса, но даёт приемлемую его аппроксимацию. Имеется ряд примеров, когда нейронные сети показывали себя лучше статистических методов. Кроме того, в статистике не имеется аналогов некоторых нейро- сетевых методов, таких, например как карты Кохонена, машина Больцмана, и, что важно для распознавания изображений - когнитроны.

Естественным образом архитектура нейронных сетей реализуется на параллельных вычислительных средствах: специализированных микросхемах, оптических и квантовых компьютерах. Это открывает широкие перспективы применения нейронных сетей в будущем. Нейронная сеть характеризуется нечётким и распределённым хранением информации. То есть, нет отдельного нейрона, отвечающего за какое-либо понятие или признак, и удаление или искажение работы этого нейрона не приведёт к фатальным последствиям.

Но, несмотря на все достоинства, применение нейронных сетей к изображениям требует специальных усилий. Это связано в первую очередь со сложным характером изображений, особенно изображений трёхмерных объектов реального мира, какими и являются лица людей.

Для решения задачи обнаружения лица на изображении применялось большое количество нейронных сетей различных архитектур, рассмотрим вкратце основные из них:

<< | >>
Источник: Макаренко Алексей Александрович. Алгоритмы и программная система классификации полутоновых изображений на основе нейронных сетей: диссертация... кандидата технических наук: 05.13.18. - Москва: РГБ, 2007. 2007

Еще по теме 1.2.1 Искусственные нейронные сети в системах распознавания:

  1. 1.2.1 Искусственные нейронные сети в системах распознавания
  2. Свёрточные нейронные сети
  3. 2 Разработка топологии искусственной нейронной сети для задач выделения сюжетной части изображения
  4. 2.1.2 Топология свёрточной нейронной сети
  5. 2.2 Алгоритм обучения нейронной сети для ускоренной сходимости обучения
  6. Стадник Алексей Викторович. Использование искусственных нейронных сетей и вейвлет-анализа для повышения эффективности в задачах распознавания и классификации, 2004
  7. 1.1. Искусственные нейронные сети. Их основные типы, используемые в физике.
  8. 1.2.11 Нейронные сети, обучаемые по методу имитации отжига.
  9. Нейронные сети
  10. Архитектура нейронной сети
  11. ИСКУССТВЕННЫЕ НЕЙРОННЫЕ СЕТИ СЕГОДНЯ
  12. Глава 1. Основы искусственных нейронных сетей
  13. ОДНОСЛОЙНЫЕ ИСКУССТВЕННЫЕ НЕЙРОННЫЕ СЕТИ
  14. МНОГОСЛОЙНЫЕ ИСКУССТВЕННЫЕ НЕЙРОННЫЕ СЕТИ
  15. ТЕРМИНОЛОГИЯ, ОБОЗНАЧЕНИЯ И СХЕМАТИЧЕСКОЕ ИЗОБРАЖЕНИЕ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ
  16. ПЕРСЕПТРОНЫ И ЗАРОЖДЕНИЕ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ