<<
>>

2.3. Разработка методов классификации качества и пригодности технологических процессов 2.3.1. Дискриминантный анализ в задаче классификации с учетом коррелированности показателей  

Основой построения процедуры классификации процесса на «качественный» и «некачественный» в соответствии с анализом построенных карт контроля качества является минимизация ошибочной классификации.
К ним относятся байесовская модель классификации и общие регрессионные модели оценивания. Но суть одна: по результатам множества карт контроля качества необходимо дать оценку, т.е. отнести текущее состояние процесса к одной из ранее сформированных групп.

Наблюдения за выполнением экспертизы по картам контроля качества определяются количеством данных заключений xi,x2,...,xp, которые представляют вектор:

Х=(хьх2,...,хр).              (2.43)

62

Предполагается что группа испытуемых образцов с одинаковым уровнем качетсва характеризуется многомерным нормальным распределением   W^rNim^J)^),   где  тк—(т^\, mk2,...,mkp)   -   математическое

ожидание W^. a D;

ст

kij

дисперсионная матрица W^.

В случае классификации на две группы ошибки могут быть в случае если: X принадлежит W2, но его относят к W\, и в результате будет совершена ошибка, вероятность которой обозначим Р(1|2); X принадлежит W\„ но его относят к W2, и в результате будет совершена ошибка, вероятность которой обозначим Р(2\\). Иллюстрация ошибок классификации показана на рис.2.2.

Вероятности ошибочной классификации

x-W.

x-Wn

Рис. 2.2.

Дискриминантная функция zпредставляет линейную комбинацию результатов наблюдений:

z=ql\X\+ а2х2 + ... + 0CnXn,              (2.44)

где ocj - набор постоянных весовых коэффициентов. Дискриминантную функцию можно рассматривать как балл, полученный при оценке качества и наличии весов для каждого уровня качества.

Процедура классификации заключается в подборе константы с и отнесении Хк }f|, если zgt;c; и к W2, если zlt;c.

Задача классификации сводится

63

к  определению  значений   щ  и  с,  для  которых   вероятность  ошибочной классификации минимальна. В связи с этим возникают следующие вопросы:

  1. Какие веса взять для лучшей классификации?
  1. Какое пороговое значение с выбрать для разделения «качественный», «некачественный»?

В общем случае эта задача является двухкритериальной оптимизационной. Ищется значение, которое максимизирует разность математических ожиданий и одновременно минимизирует дисперсию разности. В качестве свертки критериев используется расстояние Махалонобиса:

А2=(щ-т11(245)

Dz

На основании введенного критерия, двухкритериальная задача переходит в обычную задачу оптимизации, т.е. выбора значений а;, минимизирующих значение функции А2.

Решение этой задачи оптимизации является решением системы линейных уравнений:

а,а J! + а2а12 +... + ара1р =ти- /и21

ajO"21 + СС2С722 + •" + ap(J2p= W21 — т22

(2.46)

La,apl + а2ар2 +... + apGpp= тр1 - тр2

После определения а; наблюдаемому вектору X ставится в соответствие значение дискриминантной функции z.

Константа с выбирается из соображений минимизации вероятности ошибочной классификации. Сумма вероятностей ошибочных классификаций Р(2\\)+Р(\\2) минимальна при выборе константы с:

Mz, + Mz^

с =              Ї              ?-.              (2.47)

64

Таким образом, найденные из соотношений (2.45) и (2.47) значения otj и с полностью решают задачу классификации.

В качестве оценки влияния коррелированности ответов рассмотрим пример для четырех уровней. Пусть разность математических ожиданий баллов тестируемых образцов для двух групп по каждому уровню равна:

ДМ=(1, 1, 1, 1).              (2-48)

И корреляции между результатами оценки показателей также отсутствует, тогда для весов заданий справедливо:

Л=(1, 1, 1, О,              С2-49)

т.е.

все веса равны. Это объясняется равенством разностей математических ожиданий в данном гипотетическом случае. Если же сделать предположение о наличии даже небольших корреляций, то тогда:

D =

10              0              0

0     1              0.2              0

0    0.2              1              0

0     0              0              1

;(2.50)

Т.е. в данном случае только между заключениями по оценке качества второго и третьего уровня имеется корреляция 0,2. В этом случае решение уравнений для весов будет:

Л=(1, 0,83, 0,83, 1).              (2-51)

В     данном    случае    видно     существенное     снижение    весов    для

коррелированных заданий.

Однако   в   реальной   ситуации   необходимы   более   точные   разности

математических ожиданий правильных заключений на различных уровни

качества.

65

Вероятности положительных результатов

РЬ

о

2345

Pi

Рис. 2.3.

Пусть экспертиза содержит по 25 опросных карт каждого уровня N=(25, 25, 25, 25). Всего оценок - 100. В качестве уровней качества взяты значения Р=(2, 3, 4, 5). В качестве уровня качества 0i=3, 02=4. Кроме того выполнена нормировка весов для того, что максимальных балл по экспертизе был равен 100. На рис.2.3. приведены графики логистических кривых для выбранных параметров групп и параметров качества.

Так, для некоррелированных ответов значения весов будут равны:

Л=(0,42, 0,62, 1,19, 1,76) и с=34.              (2-52)

Для той же корреляционной матрицы D в данном случае параметры процедуры классификации будут равны:

Л=(0,45, о,51, 1,14, 1,9) и с=32,5.              (2-53)

В результате корреляция между идентификацией второго и третьего

уровня качества снизила их весомость в общей оценке.

Перераспределение опросов на N=(2, 25, 25, 2) с той же корреляционной

матрицей приводит к следующим значениям:

Л=(1,0, 1,1, 2,5, 4,1) и с=41,5.              (2-54)

Таким  образом,   несмотря   на  сокращение   проверок  пониженным   и

повышенным   качеством   для   оптимальной   классификации   существенно

изменился вес самых высоких уровней качества. Если корреляция отсутствует, то:

66

Л=(0,85, 1Д5, 2,4, 3,5) и с=43.              (2-55)

Таким образом, показано, что корреляция и распределение проверок для различных уровней качества существенно влияют на параметры алгоритма классификации. Имея статистические данные можно вычислить все корреляции и в процедуре классификации заменить дисперсионную матрицу ее оценкой, что повысит эффективность процедур классификации с точки зрения вероятности ошибочной классификации процесса на «качественный» и «некачественный».

 

<< | >>
Источник: ПАРШИН ДМИТРИЙ АЛЕКСАНДРОВИЧ. АВТОМАТИЗАЦИЯ СИСТЕМЫ ЭКСПЕРТНОГО ОЦЕНИВАНИЯ КАЧЕСТВА ТЕХНОЛОГИЧЕСКИХ ПРОЦЕССОВ В НЕПРЕРЫВНОМ ПРОИЗВОДСТВЕННОМ ЦИКЛЕ ПРОМЫШЛЕННЫХПРЕДПРИЯТИЙ.  ДИССЕРТАЦИЯна соискание ученой степени кандидата технических наук.Москва - 2008. 2008

Еще по теме 2.3. Разработка методов классификации качества и пригодности технологических процессов 2.3.1. Дискриминантный анализ в задаче классификации с учетом коррелированности показателей  :

  1. Глава 2. Разработка модели функционирования и методик оценки перевозочного процесса в логистической сети «Нефтебаза - АЗС»
  2. 3. РАЗРАБОТКА МЕТОДОВ ОЧИСТКИ СТЕНОК ТЕПЛОВЫХ СЕТЕЙ И ТЕПЛООБМЕННЫХ ПОВЕРХНОСТЕЙ КОТЛОВ МОДУЛЬНЫХ КОТЕЛЬНЫХ ОТ ОТЛОЖЕНИЙ
  3. 1.3.2. Методы классификации с предварительной обработкой сигнала
  4. 2.1 Методы классификации данных.
  5. 2.1.2 Методы классификации данных, использующие понятие дистанционной меры и нечеткого множества.
  6. 2.1.4 Методы классификации данных, основанные на использовании функции расстояния.
  7. Иерархический метод классификации
  8. Подсистема управления качеством ресурсного обеспечения учебного процесса.
  9. СОДЕРЖАНИЕ
  10.   1.     СИСТЕМНЫЙ     АНАЛИЗ     МЕТОДОВ      ЭКСПЕРТНОГО ОЦЕНИВАНИЯКОНТРОЛЯКАЧЕСТВА ТЕХНОЛОГИЧЕСКИХ ПРОЦЕССОВ
  11. 1.2.2. Анализ методов и моделей построения систем оценки контроля качества технологических процессов