2.8 Оцифровка нечисловых данных.
(x) ¦ 1 7
каждой из них присвоена числовая метка cj , j - 1,..., tx, при этом выпол-
нены условия центрированности и нормированное™ меток: n 1 n
Е-0; n Е^)2 -l,
i=1 i=1
где r(i) - номер градации иризиака x для i-ro объекта.
Рассмотрим только оцифровку данных для задач сокращения размерностей. Критерий поиска оптимальных меток - максимизация
Q - Е Р2,3, i Пусть теперь все признаки x(1),..., x(p) разбиты та две группы - X1 из q признаков, подлежащих оцифровке и X2 из р - q признаков, которые уже оцифрованы. Соответственно разбито и Q - сумма коэффициентов корре- X1 X1 X2 Q - Q1 + Q1,2 + Q2. Q2 В заключение рассмотрим числовой пример, связанный с 12 посетителями кафе (см выше). В следующей ниже таблице приведены рассчитанные метки:
хз Х4 Х5
1 0,89 -0,51 0,62
2 -0,46 0,61 0,53
3 -0,03 -0,49 0,51
4 - 0,38 -0,29
[2] Сумма квадратов коэффициентов корреляции 5,5541. Отметим, что до оцифровки она была равна 2,719.