Расстояния и меры близости между объектами
Меры близости отличаются от расстояний тем, что они тем больше, чем более похожи объекты.
Пусть имеются два объектаX = (Хъ ..., Xm) и Y = (Yb ..., Ym).
Используя эту запись для объектов, определим основные виды расстояний, используемых в процедуре CLUSTER:Евклидово расстояние d(Х,Y) = -Yi) (Euclidian distance).
Квадрат евклидова расстояния d(x,Y)=?(xi -Yi) (Squared
i=1
Euclidian distance).
Эвклидово расстояние и его квадрат целесообразно использовать для анализа количественных данных.
Мера близости - коэффициент корреляции
S(X,Y)= (ZZxZ^)/ (m - 1),
i =1
где Zx. и ZY. компоненты стандартизованных векторов X и Y. Эту меру
целесообразно использовать для выявления кластеров переменных, а не объектов.
Расстояние хи-квадрат получается на основе таблицы сопряженности, составленной из объектов X и Y,
X X! у X. Y Yi Y
m Y. X+Y XJ+YJ X +Y
^-m 1 1 m X.+Y. которые, предположительно, являются векторами частот. Здесь рассматриваются ожидаемые значения элементов, равные E(X) = X. х (X+ Y,) /(X. + Y.) и E(Y) = Y. х (Xi + Y) / (X. + Y.), а расстояние хи-квадрат имеет вид корня из соответствующего показателя
d (X ,Y ) =
22 Г (X, - E(X,)) +Г (Y, - E(Y,))
1 E(X,) Й E(Y,)
Расстояние Фи-квадрат является расстоянием хи-квадрат, нормированным на число объектов в таблице сопряженности, представляемой строками X и Y, т. е. на корень квадратный из N = X. + Y. .
В иерархическом кластерном анализе в SPSS также имеется несколько видов расстояний для бинарных данных (векторы X и Y состоят из нулей и единиц, обозначающих наличие или отсутствие определенных свойств объектов). Наиболее естественными из них, по-видимому, являются евклидово расстояние и его квадрат.
Еще по теме Расстояния и меры близости между объектами:
- 1.2.2. Определение. Расстоянием между элементами x,y нормированного пространства L называется
- 1.5.4. Пример. Найти кратчайшее расстояние между кривыми и .
- Меры противопожарной защиты производственных объектов
- Меры, направленные на устранение разногласий между участниками гражданских правоотношений, возникающих при
- Раздел 4. Меры связи между признаками
- 308. Какие меры может предпринять подрядчик в случае уклонения заказчика от приемки завершенного строительством объекта?
- 2.3 Статистические способы описания взаимосвязей между составляющими объекта измерения
- Гносеологический анализ и исследование знакового посредника между субъектом и объектом познания
- Лекция 4. Слово как основная единица языка и объект изучения лексикологии. Отношения между словами
- Исходная матрица расстояний
- 2.1.4 Методы классификации данных, основанные на использовании функции расстояния.
- Измерение расстояний и площадей по карте
- Статья 3. Меры по расследованию и меры обеспечения
- 6. За игрой следует второй пограничный случай — близость
- Глава 3. Меры защиты и меры ответственности по договору займа
- 5.4. Вычисление квадратичного критерия близости