<<
>>

Расстояния и меры близости между объектами

. У нас нет возможности сделать полный обзор всех коэффициентов, поэтому остановимся лишь на характерных расстояниях и мерах близости для определенных видов данных.

Меры близости отличаются от расстояний тем, что они тем больше, чем более похожи объекты.

Пусть имеются два объектаX = (Хъ ..., Xm) и Y = (Yb ..., Ym).

Используя эту запись для объектов, определим основные виды расстояний, используемых в процедуре CLUSTER:

Евклидово расстояние d(Х,Y) = -Yi) (Euclidian distance).

Квадрат евклидова расстояния d(x,Y)=?(xi -Yi) (Squared

i=1

Euclidian distance).

Эвклидово расстояние и его квадрат целесообразно использовать для анализа количественных данных.

Мера близости - коэффициент корреляции

S(X,Y)= (ZZxZ^)/ (m - 1),

i =1

где Zx. и ZY. компоненты стандартизованных векторов X и Y. Эту меру

целесообразно использовать для выявления кластеров переменных, а не объектов.

Расстояние хи-квадрат получается на основе таблицы сопряженности, составленной из объектов X и Y,

X X! у X. Y Yi Y

m Y. X+Y XJ+YJ X +Y

^-m 1 1 m X.+Y. которые, предположительно, являются векторами частот. Здесь рассматриваются ожидаемые значения элементов, равные E(X) = X. х (X+ Y,) /(X. + Y.) и E(Y) = Y. х (Xi + Y) / (X. + Y.), а расстояние хи-квадрат имеет вид корня из соответствующего показателя

d (X ,Y ) =

22 Г (X, - E(X,)) +Г (Y, - E(Y,))

1 E(X,) Й E(Y,)

Расстояние Фи-квадрат является расстоянием хи-квадрат, нормированным на число объектов в таблице сопряженности, представляемой строками X и Y, т. е. на корень квадратный из N = X. + Y. .

В иерархическом кластерном анализе в SPSS также имеется несколько видов расстояний для бинарных данных (векторы X и Y состоят из нулей и единиц, обозначающих наличие или отсутствие определенных свойств объектов). Наиболее естественными из них, по-видимому, являются евклидово расстояние и его квадрат.

<< | >>
Источник: Ковалева Г.Д., Ростовцев П.С.. Анализ социологических данных с применением статистического пакета SPSS. 2002

Еще по теме Расстояния и меры близости между объектами:

  1. 1.2.2. Определение. Расстоянием между элементами x,y нормированного пространства L называется
  2. 1.5.4. Пример. Найти кратчайшее расстояние между кривыми и .
  3. Меры противопожарной защиты производственных объектов
  4. Меры, направленные на устранение разногласий между участниками гражданских правоотношений, возникающих при
  5. Раздел 4. Меры связи между признаками
  6. 308. Какие меры может предпринять подрядчик в случае уклонения заказчика от приемки завершенного строительством объекта?
  7. 2.3 Статистические способы описания взаимосвязей между составляющими объекта измерения
  8. Гносеологический анализ и исследование знакового посредника между субъектом и объектом познания
  9. Лекция 4. Слово как основная единица языка и объект изучения лексикологии. Отношения между словами
  10. Исходная матрица расстояний
  11. 2.1.4 Методы классификации данных, основанные на использовании функции расстояния.
  12. Измерение расстояний и площадей по карте
  13. Статья 3. Меры по расследованию и меры обеспечения
  14. 6. За игрой следует второй пограничный случай — близость
  15. Глава 3. Меры защиты и меры ответственности по договору займа
  16. 5.4. Вычисление квадратичного критерия близости