7.1.1. Метод главных компонент

Один из наиболее распространенных методов факторного анализа - метод главных компонент - состоит в последовательном поиске факторов. Вначале ищется первый фактор, который объясняет наибольшую часть дисперсии, затем не зависимый от него второй фактор, объясняющий наибольшую часть оставшейся дисперсии, и т.

д. Описание всей математики построения факторов слишком сложно, поэтому для пояснения сути мы прибегнем к зрительным образам (рис. 7.2).

Рис. 7.2. Главные компонент

Геометрически это выглядит следующим образом. Для построения первого фактора берется прямая, проходящая через центр координат и облако рассеяния данных. Объектам можно сопоставить расстояния их проекций на эту прямую до центра координат, причем для одной из половин прямой (по отношению к нулевой точке) можно взять эти расстояния с отрицательным знаком. Такое построение представляет собой новую переменную, которую мы назовем осью. При построении фактора отыскивается такая ось, чтобы ее дисперсия была максимальна. Это значит, что данной осью объясняется максимум дисперсии переменных. Найденная ось после нормировки используется в качестве первого фактора. Если облако данных вытянуто в виде эллипсоида (имеет форму «огурца»), фактор совпадет с направлением, в котором вытянуты объекты, и по нему (по проекциям) с наибольшей точностью можно предсказать значения исходных переменных.

Для поиска второго фактора опре-

деляется ось, перпендикулярная первому фактору, также объясняющая наибольшую часть дисперсии, не объясненную первой осью. После нормировки эта ось становится вторым фактором. Если данные представляют собой плоский эллипсоид («блин») в трехмерном пространстве, два первых фактора позволяют в точности описать эти данные.

Максимально возможное число главных компонент равно количеству переменных.

Сколько главных компонент необходимо построить для оптимального представления рассматриваемых исходных факторов?

Обозначим Xk объясненную главной компонентой Fk часть суммарной дисперсии совокупности исходных факторов. По умолчанию в пакете предусмотрено продолжение построения факторов до тех пор, пока Хк >1. Напомним, что переменные стандартизованы, и поэтому нет смысла строить очередной фактор, если он объясняет часть дисперсии, меньшую, чем приходящаяся непосредственно на одну переменную. При этом следует учесть, что Х1 > Х2 > Х3, ... .

К сведению читателя заметим, что значения Xk являются также собственными значениями корреляционной матрицы Xl, поэтому в выдаче они будут помечены текстом EIGEN VALUE, что в переводе означает «собственные значения».

Заметим, что техника построения главных компонент расходится с теоретическими предположениями о факторах: имеется m + n независимых факторов (включая уникальные), полученных методом главных компонент в n-мерном пространстве, что невозможно.

<< | >>

↑

Источник: Ковалева Г.Д., Ростовцев П.С.. Анализ социологических данных с применением статистического пакета SPSS. 2002

Еще по теме 7.1.1. Метод главных компонент:

- Анализ социологических данных - Основы социологии - Социология журналистики - Социология управления -

- Архитектура и строительство - Безопасность жизнедеятельности - Библиотечное дело - Бизнес - Биология - Военные дисциплины - География - Геология - Демография - Диссертации России - Естествознание - Журналистика и СМИ - Информатика, вычислительная техника и управление - Искусствоведение - История - Культурология - Литература - Маркетинг - Математика - Медицина - Менеджмент - Педагогика - Политология - Право России - Право України - Промышленность - Психология - Реклама - Религиоведение - Социология - Страхование - Технические науки - Учебный процесс - Физика - Философия - Финансы - Химия - Художественные науки - Экология - Экономика - Энергетика - Юриспруденция - Языкознание -