<<
>>

5.1.1. Тест хи-квадрат

Критерий хи-квадрат основан на статистике

* 2=T(Ni - Et У/Et,

i

где Et = Pt x N - ожидаемая частота t-го значения переменной, Nt - расчетная. Теоретическое распределение этой статистики при больших N совпадает с распределением хи-квадрат.

Число степеней свободы теоретического распределения полагается равным к - 1, где к - число значений исследуе-

мой переменной. Эмпирическое правило говорит о том, что некорректно применять критерий, если ожидаемые частоты меньше 5, поскольку его распределение в этом случае не будет близко к теоретическому. Но использование точных методов вычисления значимости (метод Монте-Карло) позволяет избежать этого ограничения.

Пример. Пусть согласно статистическим данным 30 % трудоспособного населения имеет возраст до 30 лет, 30 % от 30 до 40 лет и 40 % свыше 40 лет. Соответствует ли выборочное распределение признака «возраст» в обследовании «Курильские острова» распределению возраста в генераль-ной совокупности?

RECODE v9 (1 THR 30 = 1)(31 THR 40 = 2)(41 THRU HI = 3) INTO w9.

NPAR TESTS /CHISQUARE = W9 /EXPECTED 3 3 4.

Подкоманда /CHISQUARE задает тестируемую переменную; в подкоманде /EXPECTED задаем через пробел ожидаемые пропорции распределения.

Выполнение этих команд позволяет получить значение критерия и оценить степень соответствия нашей выборки распределению генеральной совокупности (табл. 5.1, 5.2).

Таблица 5.1

Наблюдаемые и ожидаемые частоты Observed N Expected N Residual 1 175 210 -35 2 225 210 15 3 300 280 20 Total 700 Таблица 5.2

Статистика хи-квадрат W9 Chi-Square 8,333 Df 2 Asymp. Sig. 0,016 Анализируя табл. 5.1, уже по отклонениям расчетных значений от ожидаемых (см. столбец Residual), видим, что эмпирическое распределение сильно отличается от теоретического. Достаточно высокое значение критерия (Chi-Square = 8,333, табл.

5.2) малоинформативно. Ответ о совпадении

нашего распределения с теоретическим заключен в анализе наблюдаемого уровня значимости. Его малая величина (Asymp. Sig. = 0,016) показывает, что полученные отклонения значимы: вероятность получить большие значения хи-квадрат равна 1,6 %, гипотеза о соответствии выборки указанной генеральной совокупности может быть отвергнута на уровне значимости 5 %.

Таким образом, для данного случая тест показал существенное различие теоретического и эмпирического распределений.

Приведем пример применения метода статистического моделирования Монте-Карло. В этом примере производится 100 000 экспериментов по моделированию выборки из генеральной совокупности с заданными вероятностями (p1 = 0,3, p2 = 0,3, p3 = 0,4):

NPAR TEST /CHISQUARE = w9 /EXPECTED = 3 3 4 /METHOD = MC CIN(99) SAMPLES(10 0 0 0 0).

Естественно, при такой большой выборке был получен тот же результат (табл. 5.3). Уровень значимости оценивается этим методом приближенно, на основании статистических экспериментов - чем больше экспериментов, тем точнее. Поскольку оценка значимости получена на основе случайных экспериментов, выдается доверительный интервал для уровня значимости (99 %-й по умолчанию). Точечная оценка наблюдаемого уровня значимости (Monte Carlo Sig) совпадает с асимптотической оценкой (Asymp. Sig., табл. 5.3), «оптимистическая» нижняя граница равна 0,015, «пессимистическая» верхняя - 0,017. Таким образом, во всех отношениях отклонение распределения значимо.

Таблица 5.3

Значимость критерия хи-квадрат W9 Chi-Square 8,333 Df 2 Asymp. Sig. 0,016 Monte Carlo Sig Sig. 0,016 99 % Confidence Interval Lower Bound 0,015 Upper Bound 0,017

<< | >>
Источник: Ковалева Г.Д., Ростовцев П.С.. Анализ социологических данных с применением статистического пакета SPSS. 2002

Еще по теме 5.1.1. Тест хи-квадрат:

  1. Тестирование. Типы тестов. Тест Томаса, тест на определение стиля управления, методика «Психологическое время личности» А. Кроника, методика исследования самооценки С.А Будасси, методика Т. Лири, методика «Личностная агрессивность и конфликтность» Е.П. Ильина и П.А. Ковалева, тест ценностных ориентаций М. Рокича.
  2. «Логический квадрат»
  3. 4.2. Класифікація суджень за «логічним квадратом»
  4. Метод наименьших квадратов.
  5. Метод наименьших квадратов
  6. Умозаключение по логическому квадрату
  7. 4.5. Метод наименьших квадратов.
  8. 2.4. Отношения между суждениями по истинности. Логический квадрат
  9. 1.10. Выделение полного квадрата, как метод решения некоторых нестандартных задач
  10. 2.8. Построение квадратичной регрессионной модели по методу наименьших квадратов
  11. Определение параметров функциональной зависимости методом наименьших квадратов
  12. Метод наименьших квадратов
  13. 4. 1. Метод наименьших квадратов
  14. 6.5. Распределение квадрата случайной величины.
  15. Подготовка к интервью, или квадрат успеха