4.1.4. Команда MEANS - сравнение характеристик числовой переменной по группам
MEANS TABLES = v14 BY v11 BY v8 /CELLS MEAN STDDEV MEDIAN COUNT /STATISTICS ANOVA.
В команде указывается список зависимых переменных, BY и список переменных, определяющих группы. Каждое дополнительное слово BY порождает следующий нижний уровень группирования, в диалоговом режиме слову BY соответствует кнопка Next.
Анализ результатов (табл. 4.8) позволяет сделать следующие выводы. Самый высокий среднемесячный доход (332 р.) имеют разведенные мужчины, при этом он значительно превосходит среднемесячный доход, полученный всеми разведенными (249 р.) и всеми мужчинами (238 р.). На втором месте по доходам находятся вдовцы (276 р.), но их всего 5 человек, поэтому цифра ненадежна. Среди женщин наиболее высокие среднемесячные доходы (226 р.) у состоящих в браке, что почти равно доходам женатых мужчин. Это естественно - ведь это же душевой доход в семье.
Мы можем сколько угодно описывать эту таблицу, но описание не будет доказательством какой-либо истины, пока оно не подтверждено статистическим выводом. Такая таблица может быть только источником гипотез о взаимосвязи, которые в дальнейшем следует проверить.
Одномерный дисперсионный анализ здесь проводится только по переменным первого уровня задания групп.
Напомним, что суть этого анализа состоит в вычислениии межгруппового квадратичныого разброса зависимой переменной SSe (Between groups) и внутригруппового разброса, обозначается SSw (Within groups).
ВеличинаSSe характеризует, насколько сильно отклонились от общего среднего средние между группами, а SSW — отклонения от центров групп. Статистика
SSb / k
F = - в условиях гипотезы равенства средних и дисперсии рас-
SSW /(n - k)
пределения при нормальном распределении X в группах имеет распределение Фишера. F представляет собоИ в определенном смысле расстояние наблюдаемой таблицы от таблицы, в которой нет никаких зависимостей, т. е. средние в группах совпадают. Чем больше F, тем существеннее зависимость, однако сама по себе величина F ни о чем не говорит. Ответ на вопрос дает, как обычно, величина наблюдаемой значимости F-критерия: Significance - вероятность случайно получить значение F, большее выборочного Sig = P{F >FBbI&}.
Таблица 4.8
Среднемесячный душевой доход в семье V11 Состояние в браке V8 Пол Mean Std. Deviation Median N 1 женат 1 муж. 228,4 152,9 200 271 2 жен. 225,7 140,8 200 242 Total 227,1 147,2 200 513 2 вдовец 1 муж.
жен. 276,0 192,8 111,0 112,7 270 155 5 20 Total 209,4 115,1 168 25 3 разведен 1 муж.
жен. 331,9 195,9 230,0 86,1 295 180 16 25 Total 249,0 169,7 200 41 4 не был 1 муж.
жен. 263,3 212,2 223,0 118,6 200 200 41 34 Total 240,2 183,9 200 75 Total 1 муж. 238,4 167,8 200 333 2 жен. 219,9 133,4 200 321 Total 229,3 152,0 200 654 Еще раз обратим внимание на то, что в таком анализе используется предположение о нормальности распределения зависимой переменной. Не следует проводить непосредственно дисперсионный анализ переменных с существенно отличающимся от нормального распределением.
В табл. 4.9. приведена выдача одномерного дисперсионного анализа после выполнения команды
MEANS TABLES = lnv14m BY v11 BY v8 /STATISTICS ANOVA.
Наблюдаемый уровень значимости 0,707 свидетельствует о том, что на наших данных указанным методом связь не обнаруживается.
Таблица 4.9
Результаты однофакторного дисперсионного анализа Sum of Squares df Mean Square F Sig. LNV14M Лога-рифм душевого дохода * V11 Со-стояние в браке Between Groups Within Groups Total 0,40 188,51 188,92 3
650 653 0,13 0,29 0,465 0,707
Еще по теме 4.1.4. Команда MEANS - сравнение характеристик числовой переменной по группам:
- 4.1. Compare Means - простые параметрические методы сравнения средних
- Инновационная группа (команда)
- Числовые характеристики случайных величин
- 11. Правовое положение групп населения в древней Вавилонии в сравнении с аналогичными группами населения в Ассирии и Хеттии.
- 6.7. Числовые характеристики функций случайных величин.
- 2.2. Числовые характеристики распределения данных
- 3.4. Числовые характеристики случайных величин.
- 3.1. Команды получения распределений и описательных статистик3.1.1. FREQUENCIES - получение одномерных распределений переменных
- Глава 7. Построение эффективных групп и команд.
- Числовые характеристики случайных величин
- Характеристики команд.
- 1.2. Числовые характеристики случайных величин