6.2.5. Пример логистической регрессии и статистики
В качестве примера по данным RLMS изучим, как связано употребление спиртных напитков с зарплатой, полом, статусом (ранг руководителя), курит ли он.
Для этого подготовим данные: выберем в обследовании RLMS население старше 18 лет, сконструируем индикаторы курения (smoke) и употребления спиртных напитков (alcohol) (в обследовании задавался вопрос «Употребляли ли Вы в течение 30 дней алкогольные напитки»):COMPUTE filter $ = (vozr>18).
FILTER BY filter $.
COMPUTE smoke = (dm71 = 1).
VAL LAB smoke 1 "курит" 0 "не курит".
COMPUTE alcohol = (dm80 = 1).
VAL LAB alcohol 1 "пьет" 0 "не пьет".
Укрупним переменную dj10 (зарплата на основном рабочем месте). В данном случае группы по значениям этой переменной в основном достаточно наполнены. С методической целью покажем один из способов укрупнения. Для этого вначале получаем переменную wage, которая содержит номера децилей по зарплате, затем среднюю зарплату по этим децилям (см. табл. 6.5). Это осуществляется приведенной ниже программой:
MISSING VALUES dj6.0 (9997,9998,9999) dj10(99997,99998,99999).
RANK VARIABLES = dj10 (A) /NTILES (10) into wage /PRINT = YES /TIES = MEAN .
MEANS TABLES = dj10 BY wage /CELLS MEAN,
в результате которой получается
Таблица 6.5
Средняя зарплата по децилям WAGE децили зарплаты 1 2 3 4 5 6 7 8 9 10 DJ10 зарплата за 30 дней 1,01 2,11 3,07 4,16 5,42 7,03 8,53 11,08 15,65 34,64
Полученные средние используем для формирования переменной, соответствующей укрупненной зарплате (для удобства, чтобы коэффициенты регрессии не были слишком малы, в качестве единицы ее измерения возьмем сто рублей).
RECODE wage (1 = 1.01) (2 = 2.11) (3 = 3.07) (4 = 4.16) (5 = 5.42) (6 = 7.03) (7 = 8.53) (8 = 11.08) (9 = 15.65) (10 = 34.64).
RECODE dj6.0 (SYSMIS = 4)(1 THRU 5 = 1)(6 thru 10 = 2) (10 THRU HI = 3) INTO manag.
VAR LAB manag "статус" wage "заработок".
VAL LAB manag 4 "не начальник" 1 "шеф" 2 "начальничек" 3 "начальник".
EXEC.
Далее формируем переменную manag («статус») из переменной dj6.0 - «количество подчиненных».
Запускаем команду построения регрессии LOGISTIC REGRESSION, в которой использованы переменные wage - зарплата, manag - статус, dh5 - пол (1 - мужчины, 2 - женщины) smoke - курение (1 - курит, 0 - не курит), dh5D wage - «взаимодействие» пола с зарплатой (для женщин значение - 0, для мужчин - совпадает с зарплатой).
LOGISTIC REGRESSION VAR = alcohol /METHOD = ENTER wage manag dh5 smoke dh5*wage /CONTRAST (dh5) = Indicator /CONTRAST (manag) = Indicator /CONTRAST (smoke) = Indicator /PRINT = CI(95) /CRITERIA PIN(.05) POUT(.10) ITERATE(20) CUT(.69).
В выдаче программа сообщает прежде всего о перекодировании данных:
Dependent Variable Encoding:
Original Internal
.00 1.00
0 1
Следует обратить внимание, что зависимая переменная здесь должна быть дихотомической, и ее максимальный код считается кодом события, вероятность которого прогнозируется. Например, если Вы закодировали переменную ALCOHOL: (1 - употреблял, 2 - не употреблял), то будет прогнозироваться вероятность неупотребления алкоголя.
Далее идут сведения о кодировании индексных переменных для категориальных переменных; из-за их естественности здесь мы их не приводим.
Value Value
Далее следуют обозначения для переменных взаимодействия, в нашем простом случае это
Interactions:
INT_1 DH5(1) by WAGE
Еще по теме 6.2.5. Пример логистической регрессии и статистики:
- 6.2. Логистическая регрессия
- 6.2.8. Коэффициенты логистической регрессии
- Качество логистической регрессии
- Статистика перевозок на примере Испании
- Виды регрессий.
- Логистическая операция
- Множественная регрессия.
- Логистическая функция
- Логистическая цепь
- Выборочные уравнения регрессии
- Звено логистической системы
- В. Учебные примеры Пример 1. Окна из Билефельда для Англии71
- 3.4 Расчет коэффициентов уравнения регрессии
- 6.1.7. Команда построения линейной модели регрессии
- прогресс и регресс
- Логистическая концепция «планирования потребностей-ресурсов»