Некоторые статистические методики выявления факторов риска, влияющих на заболеваемость с временной утратой трудоспособности
При изучении заболеваемости с временной утратой трудоспо - собности всегда вызывает интерес выявление факторов, способствующих развитию данного вида заболеваемости, т. е. факторов риска.
Используя методы математической статистики можно найти причинно-следственные зависимости, на основе которых рекомендовать меры по оздоровлению работающих и снижению заболеваемости с временной утратой трудоспособности. Такие углубленные исследования заболеваемости с временной утратой трудоспособности рекомендуется проводить не реже, чем раз в 3-5 лет.Для решения задачи определения связи качественных признаков с уровнем заболеваемости с временной утратой трудоспособности целесообразно применить критерий соответствия (c2- хи-квадрат), располагающий высокой разрешающей способностью. Для его расчета формируется таблица сопряженности, подлежащим которого является результативный признак с его градациями (в данном случае - лица имевшие временную нетрудоспособность и лица, ее не имевшие), сказуемым - фактор с его градациями. Например, возраст по группам в соответствии с избранным классификатором, пол или другие факторы.
Общая формула для расчета критерия c2:
( Ф - Фі)
2
С 2=--------------------------------------------- , где
2 Фі
c2 - критерий соответствия (согласия),
Ф - фактические числа (абсолютные),
Ф1- теоретические числа (или ожидаемые), вычисленные в со - ответствии с нулевой гипотезой о том, что исследуемый фактор влияния на результативный признак не оказывает, или распределение болевших и не болевших лиц во всех группах, соответствующих градациям фактора, одинаково.
В случае, если полученные значения критерия С больше табличного при данном числе степеней свободы, нулевая гипотеза отвергается и принимается альтернативная гипотеза о статистически достоверном влиянии фактора на результативный признак.
43
Проиллюстрируем применение критерия с2 на примере исследования достоверности влияния возраста работающих на уровень заболеваемости с временной утратой трудоспособности среди обследованных работников птицефабрики.
“Ожидаемые” числа определяются исходя из нулевой гипоте - зы, то есть исходя из предположения о том, что никаких различий между группами не существует. Так, для лиц в возрасте до 30 лет, например, “ожидаемое” число болевших лиц будет рассчитываться так:
110 х 61,95 : 100 = 68,15,
“ожидаемое” число не болевших лиц, соответственно,
110 х 38,05 : 100 = 41,65 и т. д.
Следующий шаг расчета - нахождение разности между фактическими и ожидаемыми числами. При этом получаются положительные и отрицательные числа. В качестве проверки правильности выполнения - суммы по столбцам и строкам должны быть равны нулю.
Результативный признак | Фактор - возраст в годах | Ожидаемая гипотеза | ||||
Фактические числа - Ф | Всего | |||||
До 30 | 30-39 | 40-49 | 50 и ст. | Абс. | В % | |
Число болевших лиц | 54 | 119 | 55 | 39 | 267 | 61,95 |
Число не болевших лиц | 56 | 54 | 29 | 26 | 164 | 38,05 |
Всего обследовано | 110 | 173 | 84 | 65 | 431 | 100,0 |
Затем полученные разности возводят в квадрат и делят на со - ответствующие им в ячейках таблицы сопряженности ожидаемые числа (Ф - Ф і)2 : Фі. После этого полученные значения суммируют и получают фактический критерий с 2.
44
Результа тивный признак | Фактор - возраст в годах | Фактор - возраст в годах | ||||||
Ожидаемые числа (Ф) | Разность (Ф-Ф1) | |||||||
До 30 | 30-39 | 40-49 | 50 и ст. | До 30 | 30-39 | 40-49 | 50 и ст. | |
Число болевших лиц | 68,15 | 107,17 | 52,04 | 40,27 | -18,15 | + 11,83 | +2,96 | -1,27 |
Число не болевших лиц | 41,85 | 65,83 | 31,96 | 24,73 | + 18,15 | -11,83 | -2,96 | + 1,27 |
Всего обследовано | 110 | 173 | 84 | 65 | 0 | 0 | 0 | 0 |
Результативный признак | Фактор - возраст в годах | |||
(Ф-Ф^2 / Ф1 | ||||
До 30 | 30-39 | 40-49 | 50 и ст. | |
Число болев - ших лиц | 2,94 | 1,31 | 0,17 | 0,04 |
Число не болевших лиц | 4,78 | 2,13 | 0,27 | 0,06 |
В нашем случае с2 равен 11,7.
Для сравнения полученного значения с2 необходимо определить число степеней свободы n1 = (S - l) х (г - l), где S - число строк, г - число столбцов исходной таблицы сопряженности. В нашей примере n = (2-1) х (4-1) = 3. Поскольку табличное значение 2 (при р