5.1. t-критерий Стьюдента t-Критерий Стьютдента используется для:
(M1 о M 2) или в более общем виде, для установления сходства-различия двух эмпирических распределений;
установления отличия от нуля некоторых мер связи: коэффициента линейной корреляции Пирсона, ранговой корреляции Спирмена, точечно-бисериальной и рангово- бисериальной корреляции (rxy, rs, rpb о"0" ) и коэффициента линейной регрессии (Яху о "О"):
установления сходства-различия двух дисперсий в двух зависимых выборках.
Ограничения:это параметрический критерий, поэтому необходимо, чтобы распределение признака, по крайней мере, не отличалось от нормального распределения;
для независимых и зависимых выборок разные формулы расчета;
Гипотезы
независимые выборки:
Н0: средние значения признака в обоих выборках не различаются,
Ні: средние значения признака в обоих выборках статистически значимо различаются.
зависимые выборки:
Н0: разности оценок испытуемых в двух состояниях не отличаются от нуля,
Н1: разности оценок испытуемых в двух состояниях статистически значимо отличаются от
нуля.
Рассмотрим случай 1.
Пример 5.1.(независимые выборки). Предположим, имеется две независимые выборки школьников, интеллект которых развивали в течение некоторого времени по двум различным методикам, требуется установить, какая из методик лучше (табл.5.1). Предварительно было
выяснено, что начальный уровень интеллекта был одинаковым в обеих выборках. Задача сравнения двух методик может быть переформулирована на язык статистики как задача сравнения средних арифметических значений интеллекта в обеих выборках. Таблица 5.1. Числовые характеристики 1-я выборка 2-я выборка п 30 32 М 103 110 <У 10 12 Гипотезы:
Н0: средние значения уровня интеллекта в обоих выборках не различаются, Н1: средние значения уровня интеллекта в обоих выборках статистически значимо различаются.
В данном случае для получения эмпирического значения t-критерия используется
следующая формула:
п\ п7 (W1 +п2 ~
1 =
,V/j -м
«і + пг
l/(«i" + (л2 -1
где: n1, n2 - количество испытуемых в 1-й и 2-й выборках; Mi,M2 - средние
арифметические значения в 1-й и 2-й выборках; с1, с2 - стандартные отклонения в 1-й и 2-й выборках.
Количество степеней свободы для нахождения критического значения критерия:
Df = n1+n2-2.
(В рассматриваемых примерах критические значения t-критерия приводятся для ненаправленных гипотез).
Тогда:|юз-по|
2,486 .
[30-32-(30+ 32- 2)
УІ29Л02 +31-П2 * 30 + 32
Таким образом, получаем tэMп=2,486
2=60.
Критические значения t-критерия находим по таблице 1 (приложение 5.3.) для df=30+32-
Г2,0 для p < 0,05
t = кр
[2,66 дляp < 0,01
Полученное эмпирическое значение t-критерия превышает критическое для а=0,05, но оказывается меньше критического для а=0.01, т.е.
2,0<Гкр=2,486 < 2,66
Вывод: Н0 гипотеза отклоняется и можно сделать вывод о статистически значимом различии средних арифметических значений в двух выборках для р<0.05 и о преимуществах второй методики по сравнению с первой.
Строгое использование t-критерия предполагает, что обе выборки извлечены из нормальных совокупностей. Однако многие авторы не считают это условие достаточно жестким, указывая на возможность использования t-критерия в ситуациях, когда нет серьезных оснований сомневаться в нормальности распределения признака в генеральной совокупности, даже если это нельзя подтвердить статистически.
При зависимых выборках возникает корреляция результатов, поскольку измерения проводятся на одних и тех же испытуемых в различных условиях (х и у)', чтобы учесть влияние корреляции, применяется другая формула:
'п- 1
п
fat-ted,?.'*
где di = Xj - уь то есть разность значений признака для каждого испытуемого. Количество степеней свободы df=n-1. Проверяется статистическая гипотеза о соответствии распределения разностей t-распределению Стьюдента с нулевым средним значением.
Пример 5.2. (зависимые выборки). Допустим, проводится измерение ситуативной тревожности до и после психотерапевтического воздействия с помощью некоторого опросника (табл.5.2). Исследователя интересует вопрос, приводит ли воздействие к изменению уровня тревожности.
Гипотезы:
Н0: разности оценок у испытуемых ситуативной тревожности до и после психотерапевтического воздействия не отличаются от нуля,
Н1: разности оценок у испытуемых ситуативной тревожности до и после психотерапевтического воздействия статистически значимо отличаются от нуля
Таблица 5.2. Испытуемые "до" (х,) "после'0'0 dr ХІ -уі (df -(Xi - yf 1 30 20 10 100 2 33 17 16 256 3 41 21 20 400 4 50 43 7 49 5 36 39 3 9 6 45 11 34 1156 7 31 28 3 9 8 25 20 5 25 «=8 Щ2-2004 Подставив в формулу найденные значения Zd, и Zd,2 получим:
2.798 , df = 8-1 = 7
t =
92 8-і
^2004-922 / 8 * 8
Имеем: ізмп=2,798
Находим по таблице 1 критические значения (Приложение 5.3.) |2,365 дляp < 0,05
кр = [3,499 дляp < 0,01
Отсюда: 2,365 Случай 2. При проверке отличия от нуля мер связи (коэффициентов корреляции) эмпирическое значение t-критерия вычисляется по формуле [п-2 где r - коэффициент корреляции, n - количество испытуемых. Количество степеней свободы df= n-2. Вывод об отличии меры связи от нуля делается при превышении эмпирического значения критерия над критическим для а=0.05 и соответствующего числа степеней свободы, то есть аналогично рассмотренным выше случаям. Для коэффициентов линейной корреляции Пирсона и ранговой корреляции Спирмена можно непосредственно использовать таблицы критических значений (Приложение 5.3., таблица 2). Эмпирическое значение коэффициента корреляции берется по абсолютной величине. В некоторых пособиях и учебниках приводятся отдельные таблицы критических значений для коэффициента ранговой корреляции Спирмена, по В.Ю. Урбаху. Значения в них отличаются от критических для коэффициентов линейной корреляции Пирсона. Программа Statistiсa не делает различий между этими типами корреляций.