1,2,3, Формулы для двух объясняющих переменных,
у
x1 и x2, заданную в линейной форме
у = bo + b1 Х1 + b2 Х2 + Є. (20)
Предполагается, что между х1 и х2 нет линейной связи, то есть х2 = а1 х1 +а2, а1 = 0, В противном случае соотношение (20) с точностью до обозначений совпадает с (8), Полагаем, что у нас имеются выборки значений переменной у и переменных х1, х2,
представленные в соответствующих столбцах таблицы 1, Обозначим
1 n 1 n 1 n
х1 = х1і, х2 = -V" х2і, у= - V уі, (21 а)
n ^ n ^ n
Д QxIxI • QX2X2 - Qx1x2, QxIxI ^ ^ х1і - n (х1) , (21 b)
і=1
nn
QX2X2 = ^ х2і - n (Х2)2, Qyy = Y1 у2 - n ^ (21 С)
і=1 і=1 nn
QxIy = ^(х1і уі) - ПХ1 у, Qx2y = ^(х2і уі) - ПХ2 у, (21 d)
і=1 і=1 і=1
х2
і=1
і=1 і=1
QxiX2 = ^(х1і х2і) - ПХ1 Х2. (21 Є)
і=1
Тогда оценки параметров линейной зависимости (20) задаются соотношениями
7 QX2X2 • QxIy - QX1X2 • QX2y /00 \
b1 = д , (22 а)
7 QxIxI • QX2y - QxIX2 • QxIy /00 ,ч
b2 = д , (22 b)
bo = у - &1 х1 - &2 х2. (22 с)
Заметим здесь, что при проведении вычислений по формулам (21), (22) часто получаются неверные результаты.
Это вызвано ошибками округлений, к которым очень чувствительны эти формулы. Поэтому все вычисления должны проводиться очень аккуратно и продуманно.Используя полученные оценки, сформируем выборку остатков
Є1, Є2, . . . ,Єі, . . . ,Єп, (23)
уі
по формуле (20), т.е.
Єі = уі - bo - 61 х1і - &2 х2і, 1 < i < n. (24)
По выборке (24) вычислим остаточную сумму квадратов
Є2
Qee = Є2, (25)
і=1
которая будет использована в последующих расчетах. Величина Qee также может быть найдена по формуле
Qee = Qyy — (b1 + b2 Q/2y). (26)
Это позволяет проверить правильность вычислений по формулам (21)-(25). Оценки (22) дают приближенные значения параметров b0, b1; b2, т.е.
b0 ~ bo, b1 ~ b1, b2 ~ b2.
На основании этих приближенных равенств нельзя получить уверенного заключения о точных значениях параметров ^ и b2, а также проверить перавенетва b1 = 0 или b2 = 0, Эти неравенства указывают на наличие или отсутствие линейной зависимости между у и объясняющими переменными x1 и x2, Точность оценивания параметров b1; b2 зависит от объема выборки n и характеризуется стандартными ошибками оценок Ьъ b^.
Стандартные ошибки аь ^2 оценок 6Ь" b2 находятся по формуламQEE q/2 Х2 / QEE q/"/1
V^ee ^x'2 X2 / ^xIxI /N^
П-3'""XT", а2 = Vn—з"д". (27)
Зафиксируем значения объясняющих переменных x1 = x2, x2 = x2- Тогда выражение
y = bo + b1 xi + b2 x2 (28)
будет задавать приближенное значение зависимой переменной у, т.е. y ~ у. Точность y
ется Стандартная ошибка ау задается формулой
" = ^ ¦ (1 + n + i^ )¦ <29>
где величина равна
— Q/2/2 (x1 x1) 2 (x1 x1)(x2 x2) + Q/"/" (x2 x2) . (30)
Перейдем к обоснованию наличия или отсутствия линейной зависимости (20) между переменными у и x1; x2. Выдвигаем гипотезу H0 об отсутствии такой зависи-
b1 = 0 b2 = 0
а ¦ 100% Число а задает вероятность ошибки первого рода. Ошибка первого рода означает, что представленные данные и результаты их обработки не согласуются с принятой гипотезой H0, и мы ее отвергаем. Для проверки гипотезы H0 вычислим величину
n (b1 Q xiy + b2 Q/2y ) (n - 3) (31)
2 Qee
и будем сравнивать ее с критическим значением Fa распределения Фиш ера с f1 = 2 и f2 = n — 3 степенями свободы на уровне значимоети а (таблица П1), Если окажется, что выполнено неравенство F < Fa, то гипотезу H0 принимаем, а линейную зависимость (20) называем не значимой. Если же F > Fa, то гипотезу H0 отклоняем
y x1 , x2
называется значимой.
Если зависимость (20) признана значимой, то следует установить какая из объ-
х1 х2 у
значимоети а • 100% и построим доверительные интервалы для параметров ^ и b2:
b1 Є І1 = (&1 - ta a1, &1 + ta a1), b2 Є І2 = (&2 - ta a2,b2 + ta a2), (32)
где ta - критическое значение распределения Стыодента с n - 3 степенями свобо-
а a1 a2
(27), Интервалы /1; I2 накрывают параметры b1; b2 с вероятноетыо p = 1 - а. Если окажется, что доверительный интервал I1 содержит в себе число ноль, то полагаем
b1 = 0 у х1
I2 содержит в себе число ноль, то полагаем, что b2 = 0 и, принимаем, что переменная
у те зависит от х2, В противном случае, когда I1 и I2 не содержат число ноль, пола-
у
b1 > 0 возрастайие х1 будет вести к возрастанию у, а при b1 < 0 - к ее уменьшению,
у х2 b2
у х1 х2
по заданным х1 = х* и х2 = х* можно указать границы для ожидаемо го значения у с учетом влияния случайной составляющей е, Эти границы устанавливаются в форме доверительного интервала
у Є Iy = (у - ta ay, у + ta ay), (33)
который содержит значение переменной у с вероятностью p = 1 - а. Критическое значение ta берется так же, как и в формуле (32), а величины у, ay задаются формулами (28) и (29), Границы доверительного интервала с1 = у - ta ay, с2 = у + ta ay, как функции от величин хЦ и х2 образуют некоторую поверхность, сечения которой напоминают фигуру, представленную на рис, 3, Точность предсказания возможных значений у убывает по мере удаления точки (х*, х2) от точки (х1, х2),