<<
>>

Ошибка прогноза

Качество модели определяется ее адекватностью исследуемому процессу и точностью. Адекватность характеризуется наличием и учетом определенных статистических свойств, а точность — степенью близости к фактическим данным.
Модель прогнозирования будет считаться лучшей со статистической точки зрения, если она является адекватной и более точно описывает исходный динамический ряд.

Модель прогнозирования считается адекватной, если она учитывает существенную закономерность исследуемого процесса. В ином случае ее нельзя применять для анализа и прогнозирования.

Закономерность исследуемого процесса находит отражение в наличии определенных статистических свойств остаточной компоненты, а именно: независимости уровней, их случайности, соответствия нормальному закону распределения и равенства нулю средней ошибки.

Независимость остаточной компоненты означает отсутствие ав-токорреляции между остатками (yt - уті).

Перечислим последствия, вызываемые автокорреляцией остатков

недооценка дисперсии остатков функции регрессии;

наличие ошибки при оценке выборочной дисперсии параметров регрессии.

Ошибки в вычислении дисперсий — препятствие к корректному применению метода наименьших квадратов при построении модели исходного динамического ряда.

Очевидно, важно иметь критерий, позволяющий устанавливать наличие автокорреляции. Таким критерием является критерий Дарвина—Уотсона, в соответствии с которым вычисляется статистика d:

d = & , (6.60)

П 7

Я(УІ-УТІ) /=і

где у', у- уровни фактического динамического ряда;

Уть У ТІ— і теоретические (прогнозные) уровни динамического ряда;

п — объем выборки.

Возможные значения статистики лежат в интервале 0 < d < 4. Согласно методу Дарбина и Уотсона существует верхний de и ниж-

1 См.: Ферстер Э., Ренц Б. Методы корреляционного и регрессионного анализа. — М.: Финансы и статистика, 1983.

ний dH пределы значений статистики d.

Эти критические значения зависят от уровня значимости а, объема выборки п и числа объясняющих переменных т (для трендовых моделей т = 1). В приложении 4 приведены значения dB и dH для 5 %-го уровня значимости при п от 15 до 100 и числе объясняющих переменных от 1 до 5.

Вычисленное по (6.60) значение d сравнивается с dB и г/н, найденными по приложению 4. При этом руководствуются следующими правилами:

dB < d < 4 — dB принимается гипотеза: автокорреляция

отсутствует;

0 < d < dH принимается гипотеза о существовании

положительной автокорреляции остатков;

dH< d < dB при выбранном уровне значимости нельзя

и 4 — dB< d < 4-dH прийти к определенному выводу;

4 — dH < d < 4 принимается гипотеза о существовании

отрицательной автокорреляции остатков.

Критерий Дарбина-Уотсона обладает двумя недостатками. Первый из них — наличие области неопределенности, в которой с помощью данного критерия нельзя прийти ни к какому решению. Второй недостаток заключается в том, что при объеме выборки меньше 15 для d не существует критических значений dH и dB. В этом случае для оценки независимости уровней ряда можно использовать коэффициент автокорреляции га. Данный показатель приближенно можно вычислить по формуле

i-f> (661)

где d — статистика Дарбина-Уотсона.

Расчетное значение га сравнивают с табличным гат (приложение 3). Критическое значение коэффициента автокорреляции гат имеет одну степень свободы,т. е. / = п. Если га < гаг, то уровни динамического ряда независимы.

Для проверки случайности уровней ряда можно использовать критерий поворотных точек, который называется также критерием «пиков» и «впадин». В соответствии с этим критерием каждый уровень ряда сравнивается с двумя соединенными с ним. Если он больше или меньше их, то эта точка считается поворотной. Далее подсчитывается сумма поворотных точек К.

В случайном ряду чисел должно выполняться строгое неравенство:

16/1-29

(6.62)

(2/1-4)

к>

90

-2„

Соответствие ряда остатков нормальному закону распределения важно с точки зрения правомерности построения интервалов прогноза.

Основными свойствами ряда остатков являются их симметричность относительно тренда и преобладание малых по абсолютной величине ошибок над большими. В этой связи определяется близость к соответствующим параметрам нормального закона распределения коэффициентов асимметрии — Ас (мера «скошенности») и эксцесса — Эк (мера «скученности») наблюдений около модели, т. е.

1 " 1 -ІІУі-Уті)3

(6.63)

і п

-І(Уі-Уті) пі=1

Л

--3.

(6.64)

іІіУі-УпУ

Если эти коэффициенты близки к нулю или равны нулю, то ряд остатков распределен в соответствии с нормальным законом. Для оценки степени их близости к нулю вычисляют средние квад- ратические отклонения:

С = I - 2) , 0 І(п + 1)(я + 3)'

(6.65)

5э =

24я(я-2)(л-3) |(л+1)2(л+3)(л+5)

Если выполняются соотношения:

Ис1 ^ № Ш * h5S3,

то считается, что распределение ряда остатков не противоречит нормальному закону. В случае когда

\АС| > 2Sa или \Эк\ > 2S3

то распределение ряда не соответствует нормальному закону рас-пределения, и построение доверительных интервалов прогноза не-правомочно. В случае попадания Ас и Эк в зону неопределенности (между полутора и двумя среднеквадратическими отклонениями) может быть использован /W-критерий:

(6.66)

RS ~ (^max - ?min)A

где Етах — максимальный уровень ряда остатков (у,- — уТІ), і = 1 , л;

Етin — минимальный уровень ряда остатков (уг — ут/), і = 1, л;

S — среднее квадратическое отклонение остатков.

Если значение этого критерия попадает между табулированными границами с заданным уровнем значимости (приложение 5), то гипотеза о нормальном распределении ряда остатков принимается.

Равенство нулю средней ошибки (математическое ожидание, случайной последовательности) проверяют с помощью /-критерия Стьюдента:

1 д

(6.67)

, V/ л

tp= -і(УІ-УТІ) "ТТ. П /=1 Д

Гипотеза равенства нулю средней ошибки отклоняется, если tp больше табличного уровня /-критерия c/j = (п — 1) степенями свободы и выбранным уровнем значимости а (приложение 1).

После проверки всех моделей прогнозирования из выбранного массива на адекватность необходимо выполнить оценку их точности.

В статистическом анализе известно большое число характеристик точности1.

Наиболее часто в практической работе встречаются следующие характеристики.

1.

Оценка стандартной ошибки:

(6.68)

ІІУІ-АХ,)]2 Slf(x)=j——

где п — число наблюдений;

р — число определяемых коэффициентов модели.

2. Средняя относительная ошибка оценки

(6.69)

3. Среднее линейное отклонение

(6.70)

Jn(n-l)

4. Ширина доверительного интервала в точке прогноза.

Для получения данной статистической оценки определим доверительный интервал в прогнозируемом периоде, т.е. возможные отклонения прогноза от основной тенденции протекания рассматриваемого процесса. Для решения этой задачи построим интервальные оценки параметров регрессии а0 и в формах:

(6.71)

До = ^о ± • %» а\ = ± *р •

Здесь серединами интервалов являются точечные оценки а0 и аь рассчитанные с помощью метода наименьших квадратов. Величина tp — теоретическое значение критерия Стьюдента при уровне значимости, равном 5%, и числе степеней свободы, равном Vx = п — т — 1 (приложение 1).

Стандартные ошибки коэффициентов регрессии а* и а* вычисляются по следующим формулам:

(6.72)

Несмещенная оценка дисперсии случайной составляющей

(6.73)

02=-^гІ(Уі-Уті)2,

л-2/=1

где xh у і — фактические значения динамических рядов хи у\

уті — теоретическое значение, рассчитанное по уравнению регрессии; х - среднее значение фактора х.

Верхняя Ye и нижняя YH границы доверительного интервала в точке прогноза будут равны:

(6.74)

Ув=Ла0віа {в;хп);

где а0в; OQ — верхнее и нижнее значения параметра а0 модели прогноза; а*\ — верхнее и нижнее значения параметра модели прогноза; хп — значение фактора времени в точке прогноза.

Ширина доверительного интервала в точке прогноза

(6.75)

д = у6 - YH.

Надо отметить, что ширина доверительного интервала зависит:

от числа степеней свободы и тем самым от объема выборки, т. е. чем больше объем выборки, тем меньше (при прочих равных условиях) значение критерия t и, следовательно, уже доверительный интервал;

от величины стандартной ошибки оценки параметра регрессии (а^ и о^0). Чем меньше о^ и тем меньше при равных условиях ширина доверительного интервала.

Лучшей по точности считается та модель, у которой все перечисленные характеристики имеют меньшую величину. Однако эти показатели по-разному отражают степень точности модели и поэтому нередко дают противоречивые выводы. Для однозначного выбора лучшей модели исследователь должен воспользоваться либо одним основным показателем, либо обобщенным критерием.

Итогом работ по выбору вида математической модели прогноза является формирование ее обобщенных характеристик. В обобщенную характеристику должны быть включены вид уравнения регрессии, значения его параметров, оценки точности и адекватности модели и сами прогнозные оценки, точечные и интервальные.

<< | >>
Источник: Бережная Е.В., Бережной В.И.. Математические методы моделирования экономических систем: Учеб. пособие. — 2-е изд., перераб. и доп. — М.: Финансы и статистика,2006. - 432 е.. 2006

Еще по теме Ошибка прогноза: