Оценка математической модели прогнозирования.
Рассмотрим для примера МНК и метод экспоненциального сглаживания.
Метод наименьших квадратов состоит в определении парамет-ров модели тренда, минимизирующих ее отклонение от точек исходного временного ряда:
S=1 (у і - у і)2 -> min, (6.31)
/=і
где у і — расчетные (теоретические) значения исходного ряда;
у і — фактические значения исходного ряда;
п — число наблюдений.
Классический метод наименьших квадратов предполагает равноценность исходной информации в модели.
В реальной же практике будущее поведение процесса в большей степени определяется поздними наблюдениями, чем ранними. Речь идет о дисконтировании, т. е. уменьшении ценности более ранней информации.Дисконтирование учитывают путем введения в модель (6.31) некоторых весов Р/ < 1. Тогда
/=1
Коэффициенты Р/ могут быть заданы в числовой форме или в виде функциональной зависимости таким образом, чтобы по мере продвижения в прошлое веса убывали.
Метод наименьших квадратов широко применяется при прогнозировании, что объясняется его простотой и легкостью реализации на ЭВМ. К недостаткам МНК можно отнести следующее.
Во-первых, модель тренда жестко фиксируется, и с помощью МНК можно получить прогноз на небольшой период упреждения. Поэтому МНК относят к методам краткосрочного прогнозирования.
Во-вторых, значительную трудность представляет правильный выбор вида модели, а также обоснование и выбор весов во взвешенном методе наименьших квадратов.
Наконец, МНК очень просто реализуется только для линейных и линеаризуемых зависимостей, когда для получения оценок коэффициентов моделей решается система линейных уравнений.
Задача значительно усложняется, если для прогноза используется функци-ональная зависимость, не сводимая к линейной.Метод экспоненциального сглаживания является эффективным и надежным методом среднесрочного прогнозирования.
Здесь следует остановиться более подробно на учете важности ретроспективной информации.
Практически большее значение для построения прогноза имеет информация, описывающая процесс в моменты времени, стоящие ближе к настоящему (нулевому) моменту времени. Чем дальше мы углубляемся в ретроспекцию, тем менее ценной для прогно- за становится информация. Это можно учесть, придавая членам исходного динамического ряда некоторые веса, тем большие, чем ближе находится точка к началу периода прогноза.
Это положение лежит в основе метода экспоненциального сгла-живания. Сущность метода заключается в сглаживании исходного динамического ряда взвешенной скользящей средней, веса которой (со,) подчиняются экспоненциальному закону (рис. 6.1).
Пусть исходный динамический ряд описывается полиномом следующего вида:
2! pi j=o Jl
где Z>o> ^і» —> bp - коэффициенты; p — порядок полинома;
є, — случайная ошибка.
Метод экспоненциального сглаживания позволяет построить такое описание процесса (6.32), при котором более поздним наблюдениям придаются большие веса по сравнению с ранними наблюдениями, причем веса наблюдений убывают по экспоненте.
Slk\y) = a%(l-ayslk_?\y) (6.33)
/=0
называется экспоненциальной средней k-го порядка для ряда уи где а - параметр сглаживания.
В расчетах экспоненциальную среднюю определяют, пользуясь рекуррентной формулой, полученной Брауном:
St[k](y) = a if"11 (у) + (1 - a)S,Jf](y). (6.34)
Использование соотношения (6.34) предполагает задание начальных условий 50t2J, которые могут быть определены по формуле Брауна—Мейера:
sP(y)= І ? j>{І-а^-^Д (6.35)
р=О Р! (л-1)! У=О
где /7 = 1,2, ..., л + 1;
b — оценки коэффициентов.
Оценки коэффициентов прогнозирующего полинома определяют через экспоненциальные средние по фундаментальной теореме Брауна—Мейера.
В этом случае коэффициенты bj находят решением системы (р — I) уравнений с (р + 1) неизвестными, связывающей параметры полинома с исходной информацией.Рассмотрим применение метода экспоненциального сглаживания для двух наиболее употребительных случаев, когда тренд опи-сывается линейной функцией и параболой. Линейная модель Брауна
yt = b0 + bxt + є,. (6.36)
Начальные приближения для случая линейного тренда равны (по формуле (6.35)):
экспоненциальная средняя 1-го порядка:
экспоненциальная средняя 2-го порядка:
Зная начальные условия So'1' и и значение параметра а, вычисляют экспоненциальные средние 1-го и 2-го порядка:
S,w(y) = су, + (1 - СО^ДЧОО; (6.39)
5,[210') = а.?/11 + (1 - cOS^Cy). (6.40)
Оценки коэффициентов линейного тренда:
Ь0 = 25/400 - S,l2i А А Прогноз на 1 шагов (на время tx) равен: yt = b0 + Ьх • /. Ошибка прогноза (6.43) a = аЄ/а ^ [l+4(1 - а) + 5(1 - а)2 + 2а(4 - За)/, + 2а2/,2 Параболический тренд ^(У)^—^ ^ (6-45) Начальные приближения a 2a СІ21/.Л а 2(1-а) (1-а)(3-2а) а 2а •^^¦за^^о-^-за) (647) а 2а Экспоненциальные средние = цу, + (1 - aJ^J/'C); (6.48) •S^OO = aS/11 С) + (1 - а^ОО; (6.49) 5/31(у) = aS,[2] (у) + (1 - а)^.1!31^). (6.50) Оценки коэффициентов параболической зависимости для тренда b0 = 3[5/"(у) - 5,[2!(у)] + S,[310); (6.51) bi =-^Г(6-5а)^1,(у)-2(5-4а)5'Р(у)+(4-За)6,Р(у)1; (6.52) (l-arL J ^ + (6.53) Прогноз на момент y^k+ke+fol (6'54) Ошибка прогноза G*y - oEj д/га + ЗаЧза3/!. (6-55) Для метода экспоненциального сглаживания основным и наиболее трудным моментом является выбор параметра сглаживания а, начальных условий и степени прогнозирующего полинома. Параметр сглаживания а определяет оценки коэффициентов модели, а следовательно, результаты прогноза. В зависимости от величины параметра прогнозные оценки по- разному учитывают влияние исходного ряда наблюдений: чем больше а, тем больше вклад последних наблюдений в формирование тренда, а влияние начальных условий убывает быстро. При малом а прогнозные оценки учитывают все наблюдения, при этом уменьшение влияния более ранней информации происходит медленно. Для приближенной оценки а известны два основных соотношения: • соотношение Брауна, выведенное из условия равенства скользящей и экспоненциальной средней где N — число точек ряда, для которых динамика ряда считается однородной и устойчивой (число точек в интервале сглаживания). 2 Иногда а = —где п — число наблюдений (точек) в ретро- п +1 спективном динамическом ряду; соотношение Мейера а=—, (6.57) где ап — средняя квадратическая ошибка модели; ае — средняя квадратическая ошибка исходного ряда. Однако достоверно определить оп и аЕ из исходной информации очень сложно, поэтому использование соотношения (6.57) затруднено. Очевидно, что выбор параметра а нужно связывать с точностью прогноза, поэтому для более обоснованного выбора а можно использовать процедуру обобщенного сглаживания. В этом случае получаются следующие соотношения, связывающие дисперсию прогноза о\ и параметр сглаживания а: для линейной модели а а? = " (1-Р)2 (6.58) 1 + 4(3+5(32 + 2а(1 + 3(3)т + 2а V для квадратичной модели а2?т = [2а + За3 + За2т]ае2, (6.59) где Р = 1 - а; т — период прогноза; ое — средняя квадратическая ошибка аппроксимации исходного динамического ряда. При а = 0 выражения, стоящие в правых частях формул (6.58), (6.59), обращаются в нуль, следовательно, для уменьшения ошибки прогноза необходимо выбирать минимальное а. В то же время, чем меньше а, тем ниже точность определения начальных условий, а следовательно, ухудшается и качество прогноза. Таким образом, использование формул (6.58), (6.59) приводит к противоречию при определении параметра сглаживания. Качество прогноза во многом зависит от выбора порядка прогнозирующего полинома. Известно, что превышение второго порядка модели не приводит к существенному увеличению точности прогноза, но значительно усложняет расчет. Отметим в заключение, что метод экспоненциального сглажи-вания является одним из наиболее эффективных, надежных и ши- роко применяемых методов прогнозирования. Он позволяет получить оценку параметров тренда, характеризующих не средний уро-вень процесса, а тенденцию, сложившуюся к моменту последнего наблюдения, и при этом отличается простотой вычислительных операций. Пример 6.5. Пусть задан временной ряду,:
Год 1997 1998 1999 2000
t 1 2 3 4
У/ 40 43 46 48
Можно считать, что аппроксимирующая функция (тренд) описывается линейной функцией (рис. 6.2). Таблица 6.3 Расчетная таблица
Факти Расчетные значения
Год Период, t ческое значение У, /2 У = 37,5 + + 2,7 • / АУ =У-Уг
1997 3 1 2 40 43 46 48 1 4 9 16 40 86 138 192 40,2 42,9 45,6-48,3 0,2 -0,1 -0,4 0,3
Итого 10 177 30 456 - -
1. Определим коэффициенты прямой у = а0 + а^ по методу наименьших квадратов. Для этого вычислим ряд промежуточных значений и их суммы. Результаты занесем в табл. 6.3. Далее найдем А) =
п It і 4 10
2'І S/,2 10 30
= 120-100 = 20; ІУі Itj Ем- It? Z>2 =
И 2', 4 177
2// 10 456
= 54; 177 10 456 30 А = = 750; «о A> 20 D2 54 D0 20 Окончательно уравнение прямой имеет вид у = 37,5 + 2,7/. Подставив в него значения t = 1, 2, 3, 4, получим расчетные значения тренда (табл. 6.3). Основная ошибка а = = 0,4. N +1 4 + 1 4"= 37,5-^^-2,7 = 33,45; 3. Начальные условия сИ >0 л /0.22 +(-0,1)2 + (-0,4)2 + 0,32 a, =J =0,3. =37,5-^^.2,7 = 29,4. 4. Для t = 2 вычислим экспоненциальные средние: Jjin = 0,4 • 40 + 0,6 • 33,45 = 36; Яг12' = 0,4 • 36 + 0,6 • 29,4 = 32; значения коэффициентов: а0 = 2 • 36 - 32 = 40, «і=Г^ї(36-32) = 2,6; прогнозируемые значения: у\ = 40 + 2,6 • 1 = 42,6; отклонения от фактического значения: АУ2 = 42,6 - 43 = -0,4. / = 4, / = 5. Результаты представим в табл. 6.4. Таблица 6.4 Типовая таблица для построения прогноза по методу экспоненциального сглаживания
Год Период, t Факти-ческое значение У, Расчетные значения
S,™ St[2] До А 0\ * У$ АУ = У* ~ УІ
1997 3 1 2 40 43 46 48 36 38,6 41,6 32 34,6 37,4 40 42,6 45,8 2.7 2,6 42,6 45,3 48,6 -0,4 -0,7 0,6
2001 і = 1 - 44,2 40,1 48,3 2,7 51 -
Для t = 3: S3 = 0,4 • 43 + 0,6 • 33 = 38,6; S3[2] = 0,4 • 38,6 + 0,6 • 32 = 34,6; o0 = 42,6; а і = 2,7; = 42,6 + 2,7 • 1 = 45,3; Д/ = - 0,7. Для t = 4: $im = 0,4 • 46 + 0,6 • 38,6 = 41,6; S4121 = 0,4 • 41,6 + 0,6 • 34,6 = 37,4; a0 = 45,8; 5, = 2,8; У4 = 45,8 + 2,8 • 1 = 48,6; Ay; = 0,6. Для построения модели прогноза (? = 1) определим = о,4 • 48 + 0,6 • 41,6 = 44,2; = 0,4 • 44,2 + 0,6 • 37,4 = 40,1; а0 = 48,3; а, = 2,7. Окончательная модель прогноза имеет вид ум = 48,3 + 2,7 • (, где ^=1,2, ... (что соответствует t = 5, / = 6 и т. д.).