<<
>>

2.2. Лабораторная работа № 2. Применение регрессионных моделей для анализа и прогнозирования спроса на продукцию фирмы

Влияние объясняющих переменных x1, x2, ... , xk на объясняемую переменную - yxm исследуется методами инфлюентного, многофакторного, корреляционно-регрессионного анализа. Метод корреляционно- регрессионного анализа широко используется для изучения взаимосвязи факторов.

Уравнение множественной линейной регрессии имеет вид:

yxm = m0+m1*x1+m2*x2+...+mk*xk + e, где e - случайная ошибка.

Предполагается, что ошибка - случайная величина с нулевым математическим ожиданием и постоянной дисперсией. По данным n наблюдений требуется оценить значения параметров m0 , m1 , ... , mk. Для обеспечения статистической надежности необходимо, чтобы число наблюдений (n), по крайней мере, в 3 раза превосходило число оцениваемых параметров (k+1), формально должно быть n>=k+1. Критерием оценивания параметров чаще всего является метод наименьших квадратов. При оценке качества полученного уравнения регрессии проверяются следующие гипотезы: • о значимости коэффициентов регрессии;

о значимости уравнения;

об отсутствии автокорреляции остатков ei.

Анализ начинается с исследования корреляционной матрицы, с помощью которой выявляются коррелируемые факторы, один из пары таких факторов исключается.

Для проверки первой гипотезы рассчитывается t-статистика: ti=| mi/Smil,

где Smi - стандартное отклонение коэффициента mi. Коэффициент ti сравнивается с табличным значением tp - критическое значение таблицы распределения Стьюдента с (n-k-1) степенями свободы. Если ti> tp, то коэффициент mi значим с вероятностью ошибки p, иначе - незначим. Фактор xi , для которого незначим коэффициент mi , из модели исключается, а уравнение оценивается вновь.

Для проверки второй гипотезы рассчитывается, F-статистика. Уравнение регрессии значимо, если F>Fp, где Fp - критическое значение таблицы распределения Фишера с (k,n-k-1) степенями свободы при уровне значимости p.

При оценке линейного уравнения регрессии предполагается, что реальная взаимосвязь переменных линейна, а отклонения ej модельных данных yjm от реальных - yj (ej= yj- yjm, j=1,...,n) случайны, независимы и имеют нулевое среднее и постоянную дисперсию.

Для оценки независимости отклонений рассчитывается статистика Дарбина-Уотсона:

п 9

Ybj - О

DW = j=2

ej

S

j=1

Если DW составляет 1,5 - 2 - 2,5, то при малом объеме выборки можно считать, что автокорреляция остатков отсутствует, а любая другая нелинейная функция не превосходит построенную линейную регрессию. Автокорреляция остатков говорит о неверной спецификации модели, либо о наличии неучтенных факторов. Существует несколько способов устранения автокорреляции, например, введение в модель фактора времени, переход к темповым или относительным показателям, включение в модель неучтенных факторов, построение авторегрессионных уравнений.

При принятии маркетинговых решений возникает необходимость оценки степени влияния каждого фактора, включенного в модель, на объясняемый показатель y. Для сравнения роли различных факторов применяют частные коэффициенты эластичности Эi , ^-коэффициенты и Д-коэффициенты.

Коэффициент

Э. = т * X У

показывает, на сколько % изменится y при изменении фактора xi на 1% при фиксированном положении других факторов.

^-коэффициент показывает, на какую часть СКО - Gy изменится y с изменением фактора xi на величину своего СКО - ai:

pi=mi * Gi / Gy .

Чтобы оценить долю влияния каждого фактора в суммарном влиянии факторов, рассчитываются A-коэффициенты:

Ai=riy * Pi / R2 , где riy - коэффициент корреляции xi и y; R - коэффициент детерминации.

Анализ приоритетности влияния факторов опирается на сравнение приведенных коэффициентов.

По уравнению множественной линейной регрессии осуществляют точечный, подстановкой значений независимых факторов в уравнение, и интервальный, определением доверительного интервала, прогноз. Отличие в t-й период реального значения yj от модельного yjm связано с ошибками трех видов: ошибкой Sm0 свободного члена уравнения; ошибками Smi коэффициентов регрессии и стандартной ошибкой Sy зависимой переменной y. Тогда дисперсия ошибки прогноза определяется так:

S^2 = Sm02 + [Sm1* (x1-x1C)]2 + [Sm2* (x2-x2C)]2 + [Sm3* (x3-x3C)]2 + [Sm4* (x4-x4C)]2 + Sy2 , где xic - среднее значение xi .

Предполагается, что ошибка прогноза имеет нормальное распределение, тогда с вероятностью 99% можно утверждать, что величина прогнозируемого показателя в t-м периоде будет находиться в пределах:

ytm - 2,58 * S^ <= yt <= ytm + 2,58 * S^ .

<< | >>
Источник: Н.А. Семенов, М.Г. Шалунова. Методические указания по изучению дисциплины «Маркетинг» Н.А. Семенов, М.Г. Шалунова . - Тверь: ТГТУ,2000. - 42 с.. 2000

Еще по теме 2.2. Лабораторная работа № 2. Применение регрессионных моделей для анализа и прогнозирования спроса на продукцию фирмы: