1.5. Выбор теоретического закона распределения случайной величины
При наличии числовых характеристик случайной величины (математического ожидания, дисперсии, коэффициента вариации)
законы ее распределения могут быть определены в первом приближении по табл.
1.5.Таблица 1.5
Законы распределения случайной положительной величины в зависимости от коэффициента вариации Пределы изменения коэффициента Закон распределения случайной вариации Vx величины X ^<0,3 Нормальный 0,3 < Vx < 0,4 Гамма-распределение 0,4 ZVX< 1 Вейбулла vx= і Экспоненциальный, Пуассона
Для более точного определения теоретического закона распределения проводят дополнительную статистическую обработку данных. При обработке статистических данных решают вопрос о том, как подобрать для исходного статистического ряда теоретическую кривую распределения, которая выражала бы лишь существенные черты статистического материала, но не случайности, обусловленные недостаточным объемом выборки экспериментальных данных. Под построением теоретической кривой распределения понимается такая обработка статистических данных, когда обеспечивается подбор наиболее подходящего теоретического закона распределения, задаваемого либо функцией распределения F(x), либо плотностью распределения Дх).
Для построения теоретической кривой распределения исходный статистический ряд распределения аппроксимируется одной из дифференциальных функций теоретического распределения Дх). При этом выбирается такая функция Дх), которая обеспечивала бы максимальное приближение теоретических данных к эмпирическим Дх) я /*(х). Для оценки правдоподобия этого приближенного равенства разработано несколько критериев согласия проверяемых гипотез относительно вида функции Дх).
Наиболее употребительными критериями согласия являются критерий %2 Пирсона и критерий Колмогорова.
Для примера подробно рассмотрим критерий %2 Пирсона.Критерий %2 Пирсона. Согласно критерию %2 Пирсона в качестве меры расхождения между теоретическим законом распределения и статистическим распределением выбрана величина, определяемая следующим выражением:
X2 — i/=1 Pi
где к — число интервалов статистического ряда;
р — статистическая вероятность попадания случайной величины в интервал;
Pi — теоретическая вероятность попадания случайной величины X в /-й интервал.
Учитывая соотношение р* выражение (1.71) после пре-
п
образований записываем в виде:
(L72)
/=1 n'Pi
где mi — эмпирическое количество значений случайной величины, попадающих в /-й интервал.
Для того чтобы выяснить, является ли полученное расхождение X2 случайным за счет ограниченного объема выборки или свидетельствует о наличии существенной разницы между теоретическим и статистическим распределениями, необходимо вычислить вероятность такого расхождения А > %2, т. е. Р(% < А < оо) вероятность того, что за счет чисто случайных причин мера расхождения теоретического и статистического распределений А будет не меньше, чем фактическое значение %2 для данной выборки. Величина вероятности расхождения определяется по специальным таблицам при известных значениях г и % .
Число степеней свободы г вычисляется для данного статистического ряда распределения как
г - к - U (1.73)
где / — число исчисленных статистических характеристик (средняя, дисперсия и т. д.), использованных при вычислении теоретического распределения.
Если искомая вероятность окажется очень малой, практически меньше 0,1, то выбранное теоретическое распределение следует считать неудачным. При относительно большом значении искомой вероятности теоретическое распределение можно признать не про-тиворечащим опытным данным.
Следует отметить, что критерий х2 Пирсона применим в тех случаях, когда объем выборки п > 100 и в каждом интервале число наблюдений не менее /ті/ > 5.
Пример 1.6.
Пользуясь критерием %2 Пирсона, подобрать те-оретический закон распределения для часовой выработки автомобилей КамАЗ-5511, статистическое распределение которой приведено в табл. 1.4 примера 1.1.Решение
По форме гистограммы рис. 1.4 можно предположить, что часовая выработка автомобиля подчиняется нормальному закону.
Для оценки числовых характеристик нормального распределе-ния вычислим:
математическое ожидание *
mx = ^XiPi =4,75-0,07+ 6,25-0,14+ 7,75-0,17+ 9,25-0,17 + /=1
+ 10,75 • 0,15 + 12,25 • 0,14 + 13,75 • 0,11 + 15,25 • 0,05 = 9,7 т;
дисперсию *
Dx = Ъ(тх-хІ)рі =(9,7-4,75).0,07 + (9,7-6,25).0,14 + /=1
+ (9,7 - 7,75) • 0,17 + (9,7 - 9,25) • 0,17 + (9,7 - 10,75) • 0,15 + + (9,7 - 12,25) • 0,14 + (9,7 - 13,75) • 0,11 + (9,7 - 15,25) • 0,05 - 8,48, где Зс/ — значение середины /-го интервала.
Среднее квадратическое отклонение
0jc=^ = VM83=2,91. -ф N J J Pi=F(xi+i)-F(xi) = Ф
V
где xh xi+l — границы /-го интервала (табл. 1.4).
Коэффициент вариации
Затем составим сравнительную таблицу (табл. 1.6) чисел попаданий в интервалы mi и соответствующих значений пр;(п = 100).
Таблица 1.6
Сравнительная таблица Интервал, А*/, т 4-5,5 5,5-7,0 7,0-8,5 8,5-10 10-11,5 11,5-13,0 13,0-14,5 14,5-16 Количест-во наблю-дений, tttj 7 14 17 17 15 14 11 5 Теорети-ческое количество наблю-дений, ПРі 5 11 17 21 20 14 8 4 1.1.
Построим график теоретического распределения и совместим его с гистограммой статистического распределения (рис. 1.11).
Вычислим значение меры расхождения по формуле /=1 nPi
Определим число степеней свободы
г = к- 1= 8-2 =6.
По приложению 8 для г = 6 находим следующее:
при х2 = 3,83 р = 0,7;
при х2 = 5,35 р = 0,5.
Следовательно, искомая вероятность р при % = 5,01 приближенно равна р ~ 0,545. Эта вероятность малой не является; поэтому гипотезу о том, что часовая выработка автомобиля распределена по нормальному закону, можно считать правдоподобной.