<<
>>

§2. Дисперсия и среднее квадратическое отклонение

При описании некоторых явлений среднее арифметическое дает о них примерное представление, вполне удовлетворительное для практических целей. Таково, например, среднее число правонарушений в день, рассмотренное в примере 1 (§1).

Однако весьма часто встречаются такие ситуации, для описания которых недостаточно знать только среднее арифметическое.

История первая. Двух студентов юридического факультета послали на практику, одного в город Дрюково, другого — в город Стуково. Практиканты узнали, что в это время года среднесуточная температура в этих городах равна нулю. Тот из них, кто поехал в Стуково, будучи человеком осторожным, взял с собой только теплые вещи. Другой, более легкомысленный, оделся по-летнему. Оказалось, что в течение всей практики в обоих городах температура была стабильной: в Дрюкове — +2 днем и -2 ночью, в Стукове — +15 днем и -15 ночью. В результате, несмотря на то, что среднесуточная температура действительно была нулевой, оба студента заболели, так как один постоянно перегревался, а другой — постоянно мерз.

История вторая. Один из торговцев в Дрюкове был очень набожным человеком. Как-то раз, под впечатлением воскресной проповеди о пользе благотворительности, он в первой половине недели сдавал каждому покупателю сдачу на 1000 руб. больше, чем нужно. Но потом действие проповеди ослабело, и нашего торговца одолела природная корысть. В следующие три дня он уже обманывал каждого покупателя, беря со всех на 1000 руб. больше. Поскольку число покупателей в первые и последние три дня недели было одинаковым, то получается, что в среднем размер неправильной сдачи равен нулю, т.е. в среднем покупатели получали сдачу правильно!

Из этих историй видно, что, помимо средней величины, нужно знать еще и то, как заданные числа рассеяны около их среднего значения. Для этой цели вводятся дисперсия и среднее квадратическое отклонение.

Дисперсией величин х1, х2, ... , хп называется число

5

Пример 1. На обследование каждого из десяти автомобилей было затрачено следующее время (в мин):

Таблица 3

i 1 2 3 4 5 6 7 8 9 10
xi 25 30 22 22 54 36 41 45 25 40

Здесь символом xi обозначено время, затраченное на обследование автомобиля с номером i. Найти дисперсию величин xi.

Решение. Составим таблицу из трех столбцов:

Первичная обработка результатов эксперимента

Таблица 4

x1
25 –9 91
30 –4 16
22 –12 144
22 –12 144
54 20 400
3 2 4
41 7 49
45 11 121
25 –9 81
40 6 36
340 0 1076

В последней строке первого столбца записано общее время обследования всех автомобилей, т.е.

сумма всех чисел хi = 340. Поделив ее на 10, найдем среднее арифметическое чисел (мин).

Во втором столбце записаны разности , , ..., , представляющие собой отклонения величин х1, х2, ..., х10 от их среднего. Сумма отклонений всегда равна нулю, что показано в последней строке второго столбца. Это важнейшее свойство средней величины.

В третьем столбце табл. 4 записаны квадраты отклонений: , , ..., .

Сумма квадратов, как видно из последней строки, равна 1076. По формуле (5) находим дисперсию D:

(мин2)

Если известны частоты то для вычисления дисперсии вместо формулы (5) можно использовать формулу

(6)

где, как и выше, суть различные среди заданных чисел х1, х2, ... хk.

Средним квадратическим отклонением величин х1, х2, ... хk от их среднего значения называется величина

(7)

В примере 1 среднее квадратическое отклонение равно

= 10,373... * 10,4 (мин).

Из формулы (5) видно, что дисперсия представляет собой среднее арифметическое квадратов разностей , , ..., ,. Поэтому величину S можно рассматривать как среднее отклонение величин х1, х2, ... хn oт их среднего значения .

Из определения дисперсии и среднего квадратического отклонения следует, что последнее не превышает наибольшей из величин || (абсолютная величина отклонения). Так, в первом примере 10,4 < 20, т.е. S существенно меньше максимального отклонения. Зато в историях, которые мы рассказали в начале параграфа, среднее квадратическое отклонение S является максимально возможным, так как все отклонения от среднего значения одинаковы по абсолютной величине. Вычислив по формулам (5) и (6) среднее квадратическое отклонение температуры в Дрюкове и Стукове, мы найдем, что оно равно максимальной температуре (2 и 15 соответственно); во второй истории среднее квадратическое отклонение будет 1000 руб., что также совпадает с величиной максимального отклонения.

Прежде чем двигаться дальше, необходимо ввести весьма важное понятие переменной величины. В примере 1 центральную роль играет табл. 3, в которой каждому автомобилю ставится в соответствие время его обследования. Математики в этом случае говорят, что время обследования есть переменная величина X, принимающая значения х1, х2, ... хn.. В примере 2 из §1 переменной величиной является число правонарушений, в примере 3 — прибыль страховой компании.

Теперь допустим, что нужно обследовать все автомобили города Дрюкова. Но число автомобилей так велико, что описать все значения величины X (X — время обследования) практически невозможно. Однако мы можем, не проводя самого обследования, предсказать его результаты приближенно, с помощью примера 1. Предварительно, используя табл. 3, составим другую таблицу, в которой укажем время обследования ii и соответствующую частоту :

Таблица 5

22 25 30 36 40 41 45 54
0.2 0.2 0.1 0.1 0.1 0.1 0.1 0.1

Обычно, прогноз содержит следующую информацию о величине X:

1) диапазон значений величины X,

2) среднее значение ,

3) среднее квадратическое отклонение S,

4) интервал наиболее вероятных значений величины X,

5) долю значений величины X, попадающих в заданный промежуток.

По данным примера 1:

время обследования автомобиля изменяется в пределах от (22 - х) до (54 - х) мин,

среднее время обследования одного автомобиля — = 34 мин,

среднее отклонение величины X от ее среднего значения составляет S = 10,4 мин.

Интервалом наиболее вероятных значений величины X обычно называют интервал, серединой которого является точка — среднее арифметическое, и в который попадает более половины значений величины X. Рассмотрим, например, интервал ( – S; + S). Имеем: – S = 23,6 и + S = 44,4. Из табл. 5 видно, что в интервале 23,6 – 44,4 содержится 5 значений величины X: 25, 30, 36, 40, 41. Их частоты соответственно равны 0,2; 0,1; 0,1; 0,1; 0,1. Суммарная частота будет 0,6. Это число составляет 60% от единицы, т.е. от суммы всех частот. Следовательно, в интервал 23,6 – 44,4 попадает 60% (т.е. большая часть) значений величины X. Таким образом, этот интервал является интервалом наиболее вероятных значений величины X. Доля значений величины X, попавших в какой-либо другой интервал, оценивается так же. Обычно оценивают долю больших и малых значений. В нашем примере доля автомобилей, на обслуживание которых затрачивается меньше 23,6 мин, составляет 20% от общего количества автомобилей (в табл. 5 имеется одно такое значение — 22, и его частота равна 0,2). Доля автомобилей, на обслуживание которых затрачивается больше 44,4 мин, составляет также 20% от общего количества автомобилей.

При обработке статистического материала используется специальная терминология. Совокупность всех рассматриваемых объектов называют генеральной совокупностью, а часть объектов, каким-либо способом выбранных для обследования, называют выборкой. В нашем примере с автомобилями генеральную совокупность образуют все автомобили города Дрюкова, а выборку — те 10 автомобилей, которые рассматривались в примере 1.

Очень важно сделать выборку правильно. От этого зависит, насколько точными и достоверными будут полученные выводы, результаты прогноза. В математической статистике изучаются способы отбора, позволяющие сделать выборку так, чтобы полученная с ее помощью информация давала достаточно полное и адекватное представление об интересующем нас признаке изучаемой генеральной совокупности. Тогда найденные с помощью выборки среднее арифметическое и D дисперсия будут близки к гипотетическим величинам — среднему арифметическому и дисперсии, которые могли бы быть получены при обработке всей генеральной совокупности.

<< | >>
Источник: Неизвестный. Математика. 0000
Помощь с написанием учебных работ

Еще по теме §2. Дисперсия и среднее квадратическое отклонение:

  1. 1.1. Обзор способов и методов разработки метрологического обеспечения контроля и диагностирования технического состояния автотранспортных средств.
  2. Алгоритм расчета среднего взвешенного линейного отклонения.
  3. 7.2 Характеристики выборочной и генеральной совокупности
  4. Среднеквадратическое отклонение
  5. 1.2. Числовые характеристики случайных величин
  6. § 21.3. ПОКАЗАТЕЛИ ВАРИАЦИИ (КОЛЕБЛЕМОСТИ) ПРИЗНАКА
  7. МЕТОДЫ ВЫЯВЛЕНИЯ И ОЦЕНКИ РИСКОВ
  8. 2.6. Управление финансовыми рисками. Классификация финансовых рисков
  9. Свойства дисперсии случайной величины
  10. Среднее квадратическое отклонение.
  11. Предельные теоремы.
  12. Статистические оценки параметров распределения
  13. §2. Дисперсия и среднее квадратическое отклонение
  14. 8.Практическое занятие №8 « Нахождение вероятности событий, функции распределения и числовых характеристик дискретной случайной величины»
  15. Числовые характеристики случайных величин
  16. §10. Дискретные случайные величины и их характеристики
  17. §12. Оценки параметров распределения
  18. 2.9. Нахождение средней квадратической ошибки уравнения
  19. 12.4. Задачи для самостоятельной работы
  20. К