3.1.1.3. Подкоманда /STATISTICS - описательные статистики
FREQUENCIES V1 V2 V4 /STATISTICS DEFAULT.
Ключевые слова: MEAN - среднее;
SEMEAN - стандартная ошибка среднего;
MEDIAN- медиана (процентиль с 50 %)
MODE - мода (наиболее частое значение)
STDDEV - стандартное отклонение;
VARIANCE - дисперсия;
KURTOSIS - эксцесс (пикообразность);
SEKURT - стандартная ошибка эксцесса;
SKEWNESS - коэффициент асимметрии (скошенность);
SESKEW - стандартная ошибка коэффициента асимметрии;
RANGE - разброс = (MAX - MIN) ;
MINIMUM - минимум;
MAXIMUM - максимум;
SUM - сумма всех значений переменной;
ALL - все статистики;
DEFAULTS - статистики МEAN, STDDEV, MIN, MAX.
Статистика MEAN вычисляется по известной формуле x = ( + x2 +...
+ xn) /n , VARIANCE - несмещенная оценки дисперсии - поформуле Sx2 =^(xt -x)2/(n -1), SEMEAN - стандартная ошибка средне-
го - по формуле

/> Стандартную ошибку можно использовать для оценки доверительного интервала матожидания (в случае нормального распределения генеральной совокупности границы (1 - а) х 100 % доверительного интервала имеют вид 2 = x ± t1-a/2(и -1)Sx). Напомним, что доверительным интервалом
параметра называется интервал со случайными границами, накрывающий значение параметра с заданной (доверительной) вероятностью. В частности, приближенными оценками границ 95 %-го двустороннего доверительного интервала для матожидания являются значения x ± 1,96 Sx (истинное значение матожидания с вероятностью 0,95 находится в этих пределах).
Примерно в пределах x ± Sx должно находиться около 68 % наблюдений совокупности.
На практике постоянно возникает вопрос, нормально ли распределение переменной, так как многие статистические методы разработаны в предположении нормальности.
Исследуемые распределения обычно отличаются от нормального закона, а в этом случае оценки некоторых параметров будут смещены. Например, будет некорректно вычислена наблюдаемая значимость оценки. Исследователю важно понять, опасно ли смещение выборочного распределения от нормального. Приближенно и быстро оценить масштабы отклонения распределения от нормального можно, используяскошенность и пико ^^(xi - x)3/S j jn образность.
Скошенность SKEWNESS определяется расчетом третьего момента по
формуле I ^ (xi - x) n - коэффициент асимметрии.

Если полученная величина меньше нуля, то распределение растянуто влево, если больше нуля - то вправо. Чем больше отличие от нуля, тем значительнее отклонения распределения от нормального.
Пикообразность KURTOSIS определяется значением четвертого момен-

Нулевое значение Kurtosis означает, что пикообразность распределения совпадает с пикообразностью нормального распределения.
Чем больше четвертый момент, тем больше пикообразность распределения и, следовательно, отличие от нормального. В этом случае существенность отклонений статистик от теоретических можно проверить, используя стандартные ошибки этих статистик (Std. Error of Skewness и Std. Error of Kurtosis). В основе лежит факт, что отношение статистики к ее стандартной ошибке имеет распределение, близкое к нормальному). Например, если это отношение превышает 1,96, то мы должны отклонить гипотезу о равенстве Kurtosis нулю в генеральной совокупности и, следовательно, о нормальном распределении переменной.Полезность этих двух статистик не ограничивается проверкой нормальности распределения.
Приобретя некоторый опыт, можно использовать эти статистики для качественного анализа распределения. Например, при исследовании доходов можно использовать Kurtosis как измеритель степени неравенства доходов населения. Чем больше пикообразность, тем однороднее доходы.Перечисленные описательные статистики команды FREQUENCIES играют в анализе данных особую роль. Они позволяют провести первый этап
статистических исследований выборки. Ниже приведен пример описательных статистик, полученных для переменной «Среднемесячный душевой доход в семье», построенной по ответам на 14-й вопрос анкеты «Курильские острова».
FREQUENCIES VARIABLES = V14 /NTILES = 4 /PERCENTILES = 10 90
/STATISTICS = STDDEV VARIANCE RANGE MINIMUM MAXIMUM SEMEAN MEAN MEDIAN MODE SUM SKEWNESS SESKEW KURTOSIS SEKURT.
Команда вычисляет также и-тили и процентили.
Таблица 3.2
Статистики переменной V14 - «Душевой доход», выданные командой FREQUENCIES N Valid 673 Missing 48 Mean 229,11 Std. Error of Mean 5,83 Median 200 Mode 200 Std. Deviation 151,342 Variance 22904,531 Skewness 3,035 Std. Error of Skewness 0,094 Kurtosis 15,080 Std. Error of Kurtosis 0,188 Range 1479 Minimum 21 Maximum 1500 Sum 154190 Percentiles 10 100 25 140 50 200 75 280 90 400 Анализируя полученные данные (табл. 3.2), видим, что доход в семьях меняется в диапазоне от 21 до 1 500 р. (разброс равен 1 479). При этом средний доход составил около 229,11 р. Приближенными границами пяти-процентного доверительного интервала для матожидания будут значения
229,11 ± 1,96 х 5,83, где 1,96 - критическое значение нормального распределения для p = 0,05/2 = 0,025. Скошенность skewness = 3,035 и пикообраз- ность kurtosis = 15,08 значительно больше нуля. Их стандартные ошибки (0,094 и 0,188 соответственно) свидетельствуют о статистической значимости такого отличия. Действительно, отношение коэффициентов к ошибкам достаточно велико и попадает в критическую область, что позволяет отклонить гипотезу о равенстве полученных статистик нулю.
Результатом задания процентилей и n-тилей являются выданные в таблице процентили (у 10 % опрошенных респондентов доход меньше 100 р., у 90 % - меньше 400; имеются также процентили, ограничивающие уровни дохода для 25, 50, 75 % респондентов).
Еще по теме 3.1.1.3. Подкоманда /STATISTICS - описательные статистики:
- 3.2.1.4. Подкоманда /STATISTICS - исследование связи неколичественных переменных
- 3.1.2. DESCRIPTIVES - описательные статистики
- Определение параметров описательной статистики
- Раздел 2. Методы описательной статистики
- Приложение 2.2 Таблица описательной статистики
- ПРИЛОЖЕНИЕ6 Таблицы описательной статистики по группам.
- Приложение 3.2. Описательная статистика экспериментальной и контрольной группы
- ПРИЛОЖЕНИЕ 13 Описательная статистика различий показателей групповой готовности к риску на разных этапах развития команды.
- 3.2.1.2. Подкоманда /CELLS
- 3.1.1.2. Подкоманды /NTILES, /PERCENTILES - и-тили, процентили
- 3.2.1.1. Подкоманда /TABLES - задание таблиц
- 3.1.1.1. Подкоманды /BARCHART, /PIECHART и /HISTOGRAM - диаграммы распределения
- 1.2 Лексикология описательная и историческая
- § 52. Описательная ("аналитическая") форма будущего времени несовершенного вида
- § 52. Описательная («аналитическая») форма будущего времени несовершенного вида