2. Ранговая корреляция
Рассмотрим выборку объема п, элементы которой обладают двумя качест-веными признаками: А и В (качественный признак невозможно измерить точно, но можно расположить объекты в порядке убывания или возрастания качества).
Расположим элементы выборки в порядке ухудшения качества по признаку А. При этом зададим каждому объекту ранг хi, равный его порядковому номеру в последовательности объектов: xi = i. Затем расположим элементы выборки в порядке убывания качества по признаку В и присвоим каждому второй ранг: yi, где номер i – это номер объекта в первой последовательности рангов. Таким образом, получены две последовательности рангов:
A: x1, x2, ..., xn
B: y1, y2, ..., yn.
Для исследования наличия связи между качественными признаками А и В можно использовать коэффициенты ранговой корреляции Спирмена и Кендалла.
Коэффициент ранговой корреляции Спирмена вычисляется по формуле:
где di = xi – yi, n – объем выборки.
Для вычисления коэффициента ранговой корреляции Кендалла найдем величины R1, R2, ..., Rn, где Ri – количество чисел, больших yi, стоящих справа от yi в последовательности рангов по признаку В. Тогда выборочный коэффи-циент ранговой корреляции Кендалла
где R = R1 + R2 + ... + Rn.
Заметим, что оба коэффициента ранговой корреляции не превосходят по модулю единицы. При этом, чем ближе значение или к 1, тем теснее возможная связь между признаками А и В.
Пример 12. Десять школьников сдавали выпускной экзамен ЕГЭ по математике и вступительный экзамен по системе централизованного тестиро-вания. Результаты обоих экзаменов оценивались по 100-балльной шкале и оказались следующими (1-я строка – оценки ЕГЭ, вторая – централизованно-го тестирования):
87 82 80 79 63 55 40 34 33 29
57 92 80 69 71 43 49 51 20 19
Найти выборочные коэффициенты корреляции Спирмена и Кендалла.
Решение.
Составим последовательности рангов по убыванию баллов на каждом экзамене:
xi 1 2 3 4 5 6 7 8 9 10
yi 5 1 2 4 3 8 7 6 9 10 .
Вычислим di: d1 = 1 – 5 = -4; d2 = 2 – 1 = 1; d3 = 3 – 2 = 1; d4 = 4 – 4 = 0;
d5 = 5 – 3 = 2; d6 = 6 – 8 = -2; d7 = 7 – 7 = 0; d8 = 8 – 6 = 2; d9 = d10 = 0.
Найдем Тогда выборочный коэффициент ранговой корреляции Спирмена
Приступим к вычислению коэффициента корреляции Кендалла. Определим, сколько рангов, больших данного, располагается справа от каждого yi:
R1 = 5; R2 = 8; R3 = 7; R4 = 5; R5 = 5; R6 = 2; R7 = 2; R8 = 2; R9 = 1; R10 = 0;
R = 5 + 8 + 7 + 5 + 5 + 2 + 2 + 2 + 1 = 37;
Заметим, что величины выборочных коэффициентов корреляции позволяют предполагать существование связи между результатами экзаменов. Для проверки этого предположения следует проверить гипотезу о значимости соответствующего выборочного коэффициента ранговой корреляции.
Задания для курсовой работы включают по 6 задач. В них требуется выполнить следующие действия:
Задача 1. По данным выборки
1) построить статистический ряд распределения;
2) изобразить гистограмму;
3) вычислить выборочное среднее;
4) вычислить выборочную дисперсию.
Задача 2. Используя метод наименьших квадратов, найти параметры
зависимости y = f(ax + b) :
а) в предположении, что эта зависимость линейна;
б) в предположении, что зависимость нелинейна, выбрав по форме данных ее наиболее вероятный вид. В ответе требуется указать:
1) коэффициенты a и b для линейной зависимости;
2) форму нелинейной зависимости;
3) коэффициенты a и b для нелинейной зависимости;
4) величины средних квадратических отклонений для линейного и нелиней-ного случая.
Задача 3. По данным выборки, удовлетворяющей нормальному закону распределения, вычислить:
1) выборочное среднее;
2) исправленное выборочное среднее квадратическое отклонение;
3) доверительный интервал для математического ожидания при доверитель-ной вероятности γ;
4) доверительный интервал для среднего квадратического отклонения для того же значения γ.
Задача 4. По данным выборки, удовлетворяющей нормальному закону распределения со средним квадратическим отклонением s , вычислить
1) выборочное среднее;
2) доверительный интервал для математического ожидания при доверительной вероятности γ.
Задача 5. По данным выборки двумерной случайной величины определить:
1) вектор математического ожидания;
2) вектор дисперсии;
3) выборочный коэффициент корреляции;
4) выборочное уравнение прямой линии регрессии Y на X в виде Y = aX + b.
Задача 6. По данным двух выборок вычислить коэффициенты ранговой корреляции Спирмена и Кендалла.
Примечание 1.
Ответы на курсовые задания имеются у авторов данного методического пособия и могут быть предоставлены преподавателям, использующим его в работе со студентами.
Примечание 2.
Для выдачи большего количества различных вариантов заданий преподава-тели могут воспользоваться программой «TASKMAKER», содержащей все задания, приведенные в пособии, практически в неограниченном количестве вариантов.