<<
>>

2. Ранговая корреляция

Рассмотрим выборку объема п, элементы которой обладают двумя качест-веными признаками: А и В (качественный признак невозможно измерить точно, но можно расположить объекты в порядке убывания или возрастания качества).

Расположим элементы выборки в порядке ухудшения качества по признаку А. При этом зададим каждому объекту ранг хi, равный его порядковому номеру в последовательности объектов: xi = i. Затем расположим элементы выборки в порядке убывания качества по признаку В и присвоим каждому второй ранг: yi, где номер i – это номер объекта в первой последовательности рангов. Таким образом, получены две последовательности рангов:

A: x1, x2, ..., xn

B: y1, y2, ..., yn.

Для исследования наличия связи между качественными признаками А и В можно использовать коэффициенты ранговой корреляции Спирмена и Кендалла.

Коэффициент ранговой корреляции Спирмена вычисляется по формуле:

где di = xi – yi, n – объем выборки.

Для вычисления коэффициента ранговой корреляции Кендалла найдем величины R1, R2, ..., Rn, где Ri – количество чисел, больших yi, стоящих справа от yi в последовательности рангов по признаку В. Тогда выборочный коэффи-циент ранговой корреляции Кендалла

где R = R1 + R2 + ... + Rn.

Заметим, что оба коэффициента ранговой корреляции не превосходят по модулю единицы. При этом, чем ближе значение или к 1, тем теснее возможная связь между признаками А и В.

Пример 12. Десять школьников сдавали выпускной экзамен ЕГЭ по математике и вступительный экзамен по системе централизованного тестиро-вания. Результаты обоих экзаменов оценивались по 100-балльной шкале и оказались следующими (1-я строка – оценки ЕГЭ, вторая – централизованно-го тестирования):

87 82 80 79 63 55 40 34 33 29

57 92 80 69 71 43 49 51 20 19

Найти выборочные коэффициенты корреляции Спирмена и Кендалла.

Решение.

Составим последовательности рангов по убыванию баллов на каждом экзамене:

xi 1 2 3 4 5 6 7 8 9 10

yi 5 1 2 4 3 8 7 6 9 10 .

Вычислим di: d1 = 1 – 5 = -4; d2 = 2 – 1 = 1; d3 = 3 – 2 = 1; d4 = 4 – 4 = 0;

d5 = 5 – 3 = 2; d6 = 6 – 8 = -2; d7 = 7 – 7 = 0; d8 = 8 – 6 = 2; d9 = d10 = 0.

Найдем Тогда выборочный коэффициент ранговой корреляции Спирмена

Приступим к вычислению коэффициента корреляции Кендалла. Определим, сколько рангов, больших данного, располагается справа от каждого yi:

R1 = 5; R2 = 8; R3 = 7; R4 = 5; R5 = 5; R6 = 2; R7 = 2; R8 = 2; R9 = 1; R10 = 0;

R = 5 + 8 + 7 + 5 + 5 + 2 + 2 + 2 + 1 = 37;

Заметим, что величины выборочных коэффициентов корреляции позволяют предполагать существование связи между результатами экзаменов. Для проверки этого предположения следует проверить гипотезу о значимости соответствующего выборочного коэффициента ранговой корреляции.

Задания для курсовой работы включают по 6 задач. В них требуется выполнить следующие действия:

Задача 1. По данным выборки

1) построить статистический ряд распределения;

2) изобразить гистограмму;

3) вычислить выборочное среднее;

4) вычислить выборочную дисперсию.

Задача 2. Используя метод наименьших квадратов, найти параметры

зависимости y = f(ax + b) :

а) в предположении, что эта зависимость линейна;

б) в предположении, что зависимость нелинейна, выбрав по форме данных ее наиболее вероятный вид. В ответе требуется указать:

1) коэффициенты a и b для линейной зависимости;

2) форму нелинейной зависимости;

3) коэффициенты a и b для нелинейной зависимости;

4) величины средних квадратических отклонений для линейного и нелиней-ного случая.

Задача 3. По данным выборки, удовлетворяющей нормальному закону распределения, вычислить:

1) выборочное среднее;

2) исправленное выборочное среднее квадратическое отклонение;

3) доверительный интервал для математического ожидания при доверитель-ной вероятности γ;

4) доверительный интервал для среднего квадратического отклонения для того же значения γ.

Задача 4. По данным выборки, удовлетворяющей нормальному закону распределения со средним квадратическим отклонением s , вычислить

1) выборочное среднее;

2) доверительный интервал для математического ожидания при доверительной вероятности γ.

Задача 5. По данным выборки двумерной случайной величины определить:

1) вектор математического ожидания;

2) вектор дисперсии;

3) выборочный коэффициент корреляции;

4) выборочное уравнение прямой линии регрессии Y на X в виде Y = aX + b.

Задача 6. По данным двух выборок вычислить коэффициенты ранговой корреляции Спирмена и Кендалла.

Примечание 1.

Ответы на курсовые задания имеются у авторов данного методического пособия и могут быть предоставлены преподавателям, использующим его в работе со студентами.

Примечание 2.

Для выдачи большего количества различных вариантов заданий преподава-тели могут воспользоваться программой «TASKMAKER», содержащей все задания, приведенные в пособии, практически в неограниченном количестве вариантов.

<< | >>
Источник: Симонов А.А., Выск Н.Д.. МАТЕМАТИЧЕСКАЯ СТАТИСТИКА. Методические указания и варианты курсовых заданий. Москва - 2005. 2005

Еще по теме 2. Ранговая корреляция: