Коэффициент ранговой корреляции rs Спирмена. Корреляционный анализ по методу Спирмена (ранги Спирмена)

Краткая теория

Ранговая корреляция – это метод корреляционного анализа, отражающий отношения переменных, упорядоченных по возрастанию их значения.

Ранги - это порядковые номера единиц совокупности в ранжированном ряду. Если проранжировать совокупность по двум признакам, связь между которыми изучается, то полное совпадение рангов означает максимально тесную прямую связь, а полная противоположность рангов - максимально тесную обратную связь. Ранжировать оба признака необходимо в одном и том же порядке: либо от меньших значений признака к большим, либо наоборот.

Для практических целей использование ранговой корреляции весьма полезно. Например, если установлена высокая ранговая корреляция между двумя качественными признаками изделий, то достаточно контролировать изделия только по одному из признаков, что удешевляет и ускоряет контроль.

Коэффициент корреляции рангов, предложенный К. Спирменом, относится к непараметрическим показателям связи между переменными, измеренными в ранговой шкале. При расчете этого коэффициента не требуется никаких предположений о характере распределений признаков в генеральной совокупности. Этот коэффициент определяет степень тесноты связи порядковых признаков, которые в этом случае представляют собой ранги сравниваемых величин.

Величина коэффициента корреляции Спирмена лежит в интервале +1 и -1. Он может быть положительным и отрицательным, характеризуя направленность связи между двумя признаками, измеренными в ранговой шкале.

Ранговый коэффициент корреляции Спирмена подсчитывается по формуле:

Разность между рангами по двум переменным

число сопоставляемых пар

Первым этапом расчета коэффициента ранговой корреляции является ранжирование рядов переменных. Процедура ранжирования начинается с расположения переменных по возрастанию их значений. Разным значениям присваиваются ранги, обозначаемые натуральными числами. Если встречается несколько равных по значению переменных, им присваивается усредненный ранг.

Преимущество коэффициента корреляции рангов Спирмена состоит в том, что ранжировать можно и по таким признакам, которые нельзя выразить численно: можно проранжировать кандидатов на занятие определенной должности по профессиональному уровню, по умению руководить коллективом, по личному обаянию и т. п. При экспертных оценках можно ранжировать оценки разных экспертов и найти их корреляции друг с другом, чтобы затем исключить из рассмотрения оценки эксперта, слабо коррелированные с оценками других экспертов. Коэффициент корреляции рангов Спирмена применяется для оценки устойчивости тенденции динамики. Недостатком коэффициента корреляции рангов является то, что одинаковым разностям рангов могут соответствовать совершенно отличные разности значений признаков (в случае количественных признаков). Поэтому для последних следует считать корреляцию рангов приближенной мерой тесноты связи, обладающей меньшей информативностью, чем коэффициент корреляции числовых значений признаков.

Пример решения задачи

Условие задачи

Опрос случайно выбранных 10 студентов, проживающих в общежитии университета, позволяет выявить зависимость между средним баллом по результатам предыдущей сессии и числом часов в неделю, затраченных студентом на самостоятельную подготовку.

Определите тесноту связи при помощи коэффициента ранговой корреляции Спирмена.

Если возникли сложности с решением задач, то сайт сайт оказывает онлайн помощь студентам по статистике с домашними контрольными или экзаменами.

Решение задачи

Рассчитаем коэффициент корреляции рангов.

Ранжирование Сравнение рангов Разность рангов 1 26 4.7 8 1 3.1 1 8 10 -2 4 2 22 4.4 10 2 3.6 2 7 9 -2 4 3 8 3.8 12 3 3.7 3 1 4 -3 9 4 12 3.7 15 4 3.8 4 3 3 0 0 5 15 4.2 17 5 3.9 5 4 7 -3 9 6 30 4.3 20 6 4 6 9 8 1 1 7 20 3.6 22 7 4.2 7 6 2 4 16 8 31 4 26 8 4.3 8 10 6 4 16 9 10 3.1 30 9 4.4 9 2 1 1 1 10 17 3.9 31 10 4.7 10 5 5 0 0 Сумма 60

Коэффициент ранговой корреляции Спирмена:

Подставляя числовые значения, получаем:

Вывод к задаче

Связь между средним баллом по результатам предыдущей сессии и числом часов в неделю, затраченных студентом на самостоятельную подготовку, умеренной тесноты.

Если сроки со сдачей контрольной работы поджимают, на сайте всегда можно заказать cрочное решение задач по статистике .

Средняя стоимость решения контрольной работы 700 - 1200 рублей (но не менее 300 руб. за весь заказ). На цену сильно влияет срочность решения (от суток до нескольких часов). Стоимость онлайн-помощи на экзамене/зачете - от 1000 руб. за решение билета.

Все вопросы по стоимости можете задать прямо в чат, предварительно скинув условие задач и сообщив необходимые вам сроки решения. Время ответа - несколько минут.

Примеры близких по теме задач

Коэффициент Фехнера
Приведена краткая теория и рассмотрен пример решения задачи на расчет коэффициента корреляции знаков Фехнера.

Коэффициенты взаимной сопряженности Чупрова и Пирсона
Страница содержит сведения по методам изучения взаимосвязей между качественными признаками с помощью коэффициентов взаимной сопряженности Чупрова и Пирсона.

Калькулятор ниже вычисляет коэффициент ранговой корреляции Спирмена между двумя случайными величинами. Теоретическая часть, чтобы не отвлекаться от калькулятора, традиционно размещается под ним.

add import_export mode_edit delete

Изменения случайных величин

arrow_upward arrow_downward X arrow_upward arrow_downward Y
Размер страницы: 5 10 20 50 100 chevron_left chevron_right

Изменения случайных величин

Импортировать данные Ошибка импорта

Для разделения полей можно использовать один из этих символов: Tab, ";" или "," Пример: -50.5;-50.5

Импортировать Назад Отменить

Метод расчета коэффициента ранговой корреляции Спирмена на самом деле описывается очень просто. Это тот же самый Коэффициент корреляции Пирсона , только рассчитанный не для самих результатов измерений случайных величин, а для их ранговых значений .

То есть,

Осталось только разобраться, что такое ранговые значения и для чего все это нужно.

Если элементы вариационного ряда расположить в порядке возрастания или убывания, то рангом элемента будет являться его номер в этом упорядоченном ряду.

Например, пусть у нас есть вариационный ряд {17,26,5,14,21}. Отсортируем его элементы в порядке убывания {26,21,17,14,5}. 26 имеет ранг 1, 21 - ранг 2 и т.д. Вариационный ряд ранговых значений будет выглядеть следующим образом {3,1,5,4,2}.

То есть, при расчете коэффициента Спирмена исходные вариационные ряды преобразуются в вариационные ряды ранговых значений, после чего к ним применяется формула Пирсона.

Есть одна тонкость - ранг повторяющихся значений берется как среднее из рангов. То есть для ряда {17, 15, 14, 15} ряд ранговых значений будет выглядеть как {1, 2.5, 4, 2.5}, так как первый элемент равный 15 имеет ранг 2, а второй - ранг 3, и .

Если же повторяющихся значений нет, то есть все значения ранговых рядов - числа из диапазона от 1 до n, формулу Пирсона можно упростить до

Ну и кстати, эта формула чаще всего и приводится как формула расчета коэффицента Спирмена.

В чем же суть перехода от самих значений к их ранговым значениям?
А суть в том, что исследуя корреляцию ранговых значений можно установить насколько хорошо зависимость двух переменных описывается монотонной функцией.

Знак коэффициента указывает на направление связи между переменными. Если знак положительный, то значения Y имеют тенденцию увеличиваться при увеличении значений X; если знак отрицательный, то значения Y имеют тенденцию уменьшаться при увеличении значений X. Если коэффициент равен 0, то никакой тенденции нет. Если же коэффициент равен 1 или -1, то зависимость между X и Y имеет вид монотонной функции - то есть, при увеличении X, Y также увеличивается, либо наоборот, при увеличении X, Y уменьшается.

То есть, в отличие от коэффициента корреляции Пирсона, который может выявить только линейную зависимость одной переменной от другой, коэффициент корреляции Спирмена может выявить монотонную зависимость, там, где непосредственная линейная связь не выявляется.

Поясню на примере. Предположим, что мы исследуем функцию y=10/x.
У нас есть следующие результаты измерений X и Y
{{1,10}, {5,2}, {10,1}, {20,0.5}, {100,0.1}}
Для этих данных коэффициент корреляции Пирсона равен -0.4686, то есть связь слабая либо отсутствует. А вот коэффициент корреляции Спирмена строго равен -1, что как бы намекает исследователю, что Y имеет строгую отрицательную монотонную зависимость от X.

На практике для определения тесноты связи двух признаков часто применяется коэффициент ранговой корреляции Спирмена (Р). Значения каждого признака ранжируются по степени возрастания (от 1 до n), затем определяется разница (d) между рангами, соответствующими одному наблюдению.

Пример №1 . Зависимость между объемом промышленной продукции и инвестициями в основной капитал по 10 областям одного из федеральных округов РФ в 2003 году характеризуется следующими данными.
Вычислите ранговые коэффициенты корреляции Спирмена и Кендэла . Проверить их значимость при α=0,05. Сформулируйте вывод о зависимости между объемом промышленной продукции и инвестициями в основной капитал по рассматриваемым областям РФ.

Присвоим ранги признаку Y и фактору X . Найдем сумму разности квадратов d 2 .
Используя калькулятор , вычислим коэффициент ранговой корреляции Спирмена:

X Y ранг X, d x ранг Y, d y (d x - d y) 2
1.3 300 1 2 1
1.8 1335 2 12 100
2.4 250 3 1 4
3.4 946 4 8 16
4.8 670 5 7 4
5.1 400 6 4 4
6.3 380 7 3 16
7.5 450 8 5 9
7.8 500 9 6 9
17.5 1582 10 16 36
18.3 1216 11 9 4
22.5 1435 12 14 4
24.9 1445 13 15 4
25.8 1820 14 19 25
28.5 1246 15 10 25
33.4 1435 16 14 4
42.4 1800 17 18 1
45 1360 18 13 25
50.4 1256 19 11 64
54.8 1700 20 17 9
364

Связь между признаком Y фактором X сильная и прямая.

Оценка коэффициента ранговой корреляции Спирмена



По таблице Стьюдента находим Tтабл.
T табл = (18;0.05) = 1.734
Поскольку Tнабл > Tтабл, то отклоняем гипотезу о равенстве нулю коэффициента ранговой корреляции. Другими словами, коэффициента ранговой корреляции Спирмена статистически - значим.

Интервальная оценка для коэффициента ранговой корреляции (доверительный интервал)
Доверительный интервал для коэффициента ранговой корреляции Спирмена: p(0.5431;0.9095).

Пример №2 . Исходные данные.

5 4
3 4
1 3
3 1
6 6
2 2
Так как в матрице имеются связанные ранги (одинаковый ранговый номер) 1-го ряда, произведем их переформирование. Переформирование рангов производиться без изменения важности ранга, то есть между ранговыми номерами должны сохраниться соответствующие соотношения (больше, меньше или равно). Также не рекомендуется ставить ранг выше 1 и ниже значения равного количеству параметров (в данном случае n = 6). Переформирование рангов производится в табл.
Новые ранги
1 1 1
2 2 2
3 3 3.5
4 3 3.5
5 5 5
6 6 6
Так как в матрице имеются связанные ранги 2-го ряда, произведем их переформирование. Переформирование рангов производится в табл.
Номера мест в упорядоченном ряду Расположение факторов по оценке эксперта Новые ранги
1 1 1
2 2 2
3 3 3
4 4 4.5
5 4 4.5
6 6 6
Матрица рангов.
ранг X, d x ранг Y, d y (d x - d y) 2
5 4.5 0.25
3.5 4.5 1
1 3 4
3.5 1 6.25
6 6 0
2 2 0
21 21 11.5
Поскольку среди значений признаков х и у встречается несколько одинаковых, т.е. образуются связанные ранги, то в таком случае коэффициент Спирмена вычисляется как:

где


j - номера связок по порядку для признака х;
А j - число одинаковых рангов в j-й связке по х;
k - номера связок по порядку для признака у;
В k - число одинаковых рангов в k-й связке по у.
A = [(2 3 -2)]/12 = 0.5
B = [(2 3 -2)]/12 = 0.5
D = A + B = 0.5 + 0.5 = 1

Связь между признаком Y и фактором X умеренная и прямая.

Дисциплина "высшая математика" у некоторых вызывает неприятие, так как поистине не всем дано ее понять. Но те, кому посчастливилось изучать этот предмет и решать задачи, используя различные уравнения и коэффициенты, могут похвастаться практически полной в ней осведемленности. В психологической науке существует не только гуманитарная направленность, но и определенные формулы и способы для математической проверки выдвигаемой в ходе исследований гипотезы. Для этого применяются различные коэффициенты.

Коэффициент корреляции Спирмена

Это распространенное измерение по определению тесноты связи между какими-либо двумя признаками. Коэффициент еще называют непараметрическим методом. Он показывает статистику связи. То есть мы знаем, например, что у ребенка агрессия и раздражительность связаны между собой, а коэффициент корреляции рангов Спирмена показывает статистическую математическую связь этих двух признаков.

Как вычисляется ранговый коэффициент?

Естественно, что для всех математических определений или величин существуют свои формулы, по которым они вычисляются. Ею обладает и коэффициент корреляции Спирмена. Формула у него следующая:

С первого взгляда формула не совсем понятна, но если разобраться, все очень легко вычисляется:

  • n - это количество признаков или показателей, которые проранжированы.
  • d - разность определенных двух рангов, соответствующих конкретным двум переменным каждого испытуемого.
  • ∑d 2 - сумма всех квадратов разностей рангов признака, квадраты которых вычисляются отдельно для каждого ранга.

Область применения математической меры связи

Для применения рангового коэффициента необходимо, чтобы количественные данные признака были проранжированы, то есть им был присвоен определенный номер в зависимости от места, на котором расположен признак, и от его значения. Доказано, что два ряда признаков, выраженных в числовом виде, несколько параллельны между собой. Коэффициент ранговой корреляции Спирмена определяет степень этой параллельности, тесноты связи признаков.

Для математической операции по расчету и определению связи признаков с помощью указанного коэффициента нужно произвести некоторые действия:

  1. Каждому значению какого-либо испытуемого или явления присваивается номер по порядку - ранг. Он может соответствовать значению явления по возрастанию и по убыванию.
  2. Дальше сопоставляются ранги значения признаков двух количественных рядов для того, чтобы определить разность между ними.
  3. В отдельном столбце таблицы для каждой полученной разности прописывается ее квадрат, а внизу результаты суммируются.
  4. После этих действий применяется формула, по которой рассчитывается коэффициент корреляции Спирмена.

Свойства коэффициента корреляции

К основным свойствам коэффициента Спирмена относят следующие:

  • Измерение значений в пределах от -1 до 1.
  • Знак коэффициента интерпретаций не имеет.
  • Теснота связи определяется по принципу: чем выше величина, тем теснее связь.

Как проверить полученное значение?

Для проверки связи признаков между собой необходимо выполнить определенные действия:

  1. Выдвигается нулевая гипотеза (H0), она же основная, затем формулируется другая, альтернативная первой (H 1). Первая гипотеза будет заключаться в том, что коэффициент корреляции Спирмена равняется 0 - это значит, что связи не будет. Вторая, наоборот, гласит, что коэффициент не равен 0, тогда связь есть.
  2. Следующим действием будет нахождение наблюдаемого значения критерия. Оно находится по основной формуле коэффициента Спирмена.
  3. Далее находятся критические значения заданного критерия. Это можно сделать только с помощью специальной таблицы, где отображаются различные значения по заданным показателям: уровень значимости (l) и число, определяющее (n).
  4. Теперь нужно сравнить два полученных значения: установленного наблюдаемого, а также критического. Для этого необходимо построить критическую область. Нужно начертить прямую линию, на ней отметить точки критического значения коэффициента со знаком "-" и со знаком"+". Слева и справа от критических значений полукругами от точек откладываются критические области. Посередине, объединяя два значения, отмечается полукругом ОПГ.
  5. После этого делается вывод о тесноте связи между двумя признаками.

Где лучше использовать эту величину

Самой первой наукой, где активно использовался этот коэффициент, была психология. Ведь это наука, не основывающаяся на цифрах, однако для доказательства каких-либо важных гипотез, касающихся развития отношений, черт характера людей, знаний студентов, требуется статистическое подтверждение выводов. Также его используют в экономике, в частности, при валютных оборотах. Здесь оцениваются признаки без статистики. Очень удобен коэффициент ранговой корреляции Спирмена в этой области применения тем, что оценка производится независимо от распределения переменных, так как они заменяются ранговым числом. Активно применяется коэффициент Спирмена в банковском деле. Социология, политология, демография и другие науки также используют его в своих исследованиях. Результаты получаются быстро и максимально точно.

Удобно и быстро используется коэффициент корреляции Спирмена в Excel. Здесь существуют специальные функции, которые помогают быстро получить необходимые значения.

Какие еще коэффициенты корреляции существуют?

Кроме того, что мы узнали про коэффициент корреляции Спирмена, существуют еще различные корреляционные коэффициенты, позволяющие измерить, оценить качественные признаки, связь между количественными признаками, тесноту связи между ними, представленными в ранговой шкале. Это такие коэффициенты, как биссериальный, рангово-биссериальный, контенгенции, ассоциации, и так далее. Коэффициент Спирмена очень точно показывает тесноту связи, в отличие от всех остальных методов ее математического определения.

- это количественная оценка статистического изучения связи между явлениями, используемая в непараметрических методах.

Показатель показывает, как отличается полученная при наблюдении сумма квадратов разностей между рангами от случая отсутствия связи.

Назначение сервиса . С помощью данного онлайн-калькулятора производится:

  • расчет коэффициента ранговой корреляции Спирмена;
  • вычисление доверительного интервала для коэффициента и оценка его значимости;

Коэффициент ранговой корреляции Спирмена относится к показателям оценки тесноты связи. Качественную характеристику тесноты связи коэффициента ранговой корреляции, как и других коэффициентов корреляции, можно оценить по шкале Чеддока .

Расчет коэффициента состоит из следующих этапов:

Свойства коэффициента ранговой корреляции Спирмена

Область применения . Коэффициент корреляции рангов используется для оценки качества связи между двумя совокупностями. Кроме этого, его статистическая значимость применяется при анализе данных на гетероскедастичность .

Пример . По выборке данных наблюдаемых переменных X и Y:

  1. составить ранговую таблицу;
  2. найти коэффициент ранговой корреляции Спирмена и проверить его значимость на уровне 2a
  3. оценить характер зависимости
Решение. Присвоим ранги признаку Y и фактору X .
X Y ранг X, d x ранг Y, d y
28 21 1 1
30 25 2 2
36 29 4 3
40 31 5 4
30 32 3 5
46 34 6 6
56 35 8 7
54 38 7 8
60 39 10 9
56 41 9 10
60 42 11 11
68 44 12 12
70 46 13 13
76 50 14 14

Матрица рангов.
ранг X, d x ранг Y, d y (d x - d y) 2
1 1 0
2 2 0
4 3 1
5 4 1
3 5 4
6 6 0
8 7 1
7 8 1
10 9 1
9 10 1
11 11 0
12 12 0
13 13 0
14 14 0
105 105 10

Проверка правильности составления матрицы на основе исчисления контрольной суммы:

Сумма по столбцам матрицы равны между собой и контрольной суммы, значит, матрица составлена правильно.
По формуле вычислим коэффициент ранговой корреляции Спирмена.


Связь между признаком Y и фактором X сильная и прямая
Значимость коэффициента ранговой корреляции Спирмена
Для того чтобы при уровне значимости α проверить нулевую гипотезу о равенстве нулю генерального коэффициента ранговой корреляции Спирмена при конкурирующей гипотезе H i . p ≠ 0, надо вычислить критическую точку:

где n - объем выборки; ρ - выборочный коэффициент ранговой корреляции Спирмена: t(α, к) - критическая точка двусторонней критической области, которую находят по таблице критических точек распределения Стьюдента, по уровню значимости α и числу степеней свободы k = n-2.
Если |p| < Т kp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками не значима. Если |p| > T kp - нулевую гипотезу отвергают. Между качественными признаками существует значимая ранговая корреляционная связь.
По таблице Стьюдента находим t(α/2, k) = (0.1/2;12) = 1.782

Поскольку T kp < ρ , то отклоняем гипотезу о равенстве 0 коэффициента ранговой корреляции Спирмена. Другими словами, коэффициент ранговой корреляции статистически - значим и ранговая корреляционная связь между оценками по двум тестам значимая.

Публикации по теме