Коэффициент ранговой корреляции спирмена. Коэффициент корреляции Спирмена. Коэффициент ранговой корреляции Спирмена

​ Коэффициент ранговой корреляции Спирмена – это непараметрический метод, который используется с целью статистического изучения связи между явлениями. В этом случае определяется фактическая степень параллелизма между двумя количественными рядами изучаемых признаков и дается оценка тесноты установленной связи с помощью количественно выраженного коэффициента.

1. История разработки коэффициента ранговой корреляции

Данный критерий был разработан и предложен для проведения корреляционного анализа в 1904 году Чарльзом Эдвардом Спирменом , английским психологом, профессором Лондонского и Честерфилдского университетов.

2. Для чего используется коэффициент Спирмена?

Коэффициент ранговой корреляции Спирмена используется для выявления и оценки тесноты связи между двумя рядами сопоставляемых количественных показателей . В том случае, если ранги показателей, упорядоченных по степени возрастания или убывания, в большинстве случаев совпадают (большему значению одного показателя соответствует большее значение другого показателя - например, при сопоставлении роста пациента и его массы тела ), делается вывод о наличии прямой корреляционной связи. Если ранги показателей имеют противоположную направленность (большему значению одного показателя соответствует меньшее значение другого - например, при сопоставлении возраста и частоты сердечных сокращений ), то говорят об обратной связи между показателями.

    Коэффициент корреляции Спирмена обладает следующими свойствами:
  1. Коэффициент корреляции может принимать значения от минус единицы до единицы, причем при rs=1 имеет место строго прямая связь, а при rs= -1 – строго обратная связь.
  2. Если коэффициент корреляции отрицательный, то имеет место обратная связь, если положительный, то – прямая связь.
  3. Если коэффициент корреляции равен нулю, то связь между величинами практически отсутствует.
  4. Чем ближе модуль коэффициента корреляции к единице, тем более сильной является связь между измеряемыми величинами.

3. В каких случаях можно использовать коэффициент Спирмена?

В связи с тем, что коэффициент является методом непараметрического анализа , проверка на нормальность распределения не требуется.

Сопоставляемые показатели могут быть измерены как в непрерывной шкале (например, число эритроцитов в 1 мкл крови), так и в порядковой (например, баллы экспертной оценки от 1 до 5).

Эффективность и качество оценки методом Спирмена снижается, если разница между различными значениями какой-либо из измеряемых величин достаточно велика. Не рекомендуется использовать коэффициент Спирмена, если имеет место неравномерное распределение значений измеряемой величины.

4. Как рассчитать коэффициент Спирмена?

Расчет коэффициента ранговой корреляции Спирмена включает следующие этапы:

5. Как интерпретировать значение коэффициента Спирмена?

При использовании коэффициента ранговой корреляции условно оценивают тесноту связи между признаками, считая значения коэффициента равные 0,3 и менее - показателями слабой тесноты связи; значения более 0,4, но менее 0,7 - показателями умеренной тесноты связи, а значения 0,7 и более - показателями высокой тесноты связи.

Статистическая значимость полученного коэффициента оценивается при помощи t-критерия Стьюдента. Если расчитанное значение t-критерия меньше табличного при заданном числе степеней свободы, статистическая значимость наблюдаемой взаимосвязи - отсутствует. Если больше, то корреляционная связь считается статистически значимой.

При наличии двух рядов значений, подвергающихся ранжированию, рационально рассчитывать ранговую корреляцию Спирмена.

Такие ряды могут представляться:

  • парой признаков, определяемых в одной и той же группе исследуемых объектов;
  • парой индивидуальных соподчиненных признаков, определяемых у 2 исследуемых объектов по одинаковому набору признаков;
  • парой групповых соподчиненных признаков;
  • индивидуальной и групповой соподчиненностью признаков.

Метод предполагает проведение ранжирования показателей в отдельности для каждого из признаков.

Наименьшее значение имеет наименьший ранг.

Этот метод относится к непараметрическому статистическому методу, предназначенному для установления существования связи изучаемых явлений:

  • определение фактической степени параллелизма между двумя рядами количественных данных;
  • оценка тесноты выявленной связи, выражаемой количественно.

Корреляционный анализ

Статистический метод, предназначенный для выявления существования зависимости между 2 и более случайными величинами (переменными), а также ее силы, получил название корреляционного анализа.

Получил свое название от correlatio (лат.) – соотношение.

При его использовании возможны варианты развития событий:

  • наличие корреляции (положительная либо отрицательная);
  • отсутствие корреляции (нулевая).

В случае установления зависимости между переменными речь идет об их коррелировании. Иными словами, можно сказать, что при изменении значения Х, обязательно будет наблюдаться пропорциональное изменение значения У.

В качестве инструментов используются различные меры связи (коэффициенты).

На их выбор оказывает влияние:

  • способ измерения случайных чисел;
  • характер связи между случайными числами.

Существование корреляционной связи может отображаться графически (графики) и с помощью коэффициента (числовое отображение).

Корреляционная связь характеризуется такими признаками:

  • сила связи (при коэффициенте корреляции от ±0,7 до ±1 – сильная; от ±0,3 до ±0,699 – средняя; от 0 до ±0,299 – слабая);
  • направление связи (прямая или обратная).

Цели корреляционного анализа

Корреляционный анализ не позволяет установить причинную зависимость между исследуемыми переменными.

Он проводится с целью:

  • установления зависимости между переменными;
  • получения определенной информации о переменной на основе другой переменной;
  • определения тесноты (связи) этой зависимости;
  • определение направления установленной связи.

Методы корреляционного анализа


Данный анализ может выполняться с использованием:

  • метода квадратов или Пирсона;
  • рангового метода или Спирмена.

Метод Пирсона применим для расчетов требующих точного определения силы, существующей между переменными. Изучаемые с его помощью признаки должны выражаться только количественно.

Для применения метода Спирмена или ранговой корреляции нет жестких требований в выражении признаков – оно может быть, как количественным, так и атрибутивным. Благодаря этому методу получается информация не о точном установлении силы связи, а имеющая ориентировочный характер.

В рядах переменных могут содержаться открытые варианты. Например, когда стаж работы выражается такими значениями, как до 1 года, более 5 лет и т.д.

Коэффициент корреляции

Статистическая величина характеризующая характер изменения двух переменных получила название коэффициента корреляции либо парного коэффициента корреляции. В количественном выражении он колеблется в пределах от -1 до +1.

Наиболее распространены коэффициенты:

  • Пирсона – применим для переменных принадлежащих к интервально шкале;
  • Спирмена – для переменных порядковой шкалы.

Ограничения использования коэффициента корреляции

Получение недостоверных данных при расчете коэффициента корреляции возможно в тех случаях, когда:

  • в распоряжении имеется достаточное количество значений переменной (25-100 пар наблюдений);
  • между изучаемыми переменными установлено, например, квадратичное соотношение, а не линейное;
  • в каждом случае данные содержат больше одного наблюдения;
  • наличие аномальных значений (выбросов) переменных;
  • исследуемые данные состоят из четко выделяемых подгрупп наблюдений;
  • наличие корреляционной связи не позволяет установить какая из переменных может рассматриваться в качестве причины, а какая – в качестве следствия.

Проверка значимости корреляции

Для оценки статистических величин используется понятие их значимости или же достоверности, характеризующей вероятность случайного возникновения величины либо крайних ее значений.

Наиболее распространенным методом определения значимости корреляции является определение критерия Стьюдента.

Его значение сравнивается с табличным, количество степенней свободы принимается как 2. При получении расчетного значения критерия больше табличного, свидетельствует о значимости коэффициента корреляции.

При проведении экономических расчетов достаточным считается доверительный уровень 0,05 (95%) либо 0,01 (99%).

Ранги Спирмена

Коэффициент ранговой корреляции Спирмена позволяет статистически установить наличие связи между явлениями. Его расчет предполагает установление для каждого признака порядкового номера – ранга. Ранг может быть возрастающим либо убывающим.

Количество признаков, подвергаемых ранжированию, может быть любым. Это достаточно трудоемкий процесс, ограничивающий их количество. Затруднения начинаются при достижении 20 признаков.

Для расчета коэффициента Спирмена пользуются формулой:

в которой:

n – отображает количество ранжируемых признаков;

d – не что иное как разность между рангами по двум переменным;

а ∑(d2) – сумма квадратов разностей рангов.

Применение корреляционного анализа в психологии

Статистическое сопровождение психологических исследований позволяет сделать их более объективными и высоко репрезентативными. Статистическая обработка данных полученных в ходе психологических экспериментов способствует извлечению максимума полезной информации.

Наиболее широкое применение в обработке их результатов получил корреляционный анализ.

Уместным является проведение корреляционного анализа результатов, полученных при проведении исследований:

  • тревожности (по тестам R. Temml, M. Dorca, V. Amen);
  • семейных взаимоотношений («Анализ семейных взаимоотношений» (АСВ) опросник Э.Г. Эйдемиллера, В.В. Юстицкиса);
  • уровня интернальности-экстернальности (опросник Е.Ф. Бажина, Е.А. Голынкиной и А.М. Эткинда);
  • уровня эмоционального выгорания у педагогов (опросник В.В. Бойко);
  • связи элементов вербального интеллекта учащихся при разно профильном обучении (методика К.М. Гуревича и др.);
  • связи уровня эмпатии (методика В.В. Бойко) и удовлетворенностью браком (опросник В.В. Столина, Т.Л. Романовой, Г.П. Бутенко);
  • связи между социометрическим статусом подростков (тест Jacob L. Moreno) и особенностями стиля семейного воспитания (опросник Э.Г. Эйдемиллера, В.В. Юстицкиса);
  • структуры жизненных целей подростков, воспитанных в полных и неполных семьях (опросник Edward L. Deci, Richard M. Ryan Ryan).

Краткая инструкция к проведению корреляционного анализа по критерию Спирмена

Проведение корреляционного анализа с использованием метода Спирмена выполняется по следующему алгоритму:

  • парные сопоставимые признаки располагаются в 2 ряда, один из которых обозначается с помощью Х, а другой У;
  • значения ряда Х располагаются в порядке возрастания либо убывания;
  • последовательность расположения значений ряда У определяется их соответствием значений ряда Х;
  • для каждого значения в ряду Х определить ранг — присвоить порядковый номер от минимального значения к максимальному;
  • для каждого из значений в ряду У также определить ранг (от минимального к максимальному);
  • вычислить разницу (D) между рангами Х и У, прибегнув к формуле D=Х-У;
  • полученные значения разницы возводятся в квадрат;
  • выполнить суммирование квадратов разниц рангов;
  • выполнить расчеты по формуле:

Пример корреляции Спирмена

Необходимо установить наличие корреляционной связи между рабочим стажем и показателем травматизма при наличии следующих данных:

Наиболее подходящим методом анализа является ранговый метод, т.к. один из признаков представлен в виде открытых вариантов: рабочий стаж до 1 года и рабочий стаж 7 и более лет.

Решение задачи начинается с ранжирования данных, которые сводятся в рабочую таблицу и могут быть выполнены вручную, т.к. их объем не велик:

Рабочий стаж Число травм Порядковые номера (ранги) Разность рангов Квадрат разности рангов
d(х-у)
до 1 года 24 1 5 -4 16
1-2 16 2 4 -2 4
3-4 12 3 2,5 +0,5 0,25
5-6 12 4 2,5 +1,5 2,5
7 и более 6 5 1 +4 16
Σ d2 = 38,5

Появление дробных рангов в колонке связано с тем, что в случае появления вариант одинаковых по величине находится среднее арифметическое значение ранга. В данном примере показатель травматизма 12 встречается дважды и ему присваиваются ранги 2 и 3, находим среднее арифметическое этих рангов (2+3)/2= 2,5 и помещаем это значение в рабочую таблицу для 2 показателей.
Выполнив подстановку полученных значений в рабочую формулу и произведя несложные расчёты получаем коэффициент Спирмена равный -0,92

Отрицательное значение коэффициента свидетельствует о наличии обратной связи между признаками и позволяет утверждать, что небольшой стаж работы сопровождается большим числом травм. Причем, сила связи этих показателей достаточно большая.
Следующим этапом расчётов является определение достоверности полученного коэффициента:
рассчитывается его ошибка и критерий Стьюдента

На практике для определения тесноты связи двух признаков часто применяется коэффициент ранговой корреляции Спирмена (Р). Значения каждого признака ранжируются по степени возрастания (от 1 до n), затем определяется разница (d) между рангами, соответствующими одному наблюдению.

Пример №1 . Зависимость между объемом промышленной продукции и инвестициями в основной капитал по 10 областям одного из федеральных округов РФ в 2003 году характеризуется следующими данными.
Вычислите ранговые коэффициенты корреляции Спирмена и Кендэла . Проверить их значимость при α=0,05. Сформулируйте вывод о зависимости между объемом промышленной продукции и инвестициями в основной капитал по рассматриваемым областям РФ.

Присвоим ранги признаку Y и фактору X . Найдем сумму разности квадратов d 2 .
Используя калькулятор , вычислим коэффициент ранговой корреляции Спирмена:

X Y ранг X, d x ранг Y, d y (d x - d y) 2
1.3 300 1 2 1
1.8 1335 2 12 100
2.4 250 3 1 4
3.4 946 4 8 16
4.8 670 5 7 4
5.1 400 6 4 4
6.3 380 7 3 16
7.5 450 8 5 9
7.8 500 9 6 9
17.5 1582 10 16 36
18.3 1216 11 9 4
22.5 1435 12 14 4
24.9 1445 13 15 4
25.8 1820 14 19 25
28.5 1246 15 10 25
33.4 1435 16 14 4
42.4 1800 17 18 1
45 1360 18 13 25
50.4 1256 19 11 64
54.8 1700 20 17 9
364

Связь между признаком Y фактором X сильная и прямая.

Оценка коэффициента ранговой корреляции Спирмена



По таблице Стьюдента находим Tтабл.
T табл = (18;0.05) = 1.734
Поскольку Tнабл > Tтабл, то отклоняем гипотезу о равенстве нулю коэффициента ранговой корреляции. Другими словами, коэффициента ранговой корреляции Спирмена статистически - значим.

Интервальная оценка для коэффициента ранговой корреляции (доверительный интервал)
Доверительный интервал для коэффициента ранговой корреляции Спирмена: p(0.5431;0.9095).

Пример №2 . Исходные данные.

5 4
3 4
1 3
3 1
6 6
2 2
Так как в матрице имеются связанные ранги (одинаковый ранговый номер) 1-го ряда, произведем их переформирование. Переформирование рангов производиться без изменения важности ранга, то есть между ранговыми номерами должны сохраниться соответствующие соотношения (больше, меньше или равно). Также не рекомендуется ставить ранг выше 1 и ниже значения равного количеству параметров (в данном случае n = 6). Переформирование рангов производится в табл.
Новые ранги
1 1 1
2 2 2
3 3 3.5
4 3 3.5
5 5 5
6 6 6
Так как в матрице имеются связанные ранги 2-го ряда, произведем их переформирование. Переформирование рангов производится в табл.
Номера мест в упорядоченном ряду Расположение факторов по оценке эксперта Новые ранги
1 1 1
2 2 2
3 3 3
4 4 4.5
5 4 4.5
6 6 6
Матрица рангов.
ранг X, d x ранг Y, d y (d x - d y) 2
5 4.5 0.25
3.5 4.5 1
1 3 4
3.5 1 6.25
6 6 0
2 2 0
21 21 11.5
Поскольку среди значений признаков х и у встречается несколько одинаковых, т.е. образуются связанные ранги, то в таком случае коэффициент Спирмена вычисляется как:

где


j - номера связок по порядку для признака х;
А j - число одинаковых рангов в j-й связке по х;
k - номера связок по порядку для признака у;
В k - число одинаковых рангов в k-й связке по у.
A = [(2 3 -2)]/12 = 0.5
B = [(2 3 -2)]/12 = 0.5
D = A + B = 0.5 + 0.5 = 1

Связь между признаком Y и фактором X умеренная и прямая.

Коэффициент корреляции рангов, предложенный К. Спирменом, относится к непараметрическим показателям связи между переменными, измеренными в ранговой шкале. При расчете этого коэффициента не требуется никаких предположений о характере распределений признаков в генеральной совокупности. Этот коэффициент определяет степень тесноты связи порядковых признаков, которые в этом случае представляют собой ранги сравниваемых величин.

Величина коэффициента корреляции Спирмена также лежит в интервале +1 и -1. Он, как и коэффициент Пирсона, может быть положительным и отрицательным, характеризуя направленность связи между двумя признаками, измеренными в ранговой шкале.

В принципе число ранжируемых признаков (качеств, черт и т.п.) может быть любым, но сам процесс ранжирования большего, чем 20 числа признаков -- затруднителен. Возможно, что именно поэтому таблица критических значений рангового коэффициента корреляции рассчитана лишь для сорока ранжируемых признаков (n < 40, табл. 20 приложения 6).

Ранговый коэффициент корреляции Спирмена подсчитывается по формуле:

где n - количество ранжируемых признаков (показателей, испытуемых);

D - разность между рангами по двум переменным для каждого испытуемого;

Сумма квадратов разностей рангов.

Используя ранговый коэффициент корреляции, рассмотрим следующий пример.

Пример : Психолог выясняет, как связаны между собой индивидуальные показатели готовности к школе, полученные до начала обучения в школе у 11 первоклассников и их средняя успеваемость в конце учебного года.

Для решения этой задачи были проранжированы, во-первых, значения показателей школьной готовности, полученные при поступлении в школу, и, во-вторых, итоговые показатели успеваемости в конце года у этих же учащихся в среднем. Результаты представим в табл. 13.

Таблица 13

№ учащихся

Ранги показателей школьной готовности

Ранги среднегодовой успеваемости

Подставляем полученные данные в формулу и производим расчет. Получаем:

Для нахождения уровня значимости обращаемся к табл. 20 приложения 6, в которой приведены критические значения для коэффициентов ранговой корреляции.

Подчеркнем, что в табл. 20 приложения 6, как и в таблице для линейной корреляции Пирсона, все величины коэффициентов корреляции даны по абсолютной величине. Поэтому, знак коэффициента корреляции учитывается только при его интерпретации.

Нахождение уровней значимости в данной таблице осуществляется по числу n, т. е. по числу испытуемых. В нашем случае n = 11. Для этого числа находим :

0,61 для P 0,05

0,76 для P 0,01

Строим соответствующую ``ось значимости"":

Полученный коэффициент корреляции совпал с критическим значением для уровня значимости в 1%. Следовательно, можно утверждать, что показатели школьной готовности и итоговые оценки первоклассников связаны положительной корреляционной зависимостью - иначе говоря, чем выше показатель школьной готовности, тем лучше учится первоклассник. В терминах статистических гипотез психолог должен отклонить нулевую (Нгипотезу о сходстве и принять альтернативную (Но наличии различий, которая говорит о том, что связь между показателями школьной готовности и средней успеваемостью отлична от нуля.

Случай одинаковых (равных) рангов

При наличии одинаковых рангов формула расчета коэффициента линейной корреляции Спирмена будет несколько иной. В этом случае в формулу вычисления коэффициентов корреляции добавляются два новых члена, учитывающие одинаковые ранги. Они называются поправками на одинаковые ранги и добавляются в числитель расчетной формулы.

где n - число одинаковых рангов в первом столбце,

k - число одинаковых рангов во втором столбце.

Если имеется две группы одинаковых рангов, в каком-либо столбце то формула поправки несколько усложняется:

где n - число одинаковых рангов в первой группе ранжируемого столбца,

k - число одинаковых рангов в второй группе ранжируемого столбца. Модификация формулы в общем случае такова:

Пример : Психолог, используя тест умственного развития (ШТУР) проводит исследование интеллекта у 12 учащихся 9 класса. Одновременно с этим, но просит учителей литературы и математики провести ранжирование этих же учащихся по показателям умственного развития. Задача заключается в том, чтобы определить, как связаны между собой объективные показатели умственного развития (данные ШТУРа) и экспертные оценки учителей.

Экспериментальные данные этой задачи и дополнительные столбцы, необходимые для расчета коэффициента корреляции Спирмена, представим в виде табл. 14.

Таблица 14

№ учащихся

Ранги тестирования с помощью ШТУРа

Экспертные оценки учителей по математики

Экспертные оценки учителей по литературе

D (второго и третьего столбцов)

D (второго и четвертого столбцов)

(второго и третьего столбцов)

(второго и четвертого столбцов)

Поскольку при ранжировании использовались одинаковые ранги, то необходимо проверить правильность ранжирования во втором, третьем и четвертом столбцах таблицы. Суммирование в каждом из этих столбцов дает одинаковую сумму - 78.

Проверяем по расчетной формуле. Проверка дает:

В пятом и шестом столбцах таблицы приведены величины разности рангов между экспертными оценками психолога по тесту ШТУР для каждого ученика и величинами экспертных оценок учителей, соответственно по математике и литературе. Сумма величин разностей рангов должна быть равна нулю. Суммирование величин D в пятом и шестом столбцах дало искомый результат. Следовательно, вычитание рангов проведено правильно. Подобную проверку необходимо делать каждый раз при проведении сложных видов ранжирования.

Прежде, чем начать расчет по формуле необходимо рассчитать поправки на одинаковые ранги для второго, третьего и четвертого столбцов таблицы.

В нашем случае во втором столбце таблицы два одинаковых ранга, следовательно, по формуле величина поправки D1 будет:

В третьем столбце три одинаковых ранга, следовательно, по формуле величина поправки D2 будет:

В четвертом столбце таблицы две группы по три одинаковых ранга, следовательно, по формуле величина поправки D3 будет:

Прежде, чем преступить к решению задачи, напомним, что психолог выясняет два вопроса - как связаны величины рангов по тесту ШТУР с экспертными оценками по математике и литературе. Именно поэтому расчет проводится дважды.

Считаем первый ранговый коэффициент с учетом добавок по формуле. Получаем:

Подсчитаем без учета добавки:

Как видим, разница в величинах коэффициентов корреляции оказалась очень незначительной.

Считаем второй ранговый коэффициент с учетом добавок по формуле. Получаем:

Подсчитаем без учета добавки:

И опять, различия оказались очень незначительны. Поскольку число учащихся в обоих случаях одинаково, по табл. 20 приложения 6 находим критические значения при n = 12 сразу для обоих коэффициентов корреляции.

0,58 для P 0,05

0,73 для P 0,01

Откладываем первое значение на ``оси значимости"":

В первом случае полученный коэффициент ранговой корреляции находится в зоне значимости. Поэтому психолог должен отклонить нулевую Нгипотезу о сходстве коэффициента корреляции с нулем и принять альтернативную Но значимом отличии коэффициента корреляции от нуля. Иными словами, полученный результат говорит о том, что чем выше экспертные оценки учащихся по тесту ШТУР, тем выше их экспертные оценки по математике.

Откладываем второе значение на ``оси значимости"":

Во втором случае коэффициент ранговой корреляции находится в зоне неопределенности. Поэтому психолог может принять нулевую Нгипотезу о сходстве коэффициента корреляции с нулем и отклонить альтернативную Но значимом отличии коэффициента корреляции от нуля. В этом случае полученный результат говорит о том, что экспертные оценки учащихся по тесту ШТУР не связаны с экспертными оценками по литературе.

Для применения коэффициента корреляции Спирмена, необходимо соблюдать следующие условия:

1. Сравниваемые переменные должны быть получены в порядковой (ранговой) шкале, но могут быть измерены также в шкале интервалов и отношений.

2. Характер распределения коррелируемых величин не имеет значения.

3. Число варьирующих признаков в сравниваемых переменных X и Y должно быть одинаковым.

Таблицы для определения критических значений коэффициента корреляции Спирмена (табл. 20 приложение 6) рассчитаны от числа признаков равных n = 5 до n = 40 и при большем числе сравниваемых переменных следует использовать таблицу для пирсоновского коэффициента корреляции (табл. 19 приложение 6). Нахождение критических значений осуществляется при k = n.

This calculator below calculates Spearman"s rank correlation coefficient between two random variables. The theoretical part is traditional below the calculator.

add import_export mode_edit delete

Changes of random variables

arrow_upward arrow_downward arrow_upward arrow_downward
Items per page: 5 10 20 50 100 chevron_left chevron_right

Changes of random variables

Import data Import error

"One of the following characters is used to separate data fields: tab, semicolon (;) or comma(,)" Sample: -50.5;-50.5

Import Back Cancel

Digits after the decimal point: 4

Calculate

Spearman"s correlation coefficient

Save share extension

The method of Spearman"s rank correlation coefficient calculation is actually pretty simple. It"s like the Pearson correlation coefficient , but designed not for measurements of random variables only but for their ranking values .

We have only to understand what is the rank value and why all this is necessary.

If the elements of a variational series arranged in ascending or descending order, that rank of the element will be his number in ordered series.

For example, we have a variational series {17,26,5,14,21}. Let"s sort it"s elements in a descending order {26,21,17,14,5}. 26 has a rank of 1, 21 - rank of 2 and so on, Variational series of ranking values will look like this {3,1,5,4,2}.

I.e. when calculating Spearman"s coefficient initial variation series are converted into variational series of ranking values and then Pearson"s formula is applied to them.
.
There is one subtlety - the rank of the repeating values is taken as the average of the ranks. That is, for a series {17, 15, 14, 15}ranking series will look like {1, 2.5, 4, 2.5}, as the first element is 15 has a rank of 2, and the second - rank of 3, and.

If you don"t have the repeating values, that is, all the values of ranking series - the numbers between 1 and n, the Pearson"s formula can be simplified to

By the way, this formula is often given as the formula for calculating the Spearman"s coefficient.

What is the essence of the transition from the values themselves to their rank value?
When investigating the correlation of ranking values you can find how well the dependence of the two variables is described by a monotonic function.

The sign of the coefficient indicates the direction of the relationship between variables. If the sign is positive the values of Y has a tendency to increase with the increasement of X. If the sign is negative the values of Y has a tendency to decrease with the increasement of X. If the coefficient is 0 there is no tendency then. If the coefficient equals 1 or -1, the relationship between X and Y has an appearance of monotonic function, i.e. with the increasement of X, Y also increases and vice versa.

That is, unlike the Pearson"s correlation coefficient, which can detect only the linear relationship of one variable from another, Spearman"s correlation coefficient can detect monotonic dependence, where the direct linear relationship cannot be revealed.

Here"s an example.
Поясню на примере. Let"s suppose,we examine the function y=10/x.
We have the following measurements of X and Y
{{1,10}, {5,2}, {10,1}, {20,0.5}, {100,0.1}}
For this data, Pearson correlation coefficient is equal to -0.4686, i.e. the relationship is weak or absent. And Spearman"s correlation coefficient is strictly equal to -1, as if it"s hints to the researcher that Y has strongly negative monotonic dependence from X.


Top