Coeficientul de corelare a rangului lui Spearman rs. Analiza corelației folosind metoda Spearman (rangurile Spearman)

Scurtă teorie

Corelația de rang este o metodă de analiză a corelațiilor care reflectă relațiile variabilelor ordonate după valoare crescătoare.

Rangurile sunt numere de serie unități ale populației într-o serie ordonată. Dacă clasificăm o populație în funcție de două caracteristici, relația dintre care este studiată, atunci coincidența completă a rangurilor înseamnă cea mai apropiată conexiune directă posibilă, iar opusul complet al rangurilor înseamnă cel mai apropiat feedback posibil. Este necesar să clasați ambele caracteristici în aceeași ordine: fie de la valori mai mici ale caracteristicii la cele mai mari, fie invers.

În scopuri practice, utilizarea corelației de rang este foarte utilă. De exemplu, dacă se stabilește o corelație de rang înalt între două caracteristici calitative ale produselor, atunci este suficient să controlezi produsele doar prin una dintre caracteristici, ceea ce reduce costul și accelerează controlul.

Coeficientul de corelație de rang, propus de K. Spearman, se referă la o măsură neparametrică a relației dintre variabile măsurate pe o scară de rang. La calcularea acestui coeficient, nu sunt necesare ipoteze cu privire la natura distribuțiilor caracteristicilor în populație. Acest coeficient determină gradul de apropiere a conexiunii dintre caracteristicile ordinale, care în acest caz reprezintă rangurile mărimilor comparate.

Valoarea coeficientului de corelație Spearman se află în intervalul +1 și -1. Poate fi pozitiv sau negativ, caracterizând direcția relației dintre două caracteristici măsurate pe o scară de rang.

Coeficientul de corelare a rangului lui Spearman este calculat folosind formula:

Diferența dintre ranguri pe două variabile

numărul de perechi potrivite

Primul pas în calcularea coeficientului de corelare a rangului este ierarhizarea seriei de variabile. Procedura de clasare începe prin aranjarea variabilelor în ordinea crescătoare a valorilor lor. Diferite valori sunt atribuite ranguri, notate numere naturale. Dacă există mai multe variabile de valoare egală, li se atribuie un rang mediu.

Avantajul coeficientului de corelare a rangului Spearman este că este posibil să se ierarhească în funcție de caracteristici care nu pot fi exprimate numeric: este posibilă clasarea candidaților pentru o anumită poziție după nivelul profesional, prin capacitatea de a conduce o echipă, după farmecul personal, etc. Cu evaluările experților este posibil să ierarhizeze evaluările diferiților experți și să găsească corelațiile acestora între ele, pentru a exclude apoi din considerare aprecierile experților care sunt slab corelate cu evaluările altor experți. Coeficientul de corelare a rangului lui Spearman este utilizat pentru a evalua stabilitatea tendinței. Dezavantajul coeficientului de corelare a rangului este că aceleași diferențe de ranguri pot corespunde unor diferențe complet diferite ale valorilor caracteristicilor (în cazul caracteristicilor cantitative). Prin urmare, pentru acestea din urmă, corelarea rangurilor ar trebui considerată o măsură aproximativă a strângerii conexiunii, care este mai puțin informativă decât coeficientul de corelație al valorilor numerice ale caracteristicilor.

Exemplu de rezolvare a problemei

Stare problematica

Un sondaj pe 10 studenți selectați aleatoriu care locuiesc într-un cămin universitar dezvăluie relația dintre scorul mediu din sesiunea anterioară și numărul de ore pe săptămână petrecute de student pentru studii independente.

Determinați puterea relației folosind coeficientul de corelare a rangului Spearman.

Dacă întâmpinați dificultăți în rezolvarea problemelor, site-ul oferă ajutor online studenților la statistică cu teste sau examene acasă.

Rezolvarea problemei

Să calculăm coeficientul de corelație de rang.

Variind Comparație de rang Diferența de rang 1 26 4.7 8 1 3.1 1 8 10 -2 4 2 22 4.4 10 2 3.6 2 7 9 -2 4 3 8 3.8 12 3 3.7 3 1 4 -3 9 4 12 3.7 15 4 3.8 4 3 3 0 0 5 15 4.2 17 5 3.9 5 4 7 -3 9 6 30 4.3 20 6 4 6 9 8 1 1 7 20 3.6 22 7 4.2 7 6 2 4 16 8 31 4 26 8 4.3 8 10 6 4 16 9 10 3.1 30 9 4.4 9 2 1 1 1 10 17 3.9 31 10 4.7 10 5 5 0 0 Sumă 60

Coeficientul de corelare a rangului lui Spearman:

Înlocuind valorile numerice, obținem:

Concluzia problemei

Relația dintre GPA din sesiunea anterioară și numărul de ore pe săptămână petrecute de student pentru studii independente este moderat puternică.

Dacă termenele limită de livrare munca de testare Suntem fără timp, puteți comanda oricând soluții urgente la problemele de statistică de pe site.

Medie costul rezolvării unui test este de 700 - 1200 de ruble (dar nu mai puțin de 300 de ruble pentru întreaga comandă). Pretul este foarte influentat de urgenta deciziei (de la o zi la cateva ore). Costul ajutorului online pentru un examen/test este de la 1000 de ruble. pentru rezolvarea biletului.

Puteți adresa toate întrebările despre cost direct în chat, după ce ați trimis în prealabil condițiile sarcinii și v-a informat cu privire la intervalul de timp necesar pentru soluție. Timpul de răspuns este de câteva minute.

Exemple de probleme conexe

Raportul Fechner
Este prezentată o scurtă teorie și este luat în considerare un exemplu de rezolvare a problemei de calcul al coeficientului de corelație a semnului Fechner.

Coeficienții de contingență reciproci ai lui Chuprov și Pearson
Pagina conține informații despre metodele de studiu a relațiilor dintre caracteristicile calitative folosind coeficienții Chuprov și Pearson de contingență reciprocă.

Calculatorul de mai jos calculează coeficientul de corelare a rangului Spearman între două variabile aleatorii. Partea teoretică, pentru a nu fi distrasă de la calculator, se află în mod tradițional sub acesta.

adăuga import_export mod_edit şterge

Modificări ale variabilelor aleatoare

săgeată_în sussăgeată_în jos Xsăgeată_în sussăgeată_în jos Y
Dimensiunea paginii: 5 10 20 50 100 chevron_left chevron_right

Modificări ale variabilelor aleatoare

Importă date Eroare de import

Puteți folosi unul dintre aceste simboluri pentru a separa câmpurile: Tab, ";" sau "," Exemplu: -50,5;-50,5

Import înapoi Anulare

Metoda de calculare a coeficientului de corelare a rangului Spearman este de fapt descrisă foarte simplu. Acesta este același coeficient de corelație Pearson, calculat doar nu pentru rezultatele măsurătorii în sine variabile aleatoare, și pentru ei valorile de rang.

adica

Tot ce rămâne este să ne dăm seama care sunt valorile de rang și de ce sunt necesare toate acestea.

Dacă elementele unei serii de variații sunt aranjate în ordine crescătoare sau descrescătoare, atunci rang elementul va fi numărul său în această serie ordonată.

De exemplu, să avem o serie de variații (17,26,5,14,21). Să-i sortăm elementele în ordine descrescătoare (26,21,17,14,5). 26 are rangul 1, 21 are rangul 2 etc. Seria de variații a valorilor rangului va arăta astfel (3,1,5,4,2).

Adică la calcularea coeficientului Spearman, inițiala serie de variații sunt convertite în serii de variații de valori de rang, după care li se aplică formula Pearson.

Există o subtilitate - rangul valorilor repetate este luat ca medie a rangurilor. Adică, pentru rândul (17, 15, 14, 15) rândul de valori ale rangului va arăta ca (1, 2.5, 4, 2.5), deoarece primul element egal cu 15 are rangul 2, iar al doilea are rangul 3 și .

Dacă nu există valori care se repetă, adică toate valorile seriei de ranguri sunt numere din intervalul de la 1 la n, formula Pearson poate fi simplificată la

Ei bine, apropo, această formulă este cel mai adesea dată ca formulă pentru calcularea coeficientului Spearman.

Care este esența tranziției de la valorile înseși la valorile lor de rang?
Ideea este că, studiind corelația valorilor rangului, puteți determina cât de bine este descrisă dependența a două variabile de o funcție monotonă.

Semnul coeficientului indică direcția relației dintre variabile. Dacă semnul este pozitiv, atunci valorile Y tind să crească pe măsură ce valorile X cresc; dacă semnul este negativ, atunci valorile Y tind să scadă pe măsură ce valorile X cresc. Dacă coeficientul este 0, atunci nu există nicio tendință. Dacă coeficientul este 1 sau -1, atunci relația dintre X și Y are forma unei funcție monotonă - adică pe măsură ce X crește, crește și Y, sau invers, pe măsură ce X crește, Y scade.

Adică, spre deosebire de coeficientul de corelație Pearson, care nu poate decât să dezvăluie dependență liniară o variabilă de la alta, coeficientul de corelație Spearman poate dezvălui o relație monotonă în care nu este detectată o relație liniară directă.

Să explic cu un exemplu. Să presupunem că examinăm funcția y=10/x.
Avem următoarele măsurători X și Y
{{1,10}, {5,2}, {10,1}, {20,0.5}, {100,0.1}}
Pentru aceste date, coeficientul de corelație Pearson este -0,4686, adică relația este slabă sau absentă. Dar coeficientul de corelație Spearman este strict egal cu -1, ceea ce pare să sugereze cercetătorului că Y are o dependență monotonă negativă strictă de X.

În practică, coeficientul de corelație a rangului Spearman (P) este adesea folosit pentru a determina strânsoarea relației dintre două caracteristici. Valorile fiecărei caracteristici sunt ordonate în funcție de gradul de creștere (de la 1 la n), apoi se determină diferența (d) între rangurile corespunzătoare unei singure observații.

Exemplul nr. 1. Relația dintre volumul producției industriale și investițiile în capital fix pentru 10 regiuni ale uneia dintre districtele federale Federația Rusă în 2003 se caracterizează prin următoarele date.
Calcula Coeficienții de corelare a rangului Spearmanși Kendal. Verificați semnificația lor la α=0,05. Formulați o concluzie despre relația dintre volumul producției industriale și investițiile în capital fix pentru regiunile Federației Ruse luate în considerare.

Să atribuim ranguri caracteristicii Y și factorului X. Să aflăm suma diferenței pătratelor d 2.
Folosind un calculator, calculăm coeficientul de corelare a rangului Spearman:

X Y rangul X, d x rangul Y, d y (d x - d y) 2
1.3 300 1 2 1
1.8 1335 2 12 100
2.4 250 3 1 4
3.4 946 4 8 16
4.8 670 5 7 4
5.1 400 6 4 4
6.3 380 7 3 16
7.5 450 8 5 9
7.8 500 9 6 9
17.5 1582 10 16 36
18.3 1216 11 9 4
22.5 1435 12 14 4
24.9 1445 13 15 4
25.8 1820 14 19 25
28.5 1246 15 10 25
33.4 1435 16 14 4
42.4 1800 17 18 1
45 1360 18 13 25
50.4 1256 19 11 64
54.8 1700 20 17 9
364

Legătura dintre trăsătura Y și factorul X este puternică și directă.

Estimarea coeficientului de corelare a rangului lui Spearman



Folosind tabelul Student, găsim Ttable.
Tabelul T = (18;0,05) = 1,734
Deoarece Tob > Ttabl, respingem ipoteza că coeficientul de corelație a rangului este egal cu zero. Cu alte cuvinte, coeficientul de corelare a rangului lui Spearman este semnificativ statistic.

Estimarea intervalului pentru coeficientul de corelare a rangului (interval de încredere)
Interval de încredere pentru coeficientul de corelare a rangului lui Spearman: p(0,5431;0,9095).

Exemplul nr. 2. Datele inițiale.

5 4
3 4
1 3
3 1
6 6
2 2
Deoarece matricea conține ranguri înrudite (același număr de rang) de pe primul rând, le vom rearanja. Reorganizarea rangurilor se realizează fără modificarea importanței rangului, adică relațiile corespunzătoare (mai mult, mai mici sau egale cu) trebuie menținute între numerele de rang. De asemenea, nu este recomandat să setați rangul peste 1 și sub o valoare egală cu numărul de parametri (în în acest caz, n = 6). Reorganizarea rangurilor se realizează în tabel.
Noi ranguri
1 1 1
2 2 2
3 3 3.5
4 3 3.5
5 5 5
6 6 6
Deoarece matricea conține ranguri înrudite de pe al 2-lea rând, le vom reformata. Reorganizarea rangurilor se realizează în tabel.
Numerele locurilor în rândul ordonatAranjarea factorilor conform aprecierii expertuluiNoi ranguri
1 1 1
2 2 2
3 3 3
4 4 4.5
5 4 4.5
6 6 6
Matricea de rang.
rangul X, d xrangul Y, d y(d x - d y) 2
5 4.5 0.25
3.5 4.5 1
1 3 4
3.5 1 6.25
6 6 0
2 2 0
21 21 11.5
Deoarece printre valorile caracteristicilor x și y există mai multe identice, adică. se formează rangurile asociate, apoi în acest caz coeficientul Spearman se calculează astfel:

Unde


j - numere de conexiuni în ordinea caracteristicii x;
Iar j este numărul de ranguri identice în j-a-lea conjunctiv din x;
k - numere de conexiuni în ordinea caracteristicii y;
În k - numărul de ranguri identice în al-lea conjunctiv în y.
A = [(2 3 -2)]/12 = 0,5
B = [(2 3 -2)]/12 = 0,5
D = A + B = 0,5 + 0,5 = 1

Relația dintre trăsătura Y și factorul X este moderată și directă.

Disciplina „matematică superioară” provoacă respingere în rândul unora, deoarece cu adevărat nu toată lumea o poate înțelege. Dar cei care au norocul să studieze acest subiect și să rezolve probleme folosind diverse ecuațiiși șansele, se poate lăuda cu o conștientizare aproape completă a acesteia. În știința psihologică nu există numai orientare umanitară, dar și anumite formule și metode de verificare matematică a ipotezei prezentate în timpul cercetării. Pentru aceasta sunt utilizați diverși coeficienți.

Coeficientul de corelație Spearman

Aceasta este o măsurătoare comună pentru a determina puterea relației dintre oricare două caracteristici. Coeficientul se mai numește și metoda neparametrică. Afișează statistici de comunicare. Adică știm, de exemplu, că la un copil, agresivitatea și iritabilitatea sunt interconectate, iar coeficientul de corelare a rangului Spearman arată relația statistică matematică dintre aceste două caracteristici.

Cum se calculează coeficientul de clasare?

Desigur, toate definițiile sau mărimile matematice au propriile formule prin care sunt calculate. O are și coeficientul de corelație Spearman. Formula lui este următoarea:

La prima vedere, formula nu este complet clară, dar dacă te uiți la ea, totul este foarte ușor de calculat:

  • n este numărul de caracteristici sau indicatori care sunt clasați.
  • d este diferența dintre anumite două ranguri corespunzătoare două variabile specifice pentru fiecare subiect.
  • ∑d 2 - suma tuturor diferențelor pătrate dintre rangurile unei caracteristici, ale căror pătrate sunt calculate separat pentru fiecare rang.

Domeniul de aplicare al măsurii matematice a conexiunii

Pentru utilizare coeficient de clasare este necesar ca datele cantitative ale unei caracteristici să fie ierarhizate, adică li se atribuie un anumit număr în funcție de locul unde se află caracteristica și de valoarea acesteia. S-a dovedit că două serii de caracteristici exprimate în formă numerică sunt oarecum paralele între ele. Coeficientul de corelație de rang al lui Spearman determină gradul acestui paralelism, strânsoarea conexiunii dintre caracteristici.

Pentru operația matematică de calcul și determinare a relației dintre caracteristici folosind coeficientul specificat, trebuie să efectuați câteva acțiuni:

  1. Fiecărei valori a oricărui subiect sau fenomen i se atribuie un număr în ordine - un rang. Poate corespunde valorii unui fenomen în ordine crescătoare sau descrescătoare.
  2. În continuare, rangurile valorii caracteristicilor a două serii cantitative sunt comparate pentru a determina diferența dintre ele.
  3. Pentru fiecare diferență obținută, pătratul său este scris într-o coloană separată a tabelului, iar rezultatele sunt însumate mai jos.
  4. După acești pași, se aplică o formulă pentru a calcula coeficientul de corelație Spearman.

Proprietățile coeficientului de corelație

Principalele proprietăți ale coeficientului Spearman includ următoarele:

  • Măsurarea valorilor între -1 și 1.
  • Nu există niciun semn al coeficientului de interpretare.
  • Etanșeitatea conexiunii este determinată de principiul: cu cât valoarea este mai mare, cu atât conexiunea este mai strânsă.

Cum se verifică valoarea primită?

Pentru a verifica relația dintre semne, trebuie să efectuați anumite acțiuni:

  1. Se propune o ipoteză nulă (H0), care este și cea principală, apoi se formulează o altă alternativă la prima (H 1). Prima ipoteză va fi că coeficientul de corelație Spearman este 0 - asta înseamnă că nu va exista nicio relație. Al doilea, dimpotrivă, spune că coeficientul nu este egal cu 0, atunci există o legătură.
  2. Următorul pas este găsirea valorii observate a criteriului. Se găsește folosind formula de bază a coeficientului Spearman.
  3. În continuare, se găsesc valorile critice ale criteriului dat. Acest lucru se poate face numai folosind un tabel special care se afișează sensuri diferite conform indicatorilor dați: nivelul de semnificație (l) și numărul determinant (n).
  4. Acum trebuie să comparați cele două valori obținute: observabila stabilită, precum și cea critică. Pentru a face acest lucru, este necesar să construiți o regiune critică. Trebuie să desenați o linie dreaptă, marcați pe ea punctele valorii critice a coeficientului cu semnul „-” și cu semnul „+”. În stânga și în dreapta valorilor critice, zonele critice sunt reprezentate în semicercuri de la puncte. În mijloc, combinând două valori, este marcat cu un semicerc de OPG.
  5. După aceasta, se face o concluzie despre relația strânsă dintre cele două caracteristici.

Unde este cel mai bun loc pentru a folosi această valoare?

Prima știință în care acest coeficient a fost utilizat în mod activ a fost psihologia. La urma urmei, aceasta este o știință care nu se bazează pe numere, dar pentru a demonstra orice ipoteză importantă privind dezvoltarea relațiilor, trăsăturile de caracter ale oamenilor și cunoștințele elevilor, este necesară confirmarea statistică a concluziilor. Este folosit și în economie, în special în tranzacțiile valutare. Aici caracteristicile sunt evaluate fără statistici. Coeficientul de corelare a rangului Spearman este foarte convenabil în acest domeniu de aplicare prin faptul că evaluarea se face indiferent de distribuția variabilelor, deoarece acestea sunt înlocuite cu un număr de rang. Coeficientul Spearman este utilizat activ în domeniul bancar. Sociologia, știința politică, demografia și alte științe îl folosesc și ele în cercetările lor. Rezultatele sunt obținute rapid și cât mai precis posibil.

Este convenabil și rapid să utilizați coeficientul de corelație Spearman în Excel. Există funcții speciale aici care vă ajută să obțineți rapid valorile necesare.

Ce alți coeficienți de corelație există?

Pe lângă ceea ce am învățat despre coeficientul de corelație Spearman, există și diverși coeficienți de corelație care ne permit să măsurăm și să evaluăm caracteristicile calitative, relația dintre caracteristicile cantitative și proximitatea relației dintre acestea, prezentate pe o scară de clasare. Aceștia sunt coeficienți precum biserial, rang-biseria, contingență, asociere și așa mai departe. Coeficientul Spearman arată foarte precis apropierea relației, spre deosebire de toate celelalte metode de determinare matematică a acesteia.

- Asta cuantificare studiul statistic al relaţiei dintre fenomene, utilizat în metode neparametrice.

Indicatorul arată modul în care suma diferențelor pătrate dintre rangurile obținute în timpul observației diferă de cazul lipsei conexiunii.

Scopul serviciului. Folosind acest calculator online puteți:

  • calculul coeficientului de corelare a rangului lui Spearman;
  • calcul interval de încredere pentru coeficientul și evaluarea semnificației acestuia;

Coeficientul de corelare a rangului lui Spearman se referă la indicatori pentru evaluarea gradului de apropiere a comunicării. Caracteristica calitativă a strângerii conexiunii a coeficientului de corelație de rang, precum și a altor coeficienți de corelație, poate fi evaluată cu ajutorul scalei Chaddock.

Calculul coeficientului constă din următorii pași:

Proprietățile coeficientului de corelație a rangului lui Spearman

Domeniul de aplicare. Coeficientul de corelare a rangului folosit pentru a evalua calitatea comunicarii intre doua populatii. În plus, semnificația sa statistică este utilizată atunci când se analizează datele pentru heteroskedasticitate.

Exemplu. Pe baza unui eșantion de variabile observate X și Y:

  1. creați un tabel de clasare;
  2. găsiți coeficientul de corelare a rangului lui Spearman și verificați semnificația acestuia la nivelul 2a
  3. evaluează natura dependenței
Soluţie. Să atribuim ranguri caracteristicii Y și factorului X.
XYrangul X, d xrangul Y, d y
28 21 1 1
30 25 2 2
36 29 4 3
40 31 5 4
30 32 3 5
46 34 6 6
56 35 8 7
54 38 7 8
60 39 10 9
56 41 9 10
60 42 11 11
68 44 12 12
70 46 13 13
76 50 14 14

Matricea de rang.
rangul X, d xrangul Y, d y(d x - d y) 2
1 1 0
2 2 0
4 3 1
5 4 1
3 5 4
6 6 0
8 7 1
7 8 1
10 9 1
9 10 1
11 11 0
12 12 0
13 13 0
14 14 0
105 105 10

Verificarea corectitudinii matricei pe baza calculului sumei de control:

Suma coloanelor matricei este egală între ele și suma de control, ceea ce înseamnă că matricea este compusă corect.
Folosind formula, calculăm coeficientul de corelare a rangului Spearman.


Relația dintre trăsătura Y și factorul X este puternică și directă
Semnificația coeficientului de corelație a rangului lui Spearman
Pentru a testa ipoteza nulă la nivelul de semnificație α, coeficientul general de corelație a rangului Spearman este egal cu zero în ipoteza concurentă Hi. p ≠ 0, trebuie să calculăm punctul critic:

unde n este dimensiunea eșantionului; ρ este coeficientul de corelare a rangului Spearman eșantion: t(α, k) este punctul critic al regiunii critice cu două fețe, care se găsește din tabelul punctelor critice ale distribuției Student, în funcție de nivelul de semnificație α și numărul de grade de libertate k = n-2.
Dacă |p|< Т kp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками не значима. Если |p| >T kp - ipoteza nulă este respinsă. Există o corelație semnificativă de rang între caracteristicile calitative.
Folosind tabelul lui Student găsim t(α/2, k) = (0,1/2;12) = 1,782

Din moment ce T kp< ρ , то отклоняем гипотезу о равенстве 0 коэффициента ранговой корреляции Спирмена. Другими словами, коэффициент ранговой корреляции статистически - значим и ранговая корреляционная связь между оценками по двум тестам значимая.

Publicații pe această temă