Aplicarea corelației Spearman și Pearson. Corelații în tezele de psihologie

Un student la psihologie (sociolog, manager, manager etc.) este adesea interesat de modul în care două sau mai multe variabile sunt legate între ele în unul sau mai multe grupuri studiate.

În matematică, pentru a descrie relațiile dintre mărimile variabile, se folosește conceptul de funcție F, care asociază fiecare valoare specifică a variabilei independente X cu o valoare specifică a variabilei dependente Y. Dependența rezultată se notează Y=F( X).

În același timp, tipurile de corelații între caracteristicile măsurate pot fi diferite: de exemplu, corelația poate fi liniară și neliniară, pozitivă și negativă. Este liniară - dacă cu o creștere sau descreștere a unei variabile X, a doua variabilă Y, în medie, fie crește, fie scade și ea. Este neliniar dacă, cu o creștere a unei mărimi, natura modificării în a doua nu este liniară, ci este descrisă de alte legi.

Corelația va fi pozitivă dacă, odată cu creșterea variabilei X, crește și variabila Y în medie, iar dacă, cu creșterea lui X, variabila Y tinde să scadă în medie, atunci vorbim de prezența unui negativ. corelaţie. Este posibil să fie imposibil să se stabilească vreo relație între variabile. În acest caz, ei spun că nu există nicio corelație.

Sarcină analiza corelației se rezumă la stabilirea direcției (pozitive sau negative) și a formei (liniare, neliniare) a relației dintre diferite caracteristici, măsurarea apropierii acesteia și, în final, verificarea nivelului de semnificație a coeficienților de corelație obținuți.

Coeficientul de corelație de rang, propus de K. Spearman, se referă la o măsură neparametrică a relației dintre variabile măsurate pe o scară de rang. La calcularea acestui coeficient, nu sunt necesare ipoteze cu privire la natura distribuțiilor caracteristicilor în populație. Acest coeficient determină gradul de apropiere a conexiunii dintre caracteristicile ordinale, care în acest caz reprezintă rangurile mărimilor comparate.

Coeficientul de corelație liniară a rangului lui Spearman este calculat folosind formula:

unde n este numărul de caracteristici clasate (indicatori, subiecte);
D este diferența dintre rangurile pentru două variabile pentru fiecare subiect;
D2 este suma diferențelor pătrate de ranguri.

Valorile critice ale coeficientului de corelare a rangului Spearman sunt prezentate mai jos:

Valoarea coeficientului de corelație liniară al lui Spearman se află în intervalul +1 și -1. Coeficientul de corelație liniară al lui Spearman poate fi pozitiv sau negativ, caracterizând direcția relației dintre două trăsături măsurate pe o scară de rang.

Dacă coeficientul de corelație în modul se dovedește a fi aproape de 1, atunci acesta corespunde nivel înalt legături între variabile. Deci, în special, atunci când o variabilă este corelată cu ea însăși, valoarea coeficientului de corelație va fi egală cu +1. O astfel de relație caracterizează o dependență direct proporțională. Dacă valorile variabilei X sunt aranjate în ordine crescătoare și aceleași valori (acum desemnate ca variabilă Y) sunt aranjate în ordine descrescătoare, atunci în acest caz corelația dintre variabilele X și Y va fi exact - 1. Această valoare a coeficientului de corelație caracterizează o relație invers proporțională.

Semnul coeficientului de corelație este foarte important pentru interpretarea relației rezultate. Dacă semnul coeficientului de corelație liniară este plus, atunci relația dintre caracteristicile corelate este astfel încât o valoare mai mare a unei caracteristici (variabile) corespunde unei valori mai mari a unei alte caracteristici (o altă variabilă). Cu alte cuvinte, dacă un indicator (variabilă) crește, atunci celălalt indicator (variabilă) crește în mod corespunzător. Această dependență se numește dependență direct proporțională.

Dacă se primește un semn minus, atunci o valoare mai mare a unei caracteristici corespunde unei valori mai mici a alteia. Cu alte cuvinte, dacă există semnul minus, o creștere a unei variabile (semn, valoare) corespunde unei scăderi a unei alte variabile. Această dependență se numește dependență invers proporțională. În acest caz, alegerea variabilei căreia îi este atribuit caracterul (tendința) de creștere este arbitrară. Poate fi fie variabila X, fie variabila Y. Cu toate acestea, dacă se consideră că variabila X crește, atunci variabila Y va scădea în mod corespunzător și invers.

Să ne uităm la exemplul de corelare Spearman.

Psihologul află modul în care indicatorii individuali de pregătire pentru școală, obținuți înainte de începerea școlii în rândul a 11 elevi de clasa I, sunt legați între ei și performanța medie a acestora la sfârșitul anului școlar.

Pentru a rezolva această problemă, în primul rând, au fost clasate valorile indicatorilor pregătirea școlară primiți la admiterea la școală și, în al doilea rând, indicatorii finali de performanță la sfârșitul anului pentru aceiași elevi în medie. Prezentăm rezultatele în tabel:

Înlocuim datele obținute în formula de mai sus și efectuăm calculul. Primim:

Pentru a afla nivelul de semnificație, consultați tabelul „Valori critice ale coeficientului de corelare a rangului Spearman”, care arată valorile critice pentru coeficienți corelație de rang.

Construim „axa semnificației” corespunzătoare:

Coeficientul de corelație rezultat a coincis cu valoarea critică pentru nivelul de semnificație de 1%. În consecință, se poate argumenta că indicatorii de pregătire școlară și notele finale ale elevilor de clasa I sunt legați printr-o corelație pozitivă - cu alte cuvinte, cu cât indicatorul de pregătire școlară este mai mare, cu atât studiile de clasa întâi sunt mai bune. În ceea ce privește ipotezele statistice, psihologul trebuie să respingă ipoteza nulă (H0) despre similitudine și să accepte alternativa (H1) despre prezența diferențelor, ceea ce sugerează că relația dintre indicatorii de pregătire școlară și performanța școlară medie este diferită de zero.

Corelația Spearman. Analiza corelației folosind metoda Spearman. Spearman se clasează. Coeficientul de corelație Spearman. Corelația rangului Spearman

Dacă există două serii de valori supuse clasamentului, este rațional să se calculeze corelația rangului Spearman.

Astfel de serii pot fi reprezentate:

  • o pereche de caracteristici determinate în același grup de obiecte studiate;
  • o pereche de caracteristici subordonate individuale, determinate în 2 obiecte studiate după același set de caracteristici;
  • o pereche de caracteristici subordonate grupului;
  • subordonarea individuală şi de grup a caracteristicilor.

Metoda presupune clasarea indicatorilor separat pentru fiecare dintre caracteristici.

Cea mai mică valoare are cel mai mic rang.

Această metodă se referă la o metodă statistică neparametrică menită să stabilească existența unei relații între fenomenele studiate:

  • determinarea gradului real de paralelism între două serii de date cantitative;
  • evaluarea gradului de apropiere a legăturii identificate, exprimată cantitativ.

Analiza corelației

O metodă statistică concepută pentru a detecta existența unei relații între 2 sau mai multe variabile aleatoare(variabile), precum și puterea sa, se numește analiză de corelație.

Și-a luat numele de la corelatio (lat.) - ratio.

Când îl utilizați, sunt posibile următoarele scenarii:

  • prezența corelației (pozitive sau negative);
  • nici o corelație (zero).

Dacă se stabilește o relație între variabile, vorbim despre corelarea acestora. Cu alte cuvinte, putem spune că atunci când valoarea lui X se schimbă, se va observa în mod necesar o schimbare proporțională a valorii lui Y.

Instrumentele folosite sunt diverse masuri conexiuni (coeficienți).

Alegerea lor este influențată de:

  • o metodă de măsurare a numerelor aleatoare;
  • natura legăturii dintre numere aleatoare.

Existența unei relații de corelație poate fi afișată grafic (grafice) și folosind un coeficient (afișare numerică).

Relația de corelație se caracterizează prin următoarele caracteristici:

  • rezistența conexiunii (cu un coeficient de corelație de la ±0,7 la ±1 – puternic; de la ±0,3 la ±0,699 – medie; de ​​la 0 la ±0,299 – slab);
  • direcția de comunicare (directă sau inversă).

Obiectivele analizei corelației

Analiza corelației nu ne permite să stabilim o relație cauzală între variabilele studiate.

Se realizează în scopul:

  • stabilirea de relații între variabile;
  • obținerea anumitor informații despre o variabilă pe baza unei alte variabile;
  • determinarea apropierii (legăturii) acestei dependențe;
  • determinarea direcţiei conexiunii stabilite.

Metode de analiză a corelației


Această analiză se poate face folosind:

  • metoda pătratelor sau Pearson;
  • metoda rangului sau Spearman.

Metoda Pearson este aplicabilă calculelor care necesită o determinare precisă a forței existente între variabile. Caracteristicile studiate cu ajutorul lui trebuie exprimate doar cantitativ.

Pentru a aplica metoda Spearman sau corelația de rang nu există cerințe stricte pentru exprimarea caracteristicilor - poate fi atât cantitativă, cât și atributivă. Datorită acestei metode, se obțin informații nu despre determinarea exactă a rezistenței conexiunii, ci sunt de natură aproximativă.

Rândurile variabile pot conține variante deschise. De exemplu, atunci când experiența de muncă este exprimată în valori precum până la 1 an, mai mult de 5 ani etc.

Coeficientul de corelație

O mărime statistică care caracterizează natura modificărilor a două variabile se numește coeficient de corelație sau coeficient de pereche corelații. În termeni cantitativi, variază de la -1 la +1.

Cele mai frecvente cote sunt:

  • Pearson– aplicabil pentru variabilele aparținând scalei intervalului;
  • Spearman– pentru variabilele de scară ordinală.

Limitări ale utilizării coeficientului de corelație

Obținerea de date nesigure la calcularea coeficientului de corelație este posibilă în cazurile în care:

  • există un număr suficient de valori variabile disponibile (25-100 de perechi de observații);
  • între variabilele studiate, de exemplu, se stabilește o relație pătratică, mai degrabă decât una liniară;
  • în fiecare caz datele conțin mai mult de o observație;
  • prezența unor valori anormale (outliers) ale variabilelor;
  • datele studiate constau din subgrupuri de observații clar distinse;
  • prezenţa unei corelaţii nu ne permite să stabilim care dintre variabile poate fi considerată ca o cauză şi care ca o consecinţă.

Verificarea semnificației corelației

Pentru evaluarea mărimilor statistice se folosește conceptul de semnificație sau fiabilitate a acestora, care caracterizează probabilitatea apariției aleatorii a unei mărimi sau valorile sale extreme.

Cea mai comună metodă de determinare a semnificației unei corelații este testul t al lui Student.

Valoarea sa este comparată cu valoarea tabelului, numărul de grade de libertate este luat ca 2. Când obținerea valorii calculate a criteriului este mai mare decât valoarea tabelului, aceasta indică semnificația coeficientului de corelație.

La efectuarea calculelor economice, un nivel de încredere de 0,05 (95%) sau 0,01 (99%) este considerat suficient.

Spearman se clasează

Coeficientul de corelare a rangului lui Spearman vă permite să stabiliți statistic prezența unei relații între fenomene. Calculul acestuia presupune stabilirea unui număr de serie – rang – pentru fiecare atribut. Rangul poate fi ascendent sau descendent.

Numărul de caracteristici care fac obiectul clasamentului poate fi oricare. Acesta este un proces destul de intensiv în muncă, care limitează numărul acestora. Dificultățile încep când ajungi la 20 de semne.

Pentru a calcula coeficientul Spearman, utilizați formula:

in care:

n – afișează numărul de caracteristici clasate;

d nu este altceva decât diferența dintre rândurile a două variabile;

iar ∑(d2) este suma diferențelor pătrate de ranguri.

Aplicarea analizei corelațiilor în psihologie

Suport statistic cercetare psihologică vă permite să le faceți mai obiective și mai reprezentative. Prelucrarea statistică a datelor obținute în timpul experimentelor psihologice ajută la extragerea maximului de informații utile.

Cea mai utilizată metodă de procesare a rezultatelor acestora este analiza corelației.

Este oportun să se efectueze o analiză de corelare a rezultatelor obținute în timpul cercetării:

  • anxietate (după teste de R. Temml, M. Dorca, V. Amen);
  • relațiile de familie (chestionar „Analiza relațiilor de familie” (ARA) de E.G. Eidemiller, V.V. Yustitskis);
  • nivelul de internalitate-externalitate (chestionar de E.F. Bazhin, E.A. Golynkina și A.M. Etkind);
  • nivel epuizare emoțională printre profesori (chestionar de V.V. Boyko);
  • conexiuni între elementele inteligenței verbale a elevilor în timpul pregătirii multidisciplinare (metodologie de K.M. Gurevich și alții);
  • legături între nivelul de empatie (metoda lui V.V. Boyko) și satisfacția conjugală (chestionar de V.V. Stolin, T.L. Romanova, G.P. Butenko);
  • legăturile dintre statutul sociometric al adolescenților (testul Jacob L. Moreno) și trăsăturile de stil educația familiei(chestionar de E.G. Eidemiller, V.V. Yustitskis);
  • structurile obiectivelor de viață ale adolescenților crescuți în familii biparentale și monoparentale (chestionar Edward L. Deci, Richard M. Ryan Ryan).

Scurte instrucțiuni pentru efectuarea analizei de corelație folosind criteriul Spearman

Se efectuează analiza corelației folosind metoda lui Spearman conform următorului algoritm:

  • caracteristicile comparabile pereche sunt aranjate pe 2 rânduri, dintre care unul este desemnat cu X, iar celălalt cu Y;
  • valorile seriei X sunt dispuse în ordine crescătoare sau descrescătoare;
  • succesiunea de aranjare a valorilor seriei Y este determinată de corespondența acestora cu valorile seriei X;
  • pentru fiecare valoare din seria X, determinați rangul - atribuiți număr de serie de la valoarea minimă la maximă;
  • pentru fiecare dintre valorile din seria Y, determinați și rangul (de la minim la maxim);
  • calculați diferența (D) dintre rangurile lui X și Y, folosind formula D=X-Y;
  • valorile diferenței rezultate sunt pătrate;
  • efectuați însumarea pătratelor diferențelor de rang;
  • efectuați calcule folosind formula:

Exemplu de corelație Spearman

Este necesar să se stabilească existența unei corelații între experiența în muncă și ratele accidentării dacă sunt disponibile următoarele date:

Cea mai potrivită metodă de analiză este metoda rangului, deoarece unul dintre semne este prezentat sub formă opțiuni deschise: experiență de lucru de până la 1 an și experiență de muncă de 7 sau mai mulți ani.

Rezolvarea problemei începe cu clasarea datelor, care sunt compilate într-un tabel de lucru și se pot face manual, deoarece volumul lor nu este mare:

Experiență de muncă Numărul de leziuni Numere de serie (clasamente) Diferența de rang Diferența pătratului de ranguri
d(x-y)
pana la 1 an 24 1 5 -4 16
1-2 16 2 4 -2 4
3-4 12 3 2,5 +0,5 0,25
5-6 12 4 2,5 +1,5 2,5
7 sau mai mult 6 5 1 +4 16
Σ d2 = 38,5

Apariția rangurilor fracționale în coloană se datorează faptului că, dacă apare o opțiune de mărime egală, se găsește media valoare aritmetică rang. În acest exemplu, indicatorul de accidentare 12 apare de două ori și i se atribuie rangurile 2 și 3, găsiți media aritmetică a acestor ranguri (2+3)/2= 2,5 și plasați această valoare în foaia de lucru pentru 2 indicatori.
Înlocuind valorile obținute în formula de lucru și făcând calcule simple, obținem coeficientul Spearman egal cu -0,92

O valoare negativă a coeficientului indică prezența feedback-ului între caracteristici și ne permite să afirmăm că o scurtă experiență de muncă este însoțită de un număr mare leziuni Mai mult, puterea conexiunii dintre acești indicatori este destul de mare.
Următoarea etapă a calculelor este de a determina fiabilitatea coeficientului obținut:
eroarea acesteia și testul Student sunt calculate

Coeficientul de corelație Pearson

Coeficient r- Pearson este folosit pentru a studia relația dintre două variabile metrice măsurate pe același eșantion. Există multe situații în care utilizarea sa este adecvată. Afectează inteligența performanța academică în anii de studii superioare? Mărimea salariului unui angajat este legată de amabilitatea acestuia față de colegi? Starea de spirit a elevului afectează succesul rezolvării unei probleme complexe de aritmetică? Pentru a răspunde la astfel de întrebări, cercetătorul trebuie să măsoare doi indicatori de interes pentru fiecare membru al eșantionului.

Valoarea coeficientului de corelație nu este afectată de unitățile de măsură în care sunt prezentate caracteristicile. În consecință, orice transformări liniare ale caracteristicilor (înmulțirea cu o constantă, adăugarea unei constante) nu modifică valoarea coeficientului de corelație. O excepție este înmulțirea unuia dintre semne cu o constantă negativă: coeficientul de corelație își schimbă semnul în sens invers.

Aplicarea corelației Spearman și Pearson.

Corelația Pearson este o măsură a relației liniare dintre două variabile. Vă permite să determinați cât de proporțională este variabilitatea a două variabile. Dacă variabilele sunt proporționale între ele, atunci relația dintre ele poate fi reprezentată grafic ca o dreaptă cu o pantă pozitivă (proporție directă) sau negativă (proporție inversă).

În practică, relația dintre două variabile, dacă există una, este probabilistică și arată grafic ca un nor de dispersie elipsoidal. Acest elipsoid, totuși, poate fi reprezentat (aproximat) ca o linie dreaptă sau o linie de regresie. O linie de regresie este o linie dreaptă construită folosind metoda celor mai mici pătrate: suma distanțelor pătrate (calculate de-a lungul axei Y) de la fiecare punct de pe diagrama de dispersie la linie dreaptă este minimă.

De o importanță deosebită pentru evaluarea acurateței predicției este varianța estimărilor variabilei dependente. În esență, varianța estimărilor variabilei dependente Y este acea parte a varianței totale a acesteia care se datorează influenței variabilei independente X. Cu alte cuvinte, raportul dintre varianța estimărilor variabilei dependente și adevărata sa varianța este egală cu pătratul coeficientului de corelație.

Pătratul coeficientului de corelație dintre variabilele dependente și independente reprezintă proporția de varianță a variabilei dependente care se datorează influenței variabilei independente și se numește coeficient de determinare. Coeficientul de determinare arată astfel măsura în care variabilitatea unei variabile este cauzată (determinată) de influența altei variabile.

Coeficientul de determinare are un avantaj important față de coeficientul de corelație. Corelația nu este o funcție liniară a relației dintre două variabile. Prin urmare, media aritmetică a coeficienților de corelație pentru mai multe eșantioane nu coincide cu corelația calculată imediat pentru toți subiecții din aceste eșantioane (adică, coeficientul de corelație nu este aditiv). Dimpotrivă, coeficientul de determinare reflectă relația liniar și, prin urmare, este aditiv: poate fi mediat pe mai multe probe.

Informații suplimentare puterea conexiunii este indicată de valoarea coeficientului de corelație pătrat - coeficientul de determinare: aceasta este partea de varianță a unei variabile care poate fi explicată prin influența altei variabile. Spre deosebire de coeficientul de corelare, coeficientul de determinare crește liniar odată cu creșterea rezistenței conexiunii.

Coeficienții de corelație Spearman și τ - Kendall ( corelații de rang )

Dacă ambele variabile între care se studiază relația sunt prezentate pe o scară ordinală, sau una dintre ele este pe o scară ordinală și cealaltă pe o scară metrică, atunci se folosesc coeficienți de corelație de rang: Spearman sau τ - Kendella. Ambii coeficienți necesită o ierarhizare preliminară a ambelor variabile pentru aplicarea lor.

Coeficientul de corelație de rang al lui Spearman este o metodă neparametrică care este utilizată în scopul studierii statistice a relației dintre fenomene. În acest caz, se determină gradul real de paralelism între cele două serii cantitative ale caracteristicilor studiate și se dă o evaluare a strângerii legăturii stabilite folosind un coeficient exprimat cantitativ.

Dacă membrii unui grup de mărime au fost clasați mai întâi pe variabila x, apoi pe variabila y, atunci corelația dintre variabilele x și y se poate obține pur și simplu prin calcularea coeficientului Pearson pentru cele două serii de ranguri. Cu condiția să nu existe relații de rang (adică, fără ranguri repetate) pentru nicio variabilă, formula Pearson poate fi simplificată foarte mult din punct de vedere computațional și transformată în ceea ce este cunoscut sub numele de formula Spearman.

Puterea coeficientului de corelare a rangului Spearman este oarecum inferioară puterii coeficientului de corelație parametrică.

Este recomandabil să se folosească coeficientul de corelare a rangului atunci când există un număr mic de observații. Această metodă poate fi utilizată nu numai pentru date cantitative, ci și în cazurile în care valorile înregistrate sunt determinate de caracteristici descriptive de intensitate diferită.

Coeficientul de corelare a rangului lui Spearman la cantitati mari ranguri egale pentru una sau ambele variabile comparate dau valori grosiere. În mod ideal, ambele serii corelate ar trebui să reprezinte două secvențe de valori divergente

O alternativă la corelația Spearman pentru ranguri este corelația τ - Kendall. Corelația propusă de M. Kendall se bazează pe ideea că direcția conexiunii poate fi judecată prin compararea subiecților în perechi: dacă o pereche de subiecți are o schimbare în x care coincide în direcție cu o schimbare în y, atunci aceasta indică o conexiune pozitivă, dacă nu se potrivește - atunci despre o conexiune negativă.

Coeficienții de corelație au fost special proiectați pentru a cuantifica puterea și direcția relației dintre două proprietăți măsurate pe scale numerice (metrică sau de rang). După cum sa menționat deja, puterea maximă a conexiunii corespunde valorilor de corelație de +1 (conexiune strictă directă sau direct proporțională) și -1 (conexiune strictă inversă sau invers proporțională), absența conexiunii corespunde unei corelații egale cu zero . Informații suplimentare despre puterea relației sunt furnizate de coeficientul de determinare: aceasta este porțiunea varianței într-o variabilă care poate fi explicată prin influența altei variabile.

9. Metode parametrice pentru compararea datelor


Metodele de comparație parametrică sunt utilizate dacă variabilele dvs. au fost măsurate pe o scară metrică.

Comparația de variații 2- x probe conform testului lui Fisher .


Această metodă vă permite să testați ipoteza că varianțele celor 2 populații generale din care sunt extrase eșantioanele comparate diferă unele de altele. Limitări ale metodei - distribuția caracteristicii în ambele probe nu trebuie să difere de cea normală.

O alternativă la compararea varianțelor este testul Levene, pentru care nu este necesar să se testeze normalitatea distribuției. Această metodă poate fi utilizată pentru a verifica ipoteza egalității (omogenității) varianțelor înainte de a verifica semnificația diferențelor de medii folosind testul Student pentru eșantioane independente de diferite dimensiuni.

Corelația rangului Spearman(corelația de rang). Corelația de rang a lui Spearman este cea mai simplă modalitate de a determina gradul de relație dintre factori. Denumirea metodei indică faptul că relația este determinată între ranguri, adică serii de valori cantitative obținute, clasate în ordine descrescătoare sau crescătoare. Trebuie avut în vedere că, în primul rând, corelarea rangului nu este recomandată dacă legătura dintre perechi este mai mică de patru și mai mare de douăzeci; în al doilea rând, corelarea rangului face posibilă determinarea relației într-un alt caz, dacă valorile sunt de natură semi-cantitativă, adică nu au o expresie numerică și reflectă o ordine clară de apariție a acestor valori; în al treilea rând, este recomandabil să se folosească corelația de rang în cazurile în care este suficientă obținerea de date aproximative. Un exemplu de calcul al coeficientului de corelație de rang pentru a determina întrebarea: măsurați chestionarul X și Y sunt similare calitati personale subiecte. Folosind două chestionare (X și Y), care necesită răspunsuri alternative „da” sau „nu”, s-au obținut rezultatele primare - răspunsurile a 15 subiecți (N = 10). Rezultatele au fost prezentate ca suma răspunsurilor afirmative separat pentru chestionarul X și pentru chestionarul B. Aceste rezultate sunt rezumate în tabel. 5.19.

Tabelul 5.19. Tabelarea rezultatelor primare pentru a calcula coeficientul de corelare a rangului Spearman (p) *

Analiza matricei de corelație sumară. Metoda de corelare a galaxiilor.

Exemplu. În tabel Figura 6.18 prezintă interpretări a unsprezece variabile care sunt testate folosind metoda Wechsler. Datele au fost obținute dintr-un eșantion omogen cu vârsta cuprinsă între 18 și 25 de ani (n = 800).

Înainte de stratificare, este recomandabil să se ierarhească matricea de corelație. Pentru a face acest lucru, valorile medii ale coeficienților de corelație ai fiecărei variabile cu toate celelalte sunt calculate în matricea originală.

Apoi conform tabelului. 5.20 determinați nivelurile acceptabile de stratificare ale matricei de corelație cu o probabilitate de încredere dată de 0,95 și n - cantități

Tabelul 6.20. Matricea de corelație ascendentă

Variabile 1 2 3 4 ar 0 7 8 0 10 11 M(rij) Rang
1 1 0,637 0,488 0,623 0,282 0,647 0,371 0,485 0,371 0,365 0,336 0,454 1
2 1 0,810 0,557 0,291 0,508 0,173 0,486 0,371 0,273 0,273 0,363 4
3 1 0,346 0,291 0,406 0,360 0,818 0,346 0,291 0,282 0,336 7
4 1 0,273 0,572 0,318 0,442 0,310 0,318 0,291 0,414 3
5 1 0,354 0,254 0,216 0,236 0,207 0,149 0,264 11
6 1 0,365 0,405 0,336 0,345 0,282 0,430 2
7 1 0,310 0,388 0,264 0,266 0,310 9
8 1 0,897 0,363 0,388 0,363 5
9 1 0,388 0,430 0,846 6
10 1 0,336 0,310 8
11 1 0,300 10

Denumiri: 1 - conștientizare generală; 2 - conceptualitate; 3 - atentie; 4 - vdataness K de generalizare; b - memorare directă (în cifre) 6 - nivelul de stăpânire limba maternă; 7 - viteza de stăpânire a abilităților senzoriomotorii (codarea simbolurilor) 8 - observația; 9 - abilități combinatorii (pentru analiză și sinteză) 10 - capacitatea de a organiza părți într-un întreg semnificativ; 11 - capacitatea de sinteză euristică; M (rij) - valoarea medie a coeficienților de corelație ai variabilei cu alte variabile de observație (în cazul nostru n = 800): r (0) - valoarea planului zero „Disectant” - valoarea minimă semnificativă absolută a coeficient de corelație (n - 120, r (0) = 0,236; n = 40, r (0) = 0,407) | Δr | - pas admisibil de stratificare (n = 40, | Δr | = 0,558) în - numărul admisibil de niveluri de stratificare (n = 40, s = 1; n = 120, s = 2); r (1), r (2), ..., r (9) - valoarea absolută a planului de tăiere (n = 40, r (1) = 0,965).

Pentru n = 800, găsim valoarea gtype și limitele lui gi, după care stratificăm matricea de corelație, evidențiind pleiadele de corelație din cadrul straturilor, sau părți separate ale matricei de corelație, desenând asocieri de pleiade de corelație pentru straturile supraiacente (Fig. 5.5).

O analiză semnificativă a galaxiilor rezultate depășește limitele statisticii matematice. Trebuie remarcat faptul că există doi indicatori formali care ajută la interpretarea semnificativă a Pleiadelor. Un indicator semnificativ este gradul unui vârf, adică numărul de muchii adiacente unui vârf. Variabil cu cel mai mare număr marginile este „nucleul” galaxiei și poate fi considerat ca un indicator al variabilelor rămase ale acestei galaxii. Un alt indicator semnificativ este densitatea comunicării. O variabilă poate avea mai puține conexiuni într-o galaxie, dar mai apropiate, și mai multe conexiuni într-o altă galaxie, dar mai puțin apropiate.

Previziuni și estimări. Se numește ecuația y = b1x + b0 ecuație generală direct. Indică faptul că perechile de puncte (x, y), care

Orez. 5.5. Galaxii de corelație obținute prin stratificarea matricei

se află pe o anumită linie, conectată în așa fel încât pentru orice valoare x, valoarea b în pereche cu aceasta poate fi găsită prin înmulțirea lui x cu un anumit număr b1 și adunând, în al doilea rând, numărul b0 la acest produs.

Coeficientul de regresie vă permite să determinați gradul de modificare a factorului de investigare atunci când factorul cauzal se modifică cu o unitate. Valorile absolute caracterizează relația dintre factorii variabili prin valorile lor absolute. Coeficientul de regresie se calculează folosind formula:

Proiectarea si analiza experimentelor. Proiectarea și analiza experimentelor este a treia ramură importantă metode statistice, conceput pentru a găsi și testa relațiile cauzale dintre variabile.

Pentru a studia dependențele multifactoriale în în ultima vreme metodele de planificare experimentală matematică sunt din ce în ce mai utilizate.

Capacitatea de a varia simultan toți factorii vă permite să: a) reduceți numărul de experimente;

b) reducerea erorii experimentale la minim;

c) simplifica prelucrarea datelor primite;

d) asigura claritatea si usurinta compararii rezultatelor.

Fiecare factor poate dobândi o anumită sumă corespunzătoare sensuri diferite, care se numesc niveluri și denotă -1, 0 și 1. Un set fix de niveluri de factori determină condițiile unuia dintre experimentele posibile.

Totalitatea tuturor combinațiilor posibile se calculează folosind formula:

Un experiment factorial complet este un experiment în care sunt implementate toate combinațiile posibile de niveluri de factori. Experimentele factoriale complete pot avea proprietatea de ortogonalitate. Cu planificarea ortogonală, factorii din experiment sunt necorelați, coeficienții de regresie care sunt calculati în cele din urmă sunt determinați independent unul de celălalt.

Un avantaj important al metodei de planificare experimentală matematică este versatilitatea și adecvarea acesteia în multe domenii de cercetare.

Să luăm în considerare un exemplu de comparare a influenței unor factori asupra formării nivelului de stres mental la controlerele TV color.

Experimentul se bazează pe un Design 2 trei ortogonal (trei factori se modifică la două niveluri).

Experimentul a fost realizat cu o parte completă 2 + 3 cu trei repetări.

Planificarea ortogonală se bazează pe construcția unei ecuații de regresie. Din trei factori arată astfel:

Procesarea rezultatelor din acest exemplu include:

a) realizarea unui tabel plan ortogonal 2 +3 pentru calcul;

b) calculul coeficienților de regresie;

c) verificarea semnificaţiei acestora;

d) interpretarea datelor obţinute.

Pentru coeficienții de regresie ai ecuației menționate a fost necesar să se pună N = 2 3 = 8 opțiuni pentru a se putea aprecia semnificația coeficienților, unde numărul de repetări K a fost 3.

Matricea pentru planificarea experimentului arăta astfel:

Metoda de corelare a rangului Spearman vă permite să determinați apropierea (tăria) și direcția corelației dintre două caracteristici sau două profiluri (ierarhii) de caracteristici.

Pentru a calcula corelația de rang, este necesar să existe două rânduri de valori,

care poate fi clasat. O astfel de serie de valori ar putea fi:

1) două semne măsurate în același grup de subiecți;

2) două ierarhii individuale de trăsături identificate la doi subiecți folosind același set de trăsături;

3) două ierarhii de grup de caracteristici,

4) ierarhii individuale și de grup de caracteristici.

În primul rând, indicatorii sunt clasificați separat pentru fiecare dintre caracteristici.

De regulă, un rang inferior este atribuit unei valori de atribut inferioare.

În primul caz (două caracteristici) sunt clasate valori individuale pentru prima caracteristică, obținută de diferiți subiecți, și apoi valori individuale pentru a doua caracteristică.

Dacă două caracteristici sunt legate pozitiv, atunci subiecții cu ranguri scăzute într-una dintre ele vor avea ranguri scăzute în celălalt, iar subiecții cu ranguri ridicate în

una dintre caracteristici va avea, de asemenea, ranguri înalte pentru cealaltă caracteristică. Pentru a calcula rs este necesar să se determine diferențele (d) dintre rangurile obținute de un subiect dat pentru ambele caracteristici. Apoi acești indicatori d sunt transformați într-un anumit mod și scăzuți din 1. Decat

Cu cât diferența dintre ranguri este mai mică, cu atât rs-ul va fi mai mare, cu atât va fi mai aproape de +1.

Dacă nu există o corelație, atunci toate rangurile vor fi amestecate și nu va exista

nici o corespondență. Formula este concepută astfel încât în ​​acest caz rs să fie aproape de 0.

În cazul unei corelaţii negative între rangurile scăzute ale subiecţilor pe un singur atribut

ranguri înalte pe o altă bază vor corespunde și invers. Cu cât discrepanța dintre rangurile subiecților pe două variabile este mai mare, cu atât rs este mai aproape de -1.

În al doilea caz (două profiluri individuale), individual

valorile obținute de fiecare dintre cei 2 subiecți pentru un anumit set (identic pentru ambii) de caracteristici. Primul rang va fi acordat caracteristicii cu cea mai mică valoare; al doilea rang – un semn cu mai mult valoare mare etc. Evident, toate caracteristicile trebuie măsurate în aceleași unități, altfel clasarea este imposibilă. De exemplu, este imposibil să clasați indicatorii în Cattell Personality Inventory (16PF) dacă aceștia sunt exprimați în puncte „brute”, deoarece intervalele de valori pentru diferiți factori sunt diferite: de la 0 la 13, de la 0 la

20 și de la 0 la 26. Nu putem spune care factor va ocupa primul loc în ceea ce privește severitatea până când nu aducem toate valorile la o singură scară (cel mai adesea aceasta este scara de perete).

Dacă ierarhiile individuale ale două subiecți sunt legate pozitiv, atunci trăsăturile care au ranguri scăzute într-unul dintre ele vor avea ranguri scăzute în celălalt și invers. De exemplu, dacă factorul E (dominanță) al unui subiect are cel mai scăzut rang, atunci factorul altui subiect ar trebui să aibă și un rang scăzut, dacă factorul C al unui subiect

(stabilitatea emoțională) are cel mai înalt rang, atunci trebuie să aibă și celălalt subiect

acest factor are un rang înalt etc.

În al treilea caz (două profiluri de grup), valorile medii de grup obținute în 2 grupe de subiecți sunt clasate în funcție de un anumit set de caracteristici, identice pentru cele două grupuri. În cele ce urmează, linia de raționament este aceeași ca în cele două cazuri precedente.

În cazul 4 (profiluri individuale și de grup), valorile individuale ale subiectului și valorile medii de grup sunt clasificate separat în funcție de același set de caracteristici, care se obțin, de regulă, prin excluderea acestui subiect individual - nu participă la profilul mediu de grup cu care va fi comparat profilul individual. Corelarea rangului va testa cât de consistente sunt profilurile individuale și de grup.

În toate cele patru cazuri, semnificația coeficientului de corelație rezultat este determinată de numărul de valori clasate N. În primul caz, acest număr va coincide cu dimensiunea eșantionului n. În al doilea caz, numărul de observații va fi numărul de caracteristici care alcătuiesc ierarhia. În al treilea și al patrulea caz, N este, de asemenea, numărul de caracteristici comparate, și nu numărul de subiecți din grupuri. Explicații detaliate sunt date în exemple. Dacă valoarea absolută a lui rs atinge sau depășește o valoare critică, corelația este fiabilă.

Ipoteze.

Există două ipoteze posibile. Primul se aplică pentru cazul 1, al doilea pentru celelalte trei cazuri.

Prima versiune a ipotezelor

H0: Corelația dintre variabilele A și B nu este diferită de zero.

H1: Corelația dintre variabilele A și B este semnificativ diferită de zero.

A doua versiune a ipotezelor

H0: Corelația dintre ierarhiile A și B nu este diferită de zero.

H1: Corelația dintre ierarhiile A și B este semnificativ diferită de zero.

Limitări ale coeficientului de corelare a rangului

1. Pentru fiecare variabilă trebuie prezentate cel puțin 5 observații. Limita superioară a probei este determinată de tabelele disponibile de valori critice.

2. Coeficientul de corelație a rangului lui Spearman rs cu un număr mare de ranguri identice pentru una sau ambele variabile comparate oferă valori brute. În mod ideal, ambele serii corelate ar trebui să reprezinte două secvențe de valori divergente. Dacă această condiție nu este îndeplinită, este necesar să se facă o ajustare pentru ranguri egale.

Coeficientul de corelare a rangului lui Spearman este calculat folosind formula:

Dacă în ambele serii de ranguri comparate există grupuri de aceleași ranguri, înainte de a calcula coeficientul de corelare a rangului este necesar să se facă corecții pentru aceleași ranguri Ta și Tv:

Ta = Σ (a3 – a)/12,

Тв = Σ (в3 – в)/12,

unde a este volumul fiecărui grup de ranguri identice din seria de ranguri A, b este volumul fiecăruia

grupuri de ranguri identice din seria de rang B.

Pentru a calcula valoarea empirică a lui rs, utilizați formula:

Calculul coeficientului de corelație a rangului lui Spearman rs

1. Stabiliți la ce două caracteristici sau două ierarhii de caracteristici vor participa

comparație ca variabile A și B.

2. Clasificați valorile variabilei A, atribuind rangul 1 celei mai mici valori, în conformitate cu regulile de clasare (vezi P.2.3). Introduceți rangurile în prima coloană a tabelului în ordinea subiecților de testare sau a caracteristicilor.

3. Clasificați valorile variabilei B în conformitate cu aceleași reguli. Introduceți rangurile în a doua coloană a tabelului în ordinea numerelor subiectelor sau caracteristicilor.

5. Patratează fiecare diferență: d2. Introduceți aceste valori în a patra coloană a tabelului.

Ta = Σ (a3 – a)/12,

Тв = Σ (в3 – в)/12,

unde a este volumul fiecărui grup de ranguri identice din seria de rang A; c – volumul fiecărei grupe

ranguri identice în seria de clasare B.

a) în lipsa unor ranguri identice

rs  1 − 6 ⋅

b) în prezenţa unor ranguri identice

Σd 2  T  T

r  1 − 6 ⋅ a în,

unde Σd2 este suma diferențelor pătrate dintre rânduri; Ta și TV - corecții pentru același lucru

N – numărul de subiecte sau caracteristici care participă la clasament.

9. Determinați din Tabel (vezi Anexa 4.3) valorile critice ale rs pentru un N dat. Dacă rs depășește valoarea critică sau este cel puțin egală cu aceasta, corelația este semnificativ diferită de 0.

Exemplul 4.1 La determinarea gradului de dependență a reacției consumului de alcool față de reacția oculomotorie din lotul de testat, s-au obținut date înainte și după consumul de alcool. Reacția subiectului depinde de starea de ebrietate?

Rezultatele experimentului:

Înainte: 16, 13, 14, 9, 10, 13, 14, 14, 18, 20, 15, 10, 9, 10, 16, 17, 18. După: 24, 9, 10, 23, 20, 11, 12, 19, 18, 13, 14, 12, 14, 7, 9, 14. Să formulăm ipoteze:

H0: corelația dintre gradul de dependență al reacției înainte și după consumul de alcool nu diferă de zero.

H1: corelația dintre gradul de dependență al reacției înainte și după consumul de alcool este semnificativ diferită de zero.

Tabelul 4.1. Calculul d2 pentru coeficientul de corelare a rangului lui Spearman rs atunci când se compară indicatorii de reacție oculomotorie înainte și după experiment (N=17)

valorile

valorile

Din moment ce avem rânduri care se repetă, atunci în în acest caz, Vom aplica formula ajustată pentru ranguri egale:

Ta= ((23-2)+(33-3)+(23-2)+(33-3)+(23-2)+(23-2))/12=6

Тb =((23-2)+(23-2)+(33-3))/12=3

Să găsim valoarea empirică a coeficientului Spearman:

rs = 1- 6*((767,75+6+3)/(17*(172-1)))=0,05

Folosind tabelul (Anexa 4.3) găsim valorile critice ale coeficientului de corelație

0,48 (p ≤ 0,05)

0,62 (p ≤ 0,01)

Primim

rs=0,05∠rcr(0,05)=0,48

Concluzie: ipoteza H1 este respinsă și H0 este acceptată. Aceste. corelație între grad

dependența reacției înainte și după consumul de alcool nu diferă de zero.

Publicații pe această temă