Coeficientul de determinare r2 caracterizează proporția de variație a unei variabile. Coeficient de determinare

Abateri ale variabilei dependente de la valoarea sa medie. Variabila dependentă este explicată (prevăzută) folosind o funcție a variabilelor explicative, într-un caz particular, este pătratul coeficientului de corelație dintre variabila dependentă și valorile ei prezise folosind variabilele explicative; Atunci putem spune asta R Figura 2 arată ce proporție din varianța atributului rezultat este explicată prin influența variabilelor explicative.

Formula pentru calcularea coeficientului de determinare:

Unde yi este valoarea observată a variabilei dependente și fi- valoarea variabilei dependente prezisă de ecuația de regresie - media aritmetică a variabilei dependente.

[edit]Probleme și proprietăți generale R 2

[editează]Interpretare

Uneori, indicatorilor de apropiere a conexiunii li se poate da o evaluare calitativă (scala Chaddock):

Măsura cantitativă a apropierii conexiunii

Caracteristicile calitative ale rezistenței lipirii

Moderat

Sesizabil

Foarte sus

O conexiune funcțională are loc atunci când valoarea este 1, iar absența unei conexiuni este 0. Pentru valorile de apropiere a indicatorilor de conexiune mai mici de 0,7, valoarea coeficientului de determinare va fi întotdeauna sub 50%. Aceasta înseamnă că variația caracteristicilor factorilor reprezintă o parte mai mică în comparație cu alți factori neluați în considerare în model care influențează modificarea indicatorului de performanță. Modelele de regresie construite în astfel de condiții au o semnificație practică scăzută.

[edit]Proprietăți generale pentru regresia OLS

Regresia multiplă liniară folosind metoda celor mai mici pătrate (OLS) este cea mai frecventă utilizare a coeficientului de determinare R 2.

Regresia MOL multiplă liniară are următoarele proprietăți generale :

1. Cu cât valoarea este mai aproape de 1, cu atât modelul este mai aproape de observațiile empirice.

2. Pe măsură ce numărul variabilelor explicative crește, R 2.

[editează]Proprietăți generale pentru regresia OLS cu un termen liber (factorul unic)

Pentru cazul prezenţei într-o astfel de regresie membru liber Coeficientul de determinare are următoarele proprietăți:

1. ia valori din interval (segment).

2. în cazul unui model MOL de regresie liniară pereche, coeficientul de determinare este egal cu pătratul coeficientului de corelație, adică R 2 = r 2. Și în cazul regresiei MCO multiple R 2 = r(y;f)2. Este, de asemenea, corelația Pearson la pătrat între două variabile. Exprimă cantitatea de varianță împărțită între două variabile.

3. R 2 poate fi descompus în funcție de contribuția fiecărui factor la valoare R 2, iar contribuția fiecărui astfel de factor va fi pozitivă. Descompunerea utilizată este: , Unde r 0j- coeficientul de corelație al eșantionului al variabilei dependente și al variabilei explicative corespunzătoare celui de-al doilea indice.

4. R 2 este asociat cu testarea ipotezei că valorile adevărate ale coeficienților variabilelor explicative sunt egale cu zero, în comparație cu ipoteza alternativă că nu toate valorile adevărate ale coeficienților sunt egale cu zero. Apoi variabila aleatoare are o distribuție F cu (k-1) și (n-k) grade de libertate.

[edit]Regresie imaginară

Valori R 2, , Povestea adevărată" href="/text/category/bilmz/" rel="bookmark">Fapt verificat sau comparat folosind R 2 și modificările acestuia.

[editare] Depanare sau modificări R 2

[edita] R 2-ajustat

Pentru a preveni creșterea cercetătorilor R 2 prin adăugarea de factori străini, R 2 este înlocuit cu cel corectat https://pandia.ru/text/79/148/images/image006_10.gif" alt="R_(extended)^2" width="72" height="23 src=">, который будет совпадать с исходным для случая МНК регрессии со свободным членом, и для которого будут продолжать выполняться четыре свойства перечисленые выше. Суть этого метода заключается рассмотрении проекции единичного вектора на плоскость объясняющих переменных .!}
Pentru cazul regresiei fără termen inactiv:
,
unde X este matricea nxk a valorilor factorilor, P(X) = X * (X" * X) − 1 * X" - proiector pe planul X, https://pandia.ru/text/79/148/images/image006_10.gif" alt="R_(extended)^2" width="72" height="23">!} supuse unor mici modificări, este de asemenea potrivit pentru compararea regresiilor construite folosind: MOL, cele mai mici pătrate generalizate (GLM), cele mai mici pătrate condiționate (CMLS), cele mai mici pătrate condiționale generalizate (GCM).

[edita] R 2-adevărat (nepărtinitor)

<---Будет добавлен---!>

[edit]Alte criterii utilizate

AIC - Akaike Information Criterion - este folosit numai pentru compararea între modele. Cum valoare mai mică cu atât mai bine. Adesea folosit sub forma de comparare a modelelor serii de timp cu cantități diferiteîntârzieri.
. Oferă o penalizare mai mică pentru includerea întârzierilor suplimentare în model decât BIC.
BIC - Schwartz Information Criterion - este utilizat și interpretat în mod similar cu AIC.
. Oferă o penalizare mai mare pentru includerea întârzierilor suplimentare în model decât BIC (vezi formula).

[editează]Vezi Asemenea

§ Coeficientul de corelare

§ Corelaţie

§ Multicoliniaritate

§ Varianta unei variabile aleatoare

§ Metoda contabilizării de grup a argumentelor

§ Analiza regresiei

[editează]Note

1. 1 2 , Econometrie. Curs inițial.. - Ed. 6,7,8, suplimentar. și prelucrate.. - Moscova: Delo, 2004. - T. "". - 576 p. -ISBN-X

2. 1 2 Extinderea coeficientului de determinare la cazul general al regresiei liniare estimat folosind diverse versiuni ale metodei celor mai mici pătrate (rusă, engleză) // CEMI RAS Economie și Metode Matematice. - Moscova: CEMI RAS, 2002. - V. 3. - T. 38. - P. 107-120.

3. , Statistici aplicate. Fundamentele econometriei (în 2 volume). -??. - Moscova: Unity-Dana (proiect TASIS), 2001. - T. „1,2”. - 1088 p. - ISBN -8

4. Alegerea regresiei care maximizează estimarea imparțială a coeficientului de determinare (rusă, engleză) // Econometrie aplicată. - Moscova: Market DS, 2008. - V. 4. - T. 12. - P. 71-83.

[editează]Legături

§ Glosar de termeni statistici

§ Econometrie aplicată (jurnal)

Concluzia este aceasta: acest indicator măsoară gradul de dependență a variației unei valori față de multe altele. Este folosit pentru a evalua calitatea regresiei liniare.

Formula de calcul:

R^2 \equiv 1-(\sum_i (y_i - f_i)^2 \over \sum_i (y_i-\bar(y))^2),

  • \bar(y) – cf. aritmetica variabilei dependente;
  • fi – sens variabilă dependentă, presupusă de ecuația de regresie;
  • yi este valoarea variabilei dependente studiate.

Determinare, ce este - definiție

Coeficientul de determinare face parte din varianța variabilei (dependente), care este determinată de un model de dependență specific. Deci, această unitate va ajuta la scăderea ponderii variației inexplicabile din varianța variabilei dependente.

Acest indicator poate lua valori cuprinse între 0 și 1. Cu cât valoarea lui este mai aproape de 1, cu atât caracteristica rezultată este mai legată de factorii aflați în studiu.

Deoarece criminalitatea este rezultatul unei legături între comportament şi calitati personale, acest indicator în activitățile autorităților în cauză este calculat pentru a evalua calitatea comportamentului infracțional, dă o idee despre care a fost cauza probabilă a infracțiunii, care este motivația, care au fost motivele și condițiile pentru aceasta.

Ce arată coeficientul de determinare?

Acest coeficient arată variațiile caracteristicii efective din influența caracteristicii factorului este strâns legat de numărul de corelație. Dacă nu există o conexiune, atunci indicatorul este zero, dacă există o conexiune, este una.
Există o definiție a determinismului ca principiu al structurii lumii. Baza acestei idei este interconectarea tuturor fenomenelor. Această doctrină neagă existența lucrurilor în afara relației lor cu lumea.

Opusul este indeterminismul, este asociat cu negarea relațiilor obiective de determinare sau cu negarea cauzalității.

Determinismul genetic este credința că toate organismele se dezvoltă sub control genetic.

Determinanții criminalității în criminologie sunt înțeleși ca fenomene sociale ale căror acțiuni pot provoca criminalitate.

Folosind calcule de acest fel, este posibil să se evalueze influența socioculturală probabilistică a diferiților factori asupra dezvoltării unui individ și să se presupună modul în care o persoană se va comporta, de exemplu, în comunicarea de afaceri și să se evalueze în mod obiectiv dacă este potrivită pentru public. administrarea sau serviciul militar.

De asemenea, coeficientul determină dacă indicele este selectat corect pentru calcularea coeficienților beta și alfa. Dacă % este sub 75 pentru un anumit indice, valorile beta și alfa pentru acesta vor fi incorecte.

Indicele de determinare

Indicele de determinare este pătratul ind. corelații ale conexiunilor neliniare. Această valoare caracterizează procentul prin care modelul de regresie explică variantele variabilei de performanță în raport cu nivelul său mediu.

Formula



Coeficient de determinare ajustat

Esența acest concept este după cum urmează: acest indice arată proporția de varianță a variabilei rezultatului (total) explicată de variantele variabilelor factoriale incluse în modelul de regresie: (creștere, descrescătoare).

Coeficient de determinare

Coeficient de determinare ( - R-pătrat) este proporția de varianță a variabilei dependente explicată de modelul de dependență luat în considerare, adică variabilele explicative. Mai precis, este unul minus ponderea varianței inexplicabile (varianța erorii aleatoare a modelului sau variația factori-condițională a variabilei dependente) în varianța variabilei dependente. Este considerată o măsură universală a conexiunii dintre o variabilă aleatoare și multe altele. Într-un caz special dependență liniară este pătratul așa-numitului coeficient de corelație multiplă dintre variabila dependentă și variabilele explicative. În special, pentru un model de regresie liniară pereche, coeficientul de determinare este egal cu pătratul coeficientului de corelație obișnuit între yŞi x.

Definiție și formulă

Adevăratul coeficient de determinare al modelului de dependență a variabilei aleatoare y față de factorii x se determină astfel:

unde este varianța condiționată (prin factorii x) a variabilei dependente (varianța de eroare aleatorie a modelului).

ÎN această definiție sunt utilizaţi parametri adevăraţi care caracterizează distribuţia variabile aleatoare. Dacă folosim o estimare a eșantionului a valorilor variațiilor corespunzătoare, obținem o formulă pentru coeficientul de determinare a eșantionului (care se înțelege de obicei prin coeficientul de determinare):

unde este suma pătratelor reziduurilor de regresie, sunt valorile reale și calculate ale variabilei explicate.

Suma totală a pătratelor.

În cazul regresiei liniare cu constantă, unde este suma explicată a pătratelor, deci obținem o definiție mai simplă în acest caz - coeficientul de determinare este proporția sumei explicate de pătrate în total:

Trebuie subliniat că această formulă este valabilă doar pentru un model cu constantă în cazul general, este necesar să se folosească formula anterioară;

Interpretare

1. Coeficientul de determinare pentru un model cu o constantă ia valori de la 0 la 1. Cu cât valoarea coeficientului este mai aproape de 1, cu atât dependența este mai puternică. La evaluarea modelelor de regresie, aceasta este interpretată ca potrivirea modelului la date. Pentru modelele acceptabile, se presupune că coeficientul de determinare trebuie să fie de cel puțin 50% (în acest caz, coeficientul de corelație multiplă depășește 70% în valoare absolută). Modelele cu un coeficient de determinare peste 80% pot fi considerate destul de bune (coeficientul de corelație depășește 90%). O valoare a coeficientului de determinare de 1 înseamnă o relație funcțională între variabile.

2. În absența unei relații statistice între variabila explicată și factori, statisticile pentru regresia liniară au o distribuție asimptotică, unde este numărul de factori din model (vezi testul multiplicatorului Lagrange). În cazul regresiei liniare cu erori aleatoare distribuite normal, statisticile au o distribuție Fisher exactă (pentru eșantioane de orice dimensiune) (vezi testul F). Informațiile despre distribuția acestor valori vă permit să testați semnificația statistică model de regresie pe baza valorii coeficientului de determinare. De fapt, aceste teste testează ipoteza că adevăratul coeficient de determinare este egal cu zero.

Indicatori de dezavantaj și alternativi

Principala problemă a aplicației (selective) este că valoarea acesteia crește ( Nu scade) de la adăugarea de noi variabile la model, chiar dacă aceste variabile nu au nicio legătură cu variabila care este explicată! Prin urmare, compararea modelelor cu un număr diferit de factori folosind coeficientul de determinare este, în general, incorectă. În aceste scopuri pot fi utilizați indicatori alternativi.

Ajustat

Pentru a putea compara modele cu numere diferite factori astfel încât numărul de regresori (factori) să nu afecteze statisticile este de obicei utilizat coeficientul de determinare ajustat, care utilizează estimări imparțial ale variației:

care dă o penalizare pentru factorii incluși suplimentar, unde n este numărul de observații, iar k este numărul de parametri.

Acest indicator este întotdeauna mai mic de unul, dar teoretic poate fi mai putin de zero(numai pentru o valoare foarte mică a coeficientului obișnuit de determinare și cantitati mari factori). Prin urmare, interpretarea indicatorului ca o „cotă” se pierde. Cu toate acestea, utilizarea indicatorului în comparație este destul de justificată.

Pentru modelele cu aceeași variabilă dependentă și aceeași dimensiune a eșantionului, compararea modelelor folosind coeficientul de determinare ajustat este echivalentă cu compararea lor folosind varianta reziduala sau eroare standard a modelului. Singura diferență este că criteriile din urmă sunt mai mici, cu atât mai bine.

Criterii de informare

AIC- Criteriul informativ Akaike - folosit exclusiv pentru compararea modelelor. Cu cât valoarea este mai mică, cu atât mai bine. Adesea folosit pentru a compara modele de serie de timp cu numere diferite de decalaje.
, Unde k- numărul parametrilor modelului.
BIC sau S.C.- Bayesian Schwartz Information Criterion - utilizat și interpretat similar cu AIC.
. Oferă o penalizare mai mare pentru includerea întârzierilor suplimentare în model decât AIC.

- generalizat (extins)

În absența constantelor în regresia MOL liniară multiplă, proprietățile coeficientului de determinare pot fi încălcate pentru o anumită implementare. Prin urmare, modelele de regresie cu și fără termen de interceptare nu pot fi comparate folosind criteriul. Această problemă se rezolvă prin construirea unui coeficient de determinare generalizat, care coincide cu cel inițial pentru cazul regresiei MCO cu termen liber, și pentru care sunt îndeplinite cele patru proprietăți enumerate mai sus. Esența acestei metode este de a lua în considerare proiecția unui vector unitar pe planul variabilelor explicative.

Pentru cazul regresiei fără termen inactiv:
,
unde X este matricea nxk a valorilor factorilor, este proiectorul pe planul X, , unde este vectorul unitar nx1.

supuse unor mici modificări, este de asemenea potrivit pentru compararea regresiilor construite folosind: MOL, cele mai mici pătrate generalizate (GLM), cele mai mici pătrate condiționate (CMLS), cele mai mici pătrate condiționale generalizate (GCM).

Comentariu

Valorile ridicate ale coeficientului de determinare, în general, nu indică prezența unei relații cauză-efect între variabile (cum este cazul coeficientului de corelație obișnuit). De exemplu, dacă variabila explicată și factorii care nu sunt de fapt legați de variabila explicată au o dinamică crescătoare, atunci coeficientul de determinare va fi destul de mare. Prin urmare, adecvarea logică și semantică a modelului este de o importanță capitală. În plus, este necesar să se utilizeze criterii pentru o analiză cuprinzătoare a calității modelului.

Vezi de asemenea

Note

Legături

  • Econometrie aplicată (jurnal)

Fundația Wikimedia.

  • 2010.
  • coeficientul De Ritis

Factorul de lumină naturală

    Vedeți ce este „Coeficientul de determinare” în alte dicționare: COEFICIENT DE DETERMINARE - evaluarea calității (puterii explicative) a ecuației de regresie, ponderea varianței în variabila dependentă explicată y: R2= 1 Sum(yi yzi)2 / Sum(yi y)2, unde yi este valoarea observată a variabila dependentă y, yzi este valoarea variabilei dependente,... ...

    Coeficient de determinare Sociologie: Enciclopedie - pătratul coeficientului de corelație liniară Pearson, interpretat ca proporția de varianță a variabilei dependente explicată de variabila independentă...

    Coeficient de determinare Dicţionar sociologic Socium - O măsură a cât de bine sunt legate variabilele dependente și independente într-o analiză de regresie. De exemplu, procentul de modificare a randamentului unui activ explicat de rentabilitatea portofoliului de piață...

    Coeficient de determinare Dicţionar de investiţii - (COEFICIENTUL DE DETERMINARE) se determină la construirea unei relații de regresie liniară. Egal cu proporția de variație a variabilei dependente asociată cu variația variabilei independente...

    Glosar financiar- (Coeficientul de corelație) Coeficientul de corelație este un indicator statistic al dependenței a două variabile aleatoare Definirea coeficientului de corelație, tipuri de coeficienți de corelație, proprietăți ale coeficientului de corelație, calcul și aplicare... ... Enciclopedia investitorilor

Coeficient de determinare.  

Analiza se efectuează, de exemplu, folosind coeficientul de determinare  

O măsură alternativă a gradului de dependență dintre două variabile este coeficientul de determinare, care este coeficientul de corelație la pătrat (r2). Coeficientul de determinare este exprimat ca procent și reflectă cantitatea de modificare a indicatorului efectiv (y) datorită unei modificări a unei alte variabile - indicatorul factor (x).  

Conform rezultatelor exemplului nostru dat mai sus, coeficientul de determinare a fost r = 0,471 b2 = 0,2224 = 22,24%. Aceasta înseamnă că mai mult de 22% din modificările veniturilor din vânzări se datorează modificărilor costurilor de publicitate.  

Determinați coeficientul de determinare în funcție de condiția de testare 1. Interpretați nivelul acestui coeficient.  

În cazurile în care este dificil de justificat forma dependenței, soluția problemei poate fi realizată folosind diferite modele și rezultatele obținute pot fi comparate. Adecvarea diferitelor modele la dependențele reale este verificată folosind criteriul Fisher, eroarea medie de aproximare și valoarea coeficientului multiplu de determinare, care vor fi discutate mai târziu (vezi 7.4).  

Coeficientul de determinare al modelului, egal cu pătratul coeficientului de corelație multiplă redus, a fost de 99,31% eroarea standard a modelului a fost egală cu 4415 mii de ruble, / Statistica Fisher - 4,415, iar nivelul de semnificație al ipotezei despre; absența unei conexiuni a fost mai mică de 0,01%.  

Această expresie corespunde expresiei m)2 (vezi formula (8.2)). Identitatea coeficientului de determinare și pătratul relației de corelație servește drept bază pentru interpretarea valorii r2l ca proporție a varianței totale a caracteristicii rezultante y, care se explică prin variația factorului-factor x (și legătura dintre variaţia ambelor caracteristici). De fapt, principalul indicator al proximității conexiunii ar trebui considerat coeficientul de determinare  

Coeficientul de determinare r2 = 71,3%, adică variația vârstei unui soț depinde cu 71% de variația vârstei celeilalte jumătăți. Legătura este foarte strânsă.  

Întrucât r 2 este un analog al coeficientului de determinare, putem concluziona că 42,2% din variația costului laptelui în totalul celor 136 de întreprinderi a fost asociată cu variația productivității vacilor (și cu factori care variau de concert cu productivitatea în conformitate cu cu rezerva făcută anterior cu privire la interpretarea relaţiilor de perechi) .  

Aici Ry2 este coeficientul de determinare pentru o ecuație cu toți k factori. Numătorul (8.43) este partea explicată suplimentar a variației în y atunci când factorul xm este inclus în ecuație după toți ceilalți factori. În exemplul nostru, folosind valoarea calculată anterior R2 = 0,5765, când factorul x3 este inclus în analiză, obținem  

Cu toate acestea, cel mai mare dezavantaj al acestei metode de descompunere a R2 este dependența valorilor p2 de ordinea acceptată de includere a factorilor în ecuația de regresie. Primul factor inclus ia partea leului din efectul de sistem în favoarea sa, iar o parte nesemnificativă rămâne în ponderea ultimului factor. De exemplu, dacă rearanjam factorii dc și xe și, de asemenea, calculăm coeficientul de determinare cu doi factori /Z2 x = 0,8035 folosind formula recurentă, vom obține rezultate diferite de cele precedente  

Semnele-factorii trebuie să fie într-o relație cauzală cu semnul rezultat (consecința). Prin urmare, este inacceptabil, de exemplu, să se introducă coeficientul de rentabilitate ca unul dintre factorii Xj în modelul de cost, deși includerea unui astfel de factor crește semnificativ coeficientul de determinare.  

Principiul simplității este de preferat unui model cu un număr mai mic de factori cu același coeficient de determinare sau chiar cu un coeficient ceva mai mic.  

Excesul maxim posibil ar fi dacă nu ar exista combinații eterogene, adică Ab și Ba. Este 140 + 80 + 230 = 450. Indicatorul însuși al strângerii conexiunii este raportul dintre surplusul real și surplusul marginal 140 450 = 0,311. După cum putem observa, acest indicator este apropiat de coeficientul de asociere, dar are o interpretare extrem de logică și clară conexiunea este de 0,311 sau 31,1% din cea maximă funcțională posibilă. Acest indicator nu este un analog al coeficientului de corelare, ci al coeficientului de determinare. Prin urmare, este legitim să-l desemnăm ca R2 sau r 2. Are forma  

Coeficientul de determinare r2 este egal cu 0,88, sau 88% din fluctuațiile costului cartofilor sunt asociate cu fluctuațiile randamentului. Doar trei produse ale abaterii mg yy sunt pozitive, iar cele mai mici la fel.  

Efectuarea analizei unitate cu unitate folosind o ecuație de regresie se bazează, de obicei, pe descompunerea mărimii abaterii de la media generală (y, - y) în două componente (y, - y) și (y, - y,). Dacă ecuația de regresie include toți factorii importanți și semnificativi de care depinde valoarea caracteristicii rezultate, iar coeficientul de determinare este aproape de unitate, atunci factorii rămași neincluși în ecuație caracterizează trăsăturile individuale, neimportante, care adesea nu au o expresie cantitativă. În acest caz, diferența (y, - y/) se formează din cauza discrepanței dintre intensitatea impactului asupra y a tuturor factorilor luați în considerare în condițiile unei anumite unități i și intensitatea medie a impactului acestora, exprimat în valorile coeficienților de regresie incluși în valoare calculată yf. Acest lucru dă dreptul de a interpreta diferența (y, -y) sau raportul y/y ca un indicator al modului în care eficiența utilizării factorilor luați în considerare unitatea y/-y se corelează cu eficiența medie a utilizării acestora. Diferența (y, - y) apare din cauza diferenței dintre valorile factorilor luați în considerare pentru o anumită unitate i și media pentru populație. Această descompunere face posibilă identificarea rezervelor de care dispune fiecare unitate individuală în ceea ce privește eficiența utilizării factorilor și în ceea ce privește nivelul acestora.  

Având în vedere valorile relativ scăzute ale coeficienților de determinare raportați și de bază (/ 0 = 0,8] 54, r2, = 0,7974), diferența dintre valorile reale și calculate (V, - V) exprimă nu numai diferențe în eficiența utilizării factorului luat în considerare - grosimea rezervorului - la această mină particulară comparativ cu randamentul mediu pentru trust, dar și influența factorilor neluați în considerare în ecuația de regresie.  

I A treia metodă de construire a acțiunilor medii multidimensionale nu necesită implicarea unor evaluări subiective ale experților - sunt utilizate doar informațiile conținute în acțiunile originale. Caracteristica care are un coeficient mai mare de determinare a cotelor cu toate caracteristicile rămase este considerată mai informativă și, prin urmare, mai semnificativă. După ce am calculat coeficienții de determinare pe perechi și medii, luăm pe cel mai mic dintre ei ca unul (un punct) și obținem scoruri pentru alte caracteristici ca raportul dintre coeficienții lor medii de determinare și cel mai mic (vezi Tabelul 11.9).  

După alegerea tipului de ecuație și calcularea parametrilor acesteia, funcția selectată trebuie verificată pentru adecvare. Esența acestei etape este dacă funcția selectată caracterizează în mod adecvat dezvoltarea fenomenului economic studiat și dacă există factori dintre factorii care pot fi excluși din cauza nesemnificației în studiul acestui fenomen. Pentru studiu se utilizează coeficientul de determinare și criteriul lui Fisher.  

Coeficient de determinare

Sinonime: coeficient mixt corelații

O statistică care reflectă puterea explicativă a unei ecuații regresieși egal cu raportul dintre suma pătratelor regresiei SSR și total variatii SST:

unde este nivelul seriei, este valoarea modelată, este media la toate nivelurile seriei.

Acest indicator este o măsură statistică a bunei potriviri care poate fi utilizată pentru a determina cât de bine se potrivește o ecuație de regresie cu datele reale.

Coeficientul de determinare variază de la 0 la 1. Dacă este egal cu 0, înseamnă că nu există nicio relație între variabilele modelului de regresie și, în schimb, se estimează valoarea variabila de iesire poți la fel de bine să folosești o medie simplă a valorilor sale observate. Dimpotrivă, dacă coeficientul de determinare este 1, acesta corespunde unui model ideal, când toate punctele de observație se află exact pe linii de regresie, adică suma pătratelor abaterilor lor este 0. În practică, dacă coeficientul de determinare este aproape de 1, aceasta indică faptul că modelul funcționează foarte bine (are semnificație mare), iar dacă este aproape de 0, atunci aceasta înseamnă că modelul are o semnificaţie redusă când variabilă de intrare„explica” prost comportamentul zilei libere, adică nu există o relație liniară între ele. Evident, un astfel de model va avea o eficiență scăzută.

Coeficient de determinare(R 2 ) este cota variaţiile abateri ale variabilei dependente de la ea valoare medie, explicat de considerat modelcomunicatii(variabile explicative). Modelul de relație este de obicei specificat ca o funcție explicită a variabilelor explicative. În cazul special al unei conexiuni liniare R 2 este un pătrat coeficient de corelațieîntre variabila dependentă şi variabilele explicative.

Formula generală pentru calcularea coeficientului de determinare:

Unde y i este valoarea observată a variabilei dependente și f i- valoarea variabilei dependente prezisă de ecuația de regresie - media aritmetică a variabilei dependente.

Când se testează o ipoteză despre prezența unei conexiuni, modelul de conexiune poate fi necunoscut. Apoi este specificat sub forma unei funcții constante pe bucăți (în acest caz, coeficientul de determinare este egal cu pătratul raportului de corelare) sau valorile necunoscute ale funcției de conectare sunt estimate folosind metode netezire dependență empirică (de exemplu metoda mediei mobile) .

Publicații pe această temă