Cum se calculează varianța unei variabile aleatoare. Cum se calculează varianța în Excel folosind funcția disp.v

Așteptări matematice (valoare medie) variabilă aleatoare X dat pe un spațiu de probabilitate discret se numește numărul m =M[X]=∑x i p i dacă seria converge absolut.

Scopul serviciului. Folosind serviciul în modul online se calculează așteptările matematice, varianța și media abaterea standard (vezi exemplu). În plus, este reprezentat grafic un grafic al funcției de distribuție F(X).

Proprietăți ale așteptării matematice a unei variabile aleatoare

  1. Așteptarea matematică a unei valori constante este egală cu ea însăși: M[C]=C, C – constantă;
  2. M=C M[X]
  3. Așteptările matematice ale sumei variabilelor aleatoare este egală cu suma așteptărilor lor matematice: M=M[X]+M[Y]
  4. Așteptările matematice ale produsului variabilelor aleatoare independente este egală cu produsul așteptărilor lor matematice: M=M[X] M[Y] , dacă X și Y sunt independenți.

Proprietăți de dispersie

  1. Varianta unei valori constante este zero: D(c)=0.
  2. Factorul constant poate fi scos de sub semnul de dispersie prin pătratul: D(k*X)= k 2 D(X).
  3. Dacă variabilele aleatoare X și Y sunt independente, atunci varianța sumei este egală cu suma varianțelor: D(X+Y)=D(X)+D(Y).
  4. Dacă variabilele aleatoare X și Y sunt dependente: D(X+Y)=DX+DY+2(X-M[X])(Y-M[Y])
  5. Următoarea formulă de calcul este valabilă pentru dispersie:
    D(X)=M(X 2)-(M(X)) 2

Exemplu. Sunt cunoscute așteptările și variațiile matematice ale a două variabile aleatoare independente X și Y: M(x)=8, M(Y)=7, D(X)=9, D(Y)=6. Aflați așteptările matematice și varianța variabilei aleatoare Z=9X-8Y+7.
Soluţie. Pe baza proprietăților așteptărilor matematice: M(Z) = M(9X-8Y+7) = 9*M(X) - 8*M(Y) + M(7) = 9*8 - 8*7 + 7 = 23 .
Pe baza proprietăților dispersiei: D(Z) = D(9X-8Y+7) = D(9X) - D(8Y) + D(7) = 9^2D(X) - 8^2D(Y) + 0 = 81*9 - 64*6 = 345

Algoritm pentru calcularea așteptărilor matematice

Proprietăți ale variabilelor aleatoare discrete: toate valorile lor pot fi renumerotate numere naturale; Atribuiți fiecărei valori o probabilitate diferită de zero.
  1. Înmulțim perechile unul câte unul: x i cu p i .
  2. Adăugați produsul fiecărei perechi x i p i .
    De exemplu, pentru n = 4: m = ∑x i p i = x 1 p 1 + x 2 p 2 + x 3 p 3 + x 4 p 4
Funcția de distribuție a unei variabile aleatoare discrete treptat, ea crește brusc în acele puncte ale căror probabilități sunt pozitive.

Exemplul nr. 1.

x i 1 3 4 7 9
p i 0.1 0.2 0.1 0.3 0.3

Găsim așteptările matematice folosind formula m = ∑x i p i .
Așteptări M[X].
M[x] = 1*0,1 + 3*0,2 + 4*0,1 + 7*0,3 + 9*0,3 = 5,9
Găsim varianța folosind formula d = ∑x 2 i p i - M[x] 2 .
Varianta D[X].
D[X] = 1 2 *0,1 + 3 2 *0,2 + 4 2 *0,1 + 7 2 *0,3 + 9 2 *0,3 - 5,9 2 = 7,69
Abaterea standard σ(x).
σ = sqrt(D[X]) = sqrt(7,69) = 2,78

Exemplul nr. 2. O variabilă aleatorie discretă are următoarea serie de distribuție:

X -10 -5 0 5 10
r O 0,32 2o 0,41 0,03
Aflați valoarea lui a, așteptarea matematică și abaterea standard a acestei variabile aleatoare.

Soluţie. Valoarea lui a se găsește din relația: Σp i = 1
Σp i = a + 0,32 + 2 a + 0,41 + 0,03 = 0,76 + 3 a = 1
0,76 + 3 a = 1 sau 0,24=3 a , de unde a = 0,08

Exemplul nr. 3. Determinați legea distribuției unei variabile aleatoare discrete dacă varianța ei este cunoscută și x 1 x 1 =6; x 2 =9; x 3 =x; x 4 =15
p1 = 0,3; p2 = 0,3; p3 = 0,1; p 4 = 0,3
d(x)=12,96

Soluţie.
Aici trebuie să creați o formulă pentru a găsi varianța d(x):
d(x) = x 1 2 p 1 +x 2 2 p 2 +x 3 2 p 3 +x 4 2 p 4 -m(x) 2
unde așteptarea m(x)=x 1 p 1 +x 2 p 2 +x 3 p 3 +x 4 p 4
Pentru datele noastre
m(x)=6*0,3+9*0,3+x 3 *0,1+15*0,3=9+0,1x 3
12,96 = 6 2 0,3+9 2 0,3+x 3 2 0,1+15 2 0,3-(9+0,1x 3) 2
sau -9/100 (x 2 -20x+96)=0
În consecință, trebuie să găsim rădăcinile ecuației și vor fi două dintre ele.
x 3 =8, x 3 =12
Alegeți-l pe cel care îndeplinește condiția x 1 x 3 =12

Legea distribuției unei variabile aleatoare discrete
x 1 =6; x 2 =9; x 3 =12; x 4 =15
p1 = 0,3; p2 = 0,3; p3 = 0,1; p 4 = 0,3

Așteptările și varianța sunt caracteristicile numerice cele mai frecvent utilizate ale unei variabile aleatorii. Ele caracterizează cele mai importante trăsături ale distribuției: poziția și gradul de împrăștiere a acesteia. În multe probleme practice, o caracteristică completă, exhaustivă a unei variabile aleatoare - legea distribuției - fie nu poate fi obținută deloc, fie nu este deloc necesară. În aceste cazuri, se limitează la o descriere aproximativă a unei variabile aleatorii folosind caracteristici numerice.

Valoarea așteptată este adesea numită pur și simplu valoarea medie a unei variabile aleatorii. Dispersia unei variabile aleatoare este o caracteristică a dispersiei, răspândirea unei variabile aleatoare în jurul așteptărilor sale matematice.

Așteptarea unei variabile aleatoare discrete

Să abordăm conceptul de așteptare matematică, mai întâi pe baza interpretării mecanice a distribuției unei variabile aleatoare discrete. Fie ca unitatea de masă să fie distribuită între punctele axei x x1 , x 2 , ..., x n, iar fiecare punct material are o masă corespunzătoare de p1 , p 2 , ..., p n. Este necesar să se selecteze un punct pe axa absciselor, care să caracterizeze poziția întregului sistem de puncte materiale, ținând cont de masele acestora. Este firesc să luăm ca un astfel de punct centrul de masă al sistemului de puncte materiale. Aceasta este media ponderată a variabilei aleatoare X, la care abscisa fiecărui punct xi intră cu o „pondere” egală cu probabilitatea corespunzătoare. Valoarea medie a variabilei aleatoare obţinută în acest fel X se numește așteptarea sa matematică.

Așteptările matematice ale unei variabile aleatoare discrete este suma produselor tuturor valorilor sale posibile și probabilitățile acestor valori:

Exemplul 1. A fost organizată o loterie win-win. Există 1000 de câștiguri, dintre care 400 sunt 10 ruble. 300 - 20 de ruble fiecare. 200 - 100 de ruble fiecare. și 100 - 200 de ruble fiecare. Care este câștigul mediu pentru cineva care cumpără un bilet?

Soluţie. Vom găsi câștigurile medii dacă împărțim suma totală a câștigurilor, care este 10*400 + 20*300 + 100*200 + 200*100 = 50.000 de ruble, la 1000 (valoarea totală a câștigurilor). Apoi obținem 50000/1000 = 50 de ruble. Dar expresia pentru calcularea câștigurilor medii poate fi prezentată în următoarea formă:

Pe de altă parte, în aceste condiții, suma câștigată este o variabilă aleatorie, care poate lua valori de 10, 20, 100 și 200 de ruble. cu probabilități egale cu 0,4, respectiv; 0,3; 0,2; 0,1. Prin urmare, câștigul mediu așteptat este egal cu suma produselor mărimii câștigurilor și a probabilității de a le primi.

Exemplul 2. Editura a decis să publice o nouă carte. El plănuiește să vândă cartea cu 280 de ruble, din care el însuși va primi 200, 50 - librăria și 30 - autorul. Tabelul oferă informații despre costurile publicării unei cărți și probabilitatea de a vinde un anumit număr de exemplare ale cărții.

Găsiți profitul așteptat al editorului.

Soluţie. Variabila aleatoare „profit” este egală cu diferența dintre venitul din vânzări și costul costurilor. De exemplu, dacă se vând 500 de exemplare ale unei cărți, atunci venitul din vânzare este de 200 * 500 = 100.000, iar costul publicării este de 225.000 de ruble. Astfel, editorul se confruntă cu o pierdere de 125.000 de ruble. Următorul tabel rezumă valorile așteptate ale variabilei aleatoare - profit:

NumărProfit xi Probabilitate pi xi p i
500 -125000 0,20 -25000
1000 -50000 0,40 -20000
2000 100000 0,25 25000
3000 250000 0,10 25000
4000 400000 0,05 20000
Total: 1,00 25000

Astfel, obținem așteptarea matematică a profitului editorului:

.

Exemplul 3. Probabilitatea de a lovi cu o singură lovitură p= 0,2. Determinați consumul de proiectile care oferă o așteptare matematică a numărului de lovituri egal cu 5.

Soluţie. Din aceeași formulă de așteptare matematică pe care am folosit-o până acum, ne exprimăm x- consumul de coajă:

.

Exemplul 4. Determinați așteptările matematice ale unei variabile aleatorii x numărul de lovituri cu trei lovituri, dacă probabilitatea unei lovituri la fiecare lovitură p = 0,4 .

Sugestie: găsiți probabilitatea de valori ale variabilelor aleatoare prin formula lui Bernoulli .

Proprietățile așteptărilor matematice

Să luăm în considerare proprietățile așteptărilor matematice.

Proprietatea 1. Așteptările matematice ale unei constante este egală cu această constantă:

Proprietatea 2. Factorul constant poate fi scos din semnul așteptării matematice:

Proprietatea 3. Așteptările matematice ale sumei (diferenței) variabilelor aleatoare sunt egale cu suma (diferenței) așteptărilor lor matematice:

Proprietatea 4. Așteptările matematice ale unui produs de variabile aleatoare sunt egale cu produsul așteptărilor lor matematice:

Proprietatea 5. Dacă toate valorile unei variabile aleatoare X scade (creste) cu acelasi numar CU, atunci așteptarea sa matematică va scădea (crește) cu același număr:

Când nu te poți limita doar la așteptări matematice

În cele mai multe cazuri, doar așteptarea matematică nu poate caracteriza suficient o variabilă aleatoare.

Lasă variabilele aleatoare XŞi Y sunt date de următoarele legi de distribuție:

Sens X Probabilitate
-0,1 0,1
-0,01 0,2
0 0,4
0,01 0,2
0,1 0,1
Sens Y Probabilitate
-20 0,3
-10 0,1
0 0,2
10 0,1
20 0,3

Așteptările matematice ale acestor mărimi sunt aceleași - egale cu zero:

Cu toate acestea, modelele lor de distribuție sunt diferite. Variabila aleatoare X poate lua doar valori care diferă puțin de așteptările matematice și de variabila aleatoare Y poate lua valori care se abat semnificativ de la așteptările matematice. Un exemplu asemănător: salariul mediu nu face posibilă judecarea ponderii lucrătorilor cu plăți mari și slabe. Cu alte cuvinte, nu se poate judeca din așteptarea matematică ce abateri de la ea, cel puțin în medie, sunt posibile. Pentru a face acest lucru, trebuie să găsiți varianța variabilei aleatoare.

Dispersia unei variabile aleatoare discrete

Varianta variabilă aleatoare discretă X se numește așteptarea matematică a pătratului abaterii sale de la așteptarea matematică:

Abaterea standard a unei variabile aleatoare X valoarea aritmetică a rădăcinii pătrate a varianței sale se numește:

.

Exemplul 5. Calculați variațiile și abaterile standard ale variabilelor aleatoare XŞi Y, ale căror legi de distribuție sunt date în tabelele de mai sus.

Soluţie. Așteptări matematice ale variabilelor aleatoare XŞi Y, așa cum a fost găsit mai sus, sunt egale cu zero. Conform formulei de dispersie la E(X)=E(y)=0 obținem:

Apoi abaterile standard ale variabilelor aleatoare XŞi Y inventa

.

Astfel, cu aceleași așteptări matematice, varianța variabilei aleatoare X foarte mic, dar o variabilă aleatorie Y- semnificativă. Aceasta este o consecință a diferențelor în distribuția lor.

Exemplul 6. Investitorul are 4 proiecte alternative de investiții. Tabelul rezumă profitul așteptat în aceste proiecte cu probabilitatea corespunzătoare.

Proiectul 1Proiectul 2Proiectul 3Proiectul 4
500, P=1 1000, P=0,5 500, P=0,5 500, P=0,5
0, P=0,5 1000, P=0,25 10500, P=0,25
0, P=0,25 9500, P=0,25

Găsiți așteptările matematice, varianța și abaterea standard pentru fiecare alternativă.

Soluţie. Să arătăm cum se calculează aceste valori pentru a treia alternativă:

Tabelul rezumă valorile găsite pentru toate alternativele.

Toate alternativele au aceleași așteptări matematice. Asta înseamnă că, pe termen lung, toată lumea are același venit. Abaterea standard poate fi interpretată ca o măsură a riscului - cu cât este mai mare, cu atât este mai mare riscul investiției. Un investitor care nu dorește mult risc va alege proiectul 1, deoarece are cea mai mică abatere standard (0). Dacă investitorul preferă riscul și randamentele mari într-o perioadă scurtă, atunci va alege proiectul cu cea mai mare abatere standard - proiectul 4.

Proprietăți de dispersie

Să prezentăm proprietățile dispersiei.

Proprietatea 1. Varianta unei valori constante este zero:

Proprietatea 2. Factorul constant poate fi scos din semnul de dispersie prin pătratul:

.

Proprietatea 3. Varianta unei variabile aleatoare este egală cu așteptarea matematică a pătratului acestei valori, din care se scade pătratul așteptării matematice a valorii în sine:

,

Unde .

Proprietatea 4. Varianta sumei (diferenței) variabilelor aleatoare este egală cu suma (diferenței) varianțelor acestora:

Exemplul 7. Se știe că o variabilă aleatoare discretă X ia doar două valori: −3 și 7. În plus, așteptarea matematică este cunoscută: E(X) = 4 . Aflați varianța unei variabile aleatoare discrete.

Soluţie. Să notăm prin p probabilitatea cu care o variabilă aleatoare ia o valoare x1 = −3 . Apoi probabilitatea valorii x2 = 7 va fi 1 − p. Să derivăm ecuația pentru așteptarea matematică:

E(X) = x 1 p + x 2 (1 − p) = −3p + 7(1 − p) = 4 ,

de unde obținem probabilitățile: p= 0,3 și 1 − p = 0,7 .

Legea distribuției unei variabile aleatoare:

X −3 7
p 0,3 0,7

Calculăm varianța acestei variabile aleatoare folosind formula de la proprietatea 3 a dispersiei:

D(X) = 2,7 + 34,3 − 16 = 21 .

Găsiți singur așteptările matematice ale unei variabile aleatoare și apoi uitați-vă la soluție

Exemplul 8. Variabilă aleatorie discretă X ia doar două valori. Acceptă cea mai mare dintre valorile 3 cu probabilitatea 0,4. În plus, este cunoscută varianța variabilei aleatoare D(X) = 6 . Aflați așteptările matematice ale unei variabile aleatoare.

Exemplul 9.În urnă sunt 6 bile albe și 4 negre. Din urnă se extrag 3 bile. Numărul de bile albe dintre bilele extrase este o variabilă aleatorie discretă X. Găsiți așteptările matematice și varianța acestei variabile aleatoare.

Soluţie. Variabila aleatoare X poate lua valori 0, 1, 2, 3. Probabilitățile corespunzătoare pot fi calculate din regula înmulțirii probabilităților. Legea distribuției unei variabile aleatoare:

X 0 1 2 3
p 1/30 3/10 1/2 1/6

De aici așteptările matematice ale acestei variabile aleatoare:

M(X) = 3/10 + 1 + 1/2 = 1,8 .

Varianta unei variabile aleatoare date este:

D(X) = 0,3 + 2 + 1,5 − 3,24 = 0,56 .

Așteptarea și varianța unei variabile aleatoare continue

Pentru o variabilă aleatoare continuă, interpretarea mecanică a așteptării matematice va păstra același sens: centrul de masă pentru o unitate de masă distribuită continuu pe axa x cu densitate. f(x). Spre deosebire de o variabilă aleatoare discretă, al cărei argument al funcției xi se schimbă brusc pentru o variabilă aleatoare continuă, argumentul se schimbă continuu. Dar așteptarea matematică a unei variabile aleatoare continue este, de asemenea, legată de valoarea medie a acesteia.

Pentru a găsi așteptările matematice și varianța unei variabile aleatoare continue, trebuie să găsiți integrale definite . Dacă este dată funcția de densitate a unei variabile aleatoare continue, atunci aceasta intră direct în integrand. Dacă este dată o funcție de distribuție a probabilității, atunci prin diferențierea acesteia, trebuie să găsiți funcția de densitate.

Media aritmetică a tuturor valorilor posibile ale unei variabile aleatoare continue se numește ea așteptări matematice, notat cu sau .

.

În schimb, dacă este un a.e. nenegativ. functioneaza astfel incat , atunci există o măsură de probabilitate absolut continuă, astfel încât să fie densitatea sa.

    Înlocuirea măsurii în integrala Lebesgue:

,

unde este orice funcție Borel care este integrabilă în raport cu măsura probabilității.

Dispersia, tipurile și proprietățile dispersiei Conceptul de dispersie

Dispersia în statistică se găsește ca abatere standard a valorilor individuale ale caracteristicii la pătrat de la media aritmetică. În funcție de datele inițiale, se determină folosind formulele de varianță simple și ponderate:

1. Varianta simpla(pentru date negrupate) se calculează folosind formula:

2. Varianta ponderată (pentru seriile de variații):

unde n este frecvența (repetabilitatea factorului X)

Un exemplu de găsire a varianței

Această pagină descrie un exemplu standard de găsire a varianței, puteți, de asemenea, să vă uitați la alte probleme pentru a o găsi

Exemplul 1. Determinarea grupului, mediei grupului, intergrupurilor și varianței totale

Exemplul 2. Găsirea varianței și coeficientului de variație într-un tabel de grupare

Exemplul 3. Găsirea varianței într-o serie discretă

Exemplul 4. Următoarele date sunt disponibile pentru un grup de 20 de studenți prin corespondență. Este necesar să se construiască o serie de intervale a distribuției caracteristicii, să se calculeze valoarea medie a caracteristicii și să se studieze dispersia acesteia

Să construim o grupare de intervale. Să determinăm intervalul intervalului folosind formula:

unde X max este valoarea maximă a caracteristicii de grupare; X min – valoarea minimă a caracteristicii de grupare; n – numărul de intervale:

Acceptăm n=5. Pasul este: h = (192 - 159)/ 5 = 6,6

Să creăm o grupare de intervale

Pentru calcule suplimentare, vom construi un tabel auxiliar:

X"i – mijlocul intervalului. (de exemplu, mijlocul intervalului 159 – 165,6 = 162,3)

Determinăm înălțimea medie a elevilor folosind formula medie aritmetică ponderată:

Să determinăm varianța folosind formula:

Formula poate fi transformată astfel:

Din această formulă rezultă că varianța este egală cu diferența dintre media pătratelor opțiunilor și pătratul și media.

Dispersie în serie de variații cu intervale egale folosind metoda momentelor se poate calcula în felul următor folosind a doua proprietate a dispersiei (împărțirea tuturor opțiunilor la valoarea intervalului). Determinarea varianței, calculat folosind metoda momentelor, folosind următoarea formulă este mai puțin laborioasă:

unde i este valoarea intervalului; A este un zero convențional, pentru care este convenabil să se folosească mijlocul intervalului cu cea mai mare frecvență; m1 este pătratul momentului de ordinul întâi; m2 - moment de ordinul doi

Varianta alternativă a trăsăturilor (dacă într-o populație statistică o caracteristică se modifică în așa fel încât există doar două opțiuni care se exclud reciproc, atunci o astfel de variabilitate se numește alternativă) poate fi calculată folosind formula:

Înlocuind q = 1- p în această formulă de dispersie, obținem:

Tipuri de variație

Varianta totala măsoară variația unei caracteristici la nivelul întregii populații în ansamblu sub influența tuturor factorilor care provoacă această variație. Este egal cu pătratul mediu al abaterilor valorilor individuale ale unei caracteristici x de la valoarea medie globală a lui x și poate fi definită ca varianță simplă sau varianță ponderată.

Varianta în cadrul grupului caracterizează variația aleatorie, adică parte a variației care se datorează influenței factorilor necontabiliați și nu depinde de atributul-factorial care formează baza grupului. O astfel de dispersie este egală cu pătratul mediu al abaterilor valorilor individuale ale atributului din grupul X de la media aritmetică a grupului și poate fi calculată ca dispersie simplă sau ca dispersie ponderată.

Astfel, măsuri de variație în cadrul grupului variația unei trăsături în cadrul unui grup și este determinată de formula:

unde xi este media grupului; ni este numărul de unități din grup.

De exemplu, variațiile intragrup care trebuie determinate în sarcina de a studia influența calificărilor lucrătorilor asupra nivelului productivității muncii într-un atelier arată variații ale producției în fiecare grup cauzate de toți factorii posibili (starea tehnică a echipamentului, disponibilitatea instrumente și materiale, vârsta lucrătorilor, intensitatea muncii etc.), cu excepția diferențelor de categorie de calificare (în cadrul unui grup toți lucrătorii au aceleași calificări).

Media variațiilor în interiorul grupului reflectă variația aleatorie, adică acea parte a variației care a avut loc sub influența tuturor celorlalți factori, cu excepția factorului de grupare. Se calculează folosind formula:

Varianta intergrup caracterizează variaţia sistematică a caracteristicii rezultate, care se datorează influenţei factorului-atribut care formează baza grupului. Este egal cu pătratul mediu al abaterilor mediilor grupului de la media generală. Varianta intergrup este calculată folosind formula:

Această pagină descrie un exemplu standard de găsire a varianței, puteți, de asemenea, să vă uitați la alte probleme pentru a o găsi

Exemplul 1. Determinarea grupului, mediei grupului, intergrupurilor și varianței totale

Exemplul 2. Găsirea varianței și coeficientului de variație într-un tabel de grupare

Exemplul 3. Găsirea varianței într-o serie discretă

Exemplul 4. Următoarele date sunt disponibile pentru un grup de 20 de studenți prin corespondență. Este necesar să se construiască o serie de intervale a distribuției caracteristicii, să se calculeze valoarea medie a caracteristicii și să se studieze dispersia acesteia

Să construim o grupare de intervale. Să determinăm intervalul intervalului folosind formula:

unde X max este valoarea maximă a caracteristicii de grupare;
X min – valoarea minimă a caracteristicii de grupare;
n – numărul de intervale:

Acceptăm n=5. Pasul este: h = (192 - 159)/ 5 = 6,6

Să creăm o grupare de intervale

Pentru calcule suplimentare, vom construi un tabel auxiliar:

X"i – mijlocul intervalului. (de exemplu, mijlocul intervalului 159 – 165,6 = 162,3)

Determinăm înălțimea medie a elevilor folosind formula medie aritmetică ponderată:

Să determinăm varianța folosind formula:

Formula poate fi transformată astfel:

Din această formulă rezultă că varianța este egală cu diferența dintre media pătratelor opțiunilor și pătratul și media.

Dispersie în serie de variații cu intervale egale folosind metoda momentelor se poate calcula în felul următor folosind a doua proprietate a dispersiei (împărțirea tuturor opțiunilor la valoarea intervalului). Determinarea varianței, calculat folosind metoda momentelor, folosind următoarea formulă este mai puțin laborioasă:

unde i este valoarea intervalului;
A este un zero convențional, pentru care este convenabil să se folosească mijlocul intervalului cu cea mai mare frecvență;
m1 este pătratul momentului de ordinul întâi;
m2 - moment de ordinul doi

Varianta alternativă a trăsăturilor (dacă într-o populație statistică o caracteristică se modifică în așa fel încât există doar două opțiuni care se exclud reciproc, atunci o astfel de variabilitate se numește alternativă) poate fi calculată folosind formula:

Înlocuind q = 1- p în această formulă de dispersie, obținem:

Tipuri de variație

Varianta totala măsoară variația unei caracteristici la nivelul întregii populații în ansamblu sub influența tuturor factorilor care provoacă această variație. Este egal cu pătratul mediu al abaterilor valorilor individuale ale unei caracteristici x de la valoarea medie globală a lui x și poate fi definită ca varianță simplă sau varianță ponderată.

Varianta în cadrul grupului caracterizează variația aleatorie, adică parte a variației care se datorează influenței factorilor necontabiliați și nu depinde de atributul-factorial care formează baza grupului. O astfel de dispersie este egală cu pătratul mediu al abaterilor valorilor individuale ale atributului din grupul X de la media aritmetică a grupului și poate fi calculată ca dispersie simplă sau ca dispersie ponderată.



Astfel, măsuri de variație în cadrul grupului variația unei trăsături în cadrul unui grup și este determinată de formula:

unde xi este media grupului;
ni este numărul de unități din grup.

De exemplu, variațiile intragrup care trebuie determinate în sarcina de a studia influența calificărilor lucrătorilor asupra nivelului productivității muncii într-un atelier arată variații ale producției în fiecare grup cauzate de toți factorii posibili (starea tehnică a echipamentului, disponibilitatea instrumente și materiale, vârsta lucrătorilor, intensitatea muncii etc.), cu excepția diferențelor de categorie de calificare (în cadrul unui grup toți lucrătorii au aceleași calificări).

Varianta este o măsură a dispersiei care descrie abaterea comparativă între valorile datelor și medie. Este cea mai utilizată măsură a dispersiei în statistică, calculată prin însumarea și pătrarea abaterii fiecărei valori de date de la medie. Formula de calcul a varianței este prezentată mai jos:

s 2 – varianța eșantionului;

x av — medie eșantionului;

n dimensiunea eșantionului (numărul de valori ale datelor),

(x i – x avg) este abaterea de la valoarea medie pentru fiecare valoare a setului de date.

Pentru a înțelege mai bine formula, să ne uităm la un exemplu. Nu prea îmi place să gătesc, așa că o fac rar. Totuși, pentru a nu muri de foame, din când în când trebuie să merg la aragaz să pun în aplicare planul de a-mi satura corpul cu proteine, grăsimi și carbohidrați. Setul de date de mai jos arată de câte ori gătește Renat în fiecare lună:

Primul pas în calcularea varianței este determinarea mediei eșantionului, care în exemplul nostru este de 7,8 ori pe lună. Restul calculelor pot fi simplificate folosind următorul tabel.

Faza finală de calcul a varianței arată astfel:

Pentru cei cărora le place să facă toate calculele dintr-o singură mișcare, ecuația ar arăta astfel:

Folosind metoda numărării crude (exemplu de gătit)

Există o modalitate mai eficientă de a calcula varianța, cunoscută sub numele de metoda de numărare brută. Deși ecuația poate părea destul de greoaie la prima vedere, de fapt nu este chiar atât de înfricoșătoare. Puteți să vă asigurați de acest lucru și apoi să decideți ce metodă vă place cel mai mult.

este suma fiecărei valori de date după pătrat,

este pătratul sumei tuturor valorilor datelor.

Nu-ți pierde mințile chiar acum. Să punem toate acestea într-un tabel și veți vedea că aici sunt mai puține calcule decât în ​​exemplul anterior.

După cum puteți vedea, rezultatul a fost același ca atunci când ați folosit metoda anterioară. Avantajele acestei metode devin evidente pe măsură ce dimensiunea eșantionului (n) crește.

Calculul variației în Excel

După cum probabil ați ghicit deja, Excel are o formulă care vă permite să calculați varianța. Mai mult, începând cu Excel 2010, puteți găsi 4 tipuri de formule de variație:

1) VARIANCE.V – Returnează varianța eșantionului. Valorile booleene și textul sunt ignorate.

2) DISP.G - Returnează varianța populației. Valorile booleene și textul sunt ignorate.

3) VARIANCE - Returnează varianța eșantionului, luând în considerare valorile booleene și text.

4) VARIANCE - Returnează varianța populației, ținând cont de valorile logice și de text.

În primul rând, să înțelegem diferența dintre un eșantion și o populație. Scopul statisticilor descriptive este de a rezuma sau de a afișa date astfel încât să obțineți rapid imaginea de ansamblu, o privire de ansamblu, ca să spunem așa. Inferența statistică vă permite să faceți inferențe despre o populație pe baza unui eșantion de date din acea populație. Populația reprezintă toate rezultatele sau măsurătorile posibile care ne interesează. Un eșantion este un subset al unei populații.

De exemplu, suntem interesați de un grup de studenți de la una dintre universitățile ruse și trebuie să stabilim scorul mediu al grupului. Putem calcula performanța medie a elevilor, iar apoi cifra rezultată va fi un parametru, deoarece întreaga populație va fi implicată în calculele noastre. Totuși, dacă dorim să calculăm GPA-ul tuturor studenților din țara noastră, atunci acest grup va fi eșantionul nostru.

Diferența în formula de calcul a varianței dintre un eșantion și o populație este numitorul. Unde pentru eșantion va fi egal cu (n-1), iar pentru populația generală doar n.

Acum să ne uităm la funcțiile pentru calcularea varianței cu terminații O, a cărui descriere afirmă că textul și valorile logice sunt luate în considerare în calcul. În acest caz, atunci când se calculează varianța unui anumit set de date în care apar valori non-numerice, Excel va interpreta textul și valorile booleene false ca fiind egale cu 0, iar valorile booleene adevărate ca fiind egale cu 1.

Deci, dacă aveți o matrice de date, calcularea varianței acesteia nu va fi dificilă folosind una dintre funcțiile Excel enumerate mai sus.

Publicații pe această temă