Exemplu de calcul a variației. Varianta și abaterea standard în MS EXCEL

Conform sondajului prin sondaj, deponenții au fost grupați în funcție de mărimea depozitului lor în Sberbank a orașului:

Defini:

1) domeniul de aplicare;

2) mărimea medie a depozitului;

3) abaterea liniară medie;

4) dispersie;

5) abaterea standard;

6) coeficientul de variație al contribuțiilor.

Soluţie:

Această serie de distribuție conține intervale deschise. Într-o astfel de serie, valoarea intervalului primului grup se presupune în mod convențional a fi egală cu valoarea intervalului următorului, iar valoarea intervalului ultimului grup este egală cu valoarea intervalului precedentul.

Valoarea intervalului celui de-al doilea grup este egală cu 200, prin urmare, valoarea primului grup este, de asemenea, egală cu 200. Valoarea intervalului penultimului grup este egală cu 200, ceea ce înseamnă că și ultimul interval va au o valoare de 200.

1) Să definim intervalul de variație ca diferența dintre cel mai mare și cea mai mică valoare semn:

Gama de variație a mărimii depozitului este de 1000 de ruble.

2) Mărimea medie a contribuției va fi determinată folosind formula medie aritmetică ponderată.

Să stabilim mai întâi cantitate discretă caracteristică în fiecare interval. Pentru a face acest lucru, folosind formula medie aritmetică simplă, găsim punctele medii ale intervalelor.

Valoarea medie a primului interval va fi:

al doilea - 500 etc.

Să introducem rezultatele calculului în tabel:

Suma depozit, frecați.Numărul deponenților, fMijlocul intervalului, xxf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
Total 400 - 312000

Depozitul mediu în Sberbank a orașului va fi de 780 de ruble:

3) Abaterea liniară medie este media aritmetică a abaterilor absolute ale valorilor individuale ale unei caracteristici față de media generală:

Procedura de calcul a abaterii liniare medii în seria de distribuție a intervalului este următoarea:

1. Se calculează media aritmetică ponderată, conform paragrafului 2).

2. Se determină abaterile absolute de la medie:

3. Abaterile rezultate se înmulțesc cu frecvențele:

4. Aflați suma abaterilor ponderate fără a ține cont de semnul:

5. Suma abaterilor ponderate este împărțită la suma frecvențelor:

Este convenabil să utilizați tabelul de date de calcul:

Suma depozit, frecați.Numărul deponenților, fMijlocul intervalului, x
200-400 32 300 -480 480 15360
400-600 56 500 -280 280 15680
600-800 120 700 -80 80 9600
800-1000 104 900 120 120 12480
1000-1200 88 1100 320 320 28160
Total 400 - - - 81280

Abaterea liniară medie a mărimii depozitului clienților Sberbank este de 203,2 ruble.

4) Dispersia este media aritmetică a abaterilor pătrate ale fiecărui atribut de la media aritmetică.

Calculul varianței în seria de distribuție a intervalelor se realizează folosind formula:

Procedura de calcul a variației în acest caz este următoarea:

1. Determinați media aritmetică ponderată, așa cum se arată în paragraful 2).

2. Găsiți abateri de la medie:

3. Pătrat abaterea fiecărei opțiuni de la medie:

4. Înmulțiți pătratele abaterilor cu ponderile (frecvențele):

5. Însumați produsele rezultate:

6. Suma rezultată se împarte la suma greutăților (frecvențelor):

Să punem calculele într-un tabel:

Suma depozit, frecați.Numărul deponenților, fMijlocul intervalului, x
200-400 32 300 -480 230400 7372800
400-600 56 500 -280 78400 4390400
600-800 120 700 -80 6400 768000
800-1000 104 900 120 14400 1497600
1000-1200 88 1100 320 102400 9011200
Total 400 - - - 23040000

Această pagină descrie un exemplu standard de găsire a varianței, puteți, de asemenea, să vă uitați la alte probleme pentru a o găsi

Exemplul 1. Determinarea grupului, mediei grupului, intergrupurilor și varianței totale

Exemplul 2. Găsirea varianței și coeficientului de variație într-un tabel de grupare

Exemplul 3. Găsirea varianței în serie discretă

Exemplul 4. Următoarele date sunt disponibile pentru un grup de 20 de studenți prin corespondență. Este necesar să se construiască o serie de intervale a distribuției caracteristicii, să se calculeze valoarea medie a caracteristicii și să se studieze dispersia acesteia

Să construim grupare pe intervale. Să determinăm intervalul intervalului folosind formula:

unde X max– valoarea maxima caracteristica de grupare;
X min – valoarea minimă a caracteristicii de grupare;
n – numărul de intervale:

Acceptăm n=5. Pasul este: h = (192 - 159)/ 5 = 6,6

Să creăm o grupare de intervale

Pentru calcule suplimentare, vom construi un tabel auxiliar:

X"i – mijlocul intervalului. (de exemplu, mijlocul intervalului 159 – 165,6 = 162,3)

Determinăm înălțimea medie a elevilor folosind formula medie aritmetică ponderată:

Să determinăm varianța folosind formula:

Formula poate fi transformată astfel:

Din această formulă rezultă că varianța este egală cu diferența dintre media pătratelor opțiunilor și pătratul și media.

Dispersie în serie de variații la intervale egale folosind metoda momentelor pot fi calculate în felul următor atunci când se utilizează a doua proprietate a dispersiei (împărțirea tuturor opțiunilor la valoarea intervalului). Determinarea varianței, calculat folosind metoda momentelor, folosind următoarea formulă este mai puțin laborioasă:

unde i este valoarea intervalului;
A este un zero convențional, pentru care este convenabil să se folosească mijlocul intervalului cu cea mai mare frecvență;
m1 este pătratul momentului de ordinul întâi;
m2 - moment de ordinul doi

Varianta alternativă a trăsăturilor (dacă într-o populație statistică o caracteristică se modifică în așa fel încât există doar două opțiuni care se exclud reciproc, atunci o astfel de variabilitate se numește alternativă) poate fi calculată folosind formula:

Înlocuind q = 1- p în această formulă de dispersie, obținem:

Tipuri de variație

Varianta totala măsoară variația unei caracteristici la nivelul întregii populații în ansamblu sub influența tuturor factorilor care provoacă această variație. Este egal cu pătratul mediu al abaterilor valorilor individuale ale unei caracteristici x de la valoarea medie globală a lui x și poate fi definită ca varianță simplă sau varianță ponderată.

Varianta în cadrul grupului caracterizează variație aleatorie, adică parte a variației care se datorează influenței factorilor necontabiliați și nu depinde de atributul-factorial care formează baza grupului. O astfel de dispersie este egală cu pătratul mediu al abaterilor valorilor individuale ale atributului din grupul X de la media aritmetică a grupului și poate fi calculată ca dispersie simplă sau ca dispersie ponderată.



Astfel, măsuri de variație în cadrul grupului variația unei trăsături în cadrul unui grup și este determinată de formula:

unde xi este media grupului;
ni este numărul de unități din grup.

De exemplu, variațiile intragrup care trebuie determinate în sarcina de a studia influența calificărilor lucrătorilor asupra nivelului productivității muncii într-un atelier arată variații ale producției în fiecare grup cauzate de toți factorii posibili (starea tehnică a echipamentului, disponibilitatea instrumente și materiale, vârsta lucrătorilor, intensitatea muncii etc.), cu excepția diferențelor de categorie de calificare (în cadrul unui grup toți lucrătorii au aceleași calificări).

Dintre numeroșii indicatori care sunt utilizați în statistică, este necesar să se evidențieze calculul varianței. Trebuie remarcat faptul că efectuarea manuală a acestui calcul este o sarcină destul de obositoare. Din fericire, Excel are funcții care vă permit să automatizați procedura de calcul. Să aflăm algoritmul pentru lucrul cu aceste instrumente.

Dispersia este un indicator al variației, care este pătratul mediu al abaterilor de la așteptarea matematică. Astfel, exprimă răspândirea numerelor în jurul valorii medii. Calculul varianței poate fi efectuat atât pentru populația generală, cât și pentru eșantion.

Metoda 1: calcul pe baza populației

Pentru a calcula acest indicator în Excel pentru populația generală, utilizați funcția DISP.G. Sintaxa acestei expresii este următoarea:

DISP.G(Număr1;Număr2;…)

În total, pot fi folosite de la 1 la 255 de argumente. Argumentele pot fi fie valori numerice, fie referințe la celulele în care sunt conținute.

Să vedem cum să calculăm această valoare pentru un interval cu date numerice.


Metoda 2: calcul pe eșantion

Spre deosebire de calcularea unei valori pe baza unei populații, la calcularea unui eșantion, numitorul nu indică numărul total de numere, ci cu unul mai puțin. Acest lucru se face în scopul corectării erorilor. Excel ține cont de această nuanță într-o funcție specială care este concepută pentru acest tip de calcul - DISP.V. Sintaxa sa este reprezentată de următoarea formulă:

DISP.B(Număr1;Număr2;…)

Numărul de argumente, ca și în funcția anterioară, poate varia de la 1 la 255.


După cum puteți vedea, programul Excel poate facilita foarte mult calculul varianței. Această statistică poate fi calculată de aplicație, fie din populație, fie din eșantion. În acest caz, toate acțiunile utilizatorului se reduc de fapt la specificarea intervalului de numere care trebuie procesate, iar Excel își face singur treaba principală. Desigur, acest lucru va economisi o cantitate semnificativă de timp pentru utilizator.

Pentru date grupate varianta reziduala - media variațiilor intragrup:

Unde σ 2 j este varianța intragrup a grupului j.

Pentru date negrupate varianta reziduala– măsura acurateței aproximării, adică aproximarea dreptei de regresie la datele originale:
unde y(t) este prognoza folosind ecuația tendinței; y t – serie de dinamică inițială; n – numărul de puncte; p – numărul de coeficienți ai ecuației de regresie (număr de variabile explicative).
În acest exemplu se numește estimator de varianță imparțial.

Exemplul nr. 1. Repartizarea lucrătorilor a trei întreprinderi ale unei asociații pe categorii tarifare se caracterizează prin următoarele date:

Categoria tarifară a lucrătoruluiNumărul de lucrători la întreprindere
intreprindere 1intreprindere 2intreprindere 3
1 50 20 40
2 100 80 60
3 150 150 200
4 350 300 400
5 200 150 250
6 150 100 150

Defini:
1. varianță pentru fiecare întreprindere (varianțe intra-grup);
2. media variațiilor în interiorul grupului;
3. dispersie intergrup;
4. varianta totala.

Soluţie.
Înainte de a începe să rezolvați problema, este necesar să aflați care caracteristică este eficientă și care este factorială. În exemplul luat în considerare, atributul rezultat este „Categoria tarifară”, iar atributul factor este „Numărul (numele) întreprinderii”.
Apoi avem trei grupuri (întreprinderi), pentru care este necesar să se calculeze media grupului și variațiile intragrup:


ÎntreprindereMedia grupului,Varianta în cadrul grupului,
1 4 1,8

Media variațiilor în interiorul grupului ( varianta reziduala) se va calcula folosind formula:


unde poti calcula:
sau:


Apoi:
Varianta totala va fi egala cu: s 2 = 1,6 + 0 = 1,6.
De asemenea, variația totală poate fi calculată folosind una dintre următoarele două formule:

Când rezolvăm probleme practice, de multe ori trebuie să te confrunți cu o caracteristică care ia doar două valori alternative. În acest caz, nu vorbim despre ponderea unei anumite valori a unei caracteristici, ci despre ponderea acesteia în totalitate. Dacă proporția unităților de populație care posedă caracteristica studiată se notează cu „ r", iar cei care nu au - prin " q", atunci varianța poate fi calculată folosind formula:
s 2 = p×q

Exemplul nr. 2. Pe baza datelor de producție a șase lucrători dintr-o echipă, determinați varianța intergrup și evaluați impactul schimbului de muncă asupra productivității muncii lor dacă varianța totală este de 12,2.

Lucrator in echipa nr.Ieșire muncitor, buc.
în primul schimbîn al doilea schimb
1 18 13
2 19 14
3 22 15
4 20 17
5 24 16
6 23 15

Soluţie. Datele inițiale

Xf 1f 2f 3f 4f 5f 6Total
1 18 19 22 20 24 23 126
2 13 14 15 17 16 15 90
Total 31 33 37 37 40 38

Apoi avem 6 grupuri pentru care este necesar să se calculeze media grupului și variațiile intragrup.
1. Găsiți valorile medii ale fiecărui grup.







2. Aflați pătratul mediu al fiecărui grup.







Să rezumăm rezultatele calculului într-un tabel:
Numărul grupuluiMedia grupuluiVarianta în cadrul grupului
1 1.42 0.24
2 1.42 0.24
3 1.41 0.24
4 1.46 0.25
5 1.4 0.24
6 1.39 0.24

3. Varianta în cadrul grupului caracterizează schimbarea (variația) caracteristicii studiate (rezultate) în cadrul unui grup sub influența tuturor factorilor asupra acestuia, cu excepția factorului care stă la baza grupării:
Calculăm media variațiilor intragrup folosind formula:


4. Varianta intergrup caracterizează modificarea (variaţia) caracteristicii (rezultative) studiate sub influenţa unui factor (caracteristică factorială) care formează baza grupului.
Definim varianța intergrup ca fiind:

Unde


Apoi

Varianta totala caracterizează schimbarea (variația) caracteristicii (rezultate) studiate sub influența tuturor factorilor (caracteristicile factoriale) fără excepție. În funcție de condițiile problemei, este egal cu 12,2.
Relație de corelație empirică măsoară ce parte din variabilitatea totală a caracteristicii rezultate este cauzată de factorul studiat. Acesta este raportul dintre varianța factorilor și varianța totală:

Definim relația de corelație empirică:

Conexiunile dintre caracteristici pot fi slabe și puternice (strânse). Criteriile lor sunt evaluate pe scara Chaddock:
0,1 0,3 0,5 0,7 0,9 În exemplul nostru, relația dintre trăsătura Y și factorul X este slabă
Coeficient de determinare.

Să determinăm coeficientul de determinare:

Astfel, 0,67% din variație se datorează diferențelor dintre trăsături, iar 99,37% se datorează altor factori.
Concluzie: V în acest caz, Rezultatul lucrătorilor nu depinde de munca pe o anumită tură, de exemplu. influenţa schimbului de muncă asupra productivităţii muncii lor nu este semnificativă şi se datorează altor factori.

Exemplul nr. 3. Bazat pe medie salariile iar abaterile pătrate de la valoarea sa pentru două grupuri de lucrători, găsiți varianța totală prin aplicarea regulii de adunare a variațiilor:

Soluţie:
Media variațiilor în cadrul grupului

Definim varianța intergrup ca fiind:


Varianta totală va fi: 480 + 13824 = 14304

.

În schimb, dacă este un a.e. nenegativ. functioneaza astfel incat , atunci există o măsură de probabilitate absolut continuă, astfel încât să fie densitatea sa.

    Înlocuirea măsurii în integrala Lebesgue:

,

unde este orice funcție Borel care este integrabilă în raport cu măsura probabilității.

Dispersia, tipurile și proprietățile dispersiei Conceptul de dispersie

Dispersia în statistică se găsește ca abatere standard a valorilor individuale ale caracteristicii la pătrat de la media aritmetică. În funcție de datele inițiale, se determină folosind formulele de varianță simple și ponderate:

1. Varianta simpla(pentru date negrupate) se calculează folosind formula:

2. Varianta ponderată (pentru seriile de variații):

unde n este frecvența (repetabilitatea factorului X)

Un exemplu de găsire a varianței

Această pagină descrie un exemplu standard de găsire a varianței, puteți, de asemenea, să vă uitați la alte probleme pentru a o găsi

Exemplul 1. Determinarea grupului, mediei grupului, intergrupurilor și varianței totale

Exemplul 2. Găsirea varianței și coeficientului de variație într-un tabel de grupare

Exemplul 3. Găsirea varianței într-o serie discretă

Exemplul 4. Următoarele date sunt disponibile pentru un grup de 20 de studenți prin corespondență. Este necesar să se construiască o serie de intervale a distribuției caracteristicii, să se calculeze valoarea medie a caracteristicii și să se studieze dispersia acesteia

Să construim o grupare de intervale. Să determinăm intervalul intervalului folosind formula:

unde X max este valoarea maximă a caracteristicii de grupare; X min – valoarea minimă a caracteristicii de grupare; n – numărul de intervale:

Acceptăm n=5. Pasul este: h = (192 - 159)/ 5 = 6,6

Să creăm o grupare de intervale

Pentru calcule suplimentare, vom construi un tabel auxiliar:

X"i – mijlocul intervalului. (de exemplu, mijlocul intervalului 159 – 165,6 = 162,3)

Determinăm înălțimea medie a elevilor folosind formula medie aritmetică ponderată:

Să determinăm varianța folosind formula:

Formula poate fi transformată astfel:

Din această formulă rezultă că varianța este egală cu diferența dintre media pătratelor opțiunilor și pătratul și media.

Dispersie în serie de variații cu intervale egale folosind metoda momentelor se poate calcula în felul următor folosind a doua proprietate a dispersiei (împărțirea tuturor opțiunilor la valoarea intervalului). Determinarea varianței, calculat folosind metoda momentelor, folosind următoarea formulă este mai puțin laborioasă:

unde i este valoarea intervalului; A este un zero convențional, pentru care este convenabil să se folosească mijlocul intervalului cu cea mai mare frecvență; m1 este pătratul momentului de ordinul întâi; m2 - moment de ordinul doi

Varianta alternativă a trăsăturilor (dacă într-o populație statistică o caracteristică se modifică în așa fel încât există doar două opțiuni care se exclud reciproc, atunci o astfel de variabilitate se numește alternativă) poate fi calculată folosind formula:

Înlocuind q = 1- p în această formulă de dispersie, obținem:

Tipuri de variație

Varianta totala măsoară variația unei caracteristici la nivelul întregii populații în ansamblu sub influența tuturor factorilor care provoacă această variație. Este egal cu pătratul mediu al abaterilor valorilor individuale ale unei caracteristici x de la valoarea medie globală a lui x și poate fi definită ca varianță simplă sau varianță ponderată.

Varianta în cadrul grupului caracterizează variația aleatoare, adică parte a variației care se datorează influenței factorilor necontabiliați și nu depinde de atributul-factorial care formează baza grupului. O astfel de dispersie este egală cu pătratul mediu al abaterilor valorilor individuale ale atributului din grupul X de la media aritmetică a grupului și poate fi calculată ca dispersie simplă sau ca dispersie ponderată.

Astfel, măsuri de variație în cadrul grupului variația unei trăsături în cadrul unui grup și este determinată de formula:

unde xi este media grupului; ni este numărul de unități din grup.

De exemplu, variațiile intragrup care trebuie determinate în sarcina de a studia influența calificărilor lucrătorilor asupra nivelului productivității muncii într-un atelier arată variații ale producției în fiecare grup cauzate de toți factorii posibili (starea tehnică a echipamentului, disponibilitatea instrumente și materiale, vârsta lucrătorilor, intensitatea muncii etc.), cu excepția diferențelor de categorie de calificare (în cadrul unui grup toți lucrătorii au aceleași calificări).

Media variațiilor în interiorul grupului reflectă variația aleatoare, adică acea parte a variației care a avut loc sub influența tuturor celorlalți factori, cu excepția factorului de grupare. Se calculează folosind formula:

Varianta intergrup caracterizează variaţia sistematică a caracteristicii rezultate, care se datorează influenţei factorului-atribut care formează baza grupului. Este egal cu pătratul mediu al abaterilor mediilor grupului de la media generală. Varianta intergrup este calculată folosind formula:

Publicații pe această temă