Aflați varianța totală. Tipuri de dispersii

Conform sondajului prin sondaj, deponenții au fost grupați în funcție de mărimea depozitului lor în Sberbank a orașului:

Defini:

1) domeniul de aplicare;

2) mărimea medie a depozitului;

3) abaterea liniară medie;

4) dispersie;

5) abaterea standard;

6) coeficientul de variație al contribuțiilor.

Soluţie:

Această serie de distribuție conține intervale deschise. Într-o astfel de serie, valoarea intervalului primului grup se presupune în mod convențional a fi egală cu valoarea intervalului următorului, iar valoarea intervalului ultimului grup este egală cu valoarea intervalului precedentul.

Valoarea intervalului celui de-al doilea grup este egală cu 200, prin urmare, valoarea primului grup este, de asemenea, egală cu 200. Valoarea intervalului penultimului grup este egală cu 200, ceea ce înseamnă că și ultimul interval va au o valoare de 200.

1) Să definim intervalul de variație ca diferența dintre cel mai mare și cea mai mică valoare semn:

Gama de variație a mărimii depozitului este de 1000 de ruble.

2) Dimensiune medie contribuția va fi determinată folosind formula mediei aritmetice ponderate.

Să stabilim mai întâi cantitate discretă caracteristică în fiecare interval. Pentru a face acest lucru, folosind formula medie aritmetică simplă, găsim punctele medii ale intervalelor.

Valoarea medie a primului interval va fi:

al doilea - 500 etc.

Să introducem rezultatele calculului în tabel:

Suma depozit, frecați.Numărul deponenților, fMijlocul intervalului, xxf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
Total 400 - 312000

Depozitul mediu în Sberbank a orașului va fi de 780 de ruble:

3) Abaterea liniară medie este media aritmetică a abaterilor absolute ale valorilor individuale ale unei caracteristici față de media generală:

Procedura de calcul a abaterii liniare medii în seria de distribuție a intervalului este următoarea:

1. Se calculează media aritmetică ponderată, conform paragrafului 2).

2. Se determină abaterile absolute de la medie:

3. Abaterile rezultate se înmulțesc cu frecvențele:

4. Aflați suma abaterilor ponderate fără a ține cont de semnul:

5. Suma abaterilor ponderate este împărțită la suma frecvențelor:

Este convenabil să utilizați tabelul de date de calcul:

Suma depozit, frecați.Numărul deponenților, fMijlocul intervalului, x
200-400 32 300 -480 480 15360
400-600 56 500 -280 280 15680
600-800 120 700 -80 80 9600
800-1000 104 900 120 120 12480
1000-1200 88 1100 320 320 28160
Total 400 - - - 81280

Abaterea liniară medie a mărimii depozitului clienților Sberbank este de 203,2 ruble.

4) Dispersia este media aritmetică a abaterilor pătrate ale fiecărui atribut de la media aritmetică.

Calculul varianței în rânduri de interval distributia se face dupa formula:

Procedura de calcul a variației în acest caz este următoarea:

1. Determinați media aritmetică ponderată, așa cum se arată în paragraful 2).

2. Găsiți abateri de la medie:

3. Pătrat abaterea fiecărei opțiuni de la medie:

4. Înmulțiți pătratele abaterilor cu ponderile (frecvențele):

5. Însumați produsele rezultate:

6. Suma rezultată se împarte la suma greutăților (frecvențelor):

Să punem calculele într-un tabel:

Suma depozit, frecați.Numărul deponenților, fMijlocul intervalului, x
200-400 32 300 -480 230400 7372800
400-600 56 500 -280 78400 4390400
600-800 120 700 -80 6400 768000
800-1000 104 900 120 14400 1497600
1000-1200 88 1100 320 102400 9011200
Total 400 - - - 23040000

Teoria probabilității este o ramură specială a matematicii care este studiată numai de studenții instituțiilor de învățământ superior. Îți plac calculele și formulele? Nu vă este frică de perspectivele de a vă familiariza cu distribuția normală, entropia ansamblului, așteptările matematice și dispersia discretă variabilă aleatoare? Atunci acest subiect va fi foarte interesant pentru tine. Să aruncăm o privire la câteva dintre cele mai importante concepte de bază această ramură a științei.

Să ne amintim elementele de bază

Chiar dacă vă amintiți cele mai simple concepte ale teoriei probabilităților, nu neglijați primele paragrafe ale articolului. Ideea este că, fără o înțelegere clară a elementelor de bază, nu veți putea lucra cu formulele discutate mai jos.

Deci, are loc un eveniment aleatoriu, un experiment. Ca urmare a acțiunilor pe care le întreprindem, putem obține mai multe rezultate - unele dintre ele apar mai des, altele mai rar. Probabilitatea unui eveniment este raportul dintre numărul de rezultate efectiv obținute de un tip la număr total posibil. Numai cunoscând definiția clasică a acestui concept puteți începe să studiați așteptările matematice și dispersia variabilelor aleatoare continue.

Media aritmetică

Înapoi la școală, în timpul orelor de matematică, ai început să lucrezi cu media aritmetică. Acest concept este utilizat pe scară largă în teoria probabilității și, prin urmare, nu poate fi ignorat. Principalul lucru pentru noi în acest moment este că îl vom întâlni în formulele pentru așteptarea și dispersia matematică a unei variabile aleatoare.

Avem o succesiune de numere și vrem să aflăm media aritmetică. Tot ceea ce ni se cere este să însumăm tot ce este disponibil și să împărțim la numărul de elemente din secvență. Să avem numere de la 1 la 9. Suma elementelor va fi egală cu 45, iar această valoare o vom împărți la 9. Răspuns: - 5.

Dispersia

În termeni științifici, dispersia este pătratul mediu al abaterilor valorilor obținute ale unei caracteristici de la media aritmetică. Este notat cu o literă latină majusculă D. Ce este necesar pentru a o calcula? Pentru fiecare element al șirului, calculăm diferența dintre numărul existent și media aritmetică și o pătratăm. Vor exista exact atâtea valori câte rezultate pot exista pentru evenimentul pe care îl luăm în considerare. În continuare, însumăm tot ceea ce a primit și împărțim la numărul de elemente din secvență. Dacă avem cinci rezultate posibile, atunci împărțiți la cinci.

Dispersia are, de asemenea, proprietăți care trebuie reținute pentru a fi utilizate la rezolvarea problemelor. De exemplu, când o variabilă aleatoare crește de X ori, varianța crește de X ori la pătrat (adică X*X). Ea nu se întâmplă niciodată mai putin de zeroși nu depinde de deplasarea valorilor cu o valoare egală în sus sau în jos. În plus, pentru încercările independente, varianța sumei este egală cu suma variațiilor.

Acum trebuie să luăm în considerare exemple de dispersie a unei variabile aleatoare discrete și așteptările matematice.

Să presupunem că am efectuat 21 de experimente și am obținut 7 rezultate diferite. Am observat fiecare dintre ele de 1, 2, 2, 3, 4, 4 și, respectiv, de 5 ori. Cu ce ​​va fi egală varianța?

Mai întâi, să calculăm media aritmetică: suma elementelor, desigur, este 21. Împărțiți-o la 7, obținând 3. Acum scădeți 3 din fiecare număr din succesiunea originală, pătrați fiecare valoare și adăugați rezultatele împreună. Rezultatul este 12. Acum tot ce trebuie să facem este să împărțim numărul la numărul de elemente și, s-ar părea, atât. Dar există o captură! Să discutăm.

Dependența de numărul de experimente

Se pare că atunci când se calculează varianța, numitorul poate conține unul dintre cele două numere: fie N, fie N-1. Aici N este numărul de experimente efectuate sau numărul de elemente din secvență (care este în esență același lucru). De ce depinde asta?

Dacă numărul de teste este măsurat în sute, atunci trebuie să punem N la numitor Dacă este în unități, atunci N-1. Oamenii de știință au decis să deseneze granița în mod destul de simbolic: astăzi trece prin numărul 30. Dacă am efectuat mai puțin de 30 de experimente, atunci vom împărți cantitatea cu N-1, iar dacă mai mult, atunci cu N.

Sarcină

Să revenim la exemplul nostru de rezolvare a problemei varianței și așteptărilor matematice. Am primit un număr intermediar 12, care trebuia împărțit la N sau N-1. Deoarece am efectuat 21 de experimente, adică mai puțin de 30, vom alege a doua opțiune. Deci răspunsul este: varianța este 12 / 2 = 2.

Aşteptare

Să trecem la al doilea concept, pe care trebuie să îl luăm în considerare în acest articol. Așteptarea matematică este rezultatul adunării tuturor rezultatelor posibile înmulțite cu probabilitățile corespunzătoare. Este important de înțeles că valoarea obținută, precum și rezultatul calculării varianței, se obține o singură dată pentru întreaga problemă, indiferent de câte rezultate sunt luate în considerare în ea.

Formula pentru așteptarea matematică este destul de simplă: luăm rezultatul, înmulțim cu probabilitatea lui, adăugăm același lucru pentru al doilea, al treilea rezultat etc. Tot ce este legat de acest concept nu este greu de calculat. De exemplu, suma valorilor așteptate este egală cu valoarea așteptată a sumei. Același lucru este valabil și pentru lucrare. Nu orice cantitate din teoria probabilității vă permite să efectuați astfel de operații simple. Să luăm problema și să calculăm semnificația a două concepte pe care le-am studiat deodată. În plus, am fost distrași de teorie – este timpul să exersăm.

Un alt exemplu

Am efectuat 50 de studii și am obținut 10 tipuri de rezultate - numere de la 0 la 9 - care apar în diferite procent. Acestea sunt, respectiv: 2%, 10%, 4%, 14%, 2%,18%, 6%, 16%, 10%, 18%. Amintiți-vă că pentru a obține probabilități, trebuie să împărțiți valorile procentuale la 100. Astfel, obținem 0,02; 0,1 etc. Să prezentăm un exemplu de rezolvare a problemei pentru varianța unei variabile aleatoare și așteptarea matematică.

Calculăm media aritmetică folosind formula din care ne amintim scoala juniora: 50/10 = 5.

Acum să convertim probabilitățile în numărul de rezultate „pe bucăți” pentru a fi mai ușor de numărat. Se obține 1, 5, 2, 7, 1, 9, 3, 8, 5 și 9. Din fiecare valoare obținută scădem media aritmetică, după care punem la pătrat fiecare dintre rezultatele obținute. Vedeți cum să faceți acest lucru folosind primul element ca exemplu: 1 - 5 = (-4). În continuare: (-4) * (-4) = 16. Pentru alte valori, faceți singur aceste operații. Dacă ați făcut totul corect, atunci după ce le-ați adunat pe toate, veți obține 90.

Să continuăm să calculăm varianța și valoarea așteptată împărțind 90 la N. De ce alegem N mai degrabă decât N-1? Corect, deoarece numărul de experimente efectuate depășește 30. Deci: 90/10 = 9. Am obținut varianța. Dacă primești un alt număr, nu dispera. Cel mai probabil, ai făcut o greșeală simplă în calcule. Verificați din nou ceea ce ați scris și probabil totul va fi la locul său.

În cele din urmă, amintiți-vă formula pentru așteptările matematice. Nu vom da toate calculele, vom scrie doar un răspuns pe care îl puteți verifica după finalizarea tuturor procedurilor necesare. Valoarea așteptată va fi 5,48. Să ne amintim doar cum să efectuăm operațiuni, folosind primele elemente ca exemplu: 0*0,02 + 1*0,1... și așa mai departe. După cum puteți vedea, pur și simplu înmulțim valoarea rezultatului cu probabilitatea acestuia.

Abatere

Un alt concept strâns legat de dispersie și așteptările matematice este deviația standard. Este desemnat fie cu litere latine sd, sau greacă literă „sigma”. Acest concept arată cât de mult se abat în medie valorile de la caracteristica centrală. Pentru a-i găsi valoarea, trebuie să calculați rădăcină pătrată din dispersie.

Dacă trasați un grafic de distribuție normală și doriți să vedeți abaterea pătrată direct pe acesta, acest lucru se poate face în mai multe etape. Luați jumătate din imagine la stânga sau la dreapta modului (valoarea centrală), trageți o perpendiculară pe axa orizontală, astfel încât zonele figurilor rezultate să fie egale. Dimensiunea segmentului dintre mijlocul distribuției și proiecția rezultată pe axa orizontalăși va reprezenta abaterea standard.

Software

După cum se poate observa din descrierile formulelor și exemplele prezentate, calcularea varianței și a așteptărilor matematice nu este cea mai simplă procedură din punct de vedere aritmetic. Pentru a nu pierde timpul, are sens să folosești programul folosit în învățământul superior institutii de invatamant- se numește „R”. Are funcții care vă permit să calculați valori pentru multe concepte din statistică și teoria probabilității.

De exemplu, specificați un vector de valori. Aceasta se face astfel: vector<-c(1,5,2…). Теперь, когда вам потребуется посчитать какие-либо значения для этого вектора, вы пишете функцию и задаете его в качестве аргумента. Для нахождения дисперсии вам нужно будет использовать функцию var. Пример её использования: var(vector). Далее вы просто нажимаете «ввод» и получаете результат.

În concluzie

Dispersia și așteptările matematice sunt fără de care este dificil să calculezi ceva în viitor. În cursul principal al prelegerilor la universități, acestea sunt discutate deja în primele luni de studiu a subiectului. Tocmai din cauza lipsei de înțelegere a acestor concepte simple și a incapacității de a le calcula, mulți studenți încep imediat să rămână în urmă în program și ulterior primesc note proaste la sfârșitul sesiunii, ceea ce îi privează de o bursă.

Exersează cel puțin o săptămână, o jumătate de oră pe zi, rezolvând sarcini similare cu cele prezentate în acest articol. Apoi, la orice test de teoria probabilității, veți putea face față exemplelor fără sfaturi străine și cheat sheets.

Adesea, în statistică, atunci când se analizează un fenomen sau un proces, este necesar să se țină seama nu numai de informații despre nivelurile medii ale indicatorilor studiați, ci și împrăștiere sau variație a valorilor unităților individuale , care este o caracteristică importantă a populației studiate.

Cele mai supuse variații sunt prețurile acțiunilor, cererea și oferta și ratele dobânzilor pe diferite perioade de timp și în locuri diferite.

Principalii indicatori care caracterizează variația , sunt intervalul, dispersia, abaterea standard și coeficientul de variație.

Gama de variație reprezintă diferența dintre valorile maxime și minime ale caracteristicii: R = Xmax – Xmin. Dezavantajul acestui indicator este că evaluează doar limitele de variație ale unei trăsături și nu reflectă variabilitatea acesteia în aceste limite.

Dispersia lipsește acest neajuns. Se calculează ca pătrat mediu al abaterilor valorilor atributelor de la valoarea lor medie:

O modalitate simplificată de a calcula varianța efectuate folosind următoarele formule (simple și ponderate):

Exemple de aplicare a acestor formule sunt prezentate în sarcinile 1 și 2.

Un indicator utilizat pe scară largă în practică este abaterea standard :

Abaterea standard este definită ca rădăcina pătrată a varianței și are aceeași dimensiune ca și caracteristica studiată.

Indicatorii considerati ne permit sa obtinem valoarea absoluta a variatiei, i.e. evaluați-l în unități de măsură ale caracteristicii studiate. Spre deosebire de ei, coeficient de variație măsoară variabilitatea în termeni relativi – raportat la nivelul mediu, care în multe cazuri este de preferat.

Formula de calcul al coeficientului de variație.

Exemple de rezolvare a problemelor pe tema „Indicatori de variație în statistică”

Problema 1 . La studierea influenței publicității asupra mărimii depozitului mediu lunar la băncile din regiune, au fost examinate 2 bănci. S-au obtinut urmatoarele rezultate:

Defini:
1) pentru fiecare bancă: a) depozit mediu pe lună; b) dispersia contribuţiei;
2) depozitul mediu lunar pentru două bănci împreună;
3) Varianta depozitului pentru 2 banci, in functie de publicitate;
4) Varianta depozitului pentru 2 bănci, în funcție de toți factorii, cu excepția publicității;
5) Varianta totala folosind regula adunarii;
6) Coeficientul de determinare;
7) Relația de corelație.

Soluţie

1) Să creăm un tabel de calcul pentru o bancă cu publicitate . Pentru a determina depozitul mediu lunar, vom găsi punctele de mijloc ale intervalelor. În acest caz, valoarea intervalului deschis (primul) este echivalată condiționat cu valoarea intervalului adiacent acestuia (al doilea).

Vom găsi mărimea medie a depozitului folosind formula medie aritmetică ponderată:

29.000/50 = 580 rub.

Găsim varianța contribuției folosind formula:

23 400/50 = 468

Vom efectua acțiuni similare pentru o bancă fără publicitate :

2) Să găsim mărimea medie a depozitului pentru cele două bănci împreună. Хср =(580×50+542,8×50)/100 = 561,4 rub.

3) Vom afla varianța depozitului pentru două bănci, în funcție de publicitate, folosind formula: σ 2 =pq (formula pentru varianța unui atribut alternativ). Aici p=0,5 este proporția factorilor dependenți de publicitate; q=1-0,5, apoi σ 2 =0,5*0,5=0,25.

4) Deoarece ponderea altor factori este de 0,5, varianța depozitului pentru două bănci, în funcție de toți factorii, cu excepția publicității, este de asemenea de 0,25.

5) Determinați varianța totală folosind regula adunării.

= (468*50+636,16*50)/100=552,08

= [(580-561,4)250+(542,8-561,4)250] / 100= 34 596/ 100=345,96

σ 2 = σ 2 fapt + σ 2 rest = 552,08+345,96 = 898,04

6) Coeficient de determinare η 2 = σ 2 fapt / σ 2 = 345,96/898,04 = 0,39 = 39% - mărimea contribuției depinde de publicitate cu 39%.

7) Raportul de corelație empirică η = √η 2 = √0.39 = 0.62 – relația este destul de strânsă.

Problema 2 . Există o grupare de întreprinderi în funcție de mărimea produselor comercializabile:

Determinați: 1) dispersia valorii produselor comercializabile; 2) abaterea standard; 3) coeficientul de variație.

Soluţie

1) După condiție, este prezentată o serie de distribuție a intervalelor. Trebuie exprimat discret, adică găsiți mijlocul intervalului (x"). În grupuri de intervale închise, găsim mijlocul folosind o medie aritmetică simplă. În grupuri cu limită superioară - ca diferență între această limită superioară și jumătate din dimensiunea următorului interval (200-(400 -200):2=100).

În grupuri cu o limită inferioară - suma acestei limite inferioare și jumătate din dimensiunea intervalului anterior (800+(800-600):2=900).

Calculăm valoarea medie a produselor comercializabile folosind formula:

Хср = k×((Σ((x"-a):k)×f):Σf)+a. Aici a=500 este dimensiunea opțiunii la cea mai mare frecvență, k=600-400=200 este dimensiunea intervalului la cea mai mare frecvență Să punem rezultatul în tabel:

Deci, valoarea medie a producției comerciale pentru perioada studiată este în general egală cu Хср = (-5:37)×200+500=472,97 mii ruble.

2) Găsim varianța folosind următoarea formulă:

σ 2 = (33/37)*2002-(472,97-500)2 = 35.675,67-730,62 = 34.945,05

3) abatere standard: σ = ±√σ 2 = ±√34.945,05 ≈ ±186,94 mii ruble.

4) coeficient de variație: V = (σ /Хср)*100 = (186,94 / 472,97)*100 = 39,52%

Varianta este o măsură a dispersiei care descrie abaterea comparativă între valorile datelor și medie. Este cea mai utilizată măsură a dispersiei în statistică, calculată prin însumarea și pătrarea abaterii fiecărei valori de date de la medie. Formula de calcul a varianței este prezentată mai jos:

s 2 – varianța eșantionului;

x av — medie eșantionului;

n dimensiunea eșantionului (număr de valori ale datelor),

(x i – x avg) este abaterea de la valoarea medie pentru fiecare valoare a setului de date.

Pentru a înțelege mai bine formula, să ne uităm la un exemplu. Nu prea îmi place să gătesc, așa că o fac rar. Totuși, pentru a nu muri de foame, din când în când trebuie să merg la aragaz să pun în aplicare planul de a-mi satura corpul cu proteine, grăsimi și carbohidrați. Setul de date de mai jos arată de câte ori gătește Renat în fiecare lună:

Primul pas în calcularea varianței este determinarea mediei eșantionului, care în exemplul nostru este de 7,8 ori pe lună. Restul calculelor pot fi simplificate folosind următorul tabel.

Faza finală de calcul a varianței arată astfel:

Pentru cei cărora le place să facă toate calculele dintr-o singură mișcare, ecuația ar arăta astfel:

Folosind metoda numărării crude (exemplu de gătit)

Există o modalitate mai eficientă de a calcula varianța, cunoscută sub numele de metoda de numărare brută. Deși ecuația poate părea destul de greoaie la prima vedere, de fapt nu este chiar atât de înfricoșătoare. Puteți să vă asigurați de acest lucru și apoi să decideți ce metodă vă place cel mai mult.

este suma fiecărei valori de date după pătrat,

este pătratul sumei tuturor valorilor datelor.

Nu-ți pierde mințile chiar acum. Să punem toate acestea într-un tabel și veți vedea că sunt mai puține calcule implicate decât în ​​exemplul anterior.

După cum puteți vedea, rezultatul a fost același ca atunci când ați folosit metoda anterioară. Avantajele acestei metode devin evidente pe măsură ce dimensiunea eșantionului (n) crește.

Calculul variației în Excel

După cum probabil ați ghicit deja, Excel are o formulă care vă permite să calculați varianța. Mai mult, începând cu Excel 2010, puteți găsi 4 tipuri de formule de variație:

1) VARIANCE.V – Returnează varianța eșantionului. Valorile booleene și textul sunt ignorate.

2) DISP.G - Returnează varianța populației. Valorile booleene și textul sunt ignorate.

3) VARIANCE - Returnează varianța eșantionului, luând în considerare valorile booleene și text.

4) VARIANCE - Returnează varianța populației, ținând cont de valorile logice și de text.

În primul rând, să înțelegem diferența dintre un eșantion și o populație. Scopul statisticilor descriptive este de a rezuma sau de a afișa date astfel încât să obțineți rapid imaginea de ansamblu, o privire de ansamblu, ca să spunem așa. Inferența statistică vă permite să faceți inferențe despre o populație pe baza unui eșantion de date din acea populație. Populația reprezintă toate rezultatele sau măsurătorile posibile care ne interesează. Un eșantion este un subset al unei populații.

De exemplu, suntem interesați de un grup de studenți de la una dintre universitățile ruse și trebuie să stabilim scorul mediu al grupului. Putem calcula performanța medie a elevilor, iar apoi cifra rezultată va fi un parametru, deoarece întreaga populație va fi implicată în calculele noastre. Totuși, dacă dorim să calculăm GPA-ul tuturor studenților din țara noastră, atunci acest grup va fi eșantionul nostru.

Diferența în formula de calcul a varianței dintre un eșantion și o populație este numitorul. Unde pentru eșantion va fi egal cu (n-1), iar pentru populația generală doar n.

Acum să ne uităm la funcțiile pentru calcularea varianței cu terminații O, a cărui descriere afirmă că textul și valorile logice sunt luate în considerare în calcul. În acest caz, atunci când se calculează varianța unui anumit set de date în care apar valori non-numerice, Excel va interpreta textul și valorile booleene false ca fiind egale cu 0, iar valorile booleene adevărate ca fiind egale cu 1.

Deci, dacă aveți o matrice de date, calcularea varianței acesteia nu va fi dificilă folosind una dintre funcțiile Excel enumerate mai sus.

Cu toate acestea, această caracteristică singură nu este suficientă pentru a studia o variabilă aleatorie. Să ne imaginăm doi trăgători trăgând la o țintă. Unul trage cu precizie și lovește aproape de centru, în timp ce celălalt... se distrează și nici măcar nu țintește. Dar ce e amuzant este că el medie rezultatul va fi exact același cu primul shooter! Această situație este ilustrată în mod convențional de următoarele variabile aleatoare:

Așteptarea matematică „lunetist” este egală cu , însă, pentru „persoana interesantă”: – este și zero!

Astfel, este necesar să se cuantifice cât de departe risipite gloanțe (valori ale variabilelor aleatoare) raportate la centrul țintei (așteptări matematice). Bine împrăștiere tradus din latină nu este altfel decât dispersie .

Să vedem cum se determină această caracteristică numerică folosind unul dintre exemplele din prima parte a lecției:

Acolo am găsit o așteptare matematică dezamăgitoare a acestui joc, iar acum trebuie să calculăm varianța acestuia, care notat cu prin .

Să aflăm cât de mult sunt „împrăștiate” câștigurile/pierderile față de valoarea medie. Evident, pentru asta trebuie să calculăm diferențeîntre valori ale variabilelor aleatoare si ea așteptări matematice:

–5 – (–0,5) = –4,5
2,5 – (–0,5) = 3
10 – (–0,5) = 10,5

Acum se pare că trebuie să rezumați rezultatele, dar această cale nu este potrivită - din motivul că fluctuațiile din stânga se vor anula reciproc cu fluctuații spre dreapta. Deci, de exemplu, un trăgător „amator”. (exemplu de mai sus) diferențele vor fi , iar atunci când sunt adăugate vor da zero, așa că nu vom obține nicio estimare a dispersiei împușcării sale.

Pentru a ocoli această problemă, puteți lua în considerare module diferențe, dar din motive tehnice abordarea a prins rădăcini atunci când sunt pătrate. Este mai convenabil să formulați soluția într-un tabel:

Și aici se cere să calculeze medie ponderată valoarea abaterilor pătrate. Și CE este asta? Este al lor așteptări matematice, care este o măsură a împrăștierii:

definiţie variaţiile. Din definiție reiese imediat că varianța nu poate fi negativă– ia notă pentru practică!

Să ne amintim cum să găsim valoarea așteptată. Înmulțiți diferențele la pătrat cu probabilitățile corespunzătoare (continuare tabel):
– la sens figurat, aceasta este „forța de tracțiune”,
și rezumă rezultatele:

Nu crezi că, în comparație cu câștigurile, rezultatul s-a dovedit a fi prea mare? Așa este - l-am pătrat și pentru a reveni la dimensiunea jocului nostru, trebuie să extragem rădăcina pătrată. Această cantitate se numește abaterea standard și este notat cu litera greacă „sigma”:

Această valoare este uneori numită abaterea standard .

Care este sensul lui? Dacă ne abatem de la așteptarea matematică la stânga și la dreapta prin abaterea standard:

– atunci cele mai probabile valori ale variabilei aleatoare vor fi „concentrate” pe acest interval. Ce observăm de fapt:

Cu toate acestea, se întâmplă că atunci când se analizează împrăștierea se operează aproape întotdeauna cu conceptul de dispersie. Să ne dăm seama ce înseamnă în legătură cu jocuri. Dacă în cazul săgeților vorbim despre „precizia” lovirilor în raport cu centrul țintei, atunci dispersia caracterizează două lucruri:

În primul rând, este evident că pe măsură ce pariurile cresc, și dispersia crește. Deci, de exemplu, dacă creștem de 10 ori, atunci așteptarea matematică va crește de 10 ori, iar varianța va crește de 100 de ori (deoarece aceasta este o cantitate pătratică). Dar rețineți că regulile jocului în sine nu s-au schimbat! Doar ratele s-au schimbat, aproximativ vorbind, înainte de a paria 10 ruble, acum sunt 100.

Al doilea punct, mai interesant, este că variația caracterizează stilul de joc. Fixați mental pariurile jocului la un anumit nivel, și să vedem ce este:

Un joc cu variație scăzută este un joc precaut. Jucătorul tinde să aleagă cele mai fiabile scheme, unde nu pierde/câștigă prea mult la un moment dat. De exemplu, sistemul roșu/negru la ruletă (vezi exemplul 4 al articolului Variabile aleatorii) .

Joc cu variație mare. Ea este numită des dispersiv joc. Acesta este un stil de joc aventuros sau agresiv, în care jucătorul alege scheme de „adrenalină”. Să ne amintim măcar "Martingala", în care sumele puse în joc sunt ordine de mărime mai mari decât jocul „liniștit” de la punctul precedent.

Situația în poker este orientativă: există așa-zise strâns jucători care au tendința de a fi precauți și „tremurați” cu privire la fondurile lor de jocuri (bankroll). Nu este surprinzător, bankroll-ul lor nu fluctuează semnificativ (varianță scăzută). Dimpotrivă, dacă un jucător are o variație mare, atunci el este un agresor. Adesea își asumă riscuri, face pariuri mari și poate fie să spargă o bancă uriașă, fie să se piardă în bucăți.

Același lucru se întâmplă în Forex și așa mai departe - există o mulțime de exemple.

Mai mult, în toate cazurile nu contează dacă jocul este jucat pentru bani sau mii de dolari. Fiecare nivel are jucătorii săi cu dispersie scăzută și mare. Ei bine, după cum ne amintim, câștigul mediu este „responsabil” așteptări matematice.

Probabil ați observat că găsirea variației este un proces lung și minuțios. Dar matematica este generoasă:

Formula pentru găsirea varianței

Această formulă este derivată direct din definiția varianței și o punem imediat în uz. Voi copia semnul cu jocul nostru de mai sus:

și așteptarea matematică găsită.

Să calculăm varianța în al doilea mod. Mai întâi, să găsim așteptarea matematică - pătratul variabilei aleatoare. De determinarea așteptărilor matematice:

În acest caz:

Astfel, conform formulei:

După cum se spune, simți diferența. Și în practică, desigur, este mai bine să utilizați formula (cu excepția cazului în care condiția cere altfel).

Stăpânim tehnica de rezolvare și proiectare:

Exemplul 6

Găsiți așteptările sale matematice, varianța și abaterea standard.

Această sarcină se găsește peste tot și, de regulă, nu are sens semnificativ.
Vă puteți imagina mai multe becuri cu cifre care se aprind într-un cămin de nebuni cu anumite probabilități :)

Soluţie: Este convenabil să rezumați calculele de bază într-un tabel. Mai întâi, scriem datele inițiale în primele două rânduri. Apoi calculăm produsele, apoi și în final sumele din coloana din dreapta:

De fapt, aproape totul este gata. A treia linie arată o așteptare matematică gata făcută: .

Să calculăm varianța folosind formula:

Și în sfârșit, abaterea standard:
– Personal, de obicei rotunjesc la 2 zecimale.

Toate calculele pot fi efectuate pe un calculator sau chiar mai bine - în Excel:

E greu să greșești aici :)

Răspuns:

Cei care doresc își pot simplifica și mai mult viața și pot profita de mine calculator (demo), care nu numai că va rezolva instantaneu această problemă, ci și va construi grafică tematică (o sa ajungem acolo in curand). Programul poate fi descărcați din bibliotecă– dacă ați descărcat cel puțin un material educațional, sau primiți alt mod. Vă mulțumim pentru susținerea proiectului!

Câteva sarcini de rezolvat singur:

Exemplul 7

Calculați varianța variabilei aleatoare din exemplul anterior prin definiție.

Si un exemplu asemanator:

Exemplul 8

O variabilă aleatorie discretă este specificată de legea sa de distribuție:

Da, valorile variabilelor aleatoare pot fi destul de mari (exemplu din munca reală), și aici, dacă este posibil, folosiți Excel. Așa cum, apropo, în Exemplul 7 - este mai rapid, mai fiabil și mai plăcut.

Soluții și răspunsuri în partea de jos a paginii.

Pentru a încheia partea a 2-a a lecției, ne vom uita la o altă problemă tipică, s-ar putea spune chiar un mic puzzle:

Exemplul 9

O variabilă aleatoare discretă poate lua doar două valori: și , și . Probabilitatea, așteptările matematice și varianța sunt cunoscute.

Soluţie: Să începem cu o probabilitate necunoscută. Deoarece o variabilă aleatorie poate lua doar două valori, suma probabilităților evenimentelor corespunzătoare este:

iar de atunci .

Rămâne doar să găsești..., e ușor de spus :) Dar ei bine, iată. Prin definiția așteptărilor matematice:
– înlocuirea cantităților cunoscute:

– și nimic mai mult nu poate fi stors din această ecuație, cu excepția faptului că o puteți rescrie în direcția obișnuită:

sau:

Cred că poți ghici următorii pași. Să compunem și să rezolvăm sistemul:

Decimalele sunt, desigur, o totală rușine; înmulțiți ambele ecuații cu 10:

si imparti la 2:

E mai bine. Din prima ecuație exprimăm:
(acesta este calea mai ușoară)– înlocuiți în a 2-a ecuație:


Construim pătratși faceți simplificări:

Înmulțiți cu:

Rezultatul a fost ecuație pătratică, găsim că este discriminant:
- Grozav!

și obținem două soluții:

1) dacă , Asta ;

2) dacă , Asta .

Prima pereche de valori satisface condiția. Cu o probabilitate mare, totul este corect, dar, cu toate acestea, să notăm legea distribuției:

și efectuați o verificare, și anume, găsiți așteptarea:

Publicații pe această temă