Nájdite celkový rozptyl. Typy disperzií

Podľa výberového prieskumu boli vkladatelia zoskupení podľa veľkosti vkladu v Sberbank mesta:

Definuj:

1) rozsah variácií;

2) priemerná výška vkladu;

3) priemerná lineárna odchýlka;

4) disperzia;

5) štandardná odchýlka;

6) variačný koeficient príspevkov.

Riešenie:

Tento distribučný rad obsahuje otvorené intervaly. V takýchto sériách sa bežne predpokladá, že hodnota intervalu prvej skupiny sa rovná hodnote intervalu ďalšej skupiny a hodnota intervalu poslednej skupiny sa rovná hodnote intervalu predchádzajúcej skupiny. jeden.

Hodnota intervalu druhej skupiny je 200, teda hodnota prvej skupiny je tiež 200. Hodnota intervalu predposlednej skupiny je 200, čo znamená, že aj posledný interval bude mať hodnotu 200.

1) Definujte rozsah variácie ako rozdiel medzi najväčším a najmenšia hodnota znamenie:

Rozsah variácií vo veľkosti príspevku je 1 000 rubľov.

2) Priemerná veľkosť príspevok je určený vzorcom aritmetického váženého priemeru.

Predbežne definujme diskrétne množstvo funkciu v každom intervale. Aby sme to dosiahli, pomocou jednoduchého vzorca aritmetického priemeru nájdeme stredy intervalov.

Priemerná hodnota prvého intervalu sa bude rovnať:

druhý - 500 atď.

Výsledky výpočtov dáme do tabuľky:

Výška vkladu, rub.Počet prispievateľov, fStred intervalu, xxf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
Celkom 400 - 312000

Priemerný vklad v mestskej Sberbank bude 780 rubľov:

3) Priemerná lineárna odchýlka je aritmetický priemer absolútnych odchýlok jednotlivých hodnôt atribútu od celkového priemeru:

Postup výpočtu priemernej lineárnej odchýlky v rade intervalového rozdelenia je nasledujúci:

1. Aritmetický vážený priemer sa vypočíta tak, ako je uvedené v odseku 2).

2. Stanovia sa absolútne odchýlky variantu od priemeru:

3. Získané odchýlky sa vynásobia frekvenciami:

4. Súčet vážených odchýlok sa zistí bez zohľadnenia znamienka:

5. Súčet vážených odchýlok sa vydelí súčtom frekvencií:

Je vhodné použiť tabuľku vypočítaných údajov:

Výška vkladu, rub.Počet prispievateľov, fStred intervalu, x
200-400 32 300 -480 480 15360
400-600 56 500 -280 280 15680
600-800 120 700 -80 80 9600
800-1000 104 900 120 120 12480
1000-1200 88 1100 320 320 28160
Celkom 400 - - - 81280

Priemerná lineárna odchýlka veľkosti vkladu klientov Sberbank je 203,2 rubľov.

4) Disperzia je aritmetický priemer druhej mocniny odchýlok každej hodnoty vlastnosti od aritmetického priemeru.

Výpočet rozptylu v intervalové série distribúcia sa uskutočňuje podľa vzorca:

Postup na výpočet rozptylu je v tomto prípade nasledovný:

1. Určite aritmetický vážený priemer, ako je uvedené v odseku 2).

2. Nájdite odchýlky od priemeru:

3. Umocnenie odchýlky každej možnosti od priemeru:

4. Vynásobte druhé mocniny odchýlok váhami (frekvenciami):

5. Zhrňte prijaté diela:

6. Výsledná suma sa vydelí súčtom váh (frekvencií):

Uveďme výpočty do tabuľky:

Výška vkladu, rub.Počet prispievateľov, fStred intervalu, x
200-400 32 300 -480 230400 7372800
400-600 56 500 -280 78400 4390400
600-800 120 700 -80 6400 768000
800-1000 104 900 120 14400 1497600
1000-1200 88 1100 320 102400 9011200
Celkom 400 - - - 23040000

Teória pravdepodobnosti je špeciálny odbor matematiky, ktorý študujú iba študenti vysokých škôl. Máte radi výpočty a vzorce? Nebojíte sa vyhliadok na zoznámenie sa s normálnym rozdelením, ansámblovou entropiou, matematickým očakávaním a diskrétnym rozptylom náhodná premenná? Potom vás táto téma bude veľmi zaujímať. Poďme sa pozrieť na niektoré z najdôležitejších základné pojmy tento vedný odbor.

Pripomeňme si základy

Aj keď si pamätáte najjednoduchšie pojmy teórie pravdepodobnosti, nezanedbávajte prvé odseky článku. Faktom je, že bez jasného pochopenia základov nebudete môcť pracovať s nižšie uvedenými vzorcami.

Takže existuje nejaká náhodná udalosť, nejaký experiment. V dôsledku vykonaných akcií môžeme získať niekoľko výsledkov – niektoré z nich sú bežnejšie, iné menej časté. Pravdepodobnosť udalosti je pomer počtu skutočne prijatých výsledkov jedného typu k celkový počet možné. Iba ak poznáte klasickú definíciu tohto pojmu, môžete začať študovať matematické očakávania a rozptyl spojitých náhodných premenných.

Priemerná

Ešte v škole, na hodinách matematiky, ste začali pracovať s aritmetickým priemerom. Tento koncept je široko používaný v teórii pravdepodobnosti, a preto ho nemožno ignorovať. Pre nás je momentálne hlavné, že sa s ňou stretneme vo vzorcoch pre matematické očakávanie a rozptyl náhodnej veličiny.

Máme postupnosť čísel a chceme nájsť aritmetický priemer. Všetko, čo sa od nás vyžaduje, je sčítať všetko, čo je k dispozícii, a rozdeliť počtom prvkov v sekvencii. Nech máme čísla od 1 do 9. Súčet prvkov bude 45 a túto hodnotu vydelíme 9. Odpoveď: - 5.

Disperzia

Z vedeckého hľadiska je rozptyl priemerný štvorec odchýlok získaných hodnôt vlastností od aritmetického priemeru. Jeden sa označuje veľkým latinským písmenom D. Čo je potrebné na jeho výpočet? Pre každý prvok postupnosti vypočítame rozdiel medzi dostupným číslom a aritmetickým priemerom a umocníme ho. Pre udalosť, o ktorej uvažujeme, bude presne toľko hodnôt, koľko môže byť výsledkov. Ďalej zhrnieme všetko prijaté a vydelíme počtom prvkov v sekvencii. Ak máme päť možných výsledkov, vydeľte ich piatimi.

Rozptyl má tiež vlastnosti, ktoré si musíte zapamätať, aby ste ho mohli použiť pri riešení problémov. Napríklad, ak sa náhodná premenná zväčší X-krát, rozptyl sa zvýši o X-násobok štvorca (t.j. X*X). Nikdy nie je menej ako nula a nezávisí od posunu hodnôt o rovnakú hodnotu nahor alebo nadol. V prípade nezávislých pokusov sa rozptyl súčtu rovná súčtu rozptylov.

Teraz určite musíme zvážiť príklady rozptylu diskrétnej náhodnej premennej a matematického očakávania.

Povedzme, že vykonáme 21 experimentov a získame 7 rôznych výsledkov. Každý z nich sme pozorovali 1, 2, 2, 3, 4, 4 a 5 krát. Aký bude rozptyl?

Najprv vypočítame aritmetický priemer: súčet prvkov je samozrejme 21. Vydelíme ho 7, dostaneme 3. Teraz odpočítame 3 od každého čísla v pôvodnom poradí, odmocníme každú hodnotu a výsledky sčítame. . Ukazuje sa, že 12. Teraz nám zostáva rozdeliť číslo počtom prvkov a zdá sa, že to je všetko. Má to však háčik! Poďme o tom diskutovať.

Závislosť od počtu pokusov

Ukazuje sa, že pri výpočte rozptylu môže byť menovateľom jedno z dvoch čísel: buď N alebo N-1. Tu N je počet vykonaných experimentov alebo počet prvkov v sekvencii (čo je v skutočnosti rovnaké). Od čoho to závisí?

Ak sa počet testov meria v stovkách, potom musíme do menovateľa dať N. Ak v jednotkách, tak N-1. Vedci sa rozhodli nakresliť hranicu celkom symbolicky: dnes vedie pozdĺž čísla 30. Ak sme vykonali menej ako 30 experimentov, potom množstvo vydelíme N-1 a ak viac, tak N.

Úloha

Vráťme sa k nášmu príkladu riešenia problému rozptylu a očakávania. Dostali sme medzičíslo 12, ktoré sme museli deliť N alebo N-1. Keďže sme uskutočnili 21 experimentov, čo je menej ako 30, zvolíme druhú možnosť. Takže odpoveď je: rozptyl je 12 / 2 = 2.

Očakávaná hodnota

Prejdime k druhému konceptu, ktorý musíme zvážiť v tomto článku. Matematické očakávanie je výsledkom sčítania všetkých možných výsledkov vynásobených zodpovedajúcimi pravdepodobnosťami. Je dôležité pochopiť, že získaná hodnota, ako aj výsledok výpočtu rozptylu, sa získa iba raz za celú úlohu, bez ohľadu na to, koľko výsledkov sa v nej berie do úvahy.

Matematický vzorec očakávania je celkom jednoduchý: vezmeme výsledok, vynásobíme ho jeho pravdepodobnosťou, pripočítame to isté pre druhý, tretí výsledok atď. Všetko, čo súvisí s týmto pojmom, sa dá ľahko vypočítať. Napríklad súčet matematických očakávaní sa rovná matematickému očakávaniu súčtu. To isté platí pre prácu. Nie každá veličina v teórii pravdepodobnosti umožňuje vykonávať takéto jednoduché operácie. Zoberme si úlohu a vypočítajme hodnotu dvoch pojmov, ktoré sme študovali naraz. Navyše nás rozptyľovala teória – je čas na prax.

Ešte jeden príklad

Uskutočnili sme 50 pokusov a získali sme 10 druhov výsledkov – čísla od 0 do 9 – ktoré sa objavili v rôznych percentá. Sú to v tomto poradí: 2%, 10%, 4%, 14%, 2%, 18%, 6%, 16%, 10%, 18%. Pripomeňme, že na získanie pravdepodobností je potrebné vydeliť percentuálne hodnoty 100. Získame teda 0,02; 0,1 atď. Uveďme príklad riešenia úlohy pre rozptyl náhodnej premennej a matematického očakávania.

Aritmetický priemer vypočítame pomocou vzorca, ktorý si pamätáme Základná škola: 50/10 = 5.

Teraz preložme pravdepodobnosti na počet výsledkov „v kusoch“, aby bolo počítanie pohodlnejšie. Dostaneme 1, 5, 2, 7, 1, 9, 3, 8, 5 a 9. Od každej získanej hodnoty odpočítajte aritmetický priemer, potom odmocníme každý zo získaných výsledkov. Pozrite si, ako to urobiť s prvým prvkom ako príklad: 1 - 5 = (-4). Ďalej: (-4) * (-4) = 16. Pre iné hodnoty vykonajte tieto operácie sami. Ak ste urobili všetko správne, potom po pridaní všetkého dostanete 90.

Pokračujme vo výpočte rozptylu a priemeru delením 90 N. Prečo volíme N a nie N-1? Je to tak, pretože počet vykonaných experimentov presahuje 30. Takže: 90/10 = 9. Dostali sme rozptyl. Ak vám vyjde iné číslo, nezúfajte. S najväčšou pravdepodobnosťou ste vo výpočtoch urobili banálnu chybu. Ešte raz skontrolujte, čo ste napísali, a určite všetko zapadne na svoje miesto.

Na záver si pripomeňme matematický vzorec očakávania. Nebudeme uvádzať všetky výpočty, napíšeme iba odpoveď, ktorú si môžete skontrolovať po dokončení všetkých požadovaných postupov. Predpokladaná hodnota bude 5,48. Pripomíname len, ako vykonávať operácie, pomocou príkladu prvých prvkov: 0 * 0,02 + 1 * 0,1 ... a tak ďalej. Ako vidíte, jednoducho vynásobíme hodnotu výsledku jeho pravdepodobnosťou.

Odchýlka

Ďalším pojmom úzko súvisiacim s disperziou a matematickým očakávaním je štandardná odchýlka. Je označený buď s latinskými písmenami sd, alebo grécky malý „sigma“. Tento koncept ukazuje, ako sa hodnoty v priemere odchyľujú od centrálnej funkcie. Ak chcete zistiť jeho hodnotu, musíte vypočítať Odmocnina z disperzie.

Ak nakreslíte normálne rozdelenie a chcete priamo na ňom vidieť druhú mocninu odchýlky, môžete to urobiť v niekoľkých krokoch. Vezmite polovicu obrázka naľavo alebo napravo od režimu (stredná hodnota), nakreslite kolmicu na vodorovnú os tak, aby boli plochy výsledných obrázkov rovnaké. Hodnota segmentu medzi stredom rozdelenia a výslednou projekciou na horizontálna os a bude to štandardná odchýlka.

softvér

Ako je zrejmé z opisov vzorcov a uvedených príkladov, výpočet rozptylu a matematického očakávania nie je z aritmetického hľadiska najjednoduchší postup. Aby ste nestrácali čas, má zmysel používať program používaný vo vyššom vzdelávacie inštitúcie- volá sa to "R". Má funkcie, ktoré vám umožňujú vypočítať hodnoty pre mnohé pojmy zo štatistiky a teórie pravdepodobnosti.

Napríklad definujete vektor hodnôt. To sa deje takto: vektor<-c(1,5,2…). Теперь, когда вам потребуется посчитать какие-либо значения для этого вектора, вы пишете функцию и задаете его в качестве аргумента. Для нахождения дисперсии вам нужно будет использовать функцию var. Пример её использования: var(vector). Далее вы просто нажимаете «ввод» и получаете результат.

Konečne

Rozptyl a matematické očakávania sú bez ktorých je ťažké v budúcnosti niečo vypočítať. V hlavnom kurze prednášok na vysokých školách sa s nimi počíta už v prvých mesiacoch štúdia predmetu. Práve pre nepochopenie týchto jednoduchých pojmov a neschopnosť ich vypočítať mnohí študenti okamžite začnú v programe zaostávať a neskôr dostávajú slabé známky v relácii, čo ich pripravuje o štipendiá.

Cvičte aspoň jeden týždeň pol hodinu denne a riešte úlohy podobné tým, ktoré sú uvedené v tomto článku. Potom sa pri akomkoľvek teste teórie pravdepodobnosti vyrovnáte s príkladmi bez nadbytočných tipov a cheatov.

V štatistike je často pri analýze javu alebo procesu potrebné brať do úvahy nielen informácie o priemerných úrovniach študovaných ukazovateľov, ale aj rozptyl alebo variácie hodnôt jednotlivých jednotiek , čo je dôležitá charakteristika skúmanej populácie.

Ceny akcií, objemy ponuky a dopytu, úrokové sadzby v rôznych časových obdobiach a na rôznych miestach podliehajú najväčším zmenám.

Hlavné ukazovatele charakterizujúce variáciu , sú rozsah, rozptyl, smerodajná odchýlka a variačný koeficient.

Variácia rozpätia je rozdiel medzi maximálnou a minimálnou hodnotou atribútu: R = Xmax – Xmin. Nevýhodou tohto ukazovateľa je, že vyhodnocuje len hranice variácie vlastnosti a neodráža jej kolísanie v rámci týchto hraníc.

Disperzia bez tohto nedostatku. Vypočítava sa ako priemerná štvorec odchýlok hodnôt atribútov od ich priemernej hodnoty:

Zjednodušený spôsob výpočtu rozptylu sa vykonáva pomocou nasledujúcich vzorcov (jednoduchých a vážených):

Príklady použitia týchto vzorcov sú uvedené v úlohách 1 a 2.

V praxi široko používaný ukazovateľ je smerodajná odchýlka :

Smerodajná odchýlka je definovaná ako druhá odmocnina rozptylu a má rovnaký rozmer ako študovaný znak.

Uvažované ukazovatele umožňujú získať absolútnu hodnotu variácie, t.j. hodnotiť v merných jednotkách skúmaného znaku. Na rozdiel od nich, variačný koeficient meria fluktuáciu v relatívnom vyjadrení - vo vzťahu k priemernej úrovni, ktorá je v mnohých prípadoch výhodnejšia.

Vzorec na výpočet variačného koeficientu.

Príklady riešenia problémov na tému "Ukazovatele variácie v štatistike"

Úloha 1 . Pri skúmaní vplyvu reklamy na veľkosť priemerného mesačného vkladu v bankách kraja boli skúmané 2 banky. Získajú sa nasledujúce výsledky:

Definuj:
1) pre každú banku: a) priemerný mesačný vklad; b) rozptyl príspevku;
2) priemerný mesačný vklad za dve banky spolu;
3) Rozloženie vkladu pre 2 banky v závislosti od reklamy;
4) Rozloženie vkladu pre 2 banky v závislosti od všetkých faktorov okrem reklamy;
5) Celkový rozptyl pomocou pravidla sčítania;
6) Koeficient určenia;
7) Korelačný vzťah.

Riešenie

1) Urobme si kalkulačnú tabuľku pre banku s reklamou . Na určenie priemerného mesačného vkladu nájdeme stredy intervalov. V tomto prípade sa hodnota otvoreného intervalu (prvý) podmienene rovná hodnote susediaceho intervalu (druhého).

Priemernú veľkosť príspevku zistíme pomocou vzorca váženého aritmetického priemeru:

29 000/50 = 580 rubľov

Rozptyl príspevku sa zistí podľa vzorca:

23 400/50 = 468

Vykonáme podobné akcie pre banku bez reklám :

2) Nájdite priemerný vklad pre dve banky spolu. Xav \u003d (580 × 50 + 542,8 × 50) / 100 \u003d 561,4 rubľov.

3) Rozptyl vkladu pre dve banky v závislosti od reklamy zistíme podľa vzorca: σ 2 =pq (vzorec rozptylu alternatívneho znaku). Tu p=0,5 je podiel faktorov, ktoré závisia od reklamy; q=1-0,5, potom a2=0,5*0,5=0,25.

4) Keďže podiel ostatných faktorov je 0,5, tak aj rozptyl vkladu pre dve banky, ktorý závisí od všetkých faktorov okrem reklamy, je tiež 0,25.

5) Určte celkový rozptyl pomocou pravidla sčítania.

= (468*50+636,16*50)/100=552,08

= [(580-561,4)250+(542,8-561,4)250] / 100= 34 596/ 100=345,96

σ 2 \u003d σ 2 fakt + σ 2 zvyšok \u003d 552,08 + 345,96 \u003d 898,04

6) Koeficient determinácie η 2 = σ 2 skutočnosť / σ 2 = 345,96/898,04 = 0,39 = 39 % - veľkosť príspevku závisí od reklamy z 39 %.

7) Empirický korelačný pomer η = √η 2 = √0,39 = 0,62 - vzťah je pomerne tesný.

Úloha 2 . Existuje zoskupenie podnikov podľa hodnoty obchodovateľných produktov:

Určite: 1) rozptyl hodnoty obchodovateľných produktov; 2) štandardná odchýlka; 3) variačný koeficient.

Riešenie

1) Podľa podmienok je prezentovaný intervalový distribučný rad. Musí byť vyjadrený diskrétne, to znamená nájsť stred intervalu (x "). V skupinách uzavretých intervalov nájdeme stred jednoduchým aritmetickým priemerom. V skupinách s hornou hranicou je rozdiel medzi touto hornou hranicou a polovičná veľkosť intervalu, ktorý nasleduje (200-(400 -200):2=100).

V skupinách s dolnou hranicou - súčet tejto dolnej hranice a polovičnej veľkosti predchádzajúceho intervalu (800+(800-600):2=900).

Výpočet priemernej hodnoty obchodovateľných produktov sa vykonáva podľa vzorca:

Хср = k×((Σ((x"-a):k)×f):Σf)+a. Tu a=500 je veľkosť variantu pri najvyššej frekvencii, k=600-400=200 je veľkosť intervalu pri najvyššej frekvencii Výsledok dajme do tabuľky:

Priemerná hodnota obchodovateľného výstupu za sledované obdobie ako celok je teda Xav = (-5:37) × 200 + 500 = 472,97 tisíc rubľov.

2) Nájdeme disperziu pomocou nasledujúceho vzorca:

σ 2 \u003d (33/37) * 2002-(472,97-500) 2 \u003d 35 675,67-730,62 \u003d 34 945,05

3) štandardná odchýlka: σ = ±√σ 2 = ±√34 945,05 ≈ ±186,94 tisíc rubľov.

4) variačný koeficient: V \u003d (σ / Xav) * 100 \u003d (186,94 / 472,97) * 100 \u003d 39,52 %

Disperzia je miera disperzie, ktorá popisuje relatívnu odchýlku medzi hodnotami údajov a priemerom. Je to najbežnejšie používaná miera rozptylu v štatistike, vypočítaná súčtom, na druhú, odchýlky každej hodnoty údajov od priemeru. Vzorec na výpočet rozptylu je uvedený nižšie:

s 2 - výberový rozptyl;

x cf je stredná hodnota vzorky;

n veľkosť vzorky (počet hodnôt údajov),

(x i – x cf) je odchýlka od strednej hodnoty pre každú hodnotu súboru údajov.

Aby sme lepšie pochopili vzorec, pozrime sa na príklad. Nemám veľmi rád varenie, takže to robím len zriedka. Aby som však nezomrel od hladu, z času na čas musím zájsť k sporáku, aby som zrealizoval plán nasýtiť svoje telo bielkovinami, tukmi a sacharidmi. Nižšie uvedený súbor údajov ukazuje, koľkokrát Renat varí jedlo každý mesiac:

Prvým krokom pri výpočte rozptylu je určenie výberového priemeru, ktorý je v našom príklade 7,8-krát za mesiac. Zostávajúce výpočty si môžete uľahčiť pomocou nasledujúcej tabuľky.

Záverečná fáza výpočtu rozptylu vyzerá takto:

Pre tých, ktorí radi robia všetky výpočty naraz, bude rovnica vyzerať takto:

Použitie metódy surového počtu (príklad varenia)

Existuje efektívnejší spôsob výpočtu rozptylu, známy ako metóda „surového počítania“. Aj keď sa na prvý pohľad môže zdať rovnica dosť ťažkopádna, v skutočnosti nie je až taká desivá. Môžete si to overiť a potom sa rozhodnúť, ktorá metóda sa vám najviac páči.

je súčet každej hodnoty údajov po kvadratúre,

je druhá mocnina súčtu všetkých hodnôt údajov.

Nestrácaj hlavu hneď teraz. Uveďme to všetko vo forme tabuľky a potom uvidíte, že je tu menej výpočtov ako v predchádzajúcom príklade.

Ako vidíte, výsledok je rovnaký ako pri použití predchádzajúcej metódy. Výhody tejto metódy sa prejavia s rastúcou veľkosťou vzorky (n).

Výpočet rozptylu v Exceli

Ako ste už pravdepodobne uhádli, Excel má vzorec, ktorý vám umožňuje vypočítať rozptyl. Okrem toho od Excelu 2010 nájdete 4 druhy disperzného vzorca:

1) VAR.V - Vráti rozptyl vzorky. Booleovské hodnoty a text sa ignorujú.

2) VAR.G - Vráti rozptyl populácie. Booleovské hodnoty a text sa ignorujú.

3) VASP – Vráti vzorový rozptyl, berúc do úvahy boolovské a textové hodnoty.

4) VARP – Vracia rozptyl populácie, berúc do úvahy logické a textové hodnoty.

Najprv sa pozrime na rozdiel medzi vzorkou a populáciou. Účelom deskriptívnej štatistiky je zhrnúť alebo zobraziť údaje tak, aby sa rýchlo získal veľký obraz, takpovediac prehľad. Štatistická inferencia vám umožňuje robiť závery o populácii na základe vzorky údajov z tejto populácie. Populácia predstavuje všetky možné výsledky alebo merania, ktoré nás zaujímajú. Vzorka je podmnožinou populácie.

Napríklad nás zaujíma celkový počet študentov jednej z ruských univerzít a potrebujeme určiť priemerné skóre skupiny. Vieme vypočítať priemerný výkon žiakov a výsledný údaj bude potom parametrom, keďže do našich výpočtov bude zapojená celá populácia. Ak však chceme vypočítať GPA všetkých študentov u nás, tak táto skupina bude našou vzorkou.

Rozdiel vo vzorci na výpočet rozptylu medzi vzorkou a populáciou je v menovateli. Kde pre vzorku sa bude rovnať (n-1) a pre všeobecnú populáciu iba n.

Teraz sa poďme zaoberať funkciami výpočtu rozptylu s koncovkami ALE, v popise ktorého sa hovorí, že výpočet zohľadňuje textové a logické hodnoty. V tomto prípade pri výpočte rozptylu konkrétnej množiny údajov, kde sa vyskytujú nečíselné hodnoty, bude Excel interpretovať text a nepravdivé boolovské hodnoty ako 0 a skutočné boolovské hodnoty ako 1.

Takže, ak máte pole údajov, nebude ťažké vypočítať ich rozptyl pomocou jednej z vyššie uvedených funkcií Excelu.

Samotná táto charakteristika však ešte nestačí na štúdium náhodnej premennej. Predstavte si dvoch strelcov, ktorí strieľajú na terč. Jeden strieľa presne a triafa blízko stredu a druhý ... len sa baví a ani nemieri. Ale čo je vtipné, je to priemer výsledok bude úplne rovnaký ako pri prvom strelcovi! Táto situácia je podmienene znázornená nasledujúcimi náhodnými premennými:

Matematické očakávanie "snajpera" sa však pre "zaujímavého človeka" rovná : - je tiež nulové!

Preto je potrebné kvantifikovať, ako ďaleko rozptýlené guľky (hodnoty náhodnej premennej) vzhľadom na stred cieľa (očakávania). dobre a rozptyl z latinčiny preložené len ako disperzia .

Pozrime sa, ako sa táto číselná charakteristika určuje v jednom z príkladov 1. časti lekcie:

Tam sme našli sklamanie matematického očakávania tejto hry a teraz musíme vypočítať jej rozptyl, ktorý označené cez .

Poďme zistiť, ako ďaleko sú výhry/prehry „rozhádzané“ vzhľadom na priemernú hodnotu. Je zrejmé, že na to musíme počítať rozdiely medzi hodnoty náhodnej premennej a jej matematické očakávanie:

–5 – (–0,5) = –4,5
2,5 – (–0,5) = 3
10 – (–0,5) = 10,5

Teraz sa zdá, že je potrebné zhrnúť výsledky, ale tento spôsob nie je dobrý - z dôvodu, že kmity vľavo sa navzájom vyrušia s kmitmi vpravo. Teda napríklad „amatérsky“ strelec (príklad vyššie) rozdiely budú , a po sčítaní dajú nulu, takže nezískame žiadny odhad rozptylu jeho streľby.

Ak chcete túto nepríjemnosť obísť, zvážte modulov rozdiely, ale z technických dôvodov sa tento prístup udomácnil, keď sa umocnia. Je vhodnejšie usporiadať riešenie do tabuľky:

A tu treba počítať Vážený priemer hodnota kvadrátov odchýlok. Čo je to? Je to ich očakávaná hodnota, čo je miera rozptylu:

definícia disperzia. Z definície je hneď jasné, že rozptyl nemôže byť záporný- berte na vedomie pre prax!

Pripomeňme si, ako nájsť očakávanie. Vynásobte druhé mocniny rozdielov zodpovedajúcimi pravdepodobnosťami (Pokračovanie tabuľky):
- obrazne povedané, toto je "ťažná sila",
a zhrnúť výsledky:

Nezdá sa vám, že na pozadí výhier sa výsledok ukázal byť príliš veľký? Presne tak – kvadratúrovali sme a aby sme sa vrátili k rozmeru našej hry, potrebujeme odmocninu. Táto hodnota sa nazýva smerodajná odchýlka a označuje sa gréckym písmenom „sigma“:

Niekedy sa tento význam nazýva smerodajná odchýlka .

Aký je jeho význam? Ak sa od matematického očakávania odchýlime doľava a doprava o smerodajnú odchýlku:

– potom budú najpravdepodobnejšie hodnoty náhodnej premennej „sústredené“ na tento interval. Čo vlastne vidíme:

Stalo sa však, že pri analýze rozptylu sa takmer vždy pracuje s pojmom disperzia. Pozrime sa, čo to znamená vo vzťahu k hrám. Ak v prípade strelcov hovoríme o „presnosti“ zásahov vzhľadom na stred terča, potom rozptyl charakterizuje dve veci:

Po prvé, je zrejmé, že so zvyšovaním sadzieb sa zvyšuje aj rozptyl. Takže napríklad, ak zvýšime 10-krát, potom sa matematické očakávanie zvýši 10-krát a rozptyl sa zvýši 100-krát (akonáhle je to kvadratická hodnota). Ale všimnite si, že pravidlá hry sa nezmenili! Zmenili sa len kurzy, zhruba povedané, kedysi sme stavili 10 rubľov, teraz 100.

Druhým, zaujímavejším bodom je, že rozptyl charakterizuje štýl hry. Mentálne fixujte herné sadzby na určitej úrovni a pozrite sa, čo je tu:

Hra s nízkym rozptylom je opatrná hra. Hráč má tendenciu vyberať si tie najspoľahlivejšie schémy, kde naraz príliš veľa neprehráva/nevyhráva. Napríklad červeno-čierny systém v rulete (pozri príklad 4 v článku náhodné premenné) .

Hra s vysokým rozptylom. Často je volaná disperzia hra. Ide o dobrodružný alebo agresívny štýl hry, kde si hráč vyberá „adrenalínové“ schémy. Poďme si aspoň zaspomínať "Martingale", v ktorej sú sumy, o ktoré sa hrá, rádovo vyššie ako pri „tichej“ hre z predchádzajúceho odseku.

Situácia v pokri je orientačná: existujú tzv tesný hráči, ktorí majú tendenciu byť opatrní a „trasú“ sa svojimi hernými prostriedkami (bankroll). Niet divu, že ich bankroll veľmi nekolísa (nízka variancia). Naopak, ak má hráč vysoký rozptyl, potom je to agresor. Často riskuje, robí veľké stávky a môže rozbiť obrovský bank a rozbiť sa.

To isté sa deje na Forexe a tak ďalej – príkladov je veľa.

Navyše vo všetkých prípadoch nezáleží na tom, či ide o hru o cent alebo o tisíce dolárov. Každá úroveň má svojich hráčov s nízkou a vysokou variáciou. No, za priemernú výhru, ako si pamätáme, "zodpovedný" očakávaná hodnota.

Pravdepodobne ste si všimli, že hľadanie odchýlky je dlhý a namáhavý proces. Ale matematika je veľkorysá:

Vzorec na nájdenie rozptylu

Tento vzorec je odvodený priamo z definície rozptylu a okamžite ho uvádzame do obehu. Skopírujem tanier s našou hrou zhora:

a nájdené očakávanie .

Rozptyl vypočítame druhým spôsobom. Najprv nájdime matematické očakávanie - druhú mocninu náhodnej premennej . Autor: definícia matematického očakávania:

V tomto prípade:

Teda podľa vzorca:

Ako sa hovorí, cítiť rozdiel. A v praxi je samozrejme lepšie aplikovať vzorec (pokiaľ si podmienka nevyžaduje inak).

Ovládame techniku ​​riešenia a navrhovania:

Príklad 6

Nájdite jeho matematické očakávanie, rozptyl a smerodajnú odchýlku.

Táto úloha sa nachádza všade a spravidla nemá zmysluplný význam.
Môžete si predstaviť niekoľko žiaroviek s číslami, ktoré sa s istou pravdepodobnosťou rozsvietia v blázinci :)

Riešenie: Je vhodné zhrnúť hlavné výpočty do tabuľky. Najprv napíšeme počiatočné údaje do dvoch horných riadkov. Potom vypočítame produkty, potom a nakoniec sumy v pravom stĺpci:

V skutočnosti je takmer všetko pripravené. V treťom riadku bolo nakreslené hotové matematické očakávanie: .

Disperzia sa vypočíta podľa vzorca:

A nakoniec štandardná odchýlka:
- osobne zvyknem zaokrúhľovať na 2 desatinné miesta.

Všetky výpočty je možné vykonať na kalkulačke a ešte lepšie - v Exceli:

Je ťažké sa tu pokaziť :)

Odpoveď:

Tí, ktorí chcú, si môžu ešte viac zjednodušiť život a využiť moje výhody kalkulačka (ukážka), ktorá tento problém nielen okamžite rieši, ale aj buduje tematická grafika (príde čoskoro). Program môže stiahnuť v knižnici– ak ste si stiahli aspoň jeden študijný materiál alebo ho dostanete inač. Ďakujeme za podporu projektu!

Pár úloh na samostatné riešenie:

Príklad 7

Podľa definície vypočítajte rozptyl náhodnej premennej z predchádzajúceho príkladu.

A podobný príklad:

Príklad 8

Diskrétna náhodná premenná je daná vlastným distribučným zákonom:

Áno, hodnoty náhodnej premennej môžu byť dosť veľké (príklad z reálnej práce) a tu, ak je to možné, použite Excel. Ako, mimochodom, v príklade 7 - je to rýchlejšie, spoľahlivejšie a príjemnejšie.

Riešenia a odpovede v spodnej časti stránky.

Na záver 2. časti lekcie si rozoberieme ešte jednu typickú úlohu, dalo by sa povedať aj malý rébus:

Príklad 9

Diskrétna náhodná premenná môže nadobúdať iba dve hodnoty: a , a . Pravdepodobnosť, matematické očakávanie a rozptyl sú známe.

Riešenie: Začnime s neznámou pravdepodobnosťou. Keďže náhodná premenná môže mať iba dve hodnoty, potom súčet pravdepodobností zodpovedajúcich udalostí:

a odvtedy .

Zostáva nájsť ..., ľahko povedať :) Ale no dobre, začalo to. Podľa definície matematického očakávania:
- nahradiť známe hodnoty:

- a nič viac sa z tejto rovnice nedá vytlačiť, okrem toho, že ju môžete prepísať obvyklým smerom:

alebo:

Čo sa týka ďalších akcií, myslím, že môžete hádať. Poďme vytvoriť a vyriešiť systém:

Desatinné čísla sú, samozrejme, úplná hanba; vynásobte obe rovnice 10:

a deliť 2:

To je oveľa lepšie. Z prvej rovnice vyjadríme:
(toto je ten jednoduchší spôsob)- nahradiť v 2. rovnici:


staviame štvorec a urobte zjednodušenia:

Vynásobíme:

Ako výsledok, kvadratická rovnica, nájdite jeho diskriminačné:
- perfektné!

a dostaneme dve riešenia:

1) ak , potom ;

2) ak , potom .

Prvý pár hodnôt spĺňa podmienku. S vysokou pravdepodobnosťou je všetko správne, ale napriek tomu zapíšeme distribučný zákon:

a vykonajte kontrolu, konkrétne nájdite očakávanie:

Súvisiace publikácie