Vzorec na výpočet celkového rozptylu. Disperzia a štandardná odchýlka v MS EXCEL

Riešenie.

Ako miera rozptylu hodnôt náhodná premenná používaný disperzia

Disperzia (slovo disperzia znamená "rozptyl") je miera rozptylu hodnôt náhodnej premennej ohľadom nej matematické očakávanie... Rozptyl je matematické očakávanie druhej mocniny odchýlky náhodnej premennej od jej matematického očakávania.

Ak je náhodná premenná diskrétna s nekonečnou, ale spočítateľnou množinou hodnôt, potom

ak rad na pravej strane rovnosti konverguje.

Disperzné vlastnosti.

  • 1. Rozptyl konštanty je nulový
  • 2. Rozptyl súčtu náhodných premenných sa rovná súčtu rozptylov
  • 3. Konštantný faktor možno vyňať zo znamienka rozptylu v štvorci

Rozptyl rozdielu náhodných premenných sa rovná súčtu rozptylov

Táto vlastnosť je dôsledkom druhej a tretej vlastnosti. Disperzie sa môžu len sčítať.

Je vhodné vypočítať rozptyl podľa vzorca, ktorý možno ľahko získať pomocou vlastností rozptylu

Rozptyl je vždy pozitívny.

Rozptyl má rozmerštvorec rozmeru samotnej náhodnej premennej, čo nie je vždy vhodné. Preto množstvo

Priemerná štvorcová odchýlka (štandardná odchýlka alebo štandard) náhodnej premennej sa nazýva aritmetická hodnota druhá odmocnina jeho rozptylu

Vhoďte dve mince v nominálnych hodnotách 2 a 5 rubľov. Ak minca vypadne s erbom, udelí sa nula bodov, a ak číslo, potom počet bodov, ktorý sa rovná hodnote mince. Nájdite matematické očakávanie a rozptyl počtu bodov.

Riešenie. Najprv nájdime rozdelenie náhodnej premennej X - počet bodov. Všetky kombinácie - (2; 5), (2; 0), (0; 5), (0; 0) - sú rovnako pravdepodobné a distribučný zákon:

Očakávaná hodnota:

Odchýlku nájdeme podľa vzorca

prečo počítať

Príklad 2

Nájdite neznámu pravdepodobnosť R, matematické očakávanie a rozptyl diskrétnej náhodnej premennej daný tabuľkou rozdelenia pravdepodobnosti

Nájdeme matematické očakávanie a rozptyl:

M(X) = 00,0081 + 10,0756 + 20,2646 + 3 0,4116 + +40,2401=2,8

Na výpočet rozptylu použijeme vzorec (19.4)

D(X) = 020 ,0081 + 120,0756 + 220,2646 + 320,4116 + 420,2401 - 2,82 = 8,68 -

Príklad 3 Dvaja rovnocenní športovci organizujú turnaj, ktorý trvá buď do prvého víťazstva jedného z nich, alebo do odohrania piatich zápasov. Pravdepodobnosť výhry v jednej hre pre každého zo športovcov je 0,3 a pravdepodobnosť nerozhodného výsledku 0,4. Nájdite distribučný zákon, matematické očakávanie a rozptyl počtu odohraných hier.

Riešenie. Náhodná hodnota NS- počet odohraných hier, nadobúda hodnoty od 1 do 5, t.j.

Stanovme si pravdepodobnosti konca zápasu. Zápas sa skončí v prvej hre, ak niekto iný vyhrá ich športovcov. Pravdepodobnosť výhry je

R(1) = 0,3+0,3 =0,6.

Ak bola remíza (pravdepodobnosť remízy je 1 - 0,6 = 0,4), zápas pokračuje. Zápas sa skončí v druhej hre, ak bola v prvej remíza a v druhej niekto vyhral. Pravdepodobnosť

R(2) = 0,4 0,6=0,24.

Rovnako sa zápas skončí v tretej hre, ak boli dve remízy po sebe a opäť niekto vyhral

R(3) = 0,4 0,4 0,6 = 0,096. R(4)= 0,4 0,4 0,4 0,6=0,0384.

Piata hra v ľubovoľnom variante je posledná.

R(5)= 1 - (R(1)+R(2)+R(3)+R(4)) = 0,0256.

Dajme si všetko do tabuľky. Distribučný zákon náhodnej premennej „počet vyhraných hier“ má tvar

Očakávaná hodnota

Rozptyl sa vypočíta podľa vzorca (19.4)

Štandardné diskrétne distribúcie.

Binomické rozdelenie. Nech sa implementuje schéma Bernoulliho experimentov: n identické nezávislé experimenty, v každom z nich event A sa môže objaviť s konštantnou pravdepodobnosťou p a neobjaví sa s pravdepodobnosťou

(pozri prednášku 18).

Počet výskytov udalosti A v týchto n experimenty je diskrétna náhodná premenná X, možné hodnoty ktorý:

0; 1; 2; ... ;m; ... ; n.

Pravdepodobnosť výskytu m udalosti A v konkrétnej sérii od n experimenty a distribučný zákon takejto náhodnej veličiny je daný Bernoulliho vzorcom (pozri prednášku 18)

Číselné charakteristiky náhodnej premennej X rozdelené podľa binomického zákona:

Ak n je veľký (), potom sa vzorec (19.6) zmení na vzorec

a tabuľková Gaussova funkcia (tabuľka hodnôt Gaussovej funkcie je uvedená na konci prednášky 18).

V praxi často nie je dôležitá pravdepodobnosť výskytu. m diania A v konkrétnej sérii n experimenty a pravdepodobnosť, že udalosť A sa objaví aspoň

krát a viac krát, t.j. pravdepodobnosť, že X nadobudne hodnoty

Aby ste to dosiahli, musíte spočítať pravdepodobnosti

Ak n je veľký (), potom sa vzorec (19.9) zmení na približný vzorec

tabuľková funkcia. Tabuľky sú uvedené na konci prednášky 18.

Pri používaní tabuliek majte na pamäti

Príklad 1... Auto, ktoré sa blíži ku križovatke, môže pokračovať po ktorejkoľvek z troch ciest: A, B alebo C s rovnakou pravdepodobnosťou. Až ku križovatke jazdí päť áut. Zistite priemerný počet áut, ktoré pôjdu po ceste A, a pravdepodobnosť, že po ceste B pôjdu tri autá.

Riešenie. Počet áut prechádzajúcich po každej z ciest je náhodná veličina. Ak predpokladáme, že všetky autá, ktoré sa blížia ku križovatke, cestujú nezávisle od seba, potom sa táto náhodná premenná rozdelí podľa binomického zákona s

n= 5 a p = .

Preto je priemerný počet áut, ktoré pôjdu po ceste A, daný vzorcom (19.7)

a požadovaná pravdepodobnosť pre

Príklad 2 Pravdepodobnosť zlyhania prístroja pre každú skúšku je 0,1. Prebieha 60 testov zariadenia. Aká je pravdepodobnosť, že zariadenie zlyhá: a) 15-krát; b) nie viac ako 15-krát?

a. Keďže počet testov je 60, použijeme vzorec (19.8)

Podľa tabuľky 1 prílohy k prednáške 18 nachádzame

b... Používame vzorec (19.10).

Podľa tabuľky 2 prílohy k prednáške 18

  • - 0,495
  • 0,49995

Poissonovo rozdelenie) zákon zriedkavých javov). Ak n skvelé, ale R malý (), zatiaľ čo produkt NS si zachováva konštantnú hodnotu, ktorú označíme l,

potom sa vzorec (19.6) zmení na Poissonov vzorec

Poissonov distribučný zákon má tvar:

Je zrejmé, že definícia Poissonovho zákona je správna, keďže hlavná vlastnosť distribučnej série

splnené, pretože súčet série

Sériové rozšírenie funkcie je napísané v zátvorkách pre

Veta. Matematické očakávanie a rozptyl náhodnej premennej rozloženej podľa Poissonovho zákona sa zhodujú a rovnajú sa parametru tohto zákona, t.j.

Dôkaz.

Príklad. Na propagáciu svojich produktov na trhu spoločnosť uvádza na poštové schránky písomky. Doterajšie pracovné skúsenosti ukazujú, že asi v jednom prípade z 2000 nasleduje objednávka. Zistite pravdepodobnosť, že po umiestnení 10 000 letákov príde aspoň jedna objednávka, priemerný počet prijatých objednávok a rozptyl počtu prijatých objednávok.

Riešenie... Tu

Zisťujeme pravdepodobnosť, že aspoň jedna objednávka príde cez pravdepodobnosť opačná udalosť, t.j.

Náhodný prúd udalostí. Prúd udalostí je sled udalostí, ktoré sa vyskytujú v náhodných časoch. Typickými príkladmi tokov sú poruchy v počítačových sieťach, volania do telefónnych ústrední, tok požiadaviek na opravu zariadení atď.

Prietok udalosti tzv stacionárne ak pravdepodobnosť určitého počtu udalostí pripadajúcich na časový interval dĺžky závisí len od dĺžky intervalu a nezávisí od umiestnenia časového intervalu na časovej osi.

Podmienka stacionárnosti je splnená tokom reklamácií, ktorých pravdepodobnostné charakteristiky nezávisia od času. Najmä stacionárny tok je charakterizovaný konštantnou hustotou (priemerný počet požiadaviek za jednotku času). V praxi často existujú toky aplikácií, ktoré (aspoň na obmedzený čas) možno považovať za stacionárne. Za stacionárny možno považovať napríklad tok hovorov na mestskej telefónnej ústredni v časovom intervale od 12 do 13 hodín. Rovnaký tok počas celého dňa už nemožno považovať za stacionárny (v noci je hustota hovorov oveľa menšia ako cez deň).

Prietok udalosti nazývané stream bez následného účinku ak pre akékoľvek neprekrývajúce sa časové úseky počet udalostí pripadajúcich na jeden z nich nezávisí od počtu udalostí pripadajúcich na iné.

Podmienka absencie následného efektu – najdôležitejšia pre najjednoduchší tok – znamená, že aplikácie vstupujú do systému nezávisle od seba. Napríklad tok cestujúcich, ktorí vstupujú do stanice metra, možno považovať za tok bez následkov, pretože dôvody, ktoré spôsobili príchod jednotlivého cestujúceho v tomto a nie inom okamihu, spravidla nie sú spojené s podobnými dôvodmi pre ostatných cestujúcich. Podmienka neprítomnosti následného účinku však môže byť ľahko porušená v dôsledku objavenia sa takejto závislosti. Napríklad tok cestujúcich opúšťajúcich stanicu metra už nemožno považovať za tok bez následných účinkov, pretože okamihy odchodu cestujúcich prichádzajúcich tým istým vlakom sú na sebe závislé.

Prietok udalosti tzv obyčajný ak je pravdepodobnosť, že dve alebo viac udalostí zasiahne malý časový interval t, zanedbateľná v porovnaní s pravdepodobnosťou zasiahnutia jednej udalosti (v tejto súvislosti sa Poissonov zákon nazýva zákon zriedkavých udalostí).

Podmienka obyčajnosti znamená, že objednávky prichádzajú jedna po druhej, a nie v pároch, trojiciach atď. odchýlka rozptylu Bernoulliho rozdelenie

Napríklad tok zákazníkov vstupujúcich do kaderníckeho salónu možno považovať za takmer obyčajný. Ak sa pri mimoriadnom toku príkazy prijímajú len v pároch, len v trojiciach atď., potom sa mimoriadny tok dá ľahko zredukovať na obyčajný; na to stačí namiesto prúdu jednotlivých nárokov uvažovať tok párov, trojíc atď.. Ťažšie to bude, ak sa každý nárok môže náhodne ukázať ako dvojitý, trojitý atď. s prúdom nie homogénnych, ale nepodobných udalostí.

Ak má tok udalostí všetky tri vlastnosti (to znamená, že je stacionárny, obyčajný a nemá žiadne následky), potom sa nazýva najjednoduchší (alebo stacionárny Poissonov) tok. Názov „Poisson“ je spojený so skutočnosťou, že ak sú splnené uvedené podmienky, počet udalostí spadajúcich do akéhokoľvek pevného časového intervalu bude rozdelený na Poissonov zákon

Tu je priemerný počet udalostí A objavujúce sa za jednotku času.

Tento zákon je jednoparametrový, t.j. na jej nastavenie vám stačí poznať jeden parameter. Dá sa ukázať, že matematické očakávanie a rozptyl v Poissonovom zákone sú číselne rovnaké:

Príklad... Povedzme, že uprostred pracovného dňa je priemerný počet žiadostí 2 za sekundu. Aká je pravdepodobnosť, že 1) nepríde ani jedna požiadavka za sekundu, 2) 10 žiadostí do dvoch sekúnd?

Riešenie. Keďže oprávnenosť aplikácie Poissonovho zákona je nepochybná a jeho parameter je daný (= 2), riešenie úlohy sa redukuje na aplikáciu Poissonovho vzorca (19.11)

1) t = 1, m = 0:

2) t = 2, m = 10:

zákon veľké čísla. Matematickým základom skutočnosti, že hodnoty náhodnej premennej sú zoskupené okolo niektorých konštantných hodnôt, je zákon veľkých čísel.

Historicky prvou formuláciou zákona veľkých čísel bola Bernoulliho veta:

„Pri neobmedzenom zvyšovaní počtu identických a nezávislých experimentov n frekvencia výskytu udalosti A konverguje v pravdepodobnosti k jej pravdepodobnosti“, t.j.

kde je frekvencia výskytu udalosti A v n experimentoch,

Informatívne výraz (19.10) znamená, že pre Vysoké číslo experimentuje frekvenciu výskytu udalosti A môže nahradiť neznámu pravdepodobnosť tejto udalosti a čím väčší je počet vykonaných experimentov, tým je p * bližšie k p. zaujímavé historický fakt... K. Pearson hodil mincou 12 000-krát a jeho erb padol 6019-krát (frekvencia 0,5016). Keď bola tá istá minca hodená 24 000 krát, dostal 12 012 erbov, t.j. frekvencia 0,5005.

Najdôležitejšou formou zákona veľkých čísel je Čebyševova veta: s neobmedzeným nárastom počtu nezávislých experimentov s konečným rozptylom a vykonaných za rovnakých podmienok aritmetický priemer pozorovaných hodnôt náhodnej premennej konverguje v pravdepodobnosti k jej matematickému očakávaniu... Analyticky možno túto vetu napísať takto:

Čebyševova veta má okrem základného teoretického významu aj dôležitý praktické využitie, napríklad v teórii meraní. Po vykonaní n meraní nejakej veličiny NS získať rôzne nezhodné hodnoty NS 1, NS 2, ..., xn... Pre približnú hodnotu nameranej hodnoty NS vezmite aritmetický priemer pozorovaných hodnôt

pričom čím viac experimentov sa vykoná, tým presnejší bude výsledok. Ide o to, že rozptyl množstva klesá so zvyšujúcim sa počtom vykonaných experimentov, od r

D(X 1) = D(X 2)=…= D(xn) D(X), potom

Vzťah (19.13) ukazuje, že aj pri vysokej nepresnosti meracích prístrojov (veľká hodnota) v dôsledku zvýšenia počtu meraní je možné získať výsledok s ľubovoľne vysokou presnosťou.

Pomocou vzorca (19.10) môžeme nájsť pravdepodobnosť, že štatistická frekvencia sa neodchyľuje od pravdepodobnosti o viac ako

Príklad. Pravdepodobnosť udalosti v každom pokuse je 0,4. Koľko testov je potrebné vykonať, aby sa dalo očakávať, s pravdepodobnosťou nie menšou ako 0,8, že relatívna frekvencia udalosti sa bude odchyľovať od modulo pravdepodobnosti o menej ako 0,01?

Riešenie. Podľa vzorca (19.14)

preto sú podľa tabuľky dve aplikácie

teda, n 3932.

Rozptyl v štatistike je definovaný ako štandardná odchýlka jednotlivých hodnôt atribútu na druhú od aritmetického priemeru. Bežná metóda na výpočet druhých mocnín odchýlok možností od priemeru s ich následným spriemerovaním.

V ekonomickej a štatistickej analýze sa variácia funkcie zvyčajne hodnotí pomocou štandardnej odchýlky, je to druhá odmocnina rozptylu.

(3)

Charakterizuje absolútnu variabilitu hodnôt meniaceho sa atribútu a vyjadruje sa v rovnakých merných jednotkách ako možnosti. V štatistikách je často potrebné porovnávať variácie rôznych znakov. Na takéto porovnania sa používa relatívna miera variácie, koeficient variácie.

Disperzné vlastnosti:

1) ak odpočítate akékoľvek číslo od všetkých možností, rozptyl sa od tohto nezmení;

2) ak sú všetky hodnoty variantu delené nejakým číslom b, potom sa rozptyl zníži o b ^ 2 krát, t.j.

3) ak vypočítate strednú druhú mocninu odchýlok od akéhokoľvek čísla z nerovnakého aritmetického priemeru, potom bude väčší ako rozptyl. V tomto prípade o dobre definovanú hodnotu na štvorec rozdielu medzi priemernou hodnotou c.

Rozptyl možno definovať ako rozdiel medzi stredným štvorcom a stredným štvorcom.

17. Skupinové a medziskupinové variácie. Pravidlo sčítania odchýlky

Ak je štatistická populácia rozdelená do skupín alebo častí podľa študovaného atribútu, potom je možné pre takúto populáciu vypočítať nasledujúce typy rozptylu: skupina (súkromná), priemerná skupina (súkromná) a medziskupinová.

Celkový rozptyl- odráža variácie prvku v dôsledku všetkých podmienok a dôvodov pôsobiacich v danej štatistickej populácii.

Skupinový rozptyl- sa rovná strednej štvorci odchýlok jednotlivých hodnôt znaku v rámci skupiny od aritmetického priemeru tejto skupiny, nazývaného skupinový priemer. Navyše, priemer skupiny sa nezhoduje s celkovým priemerom za celú populáciu.

Skupinová variácia odráža variáciu vlastnosti iba v dôsledku podmienok a dôvodov pôsobiacich v rámci skupiny.

Priemerný rozdiel v skupine- je definovaný ako vážený aritmetický priemer rozptylov skupín a váhy sú objemy skupín.

Medziskupinový rozptyl- sa rovná strednej štvorci odchýlok priemeru skupiny od celkového priemeru.

Medziskupinová odchýlka charakterizuje variáciu efektívnej vlastnosti v dôsledku skupinovej vlastnosti.

Medzi uvažovanými typmi rozptylov existuje určitý vzťah: celkový rozptyl sa rovná súčtu priemerného skupinového a medziskupinového rozptylu.

Tento pomer sa nazýva pravidlo sčítania rozptylu.

18. Dynamický rad a jeho základné prvky. Typy dynamických sérií.

Séria v štatistike sú digitálne údaje zobrazujúce zmenu javu v čase alebo v priestore a umožňujúce štatistické porovnanie javov v procese ich vývoja v čase aj v rôzne formy a typy procesov. Vďaka tomu je možné objaviť vzájomnú závislosť javov.

Proces vývoja pohybu spoločenských javov v čase sa v štatistike zvyčajne nazýva dynamika. Na zobrazenie dynamiky sú zostavené série dynamiky (chronologické, časové), čo sú série časovo premenných hodnôt štatistického ukazovateľa (napríklad počet odsúdených za 10 rokov), ktoré sa nachádzajú v časová postupnosť... Ich základnými prvkami sú digitálne hodnoty tohto ukazovateľa a obdobia alebo časové body, ku ktorým sa vzťahujú.

Najdôležitejšia charakteristika série dynamiky- ich veľkosť (objem, veľkosť) toho či onoho javu, dosiahnutá v určitom období alebo do určitého okamihu. V súlade s tým je veľkosť členov série dynamiky jej úrovňou. Rozlišovať počiatočnú, strednú a konečnú úroveň časového radu. Prvá úroveň zobrazuje hodnotu prvého, konečného - hodnotu posledného člena radu. Priemerná úroveň je chronologický priemer variačného rozsahu a počíta sa v závislosti od toho, či je časový rad intervalový alebo okamžitý.

Ďalšia dôležitá charakteristika dynamického rozsahu- čas, ktorý uplynul od počiatočného do posledného pozorovania, alebo počet takýchto pozorovaní.

Existujú rôzne typy sérií dynamiky, možno ich klasifikovať podľa nasledujúcich kritérií.

1) V závislosti od spôsobu vyjadrenia úrovní sa rady dynamiky členia na rady absolútnych a odvodených ukazovateľov (relatívne a priemerné hodnoty).

2) V závislosti od toho, ako úrovne radu vyjadrujú stav javu v určitých časových bodoch (na začiatku mesiaca, štvrťroka, roka atď.) alebo jeho hodnotu za určité časové intervaly (napríklad za deň, mesiac, rok atď.) sa rozlišujú podľa momentového a intervalového radu dynamiky. Momentálne série v analytickej práci orgánov činných v trestnom konaní sa používajú pomerne zriedka.

V teórii štatistiky sa dynamika rozlišuje podľa množstva ďalších klasifikačných znakov: v závislosti od vzdialenosti medzi úrovňami - s rovnakými úrovňami a nerovnakými úrovňami v čase; v závislosti od prítomnosti hlavného trendu študovaného procesu - stacionárneho a nestacionárneho. Pri analýze časových radov sú nasledujúce úrovne radov prezentované vo forme komponentov:

Yt = TP + E (t)

kde TP je deterministický komponent, ktorý určuje všeobecný trend zmeny v čase alebo trend.

E (t) je náhodná zložka, ktorá spôsobuje kolísanie hladín.

Disperzia ja Disperzia (z lat. disperzio - disperzia)

v matematickej štatistike a teórii pravdepodobnosti najbežnejšia miera disperzie, teda odchýlky od priemeru. V štatistickom chápaní D.

je aritmetický priemer druhej mocniny odchýlok hodnôt x i z ich aritmetického priemeru

V teórii pravdepodobnosti náhodná premenná NS sa nazýva matematické očakávanie E ( NS - m x) odchýlka 2 štvorce NS z jej matematického očakávania m x= E ( NS). D. náhodná premenná NS označuje sa D ( X) alebo cez σ 2 X... Druhá odmocnina D. (teda σ, ak D. je σ 2) sa nazýva štandardná odchýlka (pozri Druhá mocnina).

Pre náhodnú premennú NS s nepretržitá distribúcia pravdepodobnosti charakterizované hustotou pravdepodobnosti (pozri Hustota pravdepodobnosti) R(NS), D. sa vypočíta podľa vzorca

V teórii pravdepodobnosti veľký význam má nasledujúcu vetu: D. súčet nezávislých členov sa rovná ich súčtu D. Nemenej dôležitá je Čebyševova nerovnosť, ktorá umožňuje odhadnúť pravdepodobnosť veľkých odchýlok náhodnej veličiny NS z jeho matematického očakávania.

II Disperzia

Prítomnosť D. vĺn vedie k skresleniu tvaru signálov pri ich šírení v médiu. Je to spôsobené harmonickými vlnami rôzne frekvencie, na ktoré sa dá signál rozložiť, sa šíria rôznymi rýchlosťami (podrobnejšie pozri Vlny, Skupinová rýchlosť). D. svetlo, keď sa šíri v priehľadnom hranole, vedie k rozkladu bieleho svetla na spektrum (pozri Disperzia svetla).


Veľká sovietska encyklopédia. - M .: Sovietska encyklopédia. 1969-1978 .

Synonymá:

Pozrite si, čo je „Disperzia“ v iných slovníkoch:

    disperzia- Rozptýliť niečo. V matematike rozptyl definuje odchýlku hodnôt od priemeru. Disperzia bieleho svetla vedie k jeho rozkladu na zložky. Rozptyl zvuku je dôvodom jeho šírenia. Rozptyľovanie uložených údajov medzi ... ... Technická príručka prekladateľa

    Moderná encyklopédia

    - (rozptyl) Miera rozptylu údajov. Rozptyl množiny N členov sa zistí sčítaním druhých mocnín ich odchýlok od priemeru a delením N. Ak sú teda členy xi pre i = 1, 2, ..., N a ich priemer je m , rozptyl...... Ekonomický slovník

    Disperzia- (z lat. disperzio rozptyl) vlnenie, závislosť rýchlosti šírenia vĺn v látke od vlnovej dĺžky (frekvencie). Stanoví sa rozptyl fyzikálne vlastnosti prostredie, v ktorom sa vlny šíria. Napríklad vo vákuu ...... Ilustrované encyklopedický slovník

    - (z lat. disperzio disperzia) v matematickej štatistike a teórii pravdepodobnosti miera disperzie (odchýlka od priemeru). V štatistike je rozptyl aritmetický priemer druhej mocniny odchýlok pozorovaných hodnôt (x1, x2, ..., xn) náhodného ... ... Veľký encyklopedický slovník

    V teórii pravdepodobnosti najbežnejšia miera odchýlky od priemeru (miera rozptylu). V angličtine: Dispersion Synonymá: Statistical Dispersion Anglické synonymá: Statistical Dispersion Pozri tiež: Vzorky Finančné...... Finančná slovná zásoba

    - [lat. disperzus rozptýlený, rozptýlený] 1) disperzia; 2) chem., fyzikálne. fragmentácia látky na veľmi malé častice. D. svetlo je rozklad bieleho svetla pomocou hranola do spektra; 3) mat. odchýlka od priemeru. Slovník cudzie slová... Komlev N.G., ...... Slovník cudzích slov ruského jazyka

    disperzia- (rozptyl) ukazovateľ rozptylu údajov, ktorý zodpovedá strednej štvorci odchýlky týchto údajov od aritmetického priemeru. Rovná sa štvorcu smerodajná odchýlka... Slovník praktický psychológ... M .: AST, zber. S. Yu Golovin. 1998... Veľká psychologická encyklopédia

    Rozptyľovanie, rozptyl Slovník ruských synoným. disperzné podstatné meno, počet synoným: 6 nanodisperzia (1) ... Slovník synonym

    Disperzia- charakteristika rozptylu hodnôt náhodnej premennej, meraná druhou mocninou ich odchýlok od priemeru (označené d2). Rozlišuje medzi teoretickým (spojitým alebo diskrétnym) a empirickým (tiež spojitým a ... Ekonomický a matematický slovník

    Disperzia- * disperzia * disperzia 1. Rozptyl; rozptyl; variácia (pozri). 2. Teoretický pravdepodobnostný koncept, ktorý charakterizuje mieru odchýlky náhodnej premennej od jej matematického očakávania. V biometrickej praxi sa používa vzorový rozptyl s2... genetika. encyklopedický slovník

knihy

  • Anomálna disperzia v širokých absorpčných pásmach, D.S. Vianoce. Reprodukované v pôvodnom autorskom pravopise z vydania z roku 1934 (Izvestija vydavateľstva Akadémie vied ZSSR). V…

Teória pravdepodobnosti je špeciálny odbor matematiky, ktorý študujú len vysokoškoláci. Máte radi výpočty a vzorce? Nebojíte sa perspektívy zoznámenia sa s normálnym rozdelením, ansámblovou entropiou, matematickým očakávaním a rozptylom diskrétnej náhodnej premennej? Potom bude táto téma pre vás veľmi zaujímavá. Poďme sa zoznámiť s niektorými z najdôležitejších základných pojmov v tomto odbore vedy.

Pripomeňme si základy

Aj keď si pamätáte najviac jednoduché pojmy teórie pravdepodobnosti, nezanedbávajte prvé odseky článku. Faktom je, že bez jasné pochopenie základy, nebudete môcť pracovať s nižšie uvedenými vzorcami.

Takže nejaké sú náhodná udalosť, akýsi experiment. V dôsledku vykonaných akcií môžeme získať niekoľko výsledkov - niektoré z nich sú bežnejšie, iné sú menej časté. Pravdepodobnosť udalosti je pomer počtu skutočne získaných výsledkov jedného typu k celkom možné. Len ak poznáte klasickú definíciu tohto pojmu, môžete začať študovať matematické očakávania a rozptyl spojitých náhodných premenných.

Priemerná

Ešte v škole, na hodinách matematiky, ste začali pracovať s aritmetickým priemerom. Tento pojem je široko používaný v teórii pravdepodobnosti, a preto ho nemožno ignorovať. Pre nás je momentálne hlavné, že sa s ňou stretneme vo vzorcoch pre matematické očakávanie a rozptyl náhodnej veličiny.

Máme postupnosť čísel a chceme nájsť aritmetický priemer. Všetko, čo sa od nás vyžaduje, je sčítať všetko, čo je k dispozícii, a rozdeliť počtom prvkov v postupnosti. Predpokladajme, že máme čísla od 1 do 9. Súčet prvkov bude 45 a túto hodnotu vydelíme 9. Odpoveď: - 5.

Disperzia

Z vedeckého hľadiska je rozptyl stredná druhá mocnina odchýlok získaných hodnôt vlastnosti od aritmetického priemeru. Jeden je označený veľkým latinským písmenom D. Čo potrebujete na jeho výpočet? Pre každý prvok postupnosti vypočítajte rozdiel medzi dostupným číslom a aritmetickým priemerom a umocnite ho. Pre udalosť, o ktorej uvažujeme, bude presne toľko hodnôt, koľko môže byť výsledkov. Ďalej zhrnieme všetko prijaté a vydelíme počtom prvkov v sekvencii. Ak máme päť možných výsledkov, potom ich vydelíme piatimi.

Rozptyl má tiež vlastnosti, ktoré je potrebné mať na pamäti, aby sa mohli uplatniť pri riešení problémov. Napríklad, keď sa náhodná premenná zvýši X-krát, rozptyl sa zvýši X-krát na druhú (t.j. X * X). Nikdy nie je menšia ako nula a nezávisí od posunu hodnôt o rovnakú hodnotu nahor alebo nadol. Navyše, pre nezávislé testy sa rozptyl súčtu rovná súčtu rozptylov.

Teraz určite musíme zvážiť príklady rozptylu diskrétnej náhodnej premennej a matematického očakávania.

Povedzme, že sme vykonali 21 experimentov a získali sme 7 rôznych výsledkov. Každý z nich sme pozorovali 1, 2, 2, 3, 4, 4 a 5 krát. Aký je rozptyl?

Najprv vypočítajme aritmetický priemer: súčet prvkov sa, samozrejme, rovná 21. Vydeľte ho číslom 7 a získajte 3. Teraz od každého čísla v pôvodnej postupnosti odčítajte 3, odmocnite každú hodnotu a pridajte hodnotu výsledky spolu. Ukáže sa 12. Teraz nám zostáva rozdeliť číslo počtom prvkov a zdá sa, že to je všetko. Má to však háčik! Poďme o tom diskutovať.

Závislosť od počtu pokusov

Ukazuje sa, že pri výpočte rozptylu môže byť menovateľom jedno z dvoch čísel: buď N alebo N-1. Tu N je počet vykonaných experimentov alebo počet položiek v sekvencii (ktoré sú v podstate rovnaké). Od čoho to závisí?

Ak sa počet testov meria v stovkách, potom by sme mali zadať menovateľa N. Ak v jednotkách, potom N-1. Vedci sa rozhodli nakresliť hranicu celkom symbolicky: dnes beží na čísle 30. Ak sme vykonali menej ako 30 experimentov, tak súčet vydelíme N-1 a ak viac, tak N.

Úloha

Vráťme sa k nášmu príkladu riešenia problému rozptylu a očakávania. Dostali sme medzičíslo 12, ktoré bolo potrebné vydeliť N alebo N-1. Keďže sme uskutočnili 21 pokusov, čo je menej ako 30, zvolíme druhú možnosť. Takže odpoveď je: rozptyl je 12/2 = 2.

Očakávaná hodnota

Prejdime k druhému konceptu, ktorý musíme v tomto článku určite zvážiť. Očakávaná hodnota je súčet všetkých možných výsledkov vynásobený zodpovedajúcimi pravdepodobnosťami. Je dôležité pochopiť, že získaná hodnota, ako aj výsledok výpočtu rozptylu, sa získa iba raz pre celý problém, bez ohľadu na to, koľko výsledkov sa v ňom berie do úvahy.

Matematický vzorec očakávania je pomerne jednoduchý: vezmeme výsledok, vynásobíme jeho pravdepodobnosťou, pripočítame to isté pre druhý, tretí výsledok atď. Všetko, čo súvisí s týmto pojmom, sa dá ľahko vypočítať. Napríklad súčet očakávaní sa rovná očakávanému súčtu. To isté platí pre dielo. Takéto jednoduché operácie nie každá hodnota v teórii pravdepodobnosti vám to umožňuje. Zoberme si problém a vypočítajme význam dvoch pojmov, ktoré sme študovali naraz. Navyše nás rozptyľovala teória – je čas na prax.

Ešte jeden príklad

Uskutočnili sme 50 pokusov a získali sme 10 druhov výsledkov – čísla od 0 do 9 – vyskytujúcich sa v rôznych percentách. Sú to v tomto poradí: 2 %, 10 %, 4 %, 14 %, 2 %, 18 %, 6 %, 16 %, 10 %, 18 %. Pripomeňme, že na získanie pravdepodobnosti je potrebné vydeliť hodnoty v percentách číslom 100. Dostaneme teda 0,02; 0,1 atď. Uveďme príklad riešenia úlohy pre rozptyl náhodnej premennej a matematického očakávania.

Aritmetický priemer vypočítame pomocou vzorca, ktorý si pamätáme Základná škola: 50/10 = 5.

Teraz preveďme pravdepodobnosti na počet výsledkov „v kusoch“, aby bolo počítanie jednoduchšie. Dostaneme 1, 5, 2, 7, 1, 9, 3, 8, 5 a 9. Od každej získanej hodnoty odpočítajte aritmetický priemer, potom odmocníme každý zo získaných výsledkov. Pozrite si, ako to urobiť pomocou prvého prvku ako príkladu: 1 - 5 = (-4). Ďalej: (-4) * (-4) = 16. Pre ostatné hodnoty vykonajte tieto operácie sami. Ak ste urobili všetko správne, po pridaní všetkého dostanete 90.

Pokračujme vo výpočte rozptylu a priemeru delením 90 N. Prečo volíme N a nie N-1? Je to tak, pretože počet vykonaných experimentov presahuje 30. Takže: 90/10 = 9. Dostali sme rozptyl. Ak získate ďalšie číslo, nezúfajte. S najväčšou pravdepodobnosťou ste urobili bežnú chybu vo výpočtoch. Ešte raz skontrolujte, čo ste napísali, a určite všetko zapadne na svoje miesto.

Na záver si pripomeňme vzorec pre matematické očakávanie. Nebudeme uvádzať všetky výpočty, napíšeme iba odpoveď, ktorú si môžete skontrolovať po dokončení všetkých požadovaných postupov. Očakávaná hodnota bude 5,48. Pripomeňme si len, ako vykonávať operácie na príklade prvých prvkov: 0 * 0,02 + 1 * 0,1 ... a tak ďalej. Ako vidíte, jednoducho vynásobíme hodnotu výsledku jeho pravdepodobnosťou.

Odchýlka

Ďalším pojmom úzko súvisiacim s rozptylom a matematickým očakávaním je štandardná odchýlka. Je určený buď s latinskými písmenami sd alebo grécka malá sigma. Tento koncept ukazuje, ako veľmi sa hodnoty v priemere odchyľujú centrálna vlastnosť... Ak chcete zistiť jeho hodnotu, musíte vypočítať Odmocnina z rozptylu.

Ak nakreslíte normálne rozdelenie a chcete vidieť priamo na ňom štvorcová odchýlka, možno to urobiť v niekoľkých fázach. Vezmite polovicu obrázka naľavo alebo napravo od modu ( ústredný význam), nakreslite kolmicu na vodorovnú os tak, aby boli plochy výsledných obrázkov rovnaké. Hodnota segmentu medzi stredom rozdelenia a výslednou projekciou na vodorovnú os bude predstavovať štandardnú odchýlku.

softvér

Ako je zrejmé z opisov vzorcov a uvedených príkladov, výpočet rozptylu a matematického očakávania nie je z aritmetického hľadiska najjednoduchší postup. Aby sa nestrácal čas, má zmysel používať program používaný vo vysokoškolskom vzdelávaní. vzdelávacie inštitúcie- volá sa to "R". Má funkcie, ktoré vám umožňujú vypočítať hodnoty pre mnohé pojmy zo štatistiky a teórie pravdepodobnosti.

Napríklad definujete vektor hodnôt. Toto sa robí nasledovne: vektor<-c(1,5,2…). Теперь, когда вам потребуется посчитать какие-либо значения для этого вектора, вы пишете функцию и задаете его в качестве аргумента. Для нахождения дисперсии вам нужно будет использовать функцию var. Пример её использования: var(vector). Далее вы просто нажимаете «ввод» и получаете результат.

Konečne

Rozptyl a matematické očakávanie – bez ktorých je ťažké v budúcnosti niečo vypočítať. V hlavnom kurze prednášok na vysokých školách sa s nimi počíta už v prvých mesiacoch štúdia predmetu. Práve kvôli nepochopeniu týchto jednoduchých pojmov a neschopnosti ich vypočítať mnohí študenti okamžite začnú v programe zaostávať a neskôr dostávajú slabé známky na základe výsledkov sedenia, čo ich pripravuje o štipendiá.

Cvičte aspoň jeden týždeň, pol hodiny denne, riešte úlohy podobné tým, ktoré sú uvedené v tomto článku. Potom sa pri akomkoľvek teste z teórie pravdepodobnosti vyrovnáte s príkladmi bez nadbytočných tipov a podvádzačov.

Disperzianáhodná premenná je mierou šírenia daného náhodná premenná, teda jej odchýlky z matematického očakávania. V štatistike sa na označenie rozptylu často používa zápis (sigma square). Druhá odmocnina rozptylu rovná sa nazýva smerodajná odchýlka alebo štandardný spread. Smerodajná odchýlka sa meria v rovnakých jednotkách ako samotná náhodná premenná a rozptyl sa meria v štvorcoch tejto jednotky.

Aj keď je veľmi vhodné použiť na odhad celej vzorky iba jednu hodnotu (napríklad priemer alebo modus a medián), tento prístup môže ľahko viesť k nepresnostiam. Príčina tejto situácie nespočíva v samotnej veličine, ale v tom, že jedna veličina v žiadnom prípade neodráža rozptyl dátových hodnôt.

Napríklad vo vzorke:

priemer je 5.

Samotná vzorka však nemá jedinú položku s hodnotou 5. Možno budete potrebovať vedieť, do akej miery sa každá položka vo vzorke blíži k jej priemeru. Alebo inými slovami, potrebujete poznať rozptyl hodnôt. Keď viete, do akej miery sa údaje zmenili, môžete ich lepšie interpretovať priemerný, medián a móda... Rýchlosť zmeny hodnôt vzorky je určená výpočtom ich rozptylu a štandardnej odchýlky.



Rozptyl a druhá odmocnina rozptylu, nazývaná štandardná odchýlka, charakterizujú strednú odchýlku od priemeru vzorky. Z týchto dvoch veličín je najdôležitejšia smerodajná odchýlka... Túto hodnotu si možno predstaviť ako priemernú vzdialenosť medzi položkami od strednej položky vo vzorke.

Rozptyl je ťažké zmysluplne interpretovať. Druhá odmocnina tejto hodnoty je však štandardná odchýlka a je dobre interpretovateľná.

Smerodajná odchýlka sa vypočíta tak, že sa najprv určí rozptyl a potom sa vypočíta druhá odmocnina rozptylu.

Napríklad pre dátové pole zobrazené na obrázku sa získajú nasledujúce hodnoty:

Obrázok 1

Tu je priemer druhých mocnín rozdielov 717,43. Ak chcete získať smerodajnú odchýlku, všetko, čo zostáva, je vziať druhú odmocninu tohto čísla.

Výsledok je približne 26,78.

Malo by sa pamätať na to, že štandardná odchýlka sa interpretuje ako priemerná vzdialenosť položiek od priemeru vzorky.

Smerodajná odchýlka meria, ako dobre priemer opisuje celú vzorku.

Povedzme, že ste vedúcim výrobného oddelenia montáže PC. Štvrťročná správa uviedla, že za posledný štvrťrok mal 2 500 počítačov. Je to dobré alebo zlé? Požiadali ste (alebo prehľad už obsahuje tento stĺpec) v prehľade o zobrazenie štandardnej odchýlky pre tieto údaje. Smerodajná odchýlka je napríklad 2000. Ako vedúcemu oddelenia je vám jasné, že výrobná linka si vyžaduje lepšie riadenie (príliš veľké odchýlky v počte zmontovaných PC).

Pripomeňme, že keď je štandardná odchýlka veľká, údaje sú značne rozptýlené okolo priemeru, a keď je štandardná odchýlka malá, sú zoskupené blízko priemeru.

Štyri štatistické funkcie VAR (), VAR (), STDEV () a STDEV () sú určené na výpočet rozptylu a štandardnej odchýlky čísel v intervale buniek. Pred výpočtom rozptylu a štandardnej odchýlky súboru údajov musíte určiť, či údaje predstavujú populáciu alebo vzorku z populácie. V prípade vzorky zo všeobecnej populácie by sa mali použiť funkcie VAR () a STDEV () a v prípade všeobecnej populácie by sa mali použiť funkcie VAR () a STDEVP ():

Všeobecná populácia Funkcia

VARP ()

STANDOLLONP ()
Ukážka

DISP ()

STDEV ()

Rozptyl (rovnako ako štandardná odchýlka), ako sme uviedli, označuje rozsah, v akom sú hodnoty zahrnuté v súbore údajov rozptýlené okolo aritmetického priemeru.

Malá hodnota rozptylu alebo štandardnej odchýlky znamená, že všetky údaje sú sústredené okolo aritmetického priemeru, zatiaľ čo veľká hodnota týchto hodnôt znamená, že údaje sú rozptýlené v širokom rozsahu hodnôt.

Rozptyl je dosť ťažké zmysluplne interpretovať (čo znamená malá hodnota, veľká hodnota?). Výkon Úlohy 3 vám umožňuje vizuálne zobraziť v grafe význam rozptylu pre množinu údajov.

Úlohy

· Cvičenie 1.

· 2.1. Uveďte pojmy: rozptyl a smerodajná odchýlka; ich symbolické označenie pri štatistickom spracovaní údajov.

· 2.2. Zostavte pracovný hárok v súlade s obrázkom 1 a vykonajte potrebné výpočty.

· 2.3. Uveďte základné vzorce používané pri výpočtoch

· 2.4. Vysvetlite celý zápis (,,)

· 2.5. Vysvetlite praktický význam rozptylu a štandardnej odchýlky.

Úloha 2.

1.1. Uveďte pojmy: všeobecná populácia a vzorka; matematické očakávanie a aritmetický priemer ich symbolického označenia pri štatistickom spracovaní údajov.

1.2. V súlade s obrázkom 2 zostavte pracovný hárok a urobte výpočty.

1.3. Uveďte základné vzorce použité pri výpočtoch (pre všeobecnú populáciu a vzorku).

Obrázok 2

1.4. Vysvetlite, prečo je možné získať také aritmetické stredné hodnoty vo vzorkách ako 46,43 a 48,78 (pozri prílohu súboru). Vyvodiť závery.

Úloha 3.

Existujú dve vzorky s rôznymi súbormi údajov, ale priemer pre ne bude rovnaký:

Obrázok 3

3.1. Zostavte pracovný hárok podľa obrázku 3 a vykonajte potrebné výpočty.

3.2. Uveďte základné vzorce výpočtu.

3.3. Zostavte grafy podľa obrázkov 4, 5.

3.4. Vysvetlite výsledné závislosti.

3.5. Vykonajte podobné výpočty pre tieto dve vzorky.

Pôvodná vzorka 11119999

Vyberte hodnoty druhej vzorky tak, aby bol aritmetický priemer pre druhú vzorku rovnaký, napríklad:

Hodnoty pre druhú vzorku si vyberte sami. Navrhnite výpočty a grafy ako obrázky 3, 4, 5. Ukážte základné vzorce, ktoré boli použité pri výpočtoch.

Vyvodiť príslušné závery.

Všetky úlohy by mali byť vypracované vo forme správy so všetkými potrebnými obrázkami, grafmi, vzorcami a stručnými vysvetlivkami.

Poznámka: Konštrukciu grafov je potrebné vysvetliť pomocou obrázkov a stručných vysvetliviek.