Formula za izračun skupne variance. Varianca in standardni odklon v MS EXCEL

Rešitev.

Kot merilo razpršenosti vrednosti naključna spremenljivka uporablja disperzija

Disperzija (beseda disperzija pomeni "razprševanje") je merilo disperzije vrednosti naključne spremenljivke glede nje matematično pričakovanje. Disperzija je matematično pričakovanje kvadrata odstopanja naključne spremenljivke od njenega matematičnega pričakovanja

Če je naključna spremenljivka diskretna z neskončnim, a štetjem nizom vrednosti, potem

če se niz na desni strani enakosti konvergira.

Disperzijske lastnosti.

  • 1. Disperzija konstantne vrednosti je nič
  • 2. Varianca vsote naključnih spremenljivk je enaka vsoti variance
  • 3. Konstantni faktor je mogoče vzeti iz predznaka variance na kvadrat

Varianca razlike naključnih spremenljivk je enaka vsoti variance

Ta lastnost je posledica druge in tretje lastnosti. Odstopanja se lahko samo seštevajo.

Varianca je priročno izračunana s formulo, ki jo je enostavno dobiti z uporabo lastnosti variance

Disperzija je vedno pozitivna.

Disperzija ima dimenzijo kvadrat dimenzije same naključne spremenljivke, kar ni vedno priročno. Zato je količina

srednje standardni odklon (standardni odklon ali standard) naključne spremenljivke se imenuje aritmetična vrednost kvadratni koren njegove variance

Vrzi dva kovanca v apoenih 2 in 5 rubljev. Če kovanec pade skupaj z grbom, se dodeli nič točk, in če je številka, potem je število točk enako vrednosti kovanca. Poiščite matematično pričakovanje in varianco števila točk.

Rešitev. Najprej poiščemo porazdelitev naključne spremenljivke X – število točk. Vse kombinacije - (2; 5), (2; 0), (0; 5), (0; 0) - so enako verjetne in zakon porazdelitve:

Pričakovana vrednost:

Po formuli najdemo disperzijo

zakaj računamo

Primer 2

Poiščite neznano verjetnost R, matematično pričakovanje in variance diskretne naključne spremenljivke, podane s tabelo porazdelitve verjetnosti

Najdemo matematično pričakovanje in varianco:

M(X) = 00,0081 + 10,0756 + 20,2646 + 3 0,4116 + +40,2401=2,8

Za izračun disperzije uporabimo formulo (19.4)

D(X) = 020 ,0081 + 120,0756 + 220,2646 + 320,4116 + 420,2401 - 2,82 = 8,68 -

Primer 3 Dva enakovredna športnika imata turnir, ki traja do prve zmage enega od njiju ali do odigranih petih iger. Verjetnost zmage v eni igri za vsakega od športnikov je 0,3, verjetnost neodločenega izida pa 0,4. Poiščite zakon porazdelitve, matematično pričakovanje in varianco števila odigranih iger.

Rešitev. Naključna vrednost X- število odigranih iger ima vrednosti od 1 do 5, t.j.

Določimo verjetnosti konca tekme. Tekma se konča v prvem nizu, če zmaga eden od tekmovalcev. Verjetnost zmage je

R(1) = 0,3+0,3 =0,6.

Če je prišlo do neodločenega izida (verjetnost izenačenja je 1 - 0,6 = 0,4), se tekma nadaljuje. Tekma se bo končala z drugo igro, če je bila prva neodločena, drugi pa je nekdo zmagal. Verjetnost

R(2) = 0,4 0,6=0,24.

Podobno se bo tekma končala na tretji igri, če sta bila dva zaporedna neodločena izid in spet nekdo zmagal

R(3) = 0,4 0,4 0,6 = 0,096. R(4)= 0,4 0,4 0,4 0,6=0,0384.

Peta stranka v kateri koli varianti je zadnja.

R(5)= 1 - (R(1)+R(2)+R(3)+R(4)) = 0,0256.

Vse skupaj strnimo v tabelo. Zakon porazdelitve naključne spremenljivke "število dobljenih iger" ima obliko

Pričakovana vrednost

Disperzija se izračuna po formuli (19.4)

Standardne diskretne distribucije.

Binomna porazdelitev. Naj se izvede Bernoullijeva eksperimentalna shema: n identični neodvisni poskusi, v vsakem od katerih je dogodek A se lahko pojavi s stalno verjetnostjo str in se z verjetnostjo ne bo pojavil

(glej predavanje 18).

Število pojavov dogodka A v teh n eksperimentov obstaja diskretna naključna spremenljivka X, možne vrednosti ki:

0; 1; 2; ... ;m; ... ; n.

Verjetnost videza m dogodki A v določeni seriji iz n poskusi in zakon porazdelitve takšne naključne spremenljivke je podana z Bernoullijevo formulo (glej predavanje 18)

Številčne značilnosti naključne spremenljivke X porazdeljeno po binomskem zakonu:

Če n je velika (), potem, pri, formula (19.6) preide v formulo

in tabelarno Gaussovo funkcijo (tabela vrednosti Gaussove funkcije je podana na koncu 18. predavanja).

V praksi pogosto ni pomembna sama verjetnost. m dogodkov A v določeni seriji n izkušnje in verjetnost, da dogodek AMPAK se bo pojavilo vsaj

krat in nič več krat, to je verjetnost, da X prevzame vrednosti

Za to moramo sešteti verjetnosti

Če n je velika (), potem, pri, formula (19.9) preide v približno formulo

tabelarna funkcija. Tabele so podane na koncu 18. predavanja.

Pri uporabi tabel upoštevajte to

Primer 1. Avtomobil, ki se približuje križišču, se lahko še naprej premika po kateri koli od treh cest: A, B ali C z enako verjetnostjo. Pet avtomobilov se približuje križišču. Poiščite povprečno število avtomobilov, ki bodo šli na cesto A, in verjetnost, da bodo trije avtomobili šli na cesto B.

Rešitev.Število avtomobilov, ki vozijo po vsaki od cest, je naključna spremenljivka. Če predpostavimo, da se vsi avtomobili, ki se približujejo križišču, vozijo neodvisno drug od drugega, potem je ta naključna spremenljivka porazdeljena po binomskem zakonu z

n= 5 in str = .

Zato je povprečno število avtomobilov, ki bodo sledili cesti A, po formuli (19,7)

in želena verjetnost pri

Primer 2 Verjetnost okvare naprave pri vsakem testu je 0,1. Opravljenih je 60 testov naprave. Kolikšna je verjetnost, da bo naprava odpovedala: a) 15-krat; b) ne več kot 15-krat?

ampak. Ker je število testov 60, uporabimo formulo (19.8)

Glede na tabelo 1 priloge k predavanju 18 najdemo

b. Uporabimo formulo (19.10).

Glede na tabelo 2 v prilogi k predavanju 18

  • - 0,495
  • 0,49995

Poissonova porazdelitev) zakon redkih pojavov).Če n super in R malo (), medtem ko izdelek itd ohranja konstantno vrednost, ki jo označimo z l,

potem formula (19.6) preide v Poissonovo formulo

Poissonov distribucijski zakon ima obliko:

Očitno je definicija Poissonovega zakona pravilna, ker glavna lastnost distribucijske serije

izpolnjen, ker vsota vrstic

Razširitev v nizu funkcij je zapisana v oklepajih za

Izrek. Matematično pričakovanje in varianca naključne spremenljivke, porazdeljene po Poissonovem zakonu, sovpadata in sta enaka parametru tega zakona, t.j.

Dokaz.

Primer. Za promocijo svojih izdelkov na trgu, podjetje postavlja poštni predali reklamnih letakov. Prejšnje izkušnje kažejo, da v približno enem primeru od 2000 sledi naročilo. Poiščite verjetnost, da bo po oddaji 10.000 letakov prejeto vsaj eno naročilo, povprečno število prejetih naročil in varianco števila prejetih naročil.

Rešitev. tukaj

Verjetnost, da bo prispelo vsaj eno naročilo, najdemo skozi verjetnost nasprotni dogodek, tj.

Naključni tok dogodkov. Tok dogodkov je zaporedje dogodkov, ki se zgodijo ob naključnem času. Tipični primeri tokov so okvare v računalniških omrežjih, klici na telefonskih centralah, tok zahtev za popravilo opreme itd.

Pretok dogodki se imenujejo stacionarni, če je verjetnost zadeti eno ali drugo število dogodkov na časovnem intervalu dolžine odvisna samo od dolžine intervala in ni odvisna od lokacije časovnega intervala na časovni osi.

Pogoj stacionarnosti je izpolnjen tok aplikacij, katerih verjetnostne značilnosti niso odvisne od časa. Zlasti stacionarni tok je značilna konstantna gostota (povprečno število zahtev na enoto časa). V praksi pogosto obstajajo tokovi aplikacij, ki jih (vsaj za omejeno časovno obdobje) lahko štejemo za stacionarne. Na primer, tok klicev na mestni telefonski centrali v časovnem intervalu od 12 do 13 ur se lahko šteje za stacionarnega. Enak pretok čez cel dan ne moremo več šteti za mirujočega (ponoči je gostota klicev veliko manjša kot podnevi).

Pretok dogodkov se imenuje tok brez učinka, če za katere koli časovne segmente, ki se ne prekrivajo, število dogodkov, ki padejo na enega od njih, ni odvisno od števila dogodkov, ki padejo na druge.

Pogoj brez posledic, ki je najbolj bistven za najpreprostejši tok, pomeni, da terjatve vstopijo v sistem neodvisno drug od drugega. Na primer, tok potnikov, ki vstopajo v postajo podzemne železnice, lahko štejemo za tok brez posledic, saj razlogi, ki so povzročili prihod posameznega potnika v tistem trenutku in ne drugega, praviloma niso povezani s podobnimi razlogi za druge potniki. Vendar se lahko zaradi pojava takšne odvisnosti zlahka krši pogoj odsotnosti stranskega učinka. Na primer, toka potnikov, ki zapuščajo postajo podzemne železnice, ni več mogoče šteti za tok brez posledic, saj so izstopni časi potnikov, ki prihajajo z istim vlakom, odvisni drug od drugega.

Pretok dogodki se imenujejo vsakdanji, če je verjetnost zadeti dva ali več dogodkov v majhnem časovnem intervalu t zanemarljiva v primerjavi z verjetnostjo zadetka enega dogodka (v zvezi s tem se Poissonov zakon imenuje zakon redkih dogodkov).

Pogoj navadnosti pomeni, da se aplikacije pojavljajo ena za drugim in ne v parih, trojkah itd.

Na primer, tok strank, ki vstopajo v frizerski salon, se lahko šteje za skoraj običajnega. Če v izrednem toku pridejo aplikacije samo v parih, samo v trojkah itd., potem je izredni tok enostavno reducirati na navadnega; za to je dovolj, da namesto toka posameznih aplikacij upoštevamo tok parov, trojk itd. Težje bo, če se lahko vsaka aplikacija naključno izkaže za dvojno, trojno itd. Potem je že treba obravnavati tok ne homogenih, ampak heterogenih dogodkov.

Če ima tok dogodkov vse tri lastnosti (tj. je stacionaren, navaden in nima poučinka), se imenuje najenostavnejši (ali stacionarni Poissonov) tok. Ime "Poisson" je posledica dejstva, da bo ob upoštevanju zgornjih pogojev število dogodkov, ki padejo na kateri koli fiksni časovni interval, porazdeljeno na Poissonov zakon

Tukaj je povprečno število dogodkov A pojavi na enoto časa.

Ta zakon je enoparametričen, tj. zahteva, da je znan samo en parameter. Lahko se pokaže, da sta matematično pričakovanje in variance v Poissonovem zakonu številčno enaki:

Primer. Naj je sredi delovnega dne povprečno število zahtev 2 na sekundo. Kolikšna je verjetnost, da 1) v sekundi ne bo prejeta nobena zahteva, 2) v dveh sekundah bo prejetih 10 zahtev?

Rešitev. Ker je veljavnost uporabe Poissonovega zakona nedvomna in je njegov parameter nastavljen (= 2), se rešitev problema zmanjša na uporabo Poissonove formule (19.11)

1) t = 1, m = 0:

2) t = 2, m = 10:

zakon velike številke. Matematična osnova za dejstvo, da so vrednosti naključne spremenljivke združene okoli nekaterih konstantnih vrednosti, je zakon velikih števil.

Zgodovinsko gledano je bila prva formulacija zakona velikih števil Bernoullijev izrek:

"Z neomejenim povečanjem števila enakih in neodvisnih poskusov n se pogostost pojavljanja dogodka A po verjetnosti zbliža z njegovo verjetnostjo", t.j.

kjer je pogostost pojava dogodka A v n poskusih,

V bistvu izraz (19.10) pomeni, da ko velike številke pogostost dogodkov A lahko nadomesti neznano verjetnost tega dogodka in večje je število poskusov, bližje je p* p. zanimivo zgodovinsko dejstvo. K. Pearson je vrgel kovanec 12000-krat, njegov grb pa je padel 6019-krat (pogostnost 0,5016). Pri 24.000 metanju istega kovanca je prejel 12.012 kapljic grba, t.j. frekvenca 0,5005.

Najpomembnejša oblika zakona velikih števil je Čebišev izrek: z neomejenim povečanjem števila neodvisnih, ki imajo končno varianco in se izvajajo pod enakimi pogoji poskusov, se aritmetična sredina opazovanih vrednosti naključne spremenljivke po verjetnosti konvergira njenemu matematičnemu pričakovanju. V analitični obliki lahko ta izrek zapišemo takole:

Čebiševljev izrek ima poleg temeljnega teoretičnega pomena tudi pomemben praktična uporaba, na primer v teoriji meritev. Po n meritvah neke količine X, dobijo različne neusklajene vrednosti X 1, X 2, ..., xn. Za približno vrednost izmerjene vrednosti X vzamemo aritmetično sredino opazovanih vrednosti

pri čemer, več poskusov bo izvedenih, bolj natančen bo rezultat. Dejstvo je, da se varianca vrednosti zmanjšuje s povečanjem števila izvedenih poskusov, saj

D(x 1) = D(x 2)=…= D(xn) D(x), torej

Relacija (19.13) kaže, da je tudi pri visoki netočnosti merilnih instrumentov (velika vrednost) s povečanjem števila meritev mogoče dobiti rezultat s poljubno visoko natančnostjo.

S formulo (19.10) lahko najdemo verjetnost, da statistična frekvenca odstopa od verjetnosti za največ

Primer. Verjetnost dogodka v vsakem poskusu je 0,4. Koliko testov je treba izvesti, da bi z verjetnostjo, ki ni manjša od 0,8, pričakovali, da bo relativna frekvenca dogodka odstopala od verjetnosti po modulu manj kot 0,01?

Rešitev. Po formuli (19.14)

zato sta glede na tabelo dve aplikaciji

posledično n 3932.

Disperzija v statistiki je opredeljena kot standardni odmik posameznih vrednosti lastnosti na kvadrat od aritmetične sredine. Pogost način za izračun kvadratov odstopanj možnosti od povprečja in nato njihovo povprečenje.

V ekonomski in statistični analizi je običajno, da se variacijo lastnosti najpogosteje ovrednoti s standardnim odklonom, ki je kvadratni koren variance.

(3)

Zaznamuje absolutno nihanje vrednosti atributa spremenljivke in je izraženo v istih enotah kot različice. V statistiki je pogosto potrebno primerjati variacije različnih značilnosti. Za takšne primerjave se uporablja relativni kazalnik variacije, koeficient variacije.

Lastnosti disperzije:

1) če od vseh možnosti odštejete katero koli število, se varianca ne bo spremenila;

2) če vse vrednosti variante delimo z nekim številom b, se bo varianca zmanjšala za b^2-krat, tj.

3) če izračunate povprečni kvadrat odstopanj od katerega koli števila z neenakomerno aritmetično sredino, bo ta večji od variance. V tem primeru z natančno določeno vrednostjo na kvadrat razlike med povprečno vrednostjo pos.

Varianco lahko definiramo kot razliko med povprečnim kvadratom in srednjim kvadratom.

17. Skupinske in medskupinske variacije. Pravilo dodajanja variance

Če je statistična populacija razdeljena na skupine ali dele glede na preučevano značilnost, potem lahko za takšno populacijo izračunamo naslednje vrste disperzije: skupinsko (zasebno), skupinsko povprečje (zasebno) in medskupinsko.

Skupna varianca- odraža variacijo lastnosti zaradi vseh pogojev in vzrokov, ki delujejo v dani statistični populaciji.

Varianca skupine- je enak povprečnemu kvadratu odstopanj posameznih vrednosti atributa znotraj skupine od aritmetične sredine te skupine, ki se imenuje skupinska sredina. V tem primeru skupinsko povprečje ne sovpada s skupnim povprečjem celotne populacije.

Varianca skupine odraža variacijo lastnosti samo zaradi pogojev in vzrokov, ki delujejo znotraj skupine.

Povprečne skupinske variance- je opredeljena kot tehtana aritmetična sredina skupinskih disperzij, pri čemer so uteži prostornine skupin.

Medskupinska varianca- je enak povprečnemu kvadratu odstopanj skupinskih srednjih vrednosti od skupnega povprečja.

Medskupinska varianca označuje variacijo nastalega atributa zaradi atributa združevanja.

Med obravnavanimi vrstami variance obstaja določena povezava: skupna varianca je enaka vsoti povprečne skupinske in medskupinske variance.

Ta relacija se imenuje pravilo seštevanja variance.

18. Dinamična vrsta in njeni sestavni elementi. Vrste dinamičnih serij.

Serije v statistiki- to so digitalni podatki, ki kažejo, ali se pojav spreminja v času ali prostoru in omogočajo statistično primerjavo pojavov tako v procesu njihovega razvoja v času kot v različne oblike in vrste procesov. Zahvaljujoč temu je mogoče zaznati medsebojno odvisnost pojavov.

Proces razvoja gibanja družbenih pojavov v času v statistiki običajno imenujemo dinamika. Za prikaz dinamike se zgradijo serije dinamik (kronološke, časovne), ki so serije časovno spremenljivih vrednosti statističnega kazalnika (na primer število obsojencev nad 10 let), ki se nahajajo v Kronološki vrstni red. Njihovi sestavni elementi so številčne vrednosti danega kazalnika in obdobja ali časovne točke, na katere se nanašajo.

Najpomembnejša značilnost časovnih vrst- njihova velikost (obseg, vrednost) tega ali onega pojava, dosežena v določenem obdobju ali v določenem trenutku. V skladu s tem je velikost pogojev serije dinamike njena raven. Razlikovati začetni, srednji in končni nivo dinamične serije. Prva stopnja prikazuje vrednost prvega, končnega - vrednost zadnjega člana serije. Povprečna raven predstavlja povprečni kronološki variacijski razpon in se izračuna glede na to, ali je časovna vrsta intervalna ali trenutna.

Druga pomembna značilnost dinamične serije- čas, ki je potekel od začetnega do končnega opazovanja, oziroma število takih opazovanj.

Obstajajo različne vrste časovnih vrst, ki jih lahko razvrstimo po naslednjih kriterijih.

1) Glede na način izražanja ravni se serije dinamike delijo na serije absolutnih in izpeljanih kazalnikov (relativne in povprečne vrednosti).

2) Odvisno od tega, kako ravni serije izražajo stanje pojava v določenih časovnih točkah (na začetku meseca, četrtletja, leta itd.) ali njegovo vrednost za določene časovne intervale (npr. na dan, mesec, leto itd.) n.), razlikujejo med trenutnimi in intervalnimi nizi dinamike. Serije trenutkov v analitičnem delu organov pregona se uporabljajo razmeroma redko.

V teoriji statistike dinamiko ločimo tudi po številnih drugih klasifikacijskih značilnostih: glede na razdaljo med nivoji - z enako oddaljenimi nivoji in časovno neenakomernimi nivoji; odvisno od prisotnosti glavnega trenda preučevanega procesa - stacionarnega in nestacionarnega. Pri analizi dinamičnih serij so naslednje ravni serije predstavljene kot komponente:

Y t \u003d TP + E (t)

kjer je TR deterministična komponenta, ki določa splošni trend spremembe skozi čas ali trend.

E (t) je naključna komponenta, ki povzroča nihanja ravni.

Disperzija jaz Disperzija (iz latinskega dispersio - disperzija)

v matematični statistiki in teoriji verjetnosti je najpogostejša mera disperzije, torej odstopanja od povprečja. V statističnem smislu je D.

je aritmetična sredina kvadratov odstopanj vrednosti x i iz njihove aritmetične sredine

V teoriji verjetnosti, porazdelitev naključne spremenljivke X se imenuje pričakovanje E ( X - m x) 2 kvadrata deviacije X iz njenega matematičnega pričakovanja m x= E ( X). D. naključna spremenljivka X označeno z D ( X) ali preko σ 2 X. Kvadratni koren D. (tj. σ, če je D. σ 2) se imenuje standardni odklon (glej Kvadratni odklon).

Za naključno spremenljivko X od neprekinjena distribucija verjetnosti, za katere je značilna gostota verjetnosti (glej gostota verjetnosti) R(X), D. se izračuna po formuli

V teoriji verjetnosti velik pomen ima izrek: D. vsota neodvisnih členov je enaka vsoti njihovih D. Nič manj pomembna ni Čebiševa neenakost, ki omogoča oceno verjetnosti velikih odstopanj naključne spremenljivke X od svojega matematičnega pričakovanja.

II Disperzija

Prisotnost D. valov vodi do popačenja oblike signalov, ko se širijo v mediju. To je zaradi harmoničnih valov različne frekvence, v katerega je mogoče razstaviti signal, se širijo z različnimi hitrostmi (za podrobnosti glejte Valovi, Skupna hitrost). D. svetlobe, ko se širi v prozorni prizmi, vodi do razgradnje bele svetlobe v spekter (glej Disperzija svetlobe).


Velika sovjetska enciklopedija. - M.: Sovjetska enciklopedija. 1969-1978 .

Sopomenke:

Poglejte, kaj je "Disperzija" v drugih slovarjih:

    disperzija- Nekaj ​​razpršim. V matematiki varianca meri odstopanje vrednosti od povprečja. Razpršenost bele svetlobe vodi do njene razgradnje na komponente. Razpršenost zvoka je vzrok za njegovo širjenje. Razpršitev shranjenih podatkov po … … Priročnik tehničnega prevajalca

    Moderna enciklopedija

    - (variance) Merilo razpršenosti podatkov. Varianco niza N izrazov najdemo tako, da seštejemo kvadrate njihovih odstopanj od povprečja in delimo z N. Torej, če so izrazi xi pri i = 1, 2, ..., N in je njihova srednja vrednost m , varianca ... ... Ekonomski slovar

    Disperzija- (iz latinskega dispersio scattering) valovi, odvisnost hitrosti širjenja valov v snovi od valovne dolžine (frekvence). Določi se disperzija fizične lastnosti medij, v katerem se širijo valovi. Na primer v vakuumu ... ... Ilustrirano enciklopedični slovar

    - (iz lat. dispersio scattering) v matematični statistiki in teoriji verjetnosti, merilo disperzije (odklon od povprečja). V statistiki je varianca aritmetična sredina kvadratov odstopanj opazovanih vrednosti (x1, x2,...,xn) naključnega ... ... Veliki enciklopedični slovar

    V teoriji verjetnosti je najpogosteje uporabljena mera odstopanja od povprečja (mera razpršitve). Angleščina: Dispersion Sopomenke: Statistical dispersion Angleški sinonimi: Statistical dispersion Glej tudi: Vzorčne populacije Finančni … … Finančni besednjak

    - [lat. dispersus razpršen, raztresen] 1) razpršenost; 2) kemijsko, fizikalno. razgradnjo snovi na zelo majhne delce. D. svetlobna razgradnja bele svetlobe z uporabo prizme v spekter; 3) mat. odstopanje od povprečja. Slovar tuje besede. Komlev N.G.,… … Slovar tujih besed ruskega jezika

    disperzija- (variance) indikator razpršenosti podatkov, ki ustreza povprečnemu kvadratu odstopanja teh podatkov od aritmetične sredine. Enako kot kvadrat standardni odklon. Slovar praktični psiholog. Moskva: AST, Žetev. S. Yu. Golovin. 1998 ... Velika psihološka enciklopedija

    Scattering, scattering Slovar ruskih sinonimov. samostalniška disperzija, število sinonimov: 6 nanodisperzija (1) … Slovar sinonimov

    Disperzija je disperzijska značilnost vrednosti naključne spremenljivke, merjena s kvadratom njihovih odstopanj od srednje vrednosti (označeno z d2). D. razlikuje teoretično (kontinuirano ali diskretno) in empirično (tudi neprekinjeno in ... ... Ekonomsko-matematični slovar

    Disperzija- * disperzija * disperzija 1. Razpršenost; razpršiti; variacija (glej). 2. Teoretično verjetnostni koncept, ki označuje stopnjo odstopanja naključne spremenljivke od njenega matematičnega pričakovanja. V biometrični praksi se uporablja variance vzorca s2 ... Genetika. enciklopedični slovar

knjige

  • Anomalna disperzija v širokih absorpcijskih pasovih, D.S. božič. Reproducirano v izvirnem avtorjevem črkovanju izdaje iz leta 1934 (založba `Zbornik Akademije znanosti ZSSR`). V…

Teorija verjetnosti je posebna veja matematike, ki jo preučujejo samo študenti visokošolskih zavodov. Obožujete izračune in formule? Se ne bojite možnosti spoznavanja normalne porazdelitve, entropije ansambla, matematičnega pričakovanja in variance diskretne naključne spremenljivke? Potem vas bo ta tema zelo zanimala. Seznanimo se z nekaterimi najpomembnejšimi osnovnimi pojmi tega oddelka znanosti.

Spomnimo se osnov

Tudi če se najbolj spomnite preprosti koncepti teorije verjetnosti, ne zanemarite prvih odstavkov članka. Bistvo je, da brez jasno razumevanje osnove, ne boste mogli delati s spodaj obravnavanimi formulami.

Torej je nekaj naključni dogodek, nekaj eksperimenta. Kot rezultat izvedenih dejanj lahko dobimo več rezultatov - nekateri so pogostejši, drugi manj pogosti. Verjetnost dogodka je razmerje med številom dejansko prejetih izidov ene vrste in skupno število možno. Šele ob poznavanju klasične definicije tega koncepta lahko začnete preučevati matematično pričakovanje in disperzijo neprekinjenih naključnih spremenljivk.

povprečno

Že v šoli, pri pouku matematike, ste začeli delati z aritmetično sredino. Ta koncept se pogosto uporablja v teoriji verjetnosti, zato ga ni mogoče prezreti. Za nas je trenutno glavno, da ga bomo srečali v formulah za matematično pričakovanje in varianco naključne spremenljivke.

Imamo zaporedje številk in želimo najti aritmetično sredino. Vse, kar se od nas zahteva, je sešteti vse, kar je na voljo, in deliti s številom elementov v zaporedju. Naj imamo števila od 1 do 9. Vsota elementov bo 45 in to vrednost bomo delili z 9. Odgovor: - 5.

Disperzija

V znanstvenem smislu je varianca povprečni kvadrat odstopanj dobljenih vrednosti lastnosti od aritmetične sredine. Ena je označena z veliko latinično črko D. Kaj je potrebno za izračun? Za vsak element zaporedja izračunamo razliko med razpoložljivim številom in aritmetično sredino ter jo kvadriramo. Vrednosti bo natanko toliko, kolikor je lahko rezultatov za dogodek, o katerem razmišljamo. Nato povzamemo vse prejeto in delimo s številom elementov v zaporedju. Če imamo pet možnih izidov, potem delimo s pet.

Varianca ima tudi lastnosti, ki si jih morate zapomniti, da jo uporabite pri reševanju problemov. Na primer, če se naključna spremenljivka poveča za X-krat, se varianca poveča za X-krat kvadrat (tj. X*X). Nikoli ni manjša od nič in ni odvisna od premika vrednosti za enako vrednost navzgor ali navzdol. Tudi pri neodvisnih poskusih je varianca vsote enaka vsoti variance.

Zdaj moramo vsekakor upoštevati primere variance diskretne naključne spremenljivke in matematičnega pričakovanja.

Recimo, da izvedemo 21 poskusov in dobimo 7 različnih rezultatov. Vsakega od njih smo opazovali 1,2,2,3,4,4 oziroma 5-krat. Kakšna bo razlika?

Najprej izračunamo aritmetično sredino: vsota elementov je seveda 21. Delimo jo s 7 in dobimo 3. Zdaj od vsakega števila v prvotnem zaporedju odštejemo 3, vsako vrednost kvadriramo in rezultate seštejemo. . Izkazalo se je 12. Zdaj nam ostane, da število delimo s številom elementov, in zdi se, da je to vse. Ampak obstaja ulov! Razpravljajmo o tem.

Odvisnost od števila poskusov

Izkazalo se je, da je pri izračunu variance imenovalec lahko eno od dveh številk: N ali N-1. Tukaj je N število izvedenih poskusov ali število elementov v zaporedju (kar je v bistvu ista stvar). od česa je odvisno?

Če se število testov meri v stotinah, moramo v imenovalec vpisati N. Če v enotah, potem N-1. Znanstveniki so se odločili, da mejo narišejo precej simbolično: danes poteka vzdolž številke 30. Če smo izvedli manj kot 30 poskusov, bomo količino delili z N-1, če je več, pa z N.

Naloga

Vrnimo se k našemu primeru reševanja problema variance in pričakovanja. Dobili smo vmesno število 12, ki smo ga morali deliti z N ali N-1. Ker smo izvedli 21 poskusov, kar je manj kot 30, bomo izbrali drugo možnost. Odgovor je torej: varianca je 12 / 2 = 2.

Pričakovana vrednost

Pojdimo na drugi koncept, ki ga moramo upoštevati v tem članku. Matematično pričakovanje je rezultat seštevanja vseh možnih rezultatov, pomnoženih z ustreznimi verjetnostmi. Pomembno je razumeti, da se dobljena vrednost, kot tudi rezultat izračuna variance, pridobi samo enkrat za celotno nalogo, ne glede na to, koliko rezultatov je v njej upoštevanih.

Formula matematičnega pričakovanja je precej preprosta: vzamemo izid, ga pomnožimo z verjetnostjo, dodamo enako za drugi, tretji rezultat itd. Vse, kar je povezano s tem konceptom, je enostavno izračunati. Na primer, vsota matematičnih pričakovanj je enaka matematičnemu pričakovanju vsote. Enako velja za delo. Takšne enostavne operacije daleč od vsake količine v teoriji verjetnosti nam omogoča, da jo izpolnimo. Vzemimo nalogo in izračunajmo vrednost dveh konceptov, ki smo jih preučevali hkrati. Poleg tega nas je motila teorija – čas je za prakso.

Še en primer

Izvedli smo 50 poskusov in dobili 10 vrst rezultatov – številke od 0 do 9 –, ki se pojavljajo v različnih odstotkih. To so: 2 %, 10 %, 4 %, 14 %, 2 %, 18 %, 6 %, 16 %, 10 %, 18 %. Spomnimo se, da morate za pridobitev verjetnosti odstotne vrednosti deliti s 100. Tako dobimo 0,02; 0,1 itd. Naj predstavimo primer reševanja problema za varianco naključne spremenljivke in matematično pričakovanje.

Aritmetično sredino izračunamo s formulo, s katero se spomnimo osnovna šola: 50/10 = 5.

Zdaj pa prevedemo verjetnosti v število izidov "v kosih", da bo bolj priročno štetje. Dobimo 1, 5, 2, 7, 1, 9, 3, 8, 5 in 9. Od vsake dobljene vrednosti odštejemo aritmetično sredino, nakar vsakega od dobljenih rezultatov kvadriramo. Oglejte si, kako to storite s prvim elementom kot primer: 1 - 5 = (-4). Nadalje: (-4) * (-4) = 16. Za druge vrednosti opravite te operacije sami. Če ste naredili vse pravilno, potem po dodajanju vsega dobite 90.

Nadaljujmo z izračunom variance in povprečja tako, da 90 delimo z N. Zakaj izberemo N in ne N-1? Tako je, saj število izvedenih poskusov presega 30. Torej: 90/10 = 9. Dobili smo disperzijo. Če dobite drugo številko, ne obupajte. Najverjetneje ste naredili banalno napako pri izračunih. Še enkrat preveri, kaj si napisal, pa bo zagotovo vse prišlo na svoje mesto.

Na koncu se spomnimo formule matematičnega pričakovanja. Ne bomo dali vseh izračunov, napisali bomo le odgovor, s katerim lahko preverite po zaključku vseh zahtevanih postopkov. Pričakovana vrednost bo 5,48. Spomnimo se le, kako izvajati operacije na primeru prvih elementov: 0 * 0,02 + 1 * 0,1 ... in tako naprej. Kot lahko vidite, preprosto pomnožimo vrednost izida z njegovo verjetnostjo.

Odstopanje

Drug koncept, ki je tesno povezan z disperzijo in matematičnim pričakovanjem, je standardni odklon. Označeno je tudi z latinskimi črkami sd ali grška mala "sigma". Ta koncept kaže, kako v povprečju vrednosti odstopajo od osrednja značilnost. Če želite ugotoviti njegovo vrednost, morate izračunati Kvadratni koren iz razpršenosti.

Če narišete normalno porazdelitev in želite videti neposredno na njej standardni odklon, to je mogoče storiti v več korakih. Vzemite polovico slike levo ali desno od mode ( osrednjega pomena), narišite pravokotno na vodoravno os, tako da so površine dobljenih številk enake. Vrednost segmenta med sredino porazdelitve in nastalo projekcijo na vodoravno os bo standardni odklon.

Programska oprema

Kot je razvidno iz opisov formul in predstavljenih primerov, izračun variance in matematičnega pričakovanja z aritmetičnega vidika ni najlažji postopek. Da ne bi izgubljali časa, je smiselno uporabiti program, ki se uporablja v višjih izobraževalne ustanove- imenuje se "R". Ima funkcije, ki vam omogočajo izračun vrednosti za številne koncepte iz statistike in teorije verjetnosti.

Na primer, definirate vektor vrednosti. To se naredi na naslednji način: vektor<-c(1,5,2…). Теперь, когда вам потребуется посчитать какие-либо значения для этого вектора, вы пишете функцию и задаете его в качестве аргумента. Для нахождения дисперсии вам нужно будет использовать функцию var. Пример её использования: var(vector). Далее вы просто нажимаете «ввод» и получаете результат.

končno

Razpršenost in matematično pričakovanje sta brez katerih je v prihodnosti težko kaj izračunati. V glavnem tečaju predavanj na univerzah se upoštevajo že v prvih mesecih študija predmeta. Prav zaradi nerazumevanja teh enostavnih pojmov in nezmožnosti njihovega izračuna mnogi študenti takoj začnejo zaostajati v programu in kasneje dobijo slabe ocene na seji, zaradi česar so prikrajšani za štipendijo.

Vadite vsaj en teden po pol ure na dan in rešujete naloge, podobne tistim, ki so predstavljene v tem članku. Nato se boste na katerem koli testu teorije verjetnosti spopadli s primeri brez tujih nasvetov in goljufij.

Disperzijanaključna spremenljivka- merilo disperzije danega naključna spremenljivka, torej njo odstopanja iz matematičnega pričakovanja. V statistiki se zapis (sigma na kvadrat) pogosto uporablja za označevanje variance. Kvadratni koren variance se imenuje standardni odklon ali standardni namaz. Standardni odklon se meri v istih enotah kot naključna spremenljivka sama, varianca pa se meri v kvadratih te enote.

Čeprav je za oceno celotnega vzorca zelo priročno uporabiti samo eno vrednost (kot sta povprečje ali način in mediana), lahko ta pristop zlahka pripelje do napačnih zaključkov. Razlog za to stanje ni v sami vrednosti, ampak v tem, da ena vrednost nikakor ne odraža razpršenosti vrednosti podatkov.

Na primer, v vzorcu:

povprečje je 5.

Vendar pa v samem vzorcu ni elementa z vrednostjo 5. Morda boste morali vedeti, kako blizu je vsak element vzorca svoji srednji vrednosti. Ali z drugimi besedami, morate poznati variance vrednosti. Če veste, v kolikšni meri so se podatki spremenili, jih lahko bolje interpretirate pomeni, mediana in moda. Stopnjo spremembe vrednosti vzorcev določimo z izračunom njihove variance in standardnega odklona.



Varianca in kvadratni koren variance, imenovana standardna deviacija, označujeta povprečno odstopanje od vzorčne sredine. Med tema dvema količinama je najpomembnejša standardni odklon. To vrednost lahko predstavimo kot povprečno razdaljo, na kateri so elementi od srednjega elementa vzorca.

Razpršenost je težko smiselno razlagati. Vendar je kvadratni koren te vrednosti standardni odmik in je primeren za razlago.

Standardni odklon se izračuna tako, da se najprej določi varianca in nato izračuna kvadratni koren variance.

Na primer, za podatkovno matriko, prikazano na sliki, bodo pridobljene naslednje vrednosti:

Slika 1

Tukaj je povprečje kvadratov razlik 717,43. Če želite dobiti standardno deviacijo, je treba vzeti samo kvadratni koren tega števila.

Rezultat bo približno 26,78.

Ne smemo pozabiti, da se standardni odklon razlaga kot povprečna razdalja, na kateri so elementi od srednje vrednosti vzorca.

Standardna deviacija kaže, kako dobro povprečje opisuje celoten vzorec.

Recimo, da ste vodja proizvodnega oddelka za sestavljanje osebnega računalnika. Četrtletno poročilo pravi, da je bila proizvodnja v zadnjem četrtletju 2500 osebnih računalnikov. Je slabo ali dobro? Zahtevali ste (ali ta stolpec že obstaja v poročilu) za prikaz standardnega odmika za te podatke v poročilu. Številka standardnega odklona je na primer 2000. Kot vodji oddelka vam postane jasno, da je treba proizvodno linijo bolje nadzorovati (prevelika odstopanja v številu računalnikov, ki se sestavljajo).

Spomnimo se, da ko je standardni odklon velik, so podatki močno razpršeni okoli povprečja, ko pa je standardni odklon majhen, se zberejo blizu srednje vrednosti.

Štiri statistične funkcije VAR(), VAR(), STDEV() in STDEV() so zasnovane za izračun variance in standardnega odklona števil v obsegu celic. Preden lahko izračunate varianco in standardni odklon nabora podatkov, morate ugotoviti, ali podatki predstavljajo populacijo ali vzorec populacije. V primeru vzorca iz splošne populacije je treba uporabiti funkciji VARP() in STDEV(), v primeru splošne populacije pa funkciji VARP() in STDEV():

Prebivalstvo Funkcija

VARP()

STDLONG()
Vzorec

VARI()

STDEV()

Disperzija (kot tudi standardna deviacija), kot smo omenili, označuje obseg, v katerem so vrednosti, vključene v nabor podatkov, razpršene okoli aritmetične sredine.

Majhna vrednost variance ali standardnega odklona kaže, da so vsi podatki skoncentrirani okoli aritmetične sredine, velika vrednost teh vrednosti pa, da so podatki razpršeni v širokem razponu vrednosti.

Razpršitev je precej težko smiselno razlagati (kaj pomeni majhna vrednost, velika vrednost?). Izvedba Naloge 3 vam omogoča, da na grafu vizualno prikažete pomen variance za nabor podatkov.

Naloge

· vaja 1.

· 2.1. Podajte pojma: variance in standardne deviacije; njihovo simbolno označevanje pri statistični obdelavi podatkov.

· 2.2. Narišite delovni list v skladu s sliko 1 in naredite potrebne izračune.

· 2.3. Navedite osnovne formule, uporabljene pri izračunih

· 2.4. Pojasni vse zapise ( , , )

· 2.5. Pojasnite praktični pomen koncepta variance in standardnega odklona.

2. naloga.

1.1. Podajte pojma: splošna populacija in vzorec; matematično pričakovanje in aritmetično sredino njihovega simbolnega označevanja pri statistični obdelavi podatkov.

1.2. V skladu s sliko 2 sestavite delovni list in naredite izračune.

1.3. Navedite osnovne formule, uporabljene pri izračunih (za splošno populacijo in vzorec).

Slika 2

1.4. Pojasnite, zakaj je v vzorcih 46,43 in 48,78 mogoče pridobiti takšne aritmetične srednje vrednosti (glejte prilogo). Za zaključek.

3. naloga.

Obstajata dva vzorca z različnim naborom podatkov, vendar bo povprečje zanje enako:

Slika 3

3.1. Narišite delovni list v skladu s sliko 3 in naredite potrebne izračune.

3.2. Navedite osnovne formule za izračun.

3.3. Zgradite grafe v skladu s slikami 4, 5.

3.4. Pojasnite nastale odvisnosti.

3.5. Izvedite podobne izračune za ta dva vzorca.

Začetni vzorec 11119999

Izberite vrednosti drugega vzorca tako, da bo aritmetična sredina za drugi vzorec enaka, na primer:

Vrednosti za drugi vzorec izberite sami. Razporedite izračune in risanje kot slike 3, 4, 5. Pokažite glavne formule, ki so bile uporabljene pri izračunih.

Naredite ustrezne zaključke.

Vse naloge naj bodo predstavljene v obliki poročila z vsemi potrebnimi številkami, grafi, formulami in kratkimi pojasnili.

Opomba: gradnjo grafov je treba razložiti s slikami in kratkimi razlagami.