Simbol x je standardni odklon. Disperzija, koren srednjega kvadrata (standardni) odklon, koeficient variacije

Treba je opozoriti, da ima ta izračun variance pomanjkljivost - izkaže se pristransko, tj. njegovo matematično pričakovanje ni enako resnični vrednosti variance. Več o tem. Hkrati pa ni vse tako slabo. S povečanjem velikosti vzorca se kljub temu približa svojemu teoretičnemu analogu, tj. je asimptotično nenaklonjen. Zato lahko pri delu z velikimi vzorci uporabite zgornjo formulo.

Znakovni jezik je koristen za prevajanje v jezik besed. Izkazalo se je, da je varianca srednji kvadrat odstopanj. To pomeni, da se najprej izračuna povprečje, nato se razlika med vsakim izvirnikom in povprečjem vzame, postavi na kvadrat, doda in nato deli s številom vrednosti v populaciji. Razlika med posamezno vrednostjo in srednjo vrednostjo odraža mero odstopanja. Kvadrirano je tako, da vsa odstopanja postanejo izključno pozitivna števila in da se izognemo medsebojnemu uničenju pozitivnih in negativnih odstopanj, ko se seštejejo. Nato s kvadratki odstopanj preprosto izračunamo aritmetično sredino. Povprečje - kvadrat - odstopanja. Odstopanja so na kvadrat in upošteva se povprečje. Odgovor se skriva v samo treh besedah.

Vendar se v čisti obliki, kot je aritmetična sredina ali indeks, varianca ne uporablja. Je precej pomožni in vmesni kazalnik, ki je potreben za druge vrste statističnih analiz. Nima niti običajne merske enote. Sodeč po formuli je to kvadrat merske enote prvotnih podatkov. Brez steklenice, kot pravijo, ne morete ugotoviti.

(modul 111)

Da bi varianco vrnili v resničnost, torej jo uporabili za bolj vsakdanje namene, se iz nje izvleče kvadratni koren. Izkazalo se je tako imenovano standardni odklon (RMS)... Obstajajo imena "standardni odklon" ali "sigma" (iz imena grške črke). Formula standardnega odklona je:

Za pridobitev tega kazalnika za vzorec uporabite formulo:

Tako kot pri varianti obstaja tudi nekoliko drugačna možnost izračuna. A ko vzorec raste, razlika izgine.

Standardni odklon očitno opisuje tudi mero podatkov o razprševanju, vendar ga je zdaj (v nasprotju z razpršenostjo) mogoče primerjati s prvotnimi podatki, saj imajo te enote enake vrednosti (kot je razvidno iz formul za izračun). Toda tudi ta indikator v svoji čisti obliki ni preveč informativen, saj vsebuje preveč vmesnih izračunov, ki so zmedeni (odstopanje, kvadrat, vsota, povprečje, koren). Kljub temu je že mogoče neposredno delati s standardnim odklonom, ker so lastnosti tega kazalnika dobro preučene in znane. Na primer, obstaja taka pravilo treh sigm, ki navaja, da imajo podatki 997 od 1000 vrednosti, ki so znotraj ± 3 sigme aritmetične sredine. Standardni odklon je kot merilo negotovosti vključen tudi v številne statistične izračune. Z njeno pomočjo se ugotovi stopnja natančnosti različnih ocen in napovedi. Če je variacija zelo velika, se bo izkazalo, da je tudi standardni odklon velik, zato bo napoved netočna, kar bo na primer izraženo v zelo širokih intervalih zaupanja.

Koeficient variacije

Standardni odklon daje absolutno oceno mere širjenja. Zato je za razumevanje, kako velik je razpon glede na same vrednosti (tj. Ne glede na njihovo lestvico), potreben relativni kazalnik. Ta indikator se imenuje koeficient variacijein se izračuna po naslednji formuli:

Koeficient variacije se meri v odstotkih (če se pomnoži s 100%). Ta kazalnik lahko uporabimo za primerjavo različnih pojavov, ne glede na njihov obseg in merske enote. Zaradi tega je koeficient variacije tako priljubljen.

V statistiki je sprejeto, da če je vrednost koeficienta variacije manjša od 33%, potem populacija velja za homogeno, če je večja od 33%, pa je heterogena. Tukaj nekaj težko komentiram. Ne vem, kdo in zakaj je to opredelil tako, toda to velja za aksiom.

Čutim, da me odnese suha teorija in moram prinesti nekaj jasnega in figurativnega. Po drugi strani pa vsi kazalniki variacije opisujejo približno isto stvar, le da se izračunajo drugače. Zato je težko zasijati z različnimi primeri, razlikujejo se lahko le vrednosti kazalnikov, ne pa tudi njihovo bistvo. Torej, primerjajmo, kako se vrednosti različnih kazalnikov variacije razlikujejo za isti nabor podatkov. Vzemimo primer z izračunom srednjega linearnega odklona (od). Tu so surovi podatki:

In urnik za opomnik.

Na podlagi teh podatkov izračunamo različne kazalnike variacije.

Srednja vrednost je običajna aritmetična sredina.

Območje variacije je razlika med visokim in najnižjim:

Povprečni linearni odklon se izračuna po formuli:

Standardni odklon:

Izračun bomo strnili v tabelo.

Kot je razvidno, linearno povprečje in standardni odklon dajeta podobne vrednosti stopnje variacije podatkov. Variacija je na kvadrat sigma, zato bo vedno relativno veliko število, kar v resnici ne pomeni ničesar. Območje variacije je razlika med skrajnimi vrednostmi in lahko pove veliko.

Povzemimo nekaj rezultatov.

Razlike v kazalniku odražajo spremenljivost procesa ali pojava. Njeno stopnjo lahko izmerimo z več kazalniki.

1. Obseg variacije je razlika med visokim in nizkim. Odraža vrsto možnih vrednosti.
2. Povprečni linearni odmik - odraža povprečje absolutnih (modulo) odstopanj vseh vrednosti analizirane populacije od njihovega povprečja.
3. Disperzija - srednji kvadrat odklonov.
4. Standardni odklon je koren variance (povprečni kvadratni odklon).
5. Koeficient variacije je najbolj univerzalni kazalnik, ki odraža stopnjo razpršenosti vrednosti ne glede na njihovo lestvico in merske enote. Koeficient variacije se meri v odstotkih in se lahko uporablja za primerjavo variacij različnih procesov in pojavov.

Tako v statistični analizi obstaja sistem kazalnikov, ki odražajo homogenost pojavov in stabilnost procesov. Kazalniki variacij pogosto nimajo samostojnega pomena in se uporabljajo za nadaljnjo analizo podatkov (izračun intervalov zaupanja

Pri statističnem preverjanju hipotez z merjenjem linearnega razmerja med naključnimi spremenljivkami.

Standardni odklon:

Standardni odklon (Ocena standardnega odklona naključne spremenljivke Tla, stene in strop okoli nas, x glede na njegovo matematično pričakovanje na podlagi nepristranske ocene njegove variance):

kje je varianca; - tla, stene okoli nas in strop, jaz th element vzorca; - Velikost vzorca; - aritmetična sredina vzorca:

Treba je opozoriti, da sta obe oceni pristranski. V splošnem primeru je nemogoče izdelati nepristransko oceno. Vendar je ocena, ki temelji na oceni nepristranske variance, skladna.

Pravilo treh sigm

Pravilo treh sigm () - skoraj vse vrednosti normalno porazdeljene naključne spremenljivke ležijo v intervalu. Natančneje - z najmanj 99,7% zaupanjem leži vrednost običajno porazdeljene naključne spremenljivke v določenem intervalu (pod pogojem, da je vrednost resnična in ni pridobljena kot rezultat obdelave vzorca).

Če resnična vrednost ni znana, potem ne bi smeli uporabljati, ampak tla, stene okoli nas in strop, s ... Tako se pravilo treh sigm spremeni v pravilo treh nadstropij, sten okoli nas in stropa, s .

Razlaga vrednosti standardnega odklona

Velika vrednost standardnega odklona kaže velik razpon vrednosti v predstavljenem nizu s povprečno vrednostjo niza; majhna vrednost torej pomeni, da so vrednosti v nizu razvrščene okoli srednje vrednosti.

Na primer, imamo tri nabore številk: (0, 0, 14, 14), (0, 6, 8, 14) in (6, 6, 8, 8). Vsi trije nizi povprečnih vrednosti so enaki 7, standardni odkloni pa 7, 5 in 1. Slednji ima množico, standardni odklon pa je majhen, saj so vrednosti v nizu zbrane okrog srednje vrednosti; prvi niz ima največji standardni odklon - vrednosti znotraj niza se močno razlikujejo od povprečja.

Na splošno lahko standardni odklon štejemo za merilo negotovosti. Na primer, v fiziki se s standardnim odklonom ugotovi napaka niza zaporednih meritev veličine. Ta vrednost je zelo pomembna za določitev verjetnosti preučevanega pojava v primerjavi s predvideno vrednostjo teorije, če se povprečna vrednost meritve močno razlikuje od vrednosti, ki jih napoveduje teorija (vrednost velikega standardnega odklona), potem je treba pridobljene vrednosti ali način njihove priprave ponovno preveriti.

Praktična uporaba

V praksi standardni odklon omogoča določanje, koliko se vrednosti v nizu lahko razlikujejo od povprečja.

Podnebje

Recimo, da obstajata dve mesti z enako povprečno dnevno maksimalno temperaturo, vendar je eno na obali, drugo pa v notranjosti. Znano je, da imajo obalna mesta veliko različnih najvišjih dnevnih temperatur manj kot v celinskih mestih. Zato bo standardni odklon najvišjih dnevnih temperatur za obalno mesto manjši od tistega za drugo mesto, kljub temu da imajo enako povprečno vrednost te vrednosti, kar v praksi pomeni, da bo verjetnost, da bo najvišja temperatura zraka vsakega določenega dneva leta močnejša razlikujejo od povprečja, višje za mesto v notranjosti celine.

Šport

Recimo, da obstaja več nogometnih ekip, ki se ocenjujejo glede na določen niz parametrov, na primer število doseženih in prejetih golov, možnosti za zadetek itd. Najboljša ekipa v tej skupini ima najverjetneje najboljše vrednosti v več parametrih. Manj kot ima ekipa standardni odklon za vsakega od predstavljenih parametrov, bolj predvidljiv je rezultat ekipe, takšne ekipe so uravnotežene. Po drugi strani pa je težko napovedati rezultat za moštvo z veliko vrednostjo standardnega odklona, \u200b\u200bkar pa je posledica neravnovesij, na primer močne obrambe, a šibkega napada.

Uporaba standardnega odklona parametrov ekipe omogoča v takšni ali drugačni meri napovedovanje rezultata dvoboja med dvema ekipama, ocenjevanje moči in slabosti ekip ter s tem izbrane metode boja.

Tehnična analiza

Poglej tudi

Literatura

* Borovikov, V. STATISTICA. Umetnost analize podatkov v računalniku: Za strokovnjake / V. Borovikov. - SPb. : Peter, 2003. - 688 str. - ISBN 5-272-00078-1.

Program Excel zelo cenijo tako strokovnjaki kot amaterji, saj lahko z njim dela kateri koli uporabnik. Na primer, kdor ima minimalne "komunikacijske" sposobnosti z Excelom, lahko nariše preprost graf, naredi spodoben znak itd.

Hkrati vam ta program omogoča celo izvajanje različnih vrst izračunov, na primer izračun, vendar to zahteva nekoliko drugačno stopnjo usposobljenosti. Če pa ste pravkar začeli tesno spoznavati ta program in vas zanima vse, kar vam bo pomagalo postati naprednejši uporabnik, je ta članek za vas. Danes vam bom povedal, kakšen je standardni odklon formule v Excelu, zakaj je sploh potrebna in pravzaprav kdaj se uporablja. Pojdi!

Kaj je

Začnimo s teorijo. Standardni odklon se običajno imenuje kvadratni koren, dobljen iz aritmetične sredine vseh kvadratov razlik med razpoložljivimi količinami in njihove aritmetične sredine. Mimogrede, tej vrednosti se običajno reče grška črka "sigma". Standardni odklon se izračuna po formuli STDEV, program pa to naredi za uporabnika samega.

Bistvo tega koncepta je ugotoviti stopnjo spremenljivosti instrumenta, to je na svoj način indikator iz opisne statistike. V katerem koli časovnem obdobju zazna spremembe nestanovitnosti instrumenta. Formule STDEV lahko uporabimo za oceno standardnega odklona vzorca, pri čemer ignoriramo logične in besedilne vrednosti.

Formula

Pomaga pri izračunu standardnega odklona v Excelovi formuli, ki je samodejno na voljo v Excelu. Če ga želite najti, morate v Excelu poiskati razdelek formule in že tam izbrati tistega, ki ima ime STDEV, zato je zelo preprosto.

Po tem se pred vami prikaže okno, v katerem boste morali vnesti podatke za izračun. V posebna polja je treba vnesti zlasti dve številki, po katerih bo program samodejno izračunal standardni odklon za vzorec.

Nedvomno so matematične formule in izračuni precej zapleteno vprašanje in vsi uporabniki se z njim ne morejo spopasti sproti. Kljub temu, če se malo poglobite in težavo razumete nekoliko podrobneje, se izkaže, da ni vse tako žalostno. Upam, da ste o tem prepričani na primeru izračuna standardnega odklona.

Video za pomoč

Pri statističnem preverjanju hipotez z merjenjem linearnega razmerja med naključnimi spremenljivkami.

Standardni odklon:

Standardni odklon (Ocena standardnega odklona naključne spremenljivke Tla, stene in strop okoli nas, x glede na njegovo matematično pričakovanje na podlagi nepristranske ocene njegove variance):

kje je varianca; - tla, stene okoli nas in strop, jaz th element vzorca; - Velikost vzorca; - aritmetična sredina vzorca:

Treba je opozoriti, da sta obe oceni pristranski. V splošnem primeru je nemogoče izdelati nepristransko oceno. Vendar je ocena, ki temelji na oceni nepristranske variance, skladna.

Pravilo treh sigm

Pravilo treh sigm () - skoraj vse vrednosti normalno porazdeljene naključne spremenljivke ležijo v intervalu. Natančneje - z najmanj 99,7% zaupanjem leži vrednost običajno porazdeljene naključne spremenljivke v določenem intervalu (pod pogojem, da je vrednost resnična in ni pridobljena kot rezultat obdelave vzorca).

Če resnična vrednost ni znana, potem ne bi smeli uporabljati, ampak tla, stene okoli nas in strop, s ... Tako se pravilo treh sigm spremeni v pravilo treh nadstropij, sten okoli nas in stropa, s .

Razlaga vrednosti standardnega odklona

Velika vrednost standardnega odklona kaže velik razpon vrednosti v predstavljenem nizu s povprečno vrednostjo niza; majhna vrednost torej pomeni, da so vrednosti v nizu razvrščene okoli srednje vrednosti.

Na primer, imamo tri nabore številk: (0, 0, 14, 14), (0, 6, 8, 14) in (6, 6, 8, 8). Vsi trije nizi povprečnih vrednosti so enaki 7, standardni odkloni pa 7, 5 in 1. Slednji ima množico, standardni odklon pa je majhen, saj so vrednosti v nizu zbrane okrog srednje vrednosti; prvi niz ima največji standardni odklon - vrednosti znotraj niza se močno razlikujejo od povprečja.

Na splošno lahko standardni odklon štejemo za merilo negotovosti. Na primer, v fiziki se s standardnim odklonom ugotovi napaka niza zaporednih meritev veličine. Ta vrednost je zelo pomembna za določitev verjetnosti preučevanega pojava v primerjavi s predvideno vrednostjo teorije, če se povprečna vrednost meritve močno razlikuje od vrednosti, ki jih napoveduje teorija (vrednost velikega standardnega odklona), potem je treba pridobljene vrednosti ali način njihove priprave ponovno preveriti.

Praktična uporaba

V praksi standardni odklon omogoča določanje, koliko se vrednosti v nizu lahko razlikujejo od povprečja.

Podnebje

Recimo, da obstajata dve mesti z enako povprečno dnevno maksimalno temperaturo, vendar je eno na obali, drugo pa v notranjosti. Znano je, da imajo obalna mesta veliko različnih najvišjih dnevnih temperatur manj kot v celinskih mestih. Zato bo standardni odklon najvišjih dnevnih temperatur za obalno mesto manjši od tistega za drugo mesto, kljub temu da imajo enako povprečno vrednost te vrednosti, kar v praksi pomeni, da bo verjetnost, da bo najvišja temperatura zraka vsakega določenega dneva leta močnejša razlikujejo od povprečja, višje za mesto v notranjosti celine.

Šport

Recimo, da obstaja več nogometnih ekip, ki se ocenjujejo glede na določen niz parametrov, na primer število doseženih in prejetih golov, možnosti za zadetek itd. Najboljša ekipa v tej skupini ima najverjetneje najboljše vrednosti v več parametrih. Manj kot ima ekipa standardni odklon za vsakega od predstavljenih parametrov, bolj predvidljiv je rezultat ekipe, takšne ekipe so uravnotežene. Po drugi strani pa je težko napovedati rezultat za moštvo z veliko vrednostjo standardnega odklona, \u200b\u200bkar pa je posledica neravnovesij, na primer močne obrambe, a šibkega napada.

Uporaba standardnega odklona parametrov ekipe omogoča v takšni ali drugačni meri napovedovanje rezultata dvoboja med dvema ekipama, ocenjevanje moči in slabosti ekip ter s tem izbrane metode boja.

Tehnična analiza

Poglej tudi

Literatura

* Borovikov, V. STATISTICA. Umetnost analize podatkov v računalniku: Za strokovnjake / V. Borovikov. - SPb. : Peter, 2003. - 688 str. - ISBN 5-272-00078-1.

X i -naključne (trenutne) vrednosti;

srednja vrednost naključnih spremenljivk v vzorcu, izračunana po formuli:

Torej, varianca je srednji kvadrat odstopanj ... To pomeni, da se najprej izračuna povprečna vrednost razlika med vsako osnovno črto in povprečjem, na kvadrat , se doda in nato deli s številom vrednosti v dani populaciji.

Razlika med posamezno vrednostjo in srednjo vrednostjo odraža mero odstopanja. Kvadrirano je tako, da vsa odstopanja postanejo izključno pozitivna števila in da se izognemo medsebojnemu uničenju pozitivnih in negativnih odstopanj, ko se seštejejo. Nato s kvadratki odstopanj preprosto izračunamo aritmetično sredino.

Odgovor na čarobno besedo "varianca" leži prav v teh treh besedah: povprečje - kvadrat - odstopanja.

Povprečni kvadratni odklon (RMS)

Če vzamemo kvadratni koren variance, dobimo tako imenovano " korensko povprečje kvadratnega odstopanja ".Obstajajo imena "Standardni odklon" ali "sigma" (iz imena grške črke σ .). Formula za srednji kvadratni odklon je:

Torej, varianca je na kvadrat sigma ali pa na kvadrat standardni odklon.

Standardni odklon je očitno tudi značilnost podatkov o disperzijski meritvi, vendar ga je zdaj (v nasprotju z disperzijo) mogoče primerjati s prvotnimi podatki, saj imajo te enote enake vrednosti (kot je razvidno iz formul za izračun). Območje variacije je razlika med skrajnimi vrednostmi. Standardni odklon je kot merilo negotovosti vključen tudi v številne statistične izračune. Z njeno pomočjo se ugotovi stopnja natančnosti različnih ocen in napovedi. Če je variacija zelo velika, se bo izkazalo, da je tudi standardni odklon velik, zato bo napoved netočna, kar bo na primer izraženo v zelo širokih intervalih zaupanja.

Zato se pri metodah statistične obdelave podatkov pri ocenah nepremičninskih predmetov uporablja pravilo dveh ali treh sigm, odvisno od zahtevane natančnosti naloge.

Za primerjavo pravila dveh sigm in pravila treh sigm uporabimo Laplaceovo formulo:

Ž - Ž,

kjer je Ф (x) Laplaceova funkcija;



Najmanjša vrednost

β \u003d največja vrednost

s \u003d vrednost sigme (standardni odklon)

a \u003d povprečje

V tem primeru se uporabi posebna oblika Laplaceove formule, kadar sta meji α in β vrednosti naključne spremenljivke X enakomerno oddaljeni od distribucijskega središča a \u003d M (X) za neko vrednost d: a \u003d a-d, b \u003d a + d. Ali (1) Formula (1) določa verjetnost danega odstopanja naključne spremenljivke X z normalnim zakonom porazdelitve od njenega matematičnega pričakovanja M (X) \u003d a. Če v formuli (1) vzamemo zaporedoma d \u003d 2s in d \u003d 3s, potem dobimo: (2), (3).

Pravilo dveh sigm

Skoraj bistveno (s stopnjo zaupanja 0,954) lahko trdimo, da vse vrednosti naključne spremenljivke X z normalnim zakonom porazdelitve odstopajo od njenega matematičnega pričakovanja M (X) \u003d a za znesek, ki ni večji od 2 s (dva standardna odklona). Verjetnost zaupanja (Pd) je verjetnost dogodkov, ki se običajno štejejo za zanesljive (njihova verjetnost je blizu 1).

Ponazorimo pravilo dveh sigm geometrijsko. Na sl. 6 prikazuje Gaussovo krivuljo z distribucijskim središčem a. Območje, ki ga omejujeta celotna krivulja in os Ox, je 1 (100%), površina ukrivljenega trapeza med abscisama a - 2s in a + 2s pa je po pravilu dveh sigm 0,954 (95,4% celotne površine). Površina zasenčenih površin je 1-0,954 \u003d 0,046 ("5% celotne površine). Ta območja se imenujejo kritično območje vrednosti naključne spremenljivke. Vrednosti naključne spremenljivke, ki pade v kritično območje, so malo verjetne in v praksi običajno veljajo za nemogoče.

Verjetnost pogojno nemogočih vrednosti se imenuje raven pomembnosti naključne spremenljivke. Stopnja pomembnosti je s stopnjo zaupanja povezana s formulo:

kjer je q stopnja pomembnosti, izražena v odstotkih.

Pravilo treh sigm

Pri reševanju vprašanj, ki zahtevajo večjo zanesljivost, ko je verjetnost zaupanja (Pd) enaka 0,997 (natančneje - 0,9973), se namesto pravila dveh sigm v skladu s formulo (3) uporablja pravilo tri sigme.



Po navedbah pravilo treh sigm s stopnjo zaupanja 0,9973 bo kritično območje območje vrednosti lastnosti zunaj intervala (a-3s, a + 3s). Stopnja pomembnosti je 0,27%.

Z drugimi besedami, verjetnost, da absolutna vrednost odstopanja trikrat presega standardni odklon, je zelo majhna, in sicer 0,0027 \u003d 1-0,9973. To pomeni, da se to lahko zgodi le v 0,27% primerov. Takšne dogodke, ki izhajajo iz načela nemožnosti verjetnih dogodkov, lahko štejemo za praktično nemogoče. Tisti. vzorec je zelo natančen.

To je bistvo pravila treh sigm:

Če je naključna spremenljivka običajno porazdeljena, potem absolutna vrednost njenega odstopanja od matematičnega pričakovanja ne presega trikratnega standardnega odklona (RMSD).

V praksi se pravilo treh sigm uporablja na naslednji način: če je porazdelitev preučevane naključne spremenljivke neznana, vendar je izpolnjen pogoj, naveden v zgornjem pravilu, to pomeni, da obstaja razlog za domnevo, da je preučevana spremenljivka običajno porazdeljena; v nasprotnem primeru se običajno ne distribuira.

Stopnja pomembnosti se upošteva glede na dovoljeno stopnjo tveganja in nalogo. Za vrednotenje nepremičnin se navadno sprejme manj natančen vzorec po pravilu dveh sigm.