Simbol x ravnate odstupanje. Disperzija, rms (standardno) devijacija, koeficijent varijacije

Važno je napomenuti da ovaj izračun disperzije ima nedostatak - ispada se pomaknuti, tj. Njegov matematički očekivanje nije jednako pravom značenju disperzije. Više o tome. U isto vrijeme, nije sve tako loše. Uz povećanje volumena uzorka, ona se još uvijek približava njenom teoretskom analognom, tj. je asimptotski ne raseljena. Stoga, kada radite s velikim veličinama uzoraka, možete koristiti formulu iznad.

Jezik znakova koristan je za prevođenje na jezik riječi. Ispada da je disperzija srednji kvadrat odstupanja. To je, na početku se izračunava prosječna vrijednost, zatim se razlika između svakog izvora i prosječne vrijednosti, podignuta je na kvadrat, ona je također podijeljena na broj vrijednosti u ovom skupu. Razlika između pojedinačne vrijednosti i prosjeka odražava mjeru odstupanja. Trg je izgrađen kako bi se osiguralo da sva odstupanja postanu ekstremno pozitivne brojeve i kako bi se izbjeglo međusobno povezivanje pozitivnih i negativnih odstupanja kada ih sažete. Zatim, s kvadratima odstupanja, jednostavno izračunamo prosječnu aritmetiku. Srednje četvrt - odstupanja. Odstupanja su povišena na kvadratu, a prosječno se razmatra. Rješenje je samo tri riječi.

Međutim, u čistom obliku, kao što je prosječna aritmetika ili indeks, ne koristi se disperzija. To je prilično pomoćni i međuproizvodni pokazatelj, koji je potreban za druge vrste statističke analize. Čak nema normalne jedinice. Sudeći po formuli, to je kvadrat mjerenja izvornih podataka. Bez boce, kao što kažu, nećete razumjeti.

(Modul 111)

Kako bi se disperzija vratila u stvarnost, to jest, da se koristi u više uzemljenih svrha, kvadratni korijen iz nje. Ispada takozvano rMS devijacija (skate), Postoje imena "standardna devijacija" ili "sigma" (s imena grčkog pisma). Formula standardnog devijacije ima oblik:

Da biste dobili ovaj pokazatelj na uzorku, koristite formulu:

Kao i kod disperzije, postoji nešto drugačija opcija izračuna. Ali s rastom uzorka, razlika nestaje.

Standardna devijacija, očito, također karakterizira mjeru raspršenja podataka, ali sada (za razliku od disperzije), može se usporediti s izvornim podacima, jer su oni isti za mjerenje (primjenjuje se iz izračuna formule). No, ovaj pokazatelj nije vrlo informativan u svom čistom obliku, budući da sadrži previše srednjih izračuna koji su zbunjeni (devijacija, kvadrat, količina, prosjek, korijen). Ipak, već je moguće izravno raditi sa standardnom devijacijom, jer su svojstva ovog pokazatelja dobro proučavana i poznata. Na primjer, postoji takav pravilo tri sigmaKoja navodi da su vrijednosti 997 vrijednosti od 1000 unutar ± 3 sigms iz srednje aritmetike. Standardna devijacija, kao mjera nesigurnosti, također je uključena u mnoge statističke izračune. Uz to, ona se određuje stupnjem točnosti različitih procjena i prognoza. Ako je varijacija vrlo velika, onda će standardna devijacija također dobiti veliki, dakle, prognoza će biti netočna, koja će izraziti, na primjer, u vrlo širokim intervalima pouzdanosti.

Koeficijent varijacije

Prosječna kvadratna devijacija daje apsolutnu procjenu mjerenja varijacije. Stoga, razumjeti koliko raspršivanja je veliko u odnosu na njihove vrijednosti (tj. Bez obzira na njihovu ljestvicu), potreban je relativni pokazatelj. Ovaj se pokazatelj zove varijacija koeficijentai izračunati prema sljedećoj formuli:

Koeficijent varijacije se mjeri kao postotak (ako se pomnožite 100%). Ovim pokazateljem možete usporediti najrazličitije pojave bez obzira na njihovu razmjeru i mjerne jedinice. Ova činjenica čini koeficijent varijacije tako popularan.

U statistici, prihvaćeno je da je vrijednost koeficijenta varijacije manja od 33%, agregat se smatra homogenim, ako je više od 33%, zatim nehomogeno. Teško mi je komentirati ovdje. Ne znam tko i zašto je tako odlučan, ali to se smatra aksiom.

Osjećam da sam se odnio suhom teorijom i morate dati nešto vizualno i figurativno. S druge strane, svi pokazatelji varijacije opisuju približno istu, samo izračunate na različite načine. Stoga je teško zasjati s različitim primjerima, samo se vrijednosti pokazatelja mogu razlikovati, ali ne i njihovu suštinu. Zato usporedite kako se vrijednosti različitih pokazatelja varijacije razlikuju za isti skup podataka. Uzmite primjer s izračunom prosječnog linearnog odstupanja (od). Ovdje su izvorni podaci:

I grafikon za podsjetnik.

Prema tim podacima, izračunavamo različite pokazatelje varijacije.

Prosječna vrijednost je uobičajena prosječna aritmetika.

Varijacija varijacije je razlika između maksimalnog i minimalnog:

Prosječna linearna devijacija se smatra formulom:

Standardna devijacija:

Izračun smanjujemo znak.

Kao što se može vidjeti, prosječno linearno i RMS odstupanje je slično stupnju varijacije podataka. Disperzija je sigma na trgu, tako da će uvijek biti relativno veliki broj koji zapravo ne govori ništa. Varijacija varijacije je razlika između ekstremnih vrijednosti i može govoriti o mnogo toga.

Sažeti neke rezultate.

Varijacija indikatora odražava varijabilnost procesa ili fenomena. Njegov stupanj se može mjeriti pomoću nekoliko pokazatelja.

1. Varijacije varijacije - razlika između maksimalnog i minimalnog. Odražava raspon mogućih vrijednosti.
2. Prosječno linearno odstupanje - odražava prosjek apsolutnih (modula) odstupanja svih vrijednosti analiziranih agregata iz njihove prosječne veličine.
3. disperzija - srednji trg odstupanja.
4. Radijatralna devijacija - korijen iz disperzije (sredina kvadrata).
5. Koeficijent varijacije je najokrutniji pokazatelj koji odražava stupanj raspršenja vrijednosti bez obzira na njihovu ljestvicu i mjerne jedinice. Koeficijent varijacije se mjeri kao postotak i može se koristiti za usporedbu varijacije različitih procesa i pojava.

Dakle, u statističkoj analizi postoji sustav pokazatelja koji odražavaju homogenost fenomena i stabilnost procesa. Često indikatori varijacije nemaju neovisno značenje i koriste se za daljnju analizu podataka (izračun intervala pouzdanosti

S statističkom provjerom hipoteza, prilikom mjerenja linearni odnos između slučajnih vrijednosti.

R srednjovjekovni odstupanje:

Standardna devijacija (Procjena slučajnih slučajnih odstupanja podnog poda, zidove oko nas i strop, x. Što se tiče matematičkog očekivanja na temelju nedovoljne procjene njegove disperzije):

gdje - disperzija; - Paul, zidovi oko nas i strop, i. - uzorkovanje elemenata; - veličina uzorka; - prosječni aritmetički uzorak:

Treba napomenuti da su obje procjene offset. Općenito, nemogućna procjena je nemoguća. Međutim, procjena na temelju procijenjene disperzije je bogata.

Pravilo tri sigma

Pravilo tri sigma () - gotovo sve vrijednosti normalno raspoređene slučajne varijable leže u intervalu. Strogo - ne manje od 99,7% pouzdanost vrijednost normalne distribuirane slučajne varijable leži u navedenom intervalu (pod uvjetom da je vrijednost istinita, a ne dobivena kao rezultat obrade uzorka).

Ako je prava vrijednost nepoznata, to treba koristiti ne, a pod, zidove oko nas i strop, s. , Dakle, vladavina tri Sigms se pretvara u pravilo od tri metra, zidove oko nas i strop, s. .

Tumačenje veličine standardne devijacije

Velika vrijednost odstupanja RMS-a pokazuje veliku varijaciju vrijednosti u prikazanom skupu od prosječne vrijednosti skupa; Mala vrijednost, odnosno, ukazuje na to da su vrijednosti u skupu grupirane oko prosječne vrijednosti.

Na primjer, imamo tri numeričke skupove: (0, 0, 14, 14), (0, 6, 8, 14) i (6, 6, 8, 8). U sva tri seta, prosječne vrijednosti su 7, a srednja kvadratna odstupanja su 7, 5 i 1. U posljednjem setu, korijenska srednja kvadratna odstupanja je mala, od vrijednosti u set grupirani oko prosječne vrijednosti; Na prvom setu, najveća vrijednost RMS odstupanja je vrijednosti unutar postavljanja snažno odstupaju s prosječnom vrijednošću.

U općem smislu, standardna devijacija može se smatrati mjerom nesigurnosti. Na primjer, u fizici, regulatorno odstupanje se koristi za određivanje pogreške niza uzastopnih mjerenja bilo koje vrijednosti. Ova vrijednost je vrlo važna za određivanje uvjerenja proučavanog fenomena u usporedbi s predviđenom teorijom vrijednost: ako je prosječna mjerna vrijednost vrlo različita od predviđene teorije vrijednosti (velika vrijednost raspona srednjeg biranja), tada Dobivene vrijednosti ili metodu dobivanja trebaju se odvijati.

Praktična uporaba

U praksi, standardna devijacija vam omogućuje da odredite koliko se vrijednosti u skupu mogu razlikovati od prosječne vrijednosti.

Klima

Pretpostavimo da postoje dva grada s istom prosječnom maksimalnom dnevnom temperaturom, ali jedan se nalazi na obali, a drugi unutar kontinenta. Poznato je da su u gradovima smještenim na obali, mnoge različite maksimalne dnevne temperature manje od gradova koji se nalaze unutar kontinenta. Stoga će riconductic devijacija maksimalnih dnevnih temperatura u obalnom gradu biti manji od drugog grada, unatoč činjenici da prosječna vrijednost ove vrijednosti imaju isti, što u praksi znači da je vjerojatnost da je maksimalna temperatura zraka Svaki pojedini dan će biti jači od prosjeka, veći u gradu, koji se nalazi unutar kontinenta.

Sport

Pretpostavimo da postoji nekoliko nogometnih timova koji se procjenjuju na određenom skupu parametara, na primjer, broj postignutih i propuštenih glava, brojki bodovanja, itd. Najvjerojatnije je da će najbolja naredba u ovoj grupi imati bolje vrijednosti za više parametara. Što je manja zapovijed RMS odstupanja za svaki od prikazanih parametara, predvidljiva naredba je rezultat naredbe, takve naredbe su uravnotežene. S druge strane, tim s velikom srednjom vrijednošću standardne devijacije je teško predvidjeti rezultat, koji je zauzvrat zbog neravnoteže, na primjer, snažnu zaštitu, ali slab napad.

Korištenje standardne devijacije naredbenih parametara omogućuje vam u određenoj mjeri kako biste predvidjeli rezultat utakmice dvaju timova, procjenjujući prednosti i slabosti timova, te se stoga odabrali načine borbe.

Tehnička analiza

vidi također

Književnost

* Borovikov, V. Statistika. Umjetnost analize podataka na računalu: za profesionalce / V. Borovikov. - St. Petersburg. : Peter, 2003. - 688 str. - ISBN 5-272-00078-1.

Excel program je visoko cijenjen od strane stručnjaka i amatera, jer može raditi s njom korisnik bilo koje razine pripreme. Na primjer, svi s minimalnim vještinama "komunikacije" s Excelom mogu izvući jednostavan raspored, napraviti pristojnu ploču itd.

U isto vrijeme, ovaj program vam omogućuje da izvršite razne vrste izračuna, na primjer, izračun, ali već postoji nešto drugačija razina pripreme. Međutim, ako ste upravo počeli blisko poznavanje s ovim programom i zainteresirani ste za sve što će vam pomoći da postanete napredniji korisnik, ovaj članak je za vas. Danas ću vam reći da je to standardna devijacija formule u Excelu i zašto je to općenito potrebno i, zapravo, kada se primjenjuje. Ići!

Što je

Počnimo s teorijom. Srednja kvadratna devijacija se naziva kvadratni korijen dobiven iz prosječne aritmetike svih kvadrata razlika između postojećih vrijednosti, kao i njihove prosječne aritmetike. Usput, ova se veličina naziva grčko pismo "Sigma". Standardna devijacija izračunava se u samootlane formulu, odnosno, program to čini za korisnika.

Bit ovog koncepta je otkriti stupanj varijabilnosti instrumenata, odnosno, to je, u svojoj vrsti, pokazatelj je iz deskriptivne statistike. Ona otkriva promjene volatilnosti alata u bilo kojem vremenskom intervalu. Uz pomoć formule standotclone možete procijeniti standardne devijacije tijekom uzorka, a logičke i tekstualne vrijednosti se ignoriraju.

Formula

Pomaže izračunavanje prosječnog kvadratnog odstupanja u Excel formuli koja se automatski daje u programu Excel. Da biste ga pronašli, morate pronaći dio formule u Exceleu, a već postoji da odaberete onu koja ima ime stavona, tako da je vrlo jednostavno.

Nakon toga, pojavit će se ispred vas, u kojem trebate unijeti podatke za izračunavanje. Konkretno, u posebnim područjima unesite dva broja, nakon čega program sam izračunava standardnu \u200b\u200bdevijaciju uzorka.

Nesumnjivo, matematičke formule i izračuni - pitanje je prilično komplicirano, a ne svi korisnici iz pokreta mogu se nositi s njom. Ipak, ako pušite malo dublje i malo detaljnije u pitanju, ispostavilo se da nije sve tako tužno. Nadam se na primjer izračunavanja standardne devijacije, bili ste uvjereni u to.

Video za pomoć

S statističkom provjerom hipoteza, prilikom mjerenja linearni odnos između slučajnih vrijednosti.

R srednjovjekovni odstupanje:

Standardna devijacija (Procjena slučajnih slučajnih odstupanja podnog poda, zidove oko nas i strop, x. Što se tiče matematičkog očekivanja na temelju nedovoljne procjene njegove disperzije):

gdje - disperzija; - Paul, zidovi oko nas i strop, i. - uzorkovanje elemenata; - veličina uzorka; - prosječni aritmetički uzorak:

Treba napomenuti da su obje procjene offset. Općenito, nemogućna procjena je nemoguća. Međutim, procjena na temelju procijenjene disperzije je bogata.

Pravilo tri sigma

Pravilo tri sigma () - gotovo sve vrijednosti normalno raspoređene slučajne varijable leže u intervalu. Strogo - ne manje od 99,7% pouzdanost vrijednost normalne distribuirane slučajne varijable leži u navedenom intervalu (pod uvjetom da je vrijednost istinita, a ne dobivena kao rezultat obrade uzorka).

Ako je prava vrijednost nepoznata, to treba koristiti ne, a pod, zidove oko nas i strop, s. , Dakle, vladavina tri Sigms se pretvara u pravilo od tri metra, zidove oko nas i strop, s. .

Tumačenje veličine standardne devijacije

Velika vrijednost odstupanja RMS-a pokazuje veliku varijaciju vrijednosti u prikazanom skupu od prosječne vrijednosti skupa; Mala vrijednost, odnosno, ukazuje na to da su vrijednosti u skupu grupirane oko prosječne vrijednosti.

Na primjer, imamo tri numeričke skupove: (0, 0, 14, 14), (0, 6, 8, 14) i (6, 6, 8, 8). U sva tri seta, prosječne vrijednosti su 7, a srednja kvadratna odstupanja su 7, 5 i 1. U posljednjem setu, korijenska srednja kvadratna odstupanja je mala, od vrijednosti u set grupirani oko prosječne vrijednosti; Na prvom setu, najveća vrijednost RMS odstupanja je vrijednosti unutar postavljanja snažno odstupaju s prosječnom vrijednošću.

U općem smislu, standardna devijacija može se smatrati mjerom nesigurnosti. Na primjer, u fizici, regulatorno odstupanje se koristi za određivanje pogreške niza uzastopnih mjerenja bilo koje vrijednosti. Ova vrijednost je vrlo važna za određivanje uvjerenja proučavanog fenomena u usporedbi s predviđenom teorijom vrijednost: ako je prosječna mjerna vrijednost vrlo različita od predviđene teorije vrijednosti (velika vrijednost raspona srednjeg biranja), tada Dobivene vrijednosti ili metodu dobivanja trebaju se odvijati.

Praktična uporaba

U praksi, standardna devijacija vam omogućuje da odredite koliko se vrijednosti u skupu mogu razlikovati od prosječne vrijednosti.

Klima

Pretpostavimo da postoje dva grada s istom prosječnom maksimalnom dnevnom temperaturom, ali jedan se nalazi na obali, a drugi unutar kontinenta. Poznato je da su u gradovima smještenim na obali, mnoge različite maksimalne dnevne temperature manje od gradova koji se nalaze unutar kontinenta. Stoga će riconductic devijacija maksimalnih dnevnih temperatura u obalnom gradu biti manji od drugog grada, unatoč činjenici da prosječna vrijednost ove vrijednosti imaju isti, što u praksi znači da je vjerojatnost da je maksimalna temperatura zraka Svaki pojedini dan će biti jači od prosjeka, veći u gradu, koji se nalazi unutar kontinenta.

Sport

Pretpostavimo da postoji nekoliko nogometnih timova koji se procjenjuju na određenom skupu parametara, na primjer, broj postignutih i propuštenih glava, brojki bodovanja, itd. Najvjerojatnije je da će najbolja naredba u ovoj grupi imati bolje vrijednosti za više parametara. Što je manja zapovijed RMS odstupanja za svaki od prikazanih parametara, predvidljiva naredba je rezultat naredbe, takve naredbe su uravnotežene. S druge strane, tim s velikom srednjom vrijednošću standardne devijacije je teško predvidjeti rezultat, koji je zauzvrat zbog neravnoteže, na primjer, snažnu zaštitu, ali slab napad.

Korištenje standardne devijacije naredbenih parametara omogućuje vam u određenoj mjeri kako biste predvidjeli rezultat utakmice dvaju timova, procjenjujući prednosti i slabosti timova, te se stoga odabrali načine borbe.

Tehnička analiza

vidi također

Književnost

* Borovikov, V. Statistika. Umjetnost analize podataka na računalu: za profesionalce / V. Borovikov. - St. Petersburg. : Peter, 2003. - 688 str. - ISBN 5-272-00078-1.

X i -random (trenutne) vrijednosti;

X.prosječna vrijednost slučajnih varijabli po uzorku izračunava se formulom:

Tako, disperzija - ovo je srednji trg odstupanja , To jest, najprije je izračunao prosječnu vrijednost, onda uzima razlika između svakog izvora i prosječne vrijednosti podignuta je na kvadrat , nabori, a zatim podijeljeni brojem vrijednosti u ovoj populaciji.

Razlika između pojedinačne vrijednosti i prosjeka odražava mjeru odstupanja. Trg je izgrađen kako bi se osiguralo da sva odstupanja postanu ekstremno pozitivne brojeve i kako bi se izbjeglo međusobno povezivanje pozitivnih i negativnih odstupanja kada ih sažete. Zatim, s kvadratima odstupanja, jednostavno izračunamo prosječnu aritmetiku.

Utjecaj čarobne riječi "disperzija" je samo u ove tri riječi: prosjek je kvadratna odstupanja.

Prosječna kvadratna devijacija (brzina)

Uklanjanje kvadratnog korijena iz disperzije, dobivamo takozvani " radijsko devijacija. "Postoje imena "Standardna devijacija" ili "Sigma" (iz imena grčkog pisma σ ,). Formula srednjeg kvadratnog odstupanja ima oblik:

Tako, disperzija je sigma na kvadratu, ili - prosječna kvadratna devijacija na trgu.

RMS odstupanje, očito, također karakterizira mjeru disperzije podataka, ali sada (za razliku od disperzije) može se usporediti s izvornim podacima, budući da su oni isti za mjerenje (to je jasno iz formule za izračun). Varijacija varijacije je razlika između ekstremnih vrijednosti. Standardna devijacija, kao mjera nesigurnosti, također je uključena u mnoge statističke izračune. Uz to, ona se određuje stupnjem točnosti različitih procjena i prognoza. Ako je varijacija vrlo velika, onda će standardna devijacija također dobiti veliki, dakle, prognoza će biti netočna, koja će izraziti, na primjer, u vrlo širokim intervalima pouzdanosti.

Stoga, u metodama statističke obrade podataka u procjenama nekretnina objekata, ovisno o potrebnoj točnosti zadatka, koristite pravilo dviju ili tri SIGMS.

Za usporedbu, pravila dviju SIGM-a i pravila tri Sigma koriste laplace formulu:

F - f,

gdje je F (x) laplace funkcija;



Minimalna vrijednost

β \u003d maksimalna vrijednost

s \u003d Sigma vrijednost (srednja kvadratna devijacija)

a \u003d prosječna vrijednost

U tom slučaju, poseban pogled na laplace formulu se koristi kada granice α i β vrijednosti slučajne varijable x jednake su središtu distribucijskog centra A \u003d m (x) do neke vrijednosti D: a \u003d A - D, b \u003d a + d. Ili (1) Formula (1) određuje vjerojatnost danog odstupanja D slučajne varijable X s normalnim zakon o raspodjeli iz matematičkog očekivanja m (x) \u003d a. Ako u formuli (1) uzmite sekvencijalno D \u003d 2S i D \u003d 3S, onda dobivamo: (2), (3).

Pravilo dva sigma

Gotovo pouzdano (uz vjerojatnost povjerenja od 0,954) može se tvrditi da su sve vrijednosti slučajne vrijednosti X s normalnim zakonom distribucije odstupaju iz matematičkog očekivanja M (x) \u003d po veličini, ne veći od 2S (dva srednja kvadratna odstupanja). Povjerljiva vjerojatnost (Pd) poziva vjerojatnost događaja koji su uvjetno prihvaćeni za pouzdanost (njihova vjerojatnost je blizu 1).

Mi ilustriramo pravilo dviju SIGM geometrijski. Na sl. 6 prikazuje Gauss krivulju s distribucijskim centrom a. Područje ograničeno na cijelu krivulju i os OX je 1 (100%), a područje krivuljenog trapeza između bijeg Abscisions A-2S i A + 2S, prema pravilu dviju sigs, je 0,954 ( 95,4% cijelog područja). Područje zasjenjenih parcela je 1-0.954 \u003d 0,046 ("5% cijelog područja). Ove web-lokacije nazivaju kritično područje slučajne varijance. Vrijednosti slučajne varijable padaju u kritično područje su malo vjerojatne i u praksi su uvjetno prihvaćene za nemoguće.

Vjerojatnost uvjetno nemogućih vrijednosti naziva se razina značajnosti slučajne varijable. Razina značaja povezana je s vjerojatnošću pouzdanosti formule:

gdje je Q razina značajnosti, izražena u postocima.

Pravilo tri sigma

Prilikom rješavanja pitanja koja zahtijevaju veću pouzdanost kada je izravnatacativna vjerojatnost (PD) jednaka 0,997 (točnije, 0.9973), umjesto pravila dviju SIGM, prema formuli (3), koristite pravilo tri SIGM.



Prema pravilo tri sigma Uz pouzdanu vjerojatnost 0,9973, kritično područje će biti područje vrijednosti znaka izvan intervala (A-3S, A + 3S). Razina značaja je 0,27%.

Drugim riječima, vjerojatnost da apsolutna vrijednost odstupanja premašuje utrostruku prosječnu kvadratnu devijaciju, vrlo malu, naime 0.0027 \u003d 1-0.9973. To znači da se može dogoditi samo 0,27% slučajeva. Takvi događaji, na temelju načela nemogućnosti nevjerojatnih događaja, mogu se smatrati gotovo nemogućim. Oni. Odabir je visoka preciznost.

Ovo je bit vladavine triju SIGM-a:

Ako se slučajna varijabla normalno distribuira, tada apsolutna vrijednost njezina odstupanja od matematičkog očekivanja ne prelazi utrostručena srednja kvadratna devijacija (SK).

U praksi se koristi pravilo tri Sigms: ako je raspodjela slučajne varijable nepoznat, ali se provodi stanje navedeno u gornjem pravilu, to jest, osnova pretpostaviti da se vrijednost proučava normalno distribuira normalno; U suprotnom, ne distribuira se normalno.

Razina značajnosti donosi se ovisno o dopuštenom stupnju rizika i zadatku. Manje točan uzorak obično se prihvaća za procjenu nekretnina, slijedeći pravila dviju SIGM-a.