Kako izračunati standardno odstopanje. Povprečni linearni in standardni odklon

V tem članku bom govoril o kako najti povprečje standardni odklon . To gradivo je izredno pomembno za popolno razumevanje matematike, zato bi moral mentor matematike posvetiti ločeno lekcijo ali celo več, da bi jo preučevali. V tem članku boste našli povezavo do podrobne in razumljive video vadnice, ki pojasnjuje, kaj je standardni odklon in kako ga najti.

Standardni odklon omogoča ovrednotenje širjenja vrednosti, dobljenih kot rezultat merjenja določenega parametra. Označeno s simbolom (grška črka "sigma").

Formula za izračun je precej preprosta. Če želite najti standardni odklon, morate vzeti kvadratni koren variance. Zdaj se morate vprašati: "Kaj je varianca?"

Kaj je varianca

Definicija variance gre takole. Disperzija je aritmetična sredina kvadratnih odstopanj vrednosti od povprečja.

Če želite ugotoviti varianco, zaporedoma izvedite naslednje izračune:

  • Določite povprečje (preprosto aritmetično povprečje niza vrednosti).
  • Nato od vsake vrednosti odštejte povprečje in kvadrirajte dobljeno razliko (dobite kvadrat razlike).
  • Naslednji korak je izračun aritmetične sredine dobljenih kvadratov razlik (zakaj točno kvadratov lahko izveste spodaj).

Poglejmo si primer. Recimo, da se vi in ​​vaši prijatelji odločite izmeriti višino svojih psov (v milimetrih). Kot rezultat meritev ste prejeli naslednje mere višine (v vihru): 600 mm, 470 mm, 170 mm, 430 mm in 300 mm.

Izračunajmo povprečje, varianco in standardni odklon.

Najprej poiščemo povprečno vrednost. Kot že veste, morate za to sešteti vse izmerjene vrednosti in jih deliti s številom meritev. Napredek izračuna:

Povprečna mm.

Torej je povprečje (aritmetična sredina) 394 mm.

Zdaj moramo določiti odstopanje višine posameznega psa od povprečja:

končno, za izračun variance, kvadriramo vsako od dobljenih razlik in nato poiščemo aritmetično sredino dobljenih rezultatov:

Razpršenost mm 2 .

Tako je disperzija 21704 mm 2.

Kako najti standardno odstopanje

Torej, kako lahko zdaj izračunamo standardni odklon, če poznamo varianco? Kot se spomnimo, iz tega vzemite kvadratni koren. To pomeni, da je standardni odklon enak:

Mm (zaokroženo na najbližje celo število v mm).

S to metodo smo ugotovili, da so nekateri psi (na primer rotvajlerji) zelo veliki psi. So pa tudi zelo majhni psi (na primer jazbečarji, a jim tega ne smeš povedati).

Najbolj zanimivo je, da standardna deviacija nosi s seboj koristne informacije. Sedaj lahko pokažemo, kateri od dobljenih rezultatov merjenja višine so znotraj intervala, ki ga dobimo, če narišemo standardni odklon od povprečja (na obe strani).

To pomeni, da s standardnim odklonom dobimo "standardno" metodo, ki nam omogoča, da ugotovimo, katera od vrednosti je normalna (statistično povprečje) in katera je izjemno velika ali, nasprotno, majhna.

Kaj je standardni odklon

Ampak ... vse bo malo drugače, če analiziramo vzorec podatke. V našem primeru smo upoštevali splošna populacija. Se pravi, naših 5 psov so bili edini psi na svetu, ki so nas zanimali.

Če pa so podatki vzorec (vrednosti, izbrane iz velikega prebivalstvo), potem je treba izračune narediti drugače.

Če obstajajo vrednosti, potem:

Vsi ostali izračuni se izvajajo podobno, vključno z določitvijo povprečja.

Na primer, če je naših pet psov le vzorec populacije psov (vseh psov na planetu), moramo deliti z 4, ne 5, namreč:

Varianca vzorca = mm 2.

pri čemer standardni odklon po vzorcu je enako mm (zaokroženo na najbližje celo število).

Lahko rečemo, da smo naredili nekaj "popravka" v primeru, ko so naše vrednosti le majhen vzorec.

Opomba. Zakaj točno kvadratne razlike?

Toda zakaj pri izračunu variance vzamemo točno kvadrat razlike? Recimo, da ste pri merjenju nekega parametra prejeli naslednji niz vrednosti: 4; 4; -4; -4. Če preprosto seštejemo absolutna odstopanja od povprečja (razlike) med seboj... negativne vrednosti se bodo medsebojno izničili s pozitivnimi:

.

Izkazalo se je, da je ta možnost neuporabna. Potem je morda vredno poskusiti absolutne vrednosti odstopanj (to je module teh vrednosti)?

Na prvi pogled se izkaže dobro (dobljena vrednost, mimogrede, se imenuje povprečno absolutno odstopanje), vendar ne v vseh primerih. Poskusimo drug primer. Rezultat meritve naj bo naslednji niz vrednosti: 7; 1; -6; -2. Potem je povprečno absolutno odstopanje:

Vau! Spet smo dobili rezultat 4, čeprav imajo razlike precej večji razpon.

Zdaj pa poglejmo, kaj se zgodi, če kvadriramo razlike (in nato vzamemo kvadratni koren njihove vsote).

Za prvi primer bo to:

.

Za drugi primer bo to:

Zdaj pa je čisto druga zadeva! Večja ko je razpršenost razlik, večja je standardna deviacija ... to je tisto, kar smo ciljali.

Pravzaprav v ta metoda Uporablja se ista ideja kot pri izračunu razdalje med točkami, le da se uporablja na drugačen način.

In z matematičnega vidika uporaba kvadratov in kvadratnih korenov zagotavlja več koristi, kot bi jih lahko dobili z absolutnimi vrednostmi odstopanja, zaradi česar je standardno odstopanje uporabno za druge matematične probleme.

Sergey Valerievich vam je povedal, kako najti standardno odstopanje

Standardni odklon(sinonimi: standardni odklon, standardni odklon, kvadratno odstopanje; povezani izrazi: standardni odklon, standardni namaz) - v teoriji verjetnosti in statistiki najpogostejši indikator razpršenosti vrednosti naključne spremenljivke glede na njeno matematično pričakovanje. Za omejene nize vzorcev vrednosti, namesto matematično pričakovanje uporabljena je aritmetična sredina vzorčne populacije.

Enciklopedični YouTube

  • 1 / 5

    Standardni odklon se meri v samih merskih enotah naključna spremenljivka in se uporablja pri izračunu standardne napake aritmetične sredine, pri konstruiranju intervalov zaupanja, pri statističnem testiranju hipotez, pri merjenju linearne povezave med naključnimi spremenljivkami. Definirano kot kvadratni koren variance naključne spremenljivke.

    Standardni odklon:

    s = n n − 1 σ 2 = 1 n − 1 ∑ i = 1 n (x i − x ¯) 2 ; (\displaystyle s=(\sqrt ((\frac (n)(n-1))\sigma ^(2)))=(\sqrt ((\frac (1)(n-1))\sum _( i=1)^(n)\levo(x_(i)-(\bar (x))\desno)^(2)));)
    • Opomba: Zelo pogosto prihaja do neskladij v imenih MSD (povprečno kvadratno odstopanje) in STD (standardno odstopanje) z njunima formulama. Na primer, v modulu numPy programskega jezika Python je funkcija std() opisana kot "standardni odklon", medtem ko formula odraža standardni odklon (deljenje s korenom vzorca). V Excelu je funkcija STANDARDEVAL() drugačna (deljenje s korenom iz n-1).

    Standardni odklon(ocena standardnega odklona naključne spremenljivke x glede na njegovo matematično pričakovanje, ki temelji na nepristranski oceni njegove variance) s (\displaystyle s):

    σ = 1 n ∑ i = 1 n (x i − x ¯) 2 . (\displaystyle \sigma =(\sqrt ((\frac (1)(n))\sum _(i=1)^(n)\levo(x_(i)-(\bar (x))\desno) ^(2))).)

    Kje σ 2 (\displaystyle \sigma ^(2))- disperzija; x i (\displaystyle x_(i)) - jaz element izbora; n (\displaystyle n)- Velikost vzorca; - aritmetična sredina vzorca:

    x ¯ = 1 n ∑ i = 1 n x i = 1 n (x 1 + … + x n) . (\displaystyle (\bar (x))=(\frac (1)(n))\sum _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\pike +x_(n)).)

    Opozoriti je treba, da sta obe oceni pristranski. V splošnem primeru je nemogoče sestaviti nepristransko oceno. Vendar je ocena, ki temelji na nepristranski oceni variance, dosledna.

    V skladu z GOST R 8.736-2011 se standardni odklon izračuna z uporabo druge formule tega razdelka. Preverite rezultate.

    Pravilo treh sigm

    Pravilo treh sigm (3 σ (\displaystyle 3\sigma )) - skoraj vse vrednosti normalno porazdeljene naključne spremenljivke ležijo v intervalu (x ¯ − 3 σ ; x ¯ + 3 σ) (\displaystyle \left((\bar (x))-3\sigma ;(\bar (x))+3\sigma \desno)). Natančneje - s približno verjetnostjo 0,9973 je vrednost normalno porazdeljene naključne spremenljivke v določenem intervalu (pod pogojem, da vrednost x ¯ (\displaystyle (\bar (x))) res in ni pridobljeno kot rezultat obdelave vzorca).

    Če je prava vrednost x ¯ (\displaystyle (\bar (x))) je neznano, potem ne smete uporabljati σ (\displaystyle \sigma ), A s. Tako se pravilo treh sigm spremeni v pravilo treh s .

    Razlaga vrednosti standardnega odklona

    Večja vrednost standardnega odklona kaže večji razpon vrednosti v predstavljenem nizu s povprečno vrednostjo niza; manjša vrednost torej kaže, da so vrednosti v nizu združene okoli povprečne vrednosti.

    Na primer, imamo tri številčni nizi: (0, 0, 14, 14), (0, 6, 8, 14) in (6, 6, 8, 8). Vsi trije nizi imajo srednje vrednosti enake 7, standardni odkloni pa enaki 7, 5 in 1. Zadnji niz ima majhen standardni odklon, saj so vrednosti v nizu združene okoli srednje vrednosti; prvi niz ima največ velik pomen standardni odklon - vrednosti znotraj nabora se močno razlikujejo od povprečne vrednosti.

    V splošnem se standardni odklon lahko šteje za merilo negotovosti. Na primer, v fiziki se standardna deviacija uporablja za določitev napake niza zaporednih meritev neke količine. Ta vrednost je zelo pomembna za določitev verjetnosti preučevanega pojava v primerjavi z vrednostjo, ki jo predvideva teorija: če se povprečna vrednost meritev močno razlikuje od vrednosti, ki jih predvideva teorija (velik standardni odklon), potem je treba dobljene vrednosti ali način njihovega pridobivanja ponovno preveriti. identificirati s tveganjem portfelja.

    Podnebje

    Recimo, da obstajata dve mesti z enako povprečno najvišjo dnevno temperaturo, vendar se eno nahaja na obali, drugo pa na ravnini. Znano je, da imajo mesta na obali veliko različnih najvišjih dnevnih temperatur, ki so nižje od mest v notranjosti. Zato bo standardni odklon najvišjih dnevnih temperatur za obalno mesto manjši kot za drugo mesto, kljub temu da je povprečna vrednost te vrednosti enaka, kar v praksi pomeni, da je verjetnost, da bo najvišja temperatura zraka na kateri koli dan v letu bo višja razlika od povprečne vrednosti, višja za mesto v notranjosti.

    Šport

    Predpostavimo, da obstaja več nogometnih ekip, ki so ocenjene na podlagi določenega niza parametrov, na primer število doseženih in prejetih golov, priložnosti za zadetek itd. Najbolj verjetno je, da bo najboljša ekipa v tej skupini imela boljše vrednosti na več parametrih. Manjši kot je standardni odklon ekipe za vsakega od predstavljenih parametrov, bolj predvidljiv je rezultat ekipe; takšne ekipe so uravnotežene. Na drugi strani pa ekipa z dobra vrednost standardna deviacija otežuje napovedovanje rezultata, kar je razloženo z neravnovesjem, na primer močna obramba, a šibek napad.

    Uporaba standardnega odklona moštvenih parametrov omogoča v takšni ali drugačni meri predvidevanje rezultata dvoboja med dvema ekipama, oceno moči in šibke strani ukazov, zato tudi izbranih načinov boja.

    Za izračun preproste geometrijske sredine se uporablja formula:

    Geometrijsko tehtano

    Za določitev utežene geometrične sredine se uporablja formula:

    Povprečni premeri koles, cevi in ​​povprečne stranice kvadratov so določeni s srednjim kvadratom.

    Korenske srednje kvadratne vrednosti se uporabljajo za izračun nekaterih kazalnikov, na primer koeficienta variacije, ki označuje ritem proizvodnje. Tu se standardno odstopanje od načrtovane proizvodnje za določeno obdobje določi po naslednji formuli:

    Te vrednosti natančno označujejo spremembo ekonomskih kazalcev v primerjavi z njihovo osnovno vrednostjo, vzeto v povprečni vrednosti.

    Kvadratno preprosto

    Srednji kvadratni koren se izračuna po formuli:

    Kvadratno tehtano

    Uteženi povprečni kvadrat je enak:

    22. Absolutni indikatorji variacije vključujejo:

    obseg variacije

    povprečno linearno odstopanje

    disperzija

    standardni odklon

    Razpon variacije (r)

    Razpon variacije- je razlika med največjo in najmanjšo vrednostjo atributa

    Prikazuje meje, znotraj katerih se vrednost značilnosti spreminja v populaciji, ki jo proučujemo.

    Delovne izkušnje petih prijavljenih v dosedanjem delu so: 2,3,4,7 in 9 let. Rešitev: razpon variacije = 9 - 2 = 7 let.

    Za posplošen opis razlik v vrednostih atributov se povprečni kazalniki variacije izračunajo na podlagi upoštevanja odstopanj od aritmetične sredine. Razlika se upošteva kot odstopanje od povprečja.

    V tem primeru, da bi se izognili temu, da bi se vsota odstopanj variant značilnosti od povprečja spremenila v nič (ničelna lastnost povprečja), je treba bodisi zanemariti znake odstopanja, to je, vzeti to vsoto modulo , ali kvadrirajte vrednosti odstopanja

    Povprečno linearno in kvadratno odstopanje

    Povprečje linearno odstopanje je aritmetično povprečje absolutnih odstopanj posameznih vrednosti lastnosti od povprečja.

    Povprečno linearno odstopanje je preprosto:

    Delovne izkušnje petih prijavljenih v dosedanjem delu so: 2,3,4,7 in 9 let.

    V našem primeru: leta;

    Odgovor: 2,4 leta.

    Ponderirano povprečno linearno odstopanje velja za združene podatke:

    Povprečno linearno odstopanje se zaradi svoje ustaljenosti v praksi relativno redko uporablja (predvsem za karakterizacijo izpolnjevanja pogodbenih obveznosti glede enakomernosti dobave; pri analizi kakovosti izdelkov ob upoštevanju tehnoloških značilnosti proizvodnje).

    Standardni odklon

    Najbolj popolna značilnost variacije je srednji kvadratni odklon, ki se imenuje standard (ali standardni odklon). Standardni odklon() je enako kvadratni koren od srednjega kvadrata odstopanj posameznih vrednosti značilnosti do aritmetične sredine:

    Standardni odklon je preprost:

    Uteženi standardni odklon se uporabi za združene podatke:

    Med povprečnim kvadratnim in povprečnim linearnim odstopanjem pri normalnih porazdelitvenih pogojih obstaja naslednje razmerje: ~ 1,25.

    Standardni odklon, ki je glavno absolutno merilo variacije, se uporablja pri določanju ordinatnih vrednosti krivulje normalne porazdelitve, pri izračunih, povezanih z organizacijo opazovanja vzorca in ugotavljanjem točnosti značilnosti vzorca, pa tudi pri ocenjevanju meje variacije lastnosti v homogeni populaciji.

    Modri ​​matematiki in statistiki so se domislili bolj zanesljivega kazalnika, čeprav za nekoliko drugačen namen - povprečno linearno odstopanje. Ta indikator označuje mero disperzije vrednosti nabora podatkov okoli njihove povprečne vrednosti.

    Če želite prikazati mero razpršenosti podatkov, se morate najprej odločiti, na podlagi česa bo ta razpršenost izračunana – običajno je to povprečna vrednost. Nato morate izračunati, kako daleč so vrednosti analiziranega niza podatkov od povprečja. Jasno je, da vsaka vrednost ustreza določeni vrednosti odstopanja, vendar nas zanima skupna ocena, ki zajema celotno populacijo. Zato se povprečno odstopanje izračuna po običajni formuli aritmetične sredine. Ampak! A da bi izračunali povprečje odstopanj, jih je treba najprej sešteti. In če seštejemo pozitivna in negativna števila, se bodo med seboj izničila in njihova vsota se bo nagibala k ničli. Da bi se temu izognili, se vsa odstopanja upoštevajo modulo, to pomeni, da vsa negativna števila postanejo pozitivna. Zdaj bo povprečno odstopanje pokazalo posplošeno mero širjenja vrednosti. Posledično se povprečno linearno odstopanje izračuna po formuli:

    a– povprečno linearno odstopanje,

    x– analizirani kazalnik, zgoraj s pomišljajem – povprečna vrednost kazalnika,

    n– število vrednosti v analiziranem nizu podatkov,

    Upam, da operater seštevanja ne bo koga prestrašil.

    Povprečno linearno odstopanje, izračunano z navedeno formulo, odraža povprečno absolutno odstopanje od povprečna velikost za ta agregat.

    Na sliki je rdeča črta povprečna vrednost. Odstopanja vsakega opazovanja od povprečja so označena z majhnimi puščicami. Vzamejo se po modulu in seštejejo. Nato se vse deli s številom vrednosti.

    Da bi sliko dopolnili, moramo navesti primer. Recimo, da obstaja podjetje, ki proizvaja potaknjence za lopate. Vsak rez mora biti dolg 1,5 metra, vendar je še pomembneje, da morajo biti vsi enaki ali vsaj plus ali minus 5 cm, vendar bodo neprevidni delavci odrezali 1,2 m ali 1,8 m. Poletni prebivalci so nezadovoljni. Direktor podjetja se je odločil za statistično analizo dolžine posekov. Izbral sem 10 kosov in izmeril njihovo dolžino, našel povprečje in izračunal povprečno linearno odstopanje. Izkazalo se je, da je povprečje ravno tisto, kar je bilo potrebno - 1,5 m, vendar je bilo povprečno linearno odstopanje 0,16 m, tako da se je izkazalo, da je vsak rez daljši ali krajši od potrebnega v povprečju za 16 cm. delavci . Pravzaprav nisem videl nobene dejanske uporabe tega indikatorja, zato sem si sam izmislil primer. Vendar pa v statistiki obstaja tak indikator.

    Razpršenost

    Tako kot povprečno linearno odstopanje tudi varianca odraža obseg širjenja podatkov okoli srednje vrednosti.

    Formula za izračun variance izgleda takole:

    (za serije variacij (utežena varianca))

    (za nezdružene podatke (enostavna varianca))

    Kjer je: σ 2 – disperzija, Xi– analiziramo sq indikator (vrednost karakteristike), – povprečno vrednost kazalnika, f i – število vrednosti v analiziranem nizu podatkov.

    Disperzija je povprečni kvadrat odstopanj.

    Najprej se izračuna povprečna vrednost, nato se razlika med vsako prvotno in povprečno vrednostjo vzame, kvadrira, pomnoži s frekvenco ustrezne vrednosti atributa, doda in nato deli s številom vrednosti v populaciji.

    Vendar pa v čista oblika, kot je aritmetična sredina ali indeks, se varianca ne uporablja. To je precej pomožni in vmesni indikator, ki se uporablja za druge vrste Statistična analiza.

    Poenostavljen način za izračun variance

    Standardni odklon

    Za uporabo variance za analizo podatkov se vzame kvadratni koren variance. Izkazalo se je tako imenovano standardni odklon.

    Mimogrede, standardni odklon se imenuje tudi sigma - iz grške črke, ki jo označuje.

    Standardni odklon seveda označuje tudi mero razpršenosti podatkov, vendar ga je zdaj (za razliko od variance) mogoče primerjati z izvirnimi podatki. Praviloma srednje kvadratne mere v statistiki dajejo natančnejše rezultate kot linearne. Zato je standardna deviacija natančnejša mera razpršenosti podatkov kot linearna povprečna deviacija.

    Eno glavnih orodij statistične analize je izračun standardnega odklona. Ta indikator vam omogoča oceno standardnega odklona za vzorec ali populacijo. Naučimo se uporabljati formulo standardnega odklona v Excelu.

    Takoj ugotovimo, kaj je standardni odklon in kako izgleda njegova formula. Ta vrednost je kvadratni koren povprečja aritmetično število kvadrati razlike med vsemi vrednostmi serije in njihovo aritmetično sredino. Za ta indikator obstaja enako ime - standardni odklon. Obe imeni sta popolnoma enakovredni.

    Seveda pa uporabniku v Excelu tega ni treba izračunati, saj program naredi vse namesto njega. Naučimo se izračunati standardno odstopanje v Excelu.

    Izračun v Excelu

    Navedeno vrednost lahko izračunate v Excelu z uporabo dveh posebne funkcije STDEV.V(na podlagi vzorčne populacije) in ST.DEV.G(na podlagi splošne populacije). Načelo njihovega delovanja je popolnoma enako, vendar jih je mogoče poklicati na tri načine, o katerih bomo razpravljali spodaj.

    1. način: Čarovnik za funkcije


    2. način: Zavihek Formule


    3. način: Ročno vnašanje formule

    Obstaja tudi način, na katerega vam okna z argumenti sploh ne bo treba klicati. Če želite to narediti, morate formulo vnesti ročno.


    Kot lahko vidite, je mehanizem za izračun standardnega odklona v Excelu zelo preprost. Uporabnik mora samo vnesti številke iz populacije ali sklice na celice, ki jih vsebujejo. Vse izračune opravi program sam. Veliko težje je razumeti, kaj je izračunani indikator in kako je mogoče rezultate izračuna uporabiti v praksi. Toda razumevanje tega se že nanaša bolj na področje statistike kot na učenje dela s programsko opremo.