Cum se calculează abaterea standard. Abaterea liniară medie și standard

În acest articol, voi vorbi despre cum să găsești media deviație standard . Acest material este extrem de important pentru o înțelegere completă a matematicii, așa că un tutore de matematică ar trebui să dedice o lecție separată sau chiar mai multe pentru studierea acesteia. În acest articol, veți găsi un link către un tutorial video detaliat și ușor de înțeles care explică ce este abaterea standard și cum să o găsiți.

deviație standard face posibilă estimarea răspândirii valorilor obținute ca urmare a măsurării unui anumit parametru. Este notat printr-un simbol (litera greacă „sigma”).

Formula de calcul este destul de simplă. Pentru a găsi abaterea standard, trebuie să luați rădăcina pătrată a varianței. Așa că acum trebuie să întrebi: „Ce este varianța?”

Ce este dispersia

Definiția varianței este următoarea. Dispersia este media aritmetică a abaterilor pătrate ale valorilor de la medie.

Pentru a găsi varianța, efectuați următoarele calcule succesiv:

  • Determinați media (media aritmetică simplă a unei serii de valori).
  • Apoi scădeți media din fiecare dintre valori și diferența rezultată la pătrat (am obținut diferenta la patrat).
  • Următorul pas este calcularea mediei aritmetice a pătratelor diferențelor obținute (Puteți afla de ce exact pătratele sunt mai jos).

Să ne uităm la un exemplu. Să presupunem că tu și prietenii tăi decideți să măsurați înălțimea câinilor dvs. (în milimetri). În urma măsurătorilor, ați primit următoarele măsurători de înălțime (la greabăn): 600 mm, 470 mm, 170 mm, 430 mm și 300 mm.

Să calculăm media, varianța și abaterea standard.

Să găsim mai întâi media. După cum știți deja, pentru aceasta trebuie să adăugați toate valorile măsurate și să împărțiți la numărul de măsurători. Progresul calculului:

Medie mm.

Deci, media (media aritmetică) este de 394 mm.

Acum trebuie să definim abaterea înălțimii fiecăruia dintre câini de la medie:

In cele din urma, pentru a calcula varianța, fiecare dintre diferențele obținute este la pătrat și apoi găsim media aritmetică a rezultatelor obținute:

Dispersie mm 2 .

Astfel, dispersia este de 21704 mm2.

Cum să găsiți abaterea standard

Deci, cum să calculăm acum abaterea standard, cunoscând varianța? După cum ne amintim, luați rădăcina pătrată a acesteia. Adică abaterea standard este:

mm (rotunjit la cel mai apropiat număr întreg în mm).

Folosind această metodă, am constatat că unii câini (de exemplu, Rottweilers) sunt foarte câini mari. Dar există și câini foarte mici (de exemplu, teckii, dar nu ar trebui să le spuneți acest lucru).

Cel mai interesant lucru este că deviația standard poartă Informatii utile. Acum putem arăta care dintre rezultatele obținute ale măsurării creșterii se află în intervalul pe care îl obținem dacă lăsăm deoparte de media (pe ambele părți ale acesteia) abaterea standard.

Adică, folosind abaterea standard, obținem o metodă „standard” care vă permite să aflați care dintre valori este normală (media statistică) și care este extraordinar de mare sau, dimpotrivă, mică.

Ce este Deviația Standard

Dar... lucrurile vor sta puțin diferit dacă analizăm prelevarea de probe date. În exemplul nostru, am luat în considerare populatia generala. Adică, cei 5 câini ai noștri au fost singurii câini din lume care ne-au interesat.

Dar dacă datele sunt un eșantion (valori alese dintr-un mare populatie), atunci calculele trebuie efectuate diferit.

Dacă există valori, atunci:

Toate celelalte calcule se fac în același mod, inclusiv determinarea mediei.

De exemplu, dacă cei cinci câini ai noștri sunt doar un eșantion dintr-o populație de câini (toți câinii de pe planetă), trebuie să împărțim la 4 în loc de 5și anume:

Varianta eșantionului = mm 2 .

în care deviație standard eșantionul este egal mm (rotunjit la cel mai apropiat număr întreg).

Putem spune că am făcut o „corecție” în cazul în care valorile noastre sunt doar o mică mostră.

Notă. De ce exact pătratele diferențelor?

Dar de ce luăm pătratele diferențelor atunci când calculăm varianța? Să admitem la măsurarea unui parametru, ați primit următorul set de valori: 4; 4; -4; -4. Dacă adăugăm doar abaterile absolute de la medie (diferența) între ele... valori negative anulați-vă reciproc cu cele pozitive:

.

Se pare că această opțiune este inutilă. Atunci poate că merită să încerci valorile absolute ale abaterilor (adică modulele acestor valori)?

La prima vedere, se pare că nu este rău (valoarea rezultată, apropo, se numește abatere medie absolută), dar nu în toate cazurile. Să încercăm un alt exemplu. Lăsați măsurarea să rezulte în următorul set de valori: 7; 1; -6; -2. Atunci abaterea medie absolută este:

Wow! Am obținut din nou rezultatul 4, deși diferențele au o răspândire mult mai mare.

Acum să vedem ce se întâmplă dacă pătram diferențele (și apoi luăm rădăcina pătrată a sumei lor).

Pentru primul exemplu, obțineți:

.

Pentru al doilea exemplu, obțineți:

Acum e cu totul alta chestiune! Abaterea rădăcină pătratică medie este cu atât mai mare, cu atât este mai mare răspândirea diferențelor... ceea ce ne străduiam.

De fapt, în aceasta metoda se folosește aceeași idee ca și la calcularea distanței dintre puncte, doar aplicată într-un mod diferit.

Și din punct de vedere matematic, utilizarea pătratelor și a rădăcinilor pătrate este mai utilă decât am putea obține pe baza valorilor absolute ale abaterilor, datorită cărora abaterea standard este aplicabilă altor probleme matematice.

Sergey Valerievich ți-a spus cum să găsești abaterea standard

deviație standard(sinonime: deviație standard, deviație standard, deviație standard; termeni conexe: deviație standard, spread standard) - în teoria probabilităților și statistică, cel mai comun indicator al dispersării valorilor unei variabile aleatoare în raport cu așteptarea sa matematică. Cu matrice limitate de mostre de valoare, în loc de așteptări matematice se foloseşte media aritmetică a populaţiei de eşantioane.

YouTube enciclopedic

  • 1 / 5

    Abaterea standard este măsurată în unități din cele mai multe variabilă aleatorieși este utilizat în calculul erorii standard a mediei aritmetice, în construcția intervalelor de încredere, în verificarea statistică a ipotezelor, în măsurarea unei relații liniare între variabile aleatoare. Este definită ca rădăcina pătrată a varianței unei variabile aleatoare.

    Deviație standard:

    s = n n − 1 σ 2 = 1 n − 1 ∑ i = 1 n (x i − x ¯) 2 ; (\displaystyle s=(\sqrt ((\frac (n)(n-1))\sigma ^(2)))=(\sqrt ((\frac (1)(n-1))\sum _( i=1)^(n)\left(x_(i)-(\bar (x))\right)^(2)));)
    • Notă: Foarte des există discrepanțe în denumirile RMS (Standard Deviation) și SRT (Standard Deviation) cu formulele lor. De exemplu, în modulul numPy al limbajului de programare Python, funcția std() este descrisă ca „abatere standard”, în timp ce formula reflectă abaterea standard (împărțită la rădăcina eșantionului). În Excel, funcția STDEV() este diferită (împărțirea la rădăcina pătrată a lui n-1).

    Deviație standard(estimarea abaterii standard a unei variabile aleatoare X raportat la așteptările sale matematice bazate pe o estimare imparțială a varianței sale) s (\displaystyle s):

    σ = 1 n ∑ i = 1 n (x i − x ¯) 2 . (\displaystyle \sigma =(\sqrt ((\frac (1)(n))\sum _(i=1)^(n)\stanga(x_(i)-(\bar (x))\dreapta) ^(2))).)

    Unde σ 2 (\displaystyle \sigma ^(2))- dispersie; x i (\displaystyle x_(i)) - i-al-lea element de probă; n (\displaystyle n)- marime de mostra; - media aritmetică a eșantionului:

    x ¯ = 1 n ∑ i = 1 n x i = 1 n (x 1 + … + x n) . (\displaystyle (\bar (x))=(\frac (1)(n))\sum _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\ldots +x_(n)).)

    Trebuie remarcat faptul că ambele estimări sunt părtinitoare. În cazul general, este imposibil să se construiască o estimare imparțială. Cu toate acestea, o estimare bazată pe o estimare imparțială a varianței este consecventă.

    În conformitate cu GOST R 8.736-2011, abaterea standard este calculată conform celei de-a doua formule a acestei secțiuni. Vă rugăm să vă verificați rezultatele.

    regula trei sigma

    regula trei sigma (3 σ (\displaystyle 3\sigma )) - aproape toate valorile unei variabile aleatoare distribuite normal se află în interval (x ¯ - 3 σ ; x ¯ + 3 σ) (\displaystyle \left((\bar (x))-3\sigma;(\bar (x))+3\sigma \right)). Mai strict - aproximativ cu o probabilitate de 0,9973, valoarea unei variabile aleatoare distribuite normal se află în intervalul specificat (cu condiția ca valoarea x ¯ (\displaystyle (\bar (x))) adevărat și nu obținut ca urmare a prelucrării probei).

    Dacă valoarea adevărată x ¯ (\displaystyle (\bar (x))) necunoscut, atunci ar trebui să utilizați σ (\displaystyle \sigma ), A s. Astfel, regula de trei sigma este transformată în regula de trei s .

    Interpretarea valorii abaterii standard

    O valoare mai mare a abaterii standard indică o răspândire mai mare a valorilor în setul prezentat cu media setului; o valoare mai mică, respectiv, indică faptul că valorile din set sunt grupate în jurul valorii medii.

    De exemplu, avem trei seturi de numere: (0, 0, 14, 14), (0, 6, 8, 14) și (6, 6, 8, 8). Toate cele trei seturi au valori medii de 7 și, respectiv, abateri standard de 7, 5 și, respectiv, 1. Ultimul set are o abatere standard mică, deoarece valorile din set sunt grupate în jurul mediei; primul set are cel mai mult mare importanță abatere standard - valorile din cadrul setului diferă puternic de valoarea medie.

    Într-un sens general, abaterea standard poate fi considerată o măsură a incertitudinii. De exemplu, în fizică, abaterea standard este utilizată pentru a determina eroarea unei serii de măsurători succesive a unei cantități. Această valoare este foarte importantă pentru determinarea plauzibilității fenomenului studiat în comparație cu valoarea prezisă de teorie: dacă valoarea medie a măsurătorilor este foarte diferită de valorile prezise de teorie (deviație standard mare), atunci valorile obținute sau metoda de obținere a acestora trebuie reverificate. este identificat cu riscul de portofoliu.

    Climat

    Să presupunem că există două orașe cu aceeași temperatură medie zilnică maximă, dar unul este situat pe coastă, iar celălalt pe câmpie. Se știe că orașele de coastă au multe temperaturi maxime zilnice mai mici decât orașele din interior. Prin urmare, abaterea standard a temperaturilor maxime zilnice în orașul de coastă va fi mai mică decât în ​​al doilea oraș, în ciuda faptului că au aceeași valoare medie a acestei valori, ceea ce înseamnă, în practică, că probabilitatea ca temperatura maximă a aerului de fiecare zi anume a anului va fi mai puternic diferit de valoarea medie, mai mare pentru un oras situat in interiorul continentului.

    Sport

    Să presupunem că există mai multe echipe de fotbal care sunt clasate în funcție de un set de parametri, de exemplu, numărul de goluri marcate și primite, șanse de gol etc. Cel mai probabil, cea mai bună echipă din această grupă va avea cele mai bune valori. în mai mulți parametri. Cu cât abaterea standard a echipei pentru fiecare dintre parametrii prezentați este mai mică, cu atât rezultatul echipei este mai previzibil, astfel de echipe sunt echilibrate. Pe de altă parte, echipa cu de mare valoare abaterea standard, este dificil de prezis rezultatul, care la rândul său se explică printr-un dezechilibru, de exemplu, o apărare puternică, dar un atac slab.

    Utilizarea abaterii standard a parametrilor echipei permite să se prezică într-o oarecare măsură rezultatul meciului dintre două echipe, evaluând punctele forte și părţile slabe comenzile și de aici metodele alese de luptă.

    Pentru a calcula media geometrică simplă, se utilizează formula:

    ponderat geometric

    Pentru a determina media ponderată geometrică, se utilizează formula:

    Diametrele medii ale roților, țevilor, laturile medii ale pătratelor sunt determinate folosind rădăcina pătrată medie.

    Valorile RMS sunt folosite pentru a calcula unii indicatori, cum ar fi coeficientul de variație, care caracterizează ritmul de ieșire. Aici, abaterea standard de la producția planificată pentru o anumită perioadă este determinată de următoarea formulă:

    Aceste valori caracterizează cu exactitate modificarea indicatorilor economici în comparație cu valoarea lor de bază, luată în valoarea medie.

    Quadratic simplu

    Pătratul mediu simplu se calculează prin formula:

    Ponderat cuadratic

    Pătratul mediu ponderat este:

    22. Măsurile absolute ale variației includ:

    gama de variatie

    abaterea liniară medie

    dispersie

    deviație standard

    Interval de variație (r)

    Variație de interval este diferența dintre valorile maxime și minime ale atributului

    Arata limitele in care se modifica valoarea atributului in populatia studiata.

    Experiența de muncă a cinci solicitanți în postul anterior este: 2,3,4,7 și 9 ani. Rezolvare: interval de variație = 9 - 2 = 7 ani.

    Pentru o caracteristică generalizată a diferențelor de valori ale atributului, indicatorii de variație medie sunt calculate pe baza abaterilor de la media aritmetică. Diferența este luată ca abatere de la medie.

    În același timp, pentru a evita transformarea în zero a sumei abaterilor opțiunilor de trăsătură de la medie (proprietatea zero a mediei), trebuie fie să ignorăm semnele abaterii, adică să luăm această sumă modulo , sau pătratează valorile abaterii

    Abaterea medie liniară și pătrată

    In medie abatere liniară este media aritmetică a abaterilor absolute ale valorilor individuale ale atributului de la medie.

    Abaterea liniară medie este simplă:

    Experiența de muncă a cinci solicitanți în postul anterior este: 2,3,4,7 și 9 ani.

    În exemplul nostru: ani;

    Răspuns: 2,4 ani.

    Abaterea liniară medie ponderată se aplică datelor grupate:

    Abaterea liniară medie, datorită convenționalității sale, este utilizată relativ rar în practică (în special, pentru a caracteriza îndeplinirea obligațiilor contractuale în ceea ce privește uniformitatea livrării; în analiza calității produsului, ținând cont de caracteristicile tehnologice ale producției). ).

    Deviație standard

    Cea mai perfectă caracteristică a variației este abaterea standard, care se numește standard (sau abatere standard). Deviație standard() este egal rădăcină pătrată de la pătratul mediu al abaterilor valorilor individuale ale caracteristicii de la media aritmetică:

    Abaterea standard este simplă:

    Abaterea standard ponderată se aplică pentru datele grupate:

    Între pătratul mediu și deviațiile liniare medii în condiții de distribuție normală are loc următoarea relație: ~ 1,25.

    Abaterea standard, fiind principala măsură absolută a variației, este utilizată la determinarea valorilor ordonatelor curbei de distribuție normală, în calculele legate de organizarea observării eșantionului și stabilirea acurateții caracteristicilor eșantionului, precum și în aprecierea limitelor variaţiei unei trăsături într-o populaţie omogenă.

    Matematicienii și statisticienii înțelepți au venit cu un indicator mai fiabil, deși într-un scop ușor diferit - abaterea liniară medie. Acest indicator caracterizează măsura răspândirii valorilor setului de date în jurul valorii medii ale acestora.

    Pentru a arăta măsura răspândirii datelor, trebuie mai întâi să determinați la ce va fi considerată această răspândire - de obicei, aceasta este valoarea medie. În continuare, trebuie să calculați cât de departe sunt valorile setului de date analizat față de medie. Este clar că fiecărei valori îi corespunde o anumită abatere, dar ne interesează și o estimare generală care să acopere întreaga populație. Prin urmare, abaterea medie este calculată folosind formula mediei aritmetice obișnuite. Dar! Dar pentru a calcula media abaterilor, acestea trebuie mai întâi adăugate. Și dacă adunăm numere pozitive și negative, acestea se vor anula reciproc, iar suma lor va tinde spre zero. Pentru a evita acest lucru, toate abaterile sunt luate modulo, adică toate numerele negative devin pozitive. Acum, abaterea medie va arăta o măsură generalizată a răspândirii valorilor. Ca rezultat, abaterea liniară medie va fi calculată prin formula:

    A este abaterea liniară medie,

    X- indicatorul analizat, cu o liniuță deasupra - valoarea medie a indicatorului,

    n este numărul de valori din setul de date analizat,

    operatorul de însumare, sper, nu sperie pe nimeni.

    Abaterea liniară medie calculată prin formula specificată reflectă abaterea medie absolută de la mărime medie pentru acest set.

    Linia roșie din imagine este valoarea medie. Abaterile fiecărei observații de la medie sunt indicate prin săgeți mici. Ele sunt luate modulo și rezumate. Apoi totul este împărțit la numărul de valori.

    Pentru a completa imaginea, mai trebuie dat un exemplu. Să presupunem că există o firmă care produce butași pentru lopeți. Fiecare tăietură ar trebui să aibă 1,5 metri lungime, dar, mai important, toate ar trebui să fie la fel, sau cel puțin plus sau minus 5 cm. Cu toate acestea, lucrătorii neglijenți vor tăia 1,2 m, apoi 1,8 m. . Directorul companiei a decis să efectueze o analiză statistică a lungimii tăierilor. Am selectat 10 piese și le-am măsurat lungimea, am găsit media și am calculat abaterea liniară medie. Media s-a dovedit a fi exact - 1,5 m. Dar abaterea liniară medie s-a dovedit a fi de 0,16 m. Deci, se dovedește că fiecare tăiere este mai lungă sau mai scurtă decât este necesar cu o medie de 16 cm. Există ceva de vorbit despre cu muncitori. De fapt, nu am văzut utilizarea reală a acestui indicator, așa că am venit și eu cu un exemplu. Cu toate acestea, există un astfel de indicator în statistici.

    Dispersia

    La fel ca deviația liniară medie, varianța reflectă, de asemenea, măsura în care datele se răspândesc în jurul mediei.

    Formula de calcul a varianței arată astfel:

    (pentru seria de variații (varianță ponderată))

    (pentru date negrupate (varianță simplă))

    Unde: σ 2 - dispersie, Xi– analizăm indicatorul sq (valoarea caracteristicii), – valoarea medie a indicatorului, f i – numărul de valori din setul de date analizat.

    Varianta este pătratul mediu al abaterilor.

    Mai întâi, se calculează media, apoi se ia diferența dintre fiecare linie de bază și medie, la pătrat, înmulțită cu frecvența valorii caracteristicii corespunzătoare, adăugată și apoi împărțită la numărul de valori din populație.

    Cu toate acestea, în formă pură, cum ar fi media aritmetică sau indicele, varianța nu este utilizată. Este mai degrabă un indicator auxiliar și intermediar care este utilizat pentru alte tipuri. analize statistice.

    Mod simplificat de a calcula varianța

    deviație standard

    Pentru a utiliza varianța pentru analiza datelor, se ia din aceasta o rădăcină pătrată. Se dovedește așa-numitul deviație standard.

    Apropo, deviația standard se mai numește și sigma - din litera greacă care o denotă.

    Deviația standard caracterizează în mod evident și măsura dispersiei datelor, dar acum (spre deosebire de dispersie) poate fi comparată cu datele originale. De regulă, indicatorii pătrați medii din statistici dau rezultate mai precise decât cei liniari. Prin urmare, abaterea standard este o măsură mai precisă a împrăștierii datelor decât abaterea liniară medie.

    Unul dintre principalele instrumente de analiză statistică este calculul abaterii standard. Acest indicator vă permite să faceți o estimare a abaterii standard pentru un eșantion sau pentru populația generală. Să învățăm cum să folosim formula abaterii standard în Excel.

    Să definim imediat care este abaterea standard și cum arată formula ei. Această valoare este rădăcina pătrată a mediei număr aritmetic pătratele diferenței tuturor valorilor seriei și media lor aritmetică. Există un nume identic pentru acest indicator - abatere standard. Ambele nume sunt complet echivalente.

    Dar, desigur, în Excel, utilizatorul nu trebuie să calculeze acest lucru, deoarece programul face totul pentru el. Să învățăm cum să calculăm abaterea standard în Excel.

    Calculul in Excel

    Puteți calcula valoarea specificată în Excel folosind două funcții speciale STDEV.B(conform eșantionului) și STDEV.G(după populația generală). Principiul funcționării lor este absolut același, dar ele pot fi numite în trei moduri, pe care le vom discuta mai jos.

    Metoda 1: Expertul funcției


    Metoda 2: fila Formule


    Metoda 3: Introducerea manuală a formulei

    Există, de asemenea, o modalitate prin care nu trebuie să apelați deloc fereastra argumentului. Pentru a face acest lucru, introduceți manual formula.


    După cum puteți vedea, mecanismul de calcul al abaterii standard în Excel este foarte simplu. Utilizatorul trebuie doar să introducă numere din populație sau link-uri către celulele care le conțin. Toate calculele sunt efectuate de programul însuși. Este mult mai dificil de înțeles care este indicatorul calculat și cum rezultatele calculului pot fi aplicate în practică. Dar înțelegerea acestui lucru aparține deja mai mult domeniului statisticilor decât a învățării cum să lucrezi cu software.