Formula abaterii pătrate. Abaterea liniară medie

$X$. Mai întâi, să ne amintim următoarea definiție:

Definiția 1

Populația-- un set de obiecte alese aleatoriu de un anumit tip, care sunt observate pentru a obține valori specifice variabilă aleatorie efectuate în condiții constante în studiul unei variabile aleatorii de un anumit tip.

Definiția 2

Varianta generala-- in medie pătrate aritmetice abateri ale valorilor variantei populației generale de la valoarea medie a acestora.

Fie valorile variantei $x_1,\ x_2,\dots ,x_k$ au, respectiv, frecvențele $n_1,\n_2,\dots ,n_k$. Apoi varianță generală calculat prin formula:

Să luăm în considerare un caz special. Fie distincte toate variantele $x_1,\ x_2,\dots ,x_k$. În acest caz $n_1,\ n_2,\dots ,n_k=1$. Obținem că în acest caz varianța generală se calculează prin formula:

De asemenea, legat de acest concept este și conceptul de abatere standard generală.

Definiția 3

media generală deviație standard

\[(\sigma )_r=\sqrt(D_r)\]

Varianta eșantionului

Să ni se dea un set de mostre în raport cu o variabilă aleatorie $X$. Mai întâi, să ne amintim următoarea definiție:

Definiția 4

Eșantion de populație -- o parte din obiectele selectate din populația generală.

Definiția 5

Varianta eșantionului-- in medie valori aritmetice opțiunea de eșantionare.

Fie valorile variantei $x_1,\ x_2,\dots ,x_k$ au, respectiv, frecvențele $n_1,\n_2,\dots ,n_k$. Apoi, varianța eșantionului se calculează cu formula:

Să luăm în considerare un caz special. Fie distincte toate variantele $x_1,\ x_2,\dots ,x_k$. În acest caz $n_1,\ n_2,\dots ,n_k=1$. Obținem că, în acest caz, varianța eșantionului este calculată prin formula:

Legat de acest concept este și conceptul de abatere standard a eșantionului.

Definiția 6

Deviația standard a eșantionului -- Rădăcină pătrată din variația generală:

\[(\sigma )_v=\sqrt(D_v)\]

Varianta corectată

Pentru a găsi varianța corectată $S^2$, este necesar să înmulțim varianța eșantionului cu fracția $\frac(n)(n-1)$, adică.

Acest concept este asociat și cu conceptul de abatere standard corectată, care se găsește prin formula:

În cazul în care valoarea variantei nu este discretă, ci sunt intervale, atunci în formulele de calcul a variațiilor generale sau eșantionului, valoarea lui $x_i$ este luată a fi valoarea mijlocului intervalului la care $ x_i.$ aparține

Un exemplu de problemă pentru găsirea varianței și a abaterii standard

Exemplul 1

Populația eșantionului este dată de următorul tabel de distribuție:

Poza 1.

Găsiți pentru aceasta varianța eșantionului, abaterea standard a eșantionului, varianța corectată și abaterea standard corectată.

Pentru a rezolva această problemă, mai întâi vom face un tabel de calcul:

Figura 2.

Valoarea lui $\overline(x_v)$ (medie eșantion) din tabel este găsită prin formula:

\[\overline(x_in)=\frac(\sum\limits^k_(i=1)(x_in_i))(n)\]

\[\overline(x_in)=\frac(\sum\limits^k_(i=1)(x_in_i))(n)=\frac(305)(20)=15,25\]

Găsiți varianța eșantionului folosind formula:

Abatere standard eșantion:

\[(\sigma )_v=\sqrt(D_v)\aproximativ 5,12\]

Varianta corectata:

\[(S^2=\frac(n)(n-1)D)_v=\frac(20)(19)\cdot 26,1875\aproximativ 27,57\]

Abaterea standard corectată.

Programul Excel este foarte apreciat atât de profesioniști, cât și de amatori, deoarece un utilizator de orice nivel de pregătire poate lucra cu el. De exemplu, oricine are abilități minime de „comunicare” cu Excel poate să deseneze un grafic simplu, să facă un semn decent etc.

În același timp, acest program vă permite chiar să efectuați diferite tipuri de calcule, de exemplu, calcule, dar acest lucru necesită deja un nivel ușor diferit de pregătire. Cu toate acestea, dacă tocmai ați început o cunoaștere apropiată a acestui program și sunteți interesat de tot ceea ce vă va ajuta să deveniți un utilizator mai avansat, acest articol este pentru dvs. Astăzi vă voi spune care este formula deviației standard în excel, de ce este necesară deloc și, de fapt, când este aplicată. Merge!

Ce este

Să începem cu teorie. Deviația standard se numește de obicei rădăcină pătrată, obținută din media aritmetică a tuturor diferențelor pătrate dintre valorile disponibile, precum și din media lor aritmetică. Apropo, această valoare este de obicei numită litera greacă „sigma”. Abaterea standard este calculată folosind formula STDEV, respectiv, programul o face pentru utilizator.

Esența acestui concept este identificarea gradului de variabilitate a instrumentului, adică este, în felul său, un indicator din statistica descriptivă. Dezvăluie modificări ale volatilității instrumentului în orice perioadă de timp. Folosind formule STDEV, puteți estima deviație standard la preluare, în timp ce valorile logice și text sunt ignorate.

Formulă

Ajută la calcularea abaterii standard în formula excel, care este furnizat automat în programul Excel. Pentru a-l găsi, trebuie să găsiți secțiunea de formule în Excel și deja acolo selectați-o pe cea care are numele STDEV, așa că este foarte simplu.

După aceea, în fața dvs. va apărea o fereastră în care va trebui să introduceți date pentru calcul. În special, două numere trebuie introduse în câmpuri speciale, după care programul va calcula automat abaterea standard pentru eșantion.

Fără îndoială, formulele și calculele matematice sunt o problemă destul de complicată și nu toți utilizatorii o pot rezolva imediat. Cu toate acestea, dacă săpați puțin mai adânc și înțelegeți problema puțin mai în detaliu, se dovedește că nu totul este atât de trist. Sper că sunteți convins de acest lucru prin exemplul de calcul a abaterii standard.

Video pentru a ajuta

Matematicienii și statisticienii înțelepți au venit cu un indicator mai fiabil, deși într-un scop ușor diferit - in medie abatere liniară . Acest indicator caracterizează măsura răspândirii valorilor setului de date în jurul valorii medii ale acestora.

Pentru a afișa măsura răspândirii datelor, trebuie mai întâi să determinați la ce va fi considerată această răspândire - de obicei, aceasta este valoarea medie. În continuare, trebuie să calculați cât de departe sunt valorile setului de date analizat față de medie. Este clar că fiecărei valori îi corespunde o anumită abatere, dar ne interesează și o estimare generală care să acopere întreaga populație. Prin urmare, abaterea medie este calculată folosind formula mediei aritmetice obișnuite. Dar! Dar pentru a calcula media abaterilor, acestea trebuie mai întâi adăugate. Și dacă adunăm numere pozitive și negative, acestea se vor anula reciproc, iar suma lor va tinde spre zero. Pentru a evita acest lucru, toate abaterile sunt luate modulo, adică toate numerele negative devin pozitive. Acum, abaterea medie va arăta o măsură generalizată a răspândirii valorilor. Ca rezultat, abaterea liniară medie va fi calculată prin formula:

A este abaterea liniară medie,

X- indicatorul analizat, cu o liniuță deasupra - valoarea medie a indicatorului,

n este numărul de valori din setul de date analizat,

operatorul de însumare, sper, nu sperie pe nimeni.

Abaterea liniară medie calculată folosind formula specificată reflectă abaterea medie absolută de la valoarea medie pentru această populație.

Linia roșie din imagine este valoarea medie. Abaterile fiecărei observații de la medie sunt indicate prin săgeți mici. Ele sunt luate modulo și rezumate. Apoi totul este împărțit la numărul de valori.

Pentru a completa imaginea, mai trebuie dat un exemplu. Să presupunem că există o firmă care produce butași pentru lopeți. Fiecare tăietură ar trebui să aibă 1,5 metri lungime, dar, mai important, toate ar trebui să fie la fel, sau cel puțin plus sau minus 5 cm. Cu toate acestea, lucrătorii neglijenți vor tăia 1,2 m, apoi 1,8 m. . Directorul companiei a decis să efectueze o analiză statistică a lungimii tăierilor. Am selectat 10 piese și le-am măsurat lungimea, am găsit media și am calculat abaterea liniară medie. Media s-a dovedit a fi exact - 1,5 m. Dar abaterea liniară medie s-a dovedit a fi de 0,16 m. Deci, se dovedește că fiecare tăiere este mai lungă sau mai scurtă decât este necesar cu o medie de 16 cm. Există ceva de vorbit despre cu muncitori. De fapt, nu am văzut utilizarea reală a acestui indicator, așa că am venit și eu cu un exemplu. Cu toate acestea, există un astfel de indicator în statistici.

Dispersia

La fel ca deviația liniară medie, varianța reflectă, de asemenea, măsura în care datele se răspândesc în jurul mediei.

Formula de calcul a varianței arată astfel:

(pentru seria de variații (varianță ponderată))

(pentru date negrupate (varianță simplă))

Unde: σ 2 - dispersie, Xi– analizăm indicatorul sq (valoarea caracteristicii), – valoarea medie a indicatorului, f i – numărul de valori din setul de date analizat.

Varianta este pătratul mediu al abaterilor.

Mai întâi, se calculează media, apoi se ia diferența dintre fiecare linie de bază și medie, la pătrat, înmulțită cu frecvența valorii caracteristicii corespunzătoare, adăugată și apoi împărțită la numărul de valori din populație.

Cu toate acestea, în formă pură, cum ar fi media aritmetică sau indicele, varianța nu este utilizată. Este mai degrabă un indicator auxiliar și intermediar care este utilizat pentru alte tipuri de analiză statistică.

Mod simplificat de a calcula varianța

deviație standard

Pentru a utiliza varianța pentru analiza datelor, se ia din aceasta o rădăcină pătrată. Se dovedește așa-numitul deviație standard.

Apropo, deviația standard se mai numește și sigma - din litera greacă care o denotă.

Deviația standard caracterizează în mod evident și măsura dispersiei datelor, dar acum (spre deosebire de dispersie) poate fi comparată cu datele originale. De regulă, indicatorii pătrați medii din statistici dau rezultate mai precise decât cei liniari. Prin urmare, abaterea standard este o măsură mai precisă a împrăștierii datelor decât abaterea liniară medie.

deviație standard(sinonime: deviație standard, deviație standard, deviație standard; termeni conexe: deviație standard, spread standard) - în teoria probabilităților și statistică, cel mai comun indicator al dispersării valorilor unei variabile aleatoare în raport cu așteptarea sa matematică. Cu matrice limitate de mostre de valori, în loc de așteptarea matematică, se utilizează media aritmetică a setului de eșantioane.

YouTube enciclopedic

  • 1 / 5

    Abaterea standard se măsoară în unități de măsură ale variabilei aleatoare în sine și este utilizată la calcularea erorii standard a mediei aritmetice, la construirea intervalelor de încredere, la verificarea statistică a ipotezelor, la măsurarea relației liniare dintre variabilele aleatoare. Este definită ca rădăcina pătrată a varianței unei variabile aleatoare.

    Deviație standard:

    s = n n − 1 σ 2 = 1 n − 1 ∑ i = 1 n (x i − x ¯) 2 ; (\displaystyle s=(\sqrt ((\frac (n)(n-1))\sigma ^(2)))=(\sqrt ((\frac (1)(n-1))\sum _( i=1)^(n)\left(x_(i)-(\bar (x))\right)^(2)));)
    • Notă: Foarte des există discrepanțe în denumirile RMS (Standard Deviation) și SRT (Standard Deviation) cu formulele lor. De exemplu, în modulul numPy al limbajului de programare Python, funcția std() este descrisă ca „abatere standard”, în timp ce formula reflectă abaterea standard (împărțită la rădăcina eșantionului). În Excel, funcția STDEV() este diferită (împărțirea la rădăcina pătrată a lui n-1).

    Deviație standard(estimarea abaterii standard a unei variabile aleatoare X raportat la așteptările sale matematice bazate pe o estimare imparțială a varianței sale) s (\displaystyle s):

    σ = 1 n ∑ i = 1 n (x i − x ¯) 2 . (\displaystyle \sigma =(\sqrt ((\frac (1)(n))\sum _(i=1)^(n)\stanga(x_(i)-(\bar (x))\dreapta) ^(2))).)

    Unde σ 2 (\displaystyle \sigma ^(2))- dispersie; x i (\displaystyle x_(i)) - i-al-lea element de probă; n (\displaystyle n)- marime de mostra; - media aritmetică a eșantionului:

    x ¯ = 1 n ∑ i = 1 n x i = 1 n (x 1 + … + x n) . (\displaystyle (\bar (x))=(\frac (1)(n))\sum _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\ldots +x_(n)).)

    Trebuie remarcat faptul că ambele estimări sunt părtinitoare. În cazul general, este imposibil să se construiască o estimare imparțială. Cu toate acestea, o estimare bazată pe o estimare imparțială a varianței este consecventă.

    În conformitate cu GOST R 8.736-2011, abaterea standard este calculată conform celei de-a doua formule a acestei secțiuni. Vă rugăm să vă verificați rezultatele.

    regula trei sigma

    regula trei sigma (3 σ (\displaystyle 3\sigma )) - aproape toate valorile unei variabile aleatoare distribuite normal se află în interval (x ¯ - 3 σ ; x ¯ + 3 σ) (\displaystyle \left((\bar (x))-3\sigma;(\bar (x))+3\sigma \right)). Mai strict - aproximativ cu o probabilitate de 0,9973, valoarea unei variabile aleatoare distribuite normal se află în intervalul specificat (cu condiția ca valoarea x ¯ (\displaystyle (\bar (x))) adevărat și nu obținut ca urmare a prelucrării probei).

    Dacă valoarea adevărată x ¯ (\displaystyle (\bar (x))) necunoscut, atunci ar trebui să utilizați σ (\displaystyle \sigma ), A s. Astfel, regula de trei sigma este transformată în regula de trei s .

    Interpretarea valorii abaterii standard

    O valoare mai mare a abaterii standard indică o răspândire mai mare a valorilor în setul prezentat cu media setului; o valoare mai mică, respectiv, indică faptul că valorile din set sunt grupate în jurul valorii medii.

    De exemplu, avem trei seturi de numere: (0, 0, 14, 14), (0, 6, 8, 14) și (6, 6, 8, 8). Toate cele trei seturi au valori medii de 7 și, respectiv, abateri standard de 7, 5 și, respectiv, 1. Ultimul set are o abatere standard mică, deoarece valorile din set sunt grupate în jurul mediei; primul set are cel mai mult mare importanță abatere standard - valorile din cadrul setului diferă puternic de valoarea medie.

    Într-un sens general, abaterea standard poate fi considerată o măsură a incertitudinii. De exemplu, în fizică, abaterea standard este utilizată pentru a determina eroarea unei serii de măsurători succesive a unei cantități. Această valoare este foarte importantă pentru determinarea plauzibilității fenomenului studiat în comparație cu valoarea prezisă de teorie: dacă valoarea medie a măsurătorilor este foarte diferită de valorile prezise de teorie (deviație standard mare), atunci valorile obținute sau metoda de obținere a acestora trebuie reverificate. este identificat cu riscul de portofoliu.

    Climat

    Să presupunem că există două orașe cu aceeași temperatură medie zilnică maximă, dar unul este situat pe coastă, iar celălalt pe câmpie. Se știe că orașele de coastă au multe temperaturi maxime zilnice mai mici decât orașele din interior. Prin urmare, abaterea standard a temperaturilor maxime zilnice în orașul de coastă va fi mai mică decât în ​​al doilea oraș, în ciuda faptului că au aceeași valoare medie a acestei valori, ceea ce înseamnă, în practică, că probabilitatea ca temperatura maximă a aerului de fiecare zi anume a anului va fi mai puternic diferit de valoarea medie, mai mare pentru un oras situat in interiorul continentului.

    Sport

    Să presupunem că există mai multe echipe de fotbal care sunt clasate în funcție de un set de parametri, de exemplu, numărul de goluri marcate și primite, șanse de gol etc. Cel mai probabil, cea mai bună echipă din această grupă va avea cele mai bune valori. în mai mulți parametri. Cu cât abaterea standard a echipei pentru fiecare dintre parametrii prezentați este mai mică, cu atât rezultatul echipei este mai previzibil, astfel de echipe sunt echilibrate. Pe de altă parte, echipa cu de mare valoare abaterea standard, este dificil de prezis rezultatul, care la rândul său se explică printr-un dezechilibru, de exemplu, o apărare puternică, dar un atac slab.

    Utilizarea abaterii standard a parametrilor echipei permite să se prezică într-o oarecare măsură rezultatul meciului dintre două echipe, evaluând punctele forte și părţile slabe comenzile și de aici metodele alese de luptă.

    Trebuie remarcat faptul că acest calcul al varianței are un dezavantaj - se dovedește a fi părtinitor, adică. a ei valorea estimata nu este egală cu valoarea adevărată a varianței. Mai multe despre asta. În același timp, nu totul este atât de rău. Odată cu creșterea dimensiunii eșantionului, se apropie în continuare de omologul său teoretic, adică. este imparțial asimptotic. Prin urmare, atunci când lucrați cu dimensiuni mari probe, puteți folosi formula de mai sus.

    Este util să traducem limbajul semnelor în limbajul cuvintelor. Rezultă că varianța este pătratul mediu al abaterilor. Adică, mai întâi se calculează valoarea medie, apoi se ia diferența dintre fiecare valoare inițială și cea medie, se pune la pătrat, se adună și apoi se împarte la numărul de valori din această populație. Diferența dintre valoarea individuală și medie reflectă măsura abaterii. Este pătrat pentru a se asigura că toate abaterile devin numere exclusiv pozitive și pentru a evita anularea reciprocă a abaterilor pozitive și negative atunci când sunt însumate. Apoi, având în vedere abaterile pătrate, calculăm pur și simplu media aritmetică. Medie - pătrat - abateri. Abaterile sunt pătrate și se ia în considerare media. Răspunsul constă în doar trei cuvinte.

    Cu toate acestea, în forma sa pură, cum ar fi, de exemplu, media aritmetică sau indicele, dispersia nu este utilizată. Este mai degrabă un indicator auxiliar și intermediar care este necesar pentru alte tipuri de analiză statistică. Nici măcar nu are o unitate de măsură normală. Judecând după formulă, acesta este pătratul unității de date originale. Fără o sticlă, după cum se spune, nu vei înțelege.

    (modulul 111)

    Pentru a readuce dispersia la realitate, adică pentru a o folosi în scopuri mai banale, din ea se extrage o rădăcină pătrată. Se dovedește așa-numitul abatere standard (RMS). Există denumiri „deviație standard” sau „sigma” (de la numele literei grecești). Formula abaterii standard este:

    Pentru a obține acest indicator pentru eșantion, utilizați formula:

    Ca și în cazul variației, există o opțiune de calcul ușor diferită. Dar pe măsură ce eșantionul crește, diferența dispare.

    Deviația standard, evident, caracterizează și măsura dispersiei datelor, dar acum (spre deosebire de dispersie) poate fi comparată cu datele originale, deoarece au aceleași unități de măsură (acest lucru este clar din formula de calcul). Dar acest indicator în forma sa pură nu este foarte informativ, deoarece conține prea multe calcule intermediare care sunt confuze (abatere, pătrat, sumă, medie, rădăcină). Cu toate acestea, este deja posibil să se lucreze direct cu abaterea standard, deoarece proprietățile acestui indicator sunt bine studiate și cunoscute. De exemplu, există asta regula trei sigma, care afirmă că 997 de puncte de date din 1000 sunt în ±3 sigma de media aritmetică. Deviația standard, ca măsură a incertitudinii, este, de asemenea, implicată în multe calcule statistice. Cu ajutorul acestuia, se stabilește gradul de acuratețe al diferitelor estimări și previziuni. Dacă variația este foarte mare, atunci și abaterea standard va fi mare, prin urmare, prognoza va fi inexactă, ceea ce va fi exprimat, de exemplu, în intervale de încredere foarte largi.

    Coeficientul de variație

    Abaterea standard oferă o estimare absolută a măsurii de răspândire. Prin urmare, pentru a înțelege cât de mare este răspândirea în raport cu valorile în sine (adică, indiferent de scara lor), este necesar un indicator relativ. Acest indicator se numește coeficient de variațieși se calculează folosind următoarea formulă:

    Coeficientul de variație este măsurat ca procent (dacă este înmulțit cu 100%). Prin acest indicator, puteți compara o varietate de fenomene, indiferent de scara și unitățile de măsură ale acestora. Acest lucruși face ca coeficientul de variație să fie atât de popular.

    În statistică, se acceptă că dacă valoarea coeficientului de variație este mai mică de 33%, atunci populația este considerată omogenă, dacă este mai mare de 33%, atunci este eterogenă. Mi-e greu să comentez aici. Nu știu cine și de ce a definit-o în acest fel, dar este considerată o axiomă.

    Simt că am fost purtat de o teorie seacă și trebuie să aduc ceva vizual și figurativ. Pe de altă parte, toți indicatorii de variație descriu aproximativ același lucru, doar că sunt calculați diferit. Prin urmare, este dificil să străluciți cu o varietate de exemple.Numai valorile indicatorilor pot diferi, dar nu și esența lor. Deci, să comparăm cum diferă valorile diferiților indicatori de variație pentru același set de date. Să luăm un exemplu cu calculul abaterii liniare medii (a ). Iată datele originale:

    Și o diagramă de memento.

    Pe baza acestor date, calculăm diverși indicatori variatii.

    Media este media aritmetică obișnuită.

    Intervalul de variație este diferența dintre maxim și minim:

    Abaterea liniară medie se calculează cu formula:

    Deviație standard:

    Rezumăm calculul într-un tabel.

    După cum puteți vedea, media liniară și abaterea standard dau valori similare pentru gradul de variație a datelor. Varianta este sigma pătrat, deci va fi întotdeauna relativă. un numar mare care, de fapt, nu spune nimic. Gama de variație este diferența dintre extreme și poate spune multe.

    Să rezumam câteva rezultate.

    Variația unui indicator reflectă variabilitatea unui proces sau fenomen. Gradul său poate fi măsurat folosind mai mulți indicatori.

    1. Gama de variație este diferența dintre maxim și minim. reflectă intervalul valori posibile.
    2. Abaterea liniară medie - reflectă media abaterilor absolute (modulo) ale tuturor valorilor populației analizate de la valoarea medie a acestora.
    3. Dispersia - pătratul mediu al abaterilor.
    4. Abaterea standard - rădăcina varianței (abaterile medii pătrate).
    5. Coeficientul de variație este cel mai universal indicator care reflectă gradul de dispersie a valorilor, indiferent de scara și unitățile de măsură ale acestora. Coeficientul de variație este măsurat ca procent și poate fi utilizat pentru a compara variația diferitelor procese și fenomene.

    Astfel, în analize statistice există un sistem de indicatori care reflectă omogenitatea fenomenelor şi stabilitatea proceselor. Adesea, indicatorii de variație nu au semnificație independentă și sunt utilizați pentru analiza ulterioară a datelor (calculul intervalelor de încredere