Formula pentru calcularea varianței totale. Varianta și abaterea standard în MS EXCEL

Soluţie.

Ca măsură de dispersie a valorilor variabilă aleatorie folosit dispersie

Dispersia (cuvântul dispersie înseamnă „împrăștiere”) este măsura dispersiei valorilor unei variabile aleatoare cu privire la ea așteptări matematice. Dispersia este așteptarea matematică a abaterii pătrate a unei variabile aleatoare de la așteptarea ei matematică

Dacă variabila aleatoare este discretă cu un set infinit, dar numărabil de valori, atunci

dacă seria din partea dreaptă a egalității converge.

Proprietăți de dispersie.

  • 1. Dispersia unei valori constante este zero
  • 2. Varianta sumei variabilelor aleatoare este egala cu suma variatiilor
  • 3. Un factor constant poate fi scos din semnul varianței la pătrat

Varianta diferenței variabilelor aleatoare este egală cu suma varianțelor

Această proprietate este o consecință a celei de-a doua și a treia proprietăți. Varianțele pot doar să se adună.

Varianta este calculată în mod convenabil printr-o formulă care este ușor de obținut folosind proprietățile varianței

Dispersia este întotdeauna pozitivă.

Dispersia are dimensiune pătratul dimensiunii variabilei aleatoare în sine, ceea ce nu este întotdeauna convenabil. Prin urmare, cantitatea

Mediu deviație standard (deviația standard sau standard) a unei variabile aleatoare este numită valoare aritmetică rădăcina pătrată a varianței sale

Aruncă două monede în valori de 2 și 5 ruble. Dacă moneda cade cu stema, atunci se acordă zero puncte, iar dacă este un număr, atunci numărul de puncte este egal cu valoarea monedei. Aflați așteptările matematice și varianța numărului de puncte.

Soluţie. Să găsim mai întâi distribuția variabilei aleatoare X - numărul de puncte. Toate combinațiile - (2; 5), (2; 0), (0; 5), (0; 0) - sunt la fel de probabile și legea distribuției:

Valorea estimata:

Găsim dispersia prin formula

de ce calculăm

Exemplul 2

Găsiți probabilitatea necunoscută R, așteptarea matematică și varianța unei variabile aleatoare discrete date de un tabel de distribuție a probabilității

Găsim așteptarea și varianța matematică:

M(X) = 00,0081 + 10,0756 + 20,2646 + 3 0,4116 + +40,2401=2,8

Pentru a calcula dispersia, folosim formula (19.4)

D(X) = 020 ,0081 + 120,0756 + 220,2646 + 320,4116 + 420,2401 - 2,82 = 8,68 -

Exemplul 3 Doi sportivi egali susțin un turneu care durează fie până la prima victorie a unuia dintre ei, fie până când s-au jucat cinci jocuri. Probabilitatea de a câștiga într-un singur joc pentru fiecare dintre sportivi este de 0,3, iar probabilitatea de egalitate este de 0,4. Găsiți legea distribuției, așteptările matematice și varianța numărului de jocuri jucate.

Soluţie. Valoare aleatoare X- numărul de jocuri jucate, ia valori de la 1 la 5, adică

Să stabilim probabilitățile de finalul meciului. Meciul se va încheia în primul set dacă unul dintre sportivi a câștigat. Probabilitatea de a câștiga este

R(1) = 0,3+0,3 =0,6.

Dacă a existat o remiză (probabilitatea unei remi este 1 - 0,6 = 0,4), atunci meciul continuă. Meciul se va încheia în al doilea joc, dacă primul a fost egal și cineva a câștigat al doilea. Probabilitate

R(2) = 0,4 0,6=0,24.

În mod similar, meciul se va încheia în al treilea joc dacă au fost două egaluri la rând și din nou cineva a câștigat

R(3) = 0,4 0,4 0,6 = 0,096. R(4)= 0,4 0,4 0,4 0,6=0,0384.

A cincea parte în orice variantă este ultima.

R(5)= 1 - (R(1)+R(2)+R(3)+R(4)) = 0,0256.

Să rezumăm totul într-un tabel. Legea distribuției variabilei aleatoare „număr de jocuri câștigate” are forma

Valorea estimata

Dispersia se calculează prin formula (19.4)

Distribuții discrete standard.

Distribuție binomială. Să fie implementată schema experimentului Bernoulli: n experimente independente identice, în fiecare dintre ele un eveniment A poate apărea cu probabilitate constantă pși nu va apărea cu o probabilitate

(vezi prelegerea 18).

Numărul de apariții ale evenimentului Aîn aceste n experimente există o variabilă aleatoare discretă X, valori posibile care:

0; 1; 2; ... ;m; ... ; n.

Probabilitatea de apariție m evenimentele A dintr-o serie anume din n experimentele cu și legea distribuției unei astfel de variabile aleatoare este dată de formula Bernoulli (vezi prelegerea 18)

Caracteristicile numerice ale unei variabile aleatorii X distribuite conform legii binomiale:

Dacă n este mare (), apoi, la, formula (19.6) intră în formulă

și funcția Gaussiană tabelată (tabelul de valori al funcției Gauss este dat la sfârșitul cursului 18).

În practică, adesea nu probabilitatea în sine este importantă. m evenimente Aîntr-o anumită serie n experiențe și probabilitatea ca evenimentul A va apărea cel puțin

ori și nu mai multe ori, adică probabilitatea ca X să ia valorile

Pentru a face acest lucru, trebuie să însumăm probabilitățile

Dacă n este mare (), apoi, la, formula (19.9) trece în formula aproximativă

funcţie tabelată. Tabelele sunt date la sfârșitul Lecției 18.

Când utilizați tabele, rețineți că

Exemplul 1. Mașina, apropiindu-se de intersecție, poate continua să se deplaseze pe oricare dintre cele trei drumuri: A, B sau C cu aceeași probabilitate. Cinci mașini se apropie de intersecție. Aflați numărul mediu de mașini care vor merge pe drumul A și probabilitatea ca trei mașini să meargă pe drumul B.

Soluţie. Numărul de mașini care trec pe fiecare dintre drumuri este o variabilă aleatorie. Dacă presupunem că toate mașinile care se apropie de intersecție fac o călătorie independent unele de altele, atunci această variabilă aleatorie este distribuită conform legii binomiale cu

n= 5 și p = .

Prin urmare, numărul mediu de mașini care vor urma drumul A este conform formulei (19,7)

iar probabilitatea dorită la

Exemplul 2 Probabilitatea de defectare a dispozitivului în fiecare test este de 0,1. Se fac 60 de teste ale aparatului. Care este probabilitatea ca aparatul să se defecteze: a) de 15 ori; b) de cel mult 15 ori?

A. Deoarece numărul de teste este 60, folosim formula (19.8)

Conform tabelului 1 din anexa la cursul 18, găsim

b. Folosim formula (19.10).

Conform tabelului 2 din anexa la cursul 18

  • - 0,495
  • 0,49995

distribuția Poisson) legea fenomenelor rare). Dacă n grozav, și R mic (), în timp ce produsul etc păstrează o valoare constantă, pe care o notăm cu l,

apoi formula (19.6) trece în formula Poisson

Legea distribuției Poisson are forma:

În mod evident, definiția legii lui Poisson este corectă, deoarece principala proprietate a seriei de distribuţie

îndeplinită, pentru că suma rândurilor

Extinderea într-o serie de funcții este scrisă între paranteze pt

Teorema. Așteptările și varianța matematică ale unei variabile aleatoare distribuite conform legii Poisson coincid și sunt egale cu parametrul acestei legi, i.e.

Dovada.

Exemplu. Pentru a-și promova produsele pe piață, compania își propune cutii poştale pliante publicitare. Experiența anterioară arată că în aproximativ un caz din 2.000 urmează o comandă. Găsiți probabilitatea ca cel puțin o comandă să fie primită după plasarea a 10.000 de fluturași, numărul mediu de comenzi primite și variația numărului de comenzi primite.

Soluţie. Aici

Probabilitatea ca cel puțin o comandă să ajungă, o găsim prin probabilitate eveniment opus, adică

Flux aleatoriu de evenimente. Un flux de evenimente este o secvență de evenimente care au loc în momente aleatorii. Exemple tipice de fluxuri sunt defecțiunile în rețelele de calculatoare, apelurile la centralele telefonice, un flux de cereri pentru reparații de echipamente etc.

curgere evenimente se numește staționar, dacă probabilitatea de a atinge unul sau altul număr de evenimente pe un interval de timp de lungime depinde numai de lungimea intervalului și nu depinde de locația intervalului de timp pe axa timpului.

Condiția de staționaritate este satisfăcută de fluxul de aplicații, ale căror caracteristici probabilistice nu depind de timp. În special, un flux staționar este caracterizat de o densitate constantă (număr mediu de cereri pe unitatea de timp). În practică, există adesea fluxuri de aplicații care (cel puțin pentru o perioadă limitată de timp) pot fi considerate staționare. De exemplu, fluxul de apeluri la o centrală telefonică din oraș în intervalul de timp de la 12 la 13 ore poate fi considerat staționar. Același flux pe parcursul întregii zile nu mai poate fi considerat staționar (noaptea densitatea apelurilor este mult mai mică decât în ​​timpul zilei).

curgere evenimentele se numesc flux fara efect, dacă pentru orice segmente de timp care nu se suprapun numărul de evenimente care se încadrează pe unul dintre ele nu depinde de numărul de evenimente care se încadrează pe celelalte.

Condiția fără efecte secundare, care este cea mai esențială pentru cel mai simplu flux, înseamnă că revendicările intră în sistem independent una de cealaltă. De exemplu, fluxul de pasageri care intră în stația de metrou poate fi considerat un flux fără efecte secundare, deoarece motivele care au determinat sosirea unui pasager individual în acel moment și nu altul, de regulă, nu sunt legate de motive similare pentru alte pasagerii. Cu toate acestea, condiția absenței unui efect secundar poate fi ușor încălcată din cauza apariției unei astfel de dependențe. De exemplu, fluxul de pasageri care părăsesc o stație de metrou nu mai poate fi considerat un flux fără efecte secundare, deoarece timpii de ieșire a pasagerilor care sosesc cu același tren depind unul de celălalt.

curgere evenimente se numește comun, dacă probabilitatea de a lovi două sau mai multe evenimente într-un interval de timp mic t este neglijabilă în comparație cu probabilitatea de a lovi un eveniment (în acest sens, legea lui Poisson se numește legea evenimentelor rare).

Condiția de ordinaritate înseamnă că aplicațiile vin pe rând, și nu în perechi, tripleți etc. abaterea varianței distribuția Bernoulli

De exemplu, fluxul de clienți care intră într-un salon de coafură poate fi considerat aproape obișnuit. Dacă într-un flux extraordinar aplicațiile vin doar în perechi, doar în tripleți etc., atunci debitul extraordinar poate fi ușor redus la unul obișnuit; pentru aceasta este suficient să luăm în considerare fluxul de perechi, triple etc., în loc de un flux de aplicații individuale.Va fi mai dificil dacă fiecare aplicație se poate dovedi aleatoriu a fi dublă, triplă etc. Atunci trebuie deja se confruntă cu un flux de evenimente nu omogene, ci eterogene.

Dacă fluxul de evenimente are toate cele trei proprietăți (adică este staționar, obișnuit și nu are efect secundar), atunci se numește cel mai simplu flux (sau staționar Poisson). Denumirea „Poisson” se datorează faptului că, în condițiile de mai sus, numărul de evenimente care se încadrează pe orice interval de timp fix va fi distribuit pe legea lui Poisson

Iată numărul mediu de evenimente A care apar pe unitatea de timp.

Această lege este uniparametrică, adică necesită un singur parametru pentru a fi cunoscut. Se poate demonstra că așteptările matematice și varianța din legea lui Poisson sunt numeric egale:

Exemplu. Lăsați la mijlocul zilei de lucru, numărul mediu de solicitări este de 2 pe secundă. Care este probabilitatea ca 1) să nu fie primite cereri într-o secundă, 2) 10 cereri să fie primite în două secunde?

Soluţie. Deoarece validitatea aplicării legii lui Poisson este dincolo de orice îndoială și parametrul acestuia este setat (= 2), soluția problemei se reduce la aplicarea formulei Poisson (19.11)

1) t = 1, m = 0:

2) t = 2, m = 10:

Lege numere mari. Baza matematică pentru faptul că valorile unei variabile aleatoare sunt grupate în jurul unor valori constante este legea numerelor mari.

Din punct de vedere istoric, prima formulare a legii numerelor mari a fost teorema lui Bernoulli:

„Cu o creștere nelimitată a numărului de experimente identice și independente n, frecvența de apariție a evenimentului A converge în probabilitate cu probabilitatea sa”, i.e.

unde este frecvența de apariție a evenimentului A în n experimente,

În mod substanțial, expresia (19.10) înseamnă că atunci când numere mari experimentează frecvența evenimentelor A poate înlocui probabilitatea necunoscută a acestui eveniment și, cu cât numărul de experimente este mai mare, cu atât p* este mai aproape de p. interesant fapt istoric. K. Pearson a aruncat o monedă de 12000 de ori și stema lui a căzut de 6019 ori (frecvență 0,5016). Când a aruncat aceeași monedă de 24.000 de ori, a primit 12.012 picături de stemă, adică. frecventa 0,5005.

Cea mai importantă formă a legii numerelor mari este teorema lui Cebyshev: cu o creștere nelimitată a numărului de independenți, având o varianță finită și efectuate în aceleași condiții de experimente, media aritmetică a valorilor observate ale unei variabile aleatoare converge în probabilitate cu așteptarea sa matematică. În formă analitică, această teoremă poate fi scrisă după cum urmează:

Teorema lui Cebyshev, pe lângă semnificația sa teoretică fundamentală, are și o importanță uz practic, de exemplu, în teoria măsurătorilor. După n măsurători ale unei cantităţi X, obțineți diferite valori nepotrivite X 1, X 2, ..., xn. Pentru valoarea aproximativă a valorii măsurate X luați media aritmetică a valorilor observate

în care, cu cât sunt efectuate mai multe experimente, cu atât rezultatul va fi mai precis. Cert este că varianța valorii scade odată cu creșterea numărului de experimente efectuate, deoarece

D(X 1) = D(X 2)=…= D(xn) D(X) , Acea

Relația (19.13) arată că chiar și cu o inexactitate mare a instrumentelor de măsură (valoare mare), prin creșterea numărului de măsurători, este posibil să se obțină un rezultat cu o precizie arbitrar de mare.

Folosind formula (19.10), se poate găsi probabilitatea ca frecvența statistică să se abate de la probabilitate cu cel mult

Exemplu. Probabilitatea unui eveniment în fiecare încercare este de 0,4. Câte teste ar trebui efectuate pentru a ne aștepta, cu o probabilitate nu mai mică de 0,8, ca frecvența relativă a unui eveniment să devieze de la probabilitatea modulo mai mică de 0,01?

Soluţie. Prin formula (19.14)

prin urmare, conform tabelului, există două aplicații

prin urmare, n 3932.

Dispersia în statistici este definită ca abaterea standard a valorilor individuale ale unei caracteristici la pătrat de la media aritmetică. O modalitate obișnuită de a calcula abaterile pătrate ale opțiunilor de la medie și apoi de a le media.

În analiza economică și statistică, se obișnuiește să se evalueze variația unei caracteristici cel mai adesea folosind abaterea standard, care este rădăcina pătrată a varianței.

(3)

Caracterizează fluctuația absolută a valorilor atributului variabil și este exprimată în aceleași unități ca și variantele. În statistică, adesea devine necesar să se compare variația diferitelor caracteristici. Pentru astfel de comparații, se folosește un indicator relativ de variație, coeficientul de variație.

Proprietăți de dispersie:

1) dacă scădeți orice număr din toate opțiunile, atunci varianța nu se va modifica;

2) dacă toate valorile variantei sunt împărțite la un număr b, atunci varianța va scădea de b^2 ori, adică.

3) dacă calculați pătratul mediu al abaterilor de la orice număr cu o medie aritmetică inegală, atunci acesta va fi mai mare decât varianța. În acest caz, printr-o valoare bine definită pe pătrat a diferenței dintre valoarea medie a pos.

Varianta poate fi definită ca diferența dintre pătratul mediu și pătratul mediu.

17. Variații de grup și intergrup. Regula de adunare a variațiilor

Dacă populația statistică este împărțită în grupuri sau părți în funcție de caracteristica studiată, atunci pentru o astfel de populație pot fi calculate următoarele tipuri de dispersie: grup (privat), medie de grup (privat) și intergrup.

Varianta totala- reflectă variaţia unei trăsături datorită tuturor condiţiilor şi cauzelor care operează într-o populaţie statistică dată.

Varianta de grup- este egal cu pătratul mediu al abaterilor valorilor individuale ale atributului din cadrul grupului de la media aritmetică a acestui grup, numită media grupului. În acest caz, media grupului nu coincide cu media totală pentru întreaga populație.

Varianta de grup reflectă variația unei trăsături numai datorită condițiilor și cauzelor care operează în cadrul grupului.

Variante medii de grup- este definită ca media aritmetică ponderată a dispersiilor grupelor, ponderile fiind volumele grupurilor.

Varianta intergrup- este egal cu pătratul mediu al abaterilor mediilor grupului de la media totală.

Varianta intergrup caracterizează variația atributului rezultat datorită atributului de grupare.

Există o anumită relație între tipurile de dispersie considerate: dispersia totală este egală cu suma dispersiei medii de grup și intergrup.

Această relație se numește regula de adunare a varianței.

18. Seria dinamică și elementele sale constitutive. Tipuri de serii dinamice.

Serii în statistică- sunt date digitale care arată dacă un fenomen se modifică în timp sau în spațiu și fac posibilă efectuarea unei comparații statistice a fenomenelor atât în ​​procesul dezvoltării lor în timp, cât și în diferite formeși tipuri de procese. Datorită acestui fapt, este posibilă detectarea dependenței reciproce a fenomenelor.

Procesul de dezvoltare a mișcării în timp a fenomenelor sociale în statistică se numește de obicei dinamică. Pentru a afișa dinamica, se construiesc serii de dinamice (cronologice, temporale), care sunt serii de valori variabile în timp ale unui indicator statistic (de exemplu, numărul de condamnați peste 10 ani), situat în ordine cronologica. Elementele lor constitutive sunt valorile numerice ale unui indicator dat și perioadele sau momentele de timp la care se referă.

Cea mai importantă caracteristică a seriei de timp- mărimea lor (volum, valoare) a unui fenomen, realizat într-o anumită perioadă sau într-un anumit moment. În consecință, mărimea termenilor seriei de dinamică este nivelul acesteia. Distinge nivelurile inițiale, mijlocii și finale ale seriei dinamice. Primul nivel arată valoarea primului, final - valoarea ultimului membru al seriei. Nivel mediu reprezintă intervalul variațional cronologic mediu și se calculează în funcție de faptul că seria temporală este interval sau instant.

O altă caracteristică importantă a seriei dinamice- timpul scurs de la observația inițială până la cea finală, sau numărul de astfel de observații.

Există diferite tipuri de serii temporale, acestea pot fi clasificate după următoarele criterii.

1) În funcție de modul de exprimare a nivelurilor, seriile de dinamică se împart în serii de indicatori absoluti și derivați (valori relative și medii).

2) În funcție de modul în care nivelurile seriei exprimă starea fenomenului în anumite momente de timp (la începutul lunii, trimestrului, anului etc.) sau valoarea acestuia pentru anumite intervale de timp (de exemplu, pe zi, lună, an etc.) n.), distingeți între serii de moment și, respectiv, interval de dinamică. Serii de momente în activitatea analitică a agențiilor de aplicare a legii sunt utilizate relativ rar.

În teoria statisticii, dinamica se distinge și după o serie de alte trăsături de clasificare: în funcție de distanța dintre niveluri - cu nivele echidistante și nivele inegale în timp; în funcţie de prezenţa tendinţei principale a procesului studiat – staţionar şi non-staţionar. Atunci când se analizează serii dinamice, următoarele niveluri ale seriei sunt prezentate ca componente:

Y t \u003d TP + E (t)

unde TR este o componentă deterministă care determină tendința generală de schimbare în timp sau o tendință.

E (t) este o componentă aleatorie care provoacă fluctuații de nivel.

Dispersia eu Dispersie (din latină dispersio - dispersie)

în statistica matematică și teoria probabilității, cea mai comună măsură a dispersiei, adică abaterile de la medie. În sens statistic, D.

este media aritmetică a abaterilor pătrate ale valorilor x i din media lor aritmetică

În teoria probabilității, distribuția unei variabile aleatoare X se numește așteptarea E ( X - m x) 2 abatere la pătrat X din așteptările ei matematice m x= E ( X). D. variabilă aleatoare X notat cu D ( X) sau prin σ 2 X. Rădăcina pătrată a lui D. (adică σ, dacă D. este σ 2) se numește abatere standard (vezi Abaterea pătrată).

Pentru o variabilă aleatorie X Cu distribuție continuă probabilități caracterizate printr-o densitate de probabilitate (vezi Densitatea probabilității) R(X), D. se calculează prin formula

În teoria probabilității mare importanță are o teoremă: D. suma termenilor independenți este egală cu suma D lor. Nu mai puțin importantă este inegalitatea Cebyshev, care permite estimarea probabilității abaterilor mari ale unei variabile aleatoare X din așteptările sale matematice.

II Dispersia

Prezența undelor D. duce la o distorsiune a formei semnalelor pe măsură ce acestea se propagă în mediu. Acest lucru se datorează undelor armonice frecvente diferite, în care semnalul poate fi descompus, se propagă la viteze diferite (pentru detalii, vezi Unde, Viteza grupului). D. a luminii atunci când se propagă într-o prismă transparentă duce la descompunerea luminii albe într-un spectru (vezi Dispersia luminii).


Marea Enciclopedie Sovietică. - M.: Enciclopedia Sovietică. 1969-1978 .

Sinonime:

Vedeți ce este „Dispersia” în alte dicționare:

    dispersie- Imprăștiind ceva. În matematică, varianța măsoară abaterea valorilor de la medie. Dispersia luminii albe duce la descompunerea acesteia în componente. Dispersia sunetului este cauza răspândirii acestuia. Se împrăștie datele stocate în… … Manualul Traducătorului Tehnic

    Enciclopedia modernă

    - (varianță) O măsură a împrăștierii datelor. Varianța unei mulțimi de N termeni se găsește adunând pătratele abaterilor lor de la medie și împărțind la N. Prin urmare, dacă termenii sunt xi la i = 1, 2, ..., N, iar media lor este m , varianța ...... Dicționar economic

    Dispersia- (din latinescul dispersio scattering) unde, dependența vitezei de propagare a undelor într-o substanță de lungimea de undă (frecvența). Se determină dispersia proprietăți fizice mediul în care se propagă undele. De exemplu, în vid ...... Ilustrat Dicţionar enciclopedic

    - (din lat. dispersio scattering) în statistica matematică și teoria probabilității, o măsură a dispersiei (abaterea de la medie). În statistică, varianța este media aritmetică a abaterilor pătrate ale valorilor observate (x1, x2,...,xn) ale unui ... ... Dicţionar enciclopedic mare

    În teoria probabilității, cea mai utilizată măsură a abaterii de la medie (măsura de împrăștiere). Engleză: Dispersion Sinonime: Statistical dispersion Sinonime în engleză: Statistical dispersion Vezi și: Eșantion de populații Financiar…… Vocabular financiar

    - [lat. dispersus împrăștiat, împrăștiat] 1) împrăștiere; 2) chimic, fizic. descompunerea unei substanțe în particule foarte mici. D. descompunerea luminii a luminii albe folosind o prismă într-un spectru; 3) mat. abatere de la medie. Dicţionar cuvinte străine. Komlev N.G.,… … Dicționar de cuvinte străine ale limbii ruse

    dispersie- indicator (varianță) al dispersării datelor, corespunzător pătratului mediu al abaterii acestor date de la media aritmetică. Egal cu un pătrat deviație standard. Dicţionar psiholog practic. Moscova: AST, Harvest. S. Yu. Golovin. 1998... Marea Enciclopedie Psihologică

    Scattering, scattering Dicționar de sinonime rusești. substantiv dispersie, număr de sinonime: 6 nanodispersion (1) … Dicţionar de sinonime

    Dispersia este caracteristica de dispersie a valorilor unei variabile aleatoare, măsurată prin pătratul abaterilor acestora de la valoarea medie (notat cu d2). D. diferă teoretic (continuu sau discret) și empiric (tot continuu și ... ... Dicţionar economic şi matematic

    Dispersia- * dispersie * dispersie 1. Imprastiere; împrăștia; variaţie (vezi). 2. Un concept teoretic probabilist care caracterizează gradul de abatere al unei variabile aleatoare de la așteptarea ei matematică. În practica biometrică, este utilizat varianța eșantionului s2... Genetica. Dicţionar enciclopedic

Cărți

  • Dispersie anormală în benzi largi de absorbție, D.S. Crăciun. Reproduce în ortografia originală a autorului ediției din 1934 (editura `Proceedings of the Academy of Sciences of the URSS`). ÎN…

Teoria probabilității este o ramură specială a matematicii care este studiată numai de studenții instituțiilor de învățământ superior. Îți plac calculele și formulele? Nu vă este frică de perspectivele de familiarizare cu distribuția normală, entropia ansamblului, așteptările matematice și varianța unei variabile aleatoare discrete? Atunci acest subiect va fi de mare interes pentru tine. Să ne familiarizăm cu unele dintre cele mai importante concepte de bază ale acestei secțiuni a științei.

Să ne amintim elementele de bază

Chiar dacă îți amintești cel mai mult concepte simple teoria probabilității, nu neglijați primele paragrafe ale articolului. Ideea este că fără înţelegere clară de bază, nu veți putea lucra cu formulele discutate mai jos.

Deci există unele eveniment aleatoriu, ceva experiment. Ca urmare a acțiunilor efectuate, putem obține mai multe rezultate - unele dintre ele sunt mai frecvente, altele mai puțin frecvente. Probabilitatea unui eveniment este raportul dintre numărul de rezultate efectiv primite de un tip la numărul total posibil. Numai cunoscând definiția clasică a acestui concept, puteți începe să studiați așteptările matematice și dispersia variabilelor aleatoare continue.

In medie

Înapoi la școală, la lecțiile de matematică, ai început să lucrezi cu media aritmetică. Acest concept este utilizat pe scară largă în teoria probabilității și, prin urmare, nu poate fi ignorat. Principalul lucru pentru noi în acest moment este că îl vom întâlni în formulele pentru așteptarea și varianța matematică a unei variabile aleatoare.

Avem o succesiune de numere și vrem să aflăm media aritmetică. Tot ceea ce ni se cere este să însumăm tot ceea ce este disponibil și să împărțim la numărul de elemente din succesiune. Să avem numere de la 1 la 9. Suma elementelor va fi 45, iar această valoare o vom împărți la 9. Răspuns: - 5.

Dispersia

În termeni științifici, varianța este pătratul mediu al abaterilor valorilor caracteristicilor obținute de la media aritmetică. Unul este notat cu litera latină majusculă D. Ce este necesar pentru a o calcula? Pentru fiecare element al șirului, calculăm diferența dintre numărul disponibil și media aritmetică și o pătratăm. Vor exista exact atâtea valori câte rezultate pot exista pentru evenimentul pe care îl luăm în considerare. În continuare, rezumăm totul primit și împărțim la numărul de elemente din secvență. Dacă avem cinci rezultate posibile, atunci împărțiți la cinci.

Varianta are, de asemenea, proprietăți pe care trebuie să le rețineți pentru a o aplica atunci când rezolvați probleme. De exemplu, dacă variabila aleatoare este mărită de X ori, varianța crește de X ori pătratul (adică, X*X). Nu este niciodată mai mic de zero și nu depinde de deplasarea valorilor cu o valoare egală în sus sau în jos. De asemenea, pentru încercările independente, varianța sumei este egală cu suma variațiilor.

Acum trebuie să luăm în considerare exemple de varianță a unei variabile aleatoare discrete și așteptările matematice.

Să presupunem că rulăm 21 de experimente și obținem 7 rezultate diferite. Am observat fiecare dintre ele, respectiv, de 1,2,2,3,4,4 și, respectiv, de 5 ori. Care va fi variația?

Mai întâi, calculăm media aritmetică: suma elementelor, desigur, este 21. O împărțim la 7, obținând 3. Acum scădem 3 din fiecare număr din șirul inițial, pătram fiecare valoare și adunăm rezultatele împreună. . Se dovedește 12. Acum ne rămâne să împărțim numărul la numărul de elemente și, s-ar părea, atât. Dar există o captură! Să discutăm.

Dependența de numărul de experimente

Se pare că atunci când se calculează varianța, numitorul poate fi unul dintre cele două numere: fie N, fie N-1. Aici N este numărul de experimente efectuate sau numărul de elemente din secvență (care este în esență același lucru). De ce depinde?

Dacă numărul de teste este măsurat în sute, atunci trebuie să punem la numitor N. Dacă este în unități, atunci N-1. Oamenii de știință au decis să deseneze granița în mod destul de simbolic: astăzi trece de-a lungul numărului 30. Dacă am efectuat mai puțin de 30 de experimente, atunci vom împărți cantitatea cu N-1, iar dacă mai mult, atunci cu N.

Sarcină

Să ne întoarcem la exemplul nostru de rezolvare a problemei varianței și așteptărilor. Am obținut un număr intermediar de 12, care trebuia împărțit la N sau N-1. Deoarece am efectuat 21 de experimente, adică mai puțin de 30, vom alege a doua opțiune. Deci răspunsul este: varianța este 12 / 2 = 2.

Valorea estimata

Să trecem la al doilea concept, pe care trebuie să îl luăm în considerare în acest articol. Așteptarea matematică este rezultatul adunării tuturor rezultatelor posibile înmulțite cu probabilitățile corespunzătoare. Este important de înțeles că valoarea rezultată, precum și rezultatul calculării varianței, se obține o singură dată pentru întreaga sarcină, indiferent de câte rezultate ia în considerare.

Formula de așteptare matematică este destul de simplă: luăm rezultatul, îl înmulțim cu probabilitatea lui, adăugăm același lucru pentru al doilea, al treilea rezultat etc. Tot ce este legat de acest concept este ușor de calculat. De exemplu, suma așteptărilor matematice este egală cu așteptările matematice ale sumei. Același lucru este valabil și pentru lucrare. Astfel de operatii simple departe de orice mărime din teoria probabilității ne permite să ne îndeplinim cu ea. Să luăm o sarcină și să calculăm valoarea a două concepte pe care le-am studiat simultan. În plus, am fost distrași de teorie – este timpul să exersăm.

Încă un exemplu

Am efectuat 50 de studii și am obținut 10 tipuri de rezultate - numere de la 0 la 9 - care apar în procente diferite. Acestea sunt, respectiv: 2%, 10%, 4%, 14%, 2%, 18%, 6%, 16%, 10%, 18%. Amintiți-vă că pentru a obține probabilitățile, trebuie să împărțiți valorile procentuale la 100. Astfel, obținem 0,02; 0,1 etc. Să prezentăm un exemplu de rezolvare a problemei pentru varianța unei variabile aleatoare și așteptarea matematică.

Calculăm media aritmetică folosind formula cu care ne amintim scoala elementara: 50/10 = 5.

Acum să traducem probabilitățile în numărul de rezultate „pe bucăți” pentru a face mai convenabil numărarea. Obținem 1, 5, 2, 7, 1, 9, 3, 8, 5 și 9. Scădem media aritmetică din fiecare valoare obținută, după care punem la pătrat fiecare dintre rezultatele obținute. Vedeți cum să faceți acest lucru cu primul element ca exemplu: 1 - 5 = (-4). Mai mult: (-4) * (-4) = 16. Pentru alte valori, faceți singur aceste operații. Dacă ați făcut totul bine, atunci după ce ați adăugat totul obțineți 90.

Să continuăm calcularea varianței și a mediei împărțind 90 la N. De ce alegem N și nu N-1? Așa este, pentru că numărul de experimente efectuate depășește 30. Deci: 90/10 = 9. Am obținut dispersia. Dacă primești un alt număr, nu dispera. Cel mai probabil, ai făcut o eroare banală în calcule. Verificați din nou ceea ce ați scris și, cu siguranță, totul va fi la locul său.

În cele din urmă, să ne amintim formula de așteptare matematică. Nu vom da toate calculele, vom scrie doar răspunsul cu care puteți verifica după finalizarea tuturor procedurilor solicitate. Valoarea așteptată va fi 5,48. Ne amintim doar cum să efectuăm operațiuni, folosind exemplul primelor elemente: 0 * 0,02 + 1 * 0,1 ... și așa mai departe. După cum puteți vedea, pur și simplu înmulțim valoarea rezultatului cu probabilitatea acestuia.

Deviere

Un alt concept strâns legat de dispersie și așteptările matematice este abaterea standard. Este marcat fie cu litere latine sd sau greacă minusculă „sigma”. Acest concept arată cum, în medie, valorile se abat de la caracteristică centrală. Pentru a-i găsi valoarea, trebuie să calculați Rădăcină pătrată din dispersie.

Dacă trasați o distribuție normală și doriți să vedeți direct pe ea deviație standard, acest lucru se poate face în mai mulți pași. Luați jumătate din imagine la stânga sau la dreapta modului ( importanță centrală), trageți o perpendiculară pe axa orizontală, astfel încât ariile figurilor rezultate să fie egale. Valoarea segmentului dintre mijlocul distribuției și proiecția rezultată pe axa orizontală va fi abaterea standard.

Software

După cum se poate observa din descrierile formulelor și exemplele prezentate, calcularea varianței și a așteptărilor matematice nu este cea mai ușoară procedură din punct de vedere aritmetic. Pentru a nu pierde timpul, este logic să folosiți programul folosit în superioare institutii de invatamant- se numește „R”. Are funcții care vă permit să calculați valori pentru multe concepte din statistică și teoria probabilității.

De exemplu, definiți un vector de valori. Aceasta se face astfel: vector<-c(1,5,2…). Теперь, когда вам потребуется посчитать какие-либо значения для этого вектора, вы пишете функцию и задаете его в качестве аргумента. Для нахождения дисперсии вам нужно будет использовать функцию var. Пример её использования: var(vector). Далее вы просто нажимаете «ввод» и получаете результат.

In cele din urma

Dispersia și așteptările matematice sunt fără de care este dificil să calculezi ceva în viitor. În cursul principal al prelegerilor la universități, acestea sunt luate în considerare deja în primele luni de studiu a materiei. Tocmai din cauza lipsei de înțelegere a acestor concepte simple și a incapacității de a le calcula, mulți studenți încep imediat să rămână în urmă în program și ulterior primesc note slabe la sfârșitul sesiunii, ceea ce îi privează de burse.

Exersează cel puțin o săptămână timp de o jumătate de oră pe zi, rezolvând sarcini similare cu cele prezentate în acest articol. Apoi, la orice test de teorie a probabilităților, vei face față exemplelor fără sfaturi străine și foi de cheat.

Dispersiavariabilă aleatorie- o măsură a dispersiei unui dat variabilă aleatorie, adică ea abaterile din așteptările matematice. În statistică, notația (sigma pătrat) este adesea folosită pentru a desemna varianța. Rădăcina pătrată a varianței se numește deviație standard sau spread standard. Abaterea standard este măsurată în aceleași unități ca și variabila aleatoare în sine, iar varianța este măsurată în pătratele acelei unități.

Deși este foarte convenabil să folosiți o singură valoare (cum ar fi media sau modul și mediana) pentru a estima întregul eșantion, această abordare poate duce cu ușurință la concluzii incorecte. Motivul acestei situații nu constă în valoarea în sine, ci în faptul că o valoare nu reflectă în niciun fel răspândirea valorilor datelor.

De exemplu, în eșantion:

media este 5.

Cu toate acestea, nu există niciun element în eșantion în sine cu o valoare de 5. Poate fi necesar să știți cât de aproape este fiecare element al eșantionului de valoarea sa medie. Sau, cu alte cuvinte, trebuie să cunoașteți varianța valorilor. Știind măsura în care datele s-au schimbat, puteți interpreta mai bine valoarea medie, medianȘi Modă. Gradul de modificare a valorilor eșantionului este determinat prin calcularea varianței și a abaterii standard a acestora.



Varianta și rădăcina pătrată a varianței, numite abatere standard, caracterizează abaterea medie de la media eșantionului. Dintre aceste două cantități, cea mai importantă este deviație standard. Această valoare poate fi reprezentată ca distanța medie la care se află elementele față de elementul mijlociu al probei.

Dispersia este dificil de interpretat în mod semnificativ. Cu toate acestea, rădăcina pătrată a acestei valori este abaterea standard și se pretează bine interpretării.

Abaterea standard este calculată determinând mai întâi varianța și apoi calculând rădăcina pătrată a varianței.

De exemplu, pentru matricea de date prezentată în figură, se vor obține următoarele valori:

Poza 1

Aici, media diferențelor pătrate este 717,43. Pentru a obține abaterea standard, rămâne doar să luăm rădăcina pătrată a acestui număr.

Rezultatul va fi de aproximativ 26,78.

Trebuie reținut că abaterea standard este interpretată ca distanța medie la care se află elementele față de media eșantionului.

Abaterea standard arată cât de bine descrie media întregul eșantion.

Să presupunem că ești șeful departamentului de producție pentru asamblarea unui PC. Raportul trimestrial spune că producția pentru ultimul trimestru a fost de 2500 de computere. Este rău sau bun? Ați cerut (sau există deja această coloană în raport) să afișați abaterea standard pentru aceste date în raport. Numărul abaterii standard, de exemplu, este 2000. Vă devine clar, în calitate de șef de departament, că linia de producție are nevoie de un control mai bun (abateri prea mari ale numărului de PC-uri care sunt asamblate).

Amintiți-vă că, atunci când abaterea standard este mare, datele sunt împrăștiate pe scară largă în jurul mediei, iar când abaterea standard este mică, se grupează aproape de medie.

Patru funcții statistice VARP(), VARP(), STDEV() și STDEV() sunt concepute pentru a calcula varianța și abaterea standard a numerelor dintr-un interval de celule. Înainte de a putea calcula varianța și abaterea standard a unui set de date, trebuie să determinați dacă datele reprezintă populația sau un eșantion al populației. În cazul unui eșantion din populația generală, trebuie utilizate funcțiile VARP() și STDEV(), iar în cazul populației generale, funcțiile VARP() și STDEV() trebuie utilizate:

Populația Funcţie

VARP()

STDLONG()
Probă

VARI()

STDEV()

Varianta (precum și abaterea standard), așa cum am observat, indică măsura în care valorile incluse în setul de date sunt împrăștiate în jurul mediei aritmetice.

O valoare mică a varianței sau abaterii standard indică faptul că toate datele sunt centrate în jurul mediei aritmetice, iar o valoare mare a acestor valori indică faptul că datele sunt împrăștiate pe o gamă largă de valori.

Varianta este destul de dificil de interpretat în mod semnificativ (ce înseamnă o valoare mică, o valoare mare?). Performanţă Sarcini 3 vă va permite să afișați vizual, pe un grafic, semnificația variației pentru un set de date.

Sarcini

· Exercitiul 1.

· 2.1. Dați conceptele: varianță și abatere standard; desemnarea lor simbolică în prelucrarea datelor statistice.

· 2.2. Întocmește o fișă de lucru în conformitate cu figura 1 și face calculele necesare.

· 2.3. Dați formulele de bază utilizate în calcule

· 2.4. Explicați toate notațiile ( , , )

· 2.5. Explicați semnificația practică a conceptului de varianță și abatere standard.

Sarcina 2.

1.1. Dați conceptele: populație generală și eșantion; așteptarea matematică și media aritmetică a desemnării lor simbolice în prelucrarea datelor statistice.

1.2. În conformitate cu figura 2, întocmește o fișă de lucru și face calcule.

1.3. Dați formulele de bază utilizate în calcule (pentru populația generală și eșantion).

Figura 2

1.4. Explicați de ce este posibil să obțineți astfel de valori ale mediilor aritmetice în eșantioane ca 46.43 și 48.78 (vezi fișierul Anexă). A trage concluzii.

Sarcina 3.

Există două mostre cu un set diferit de date, dar media pentru ele va fi aceeași:

Figura 3

3.1. Întocmește o fișă de lucru în conformitate cu figura 3 și face calculele necesare.

3.2. Dați formulele de calcul de bază.

3.3. Construiți grafice în conformitate cu figurile 4, 5.

3.4. Explicați dependențele rezultate.

3.5. Efectuați calcule similare pentru aceste două mostre.

Proba inițială 11119999

Selectați valorile celui de-al doilea eșantion, astfel încât media aritmetică pentru al doilea eșantion să fie aceeași, de exemplu:

Alegeți singur valorile pentru a doua probă. Aranjați calculele și trasați ca figurile 3, 4, 5. Afișați principalele formule care au fost utilizate în calcule.

Trageți concluziile adecvate.

Toate sarcinile trebuie prezentate sub forma unui raport cu toate cifrele, graficele, formulele și scurtele explicații necesare.

Notă: construcția graficelor trebuie explicată cu figuri și scurte explicații.