Graficul densității probabilității pentru o distribuție normală. Legea distribuției normale a variabilelor aleatoare. Diagrame de densitate ale distribuțiilor normale bivariate

Luați în considerare distribuția normală. Folosind funcțiaMS EXCELNORM.DIST() Să reprezentăm grafic funcția de distribuție și densitatea de probabilitate. Vom genera o matrice de numere aleatoare distribuite conform legii normale și vom evalua parametrii de distribuție, valoarea medie și abaterea standard.

Distribuție normală(numită și distribuție Gaussiană) este cea mai importantă atât în ​​teorie, cât și în aplicațiile sistemului de control al calității. Importanța valorii Distribuție normală(engleză) Normaldistributie) în multe domenii ale științei rezultă din teoria probabilității.

Definiţie: variabilă aleatoare x distribuite peste legea normală daca are:

Distribuție normală depinde de doi parametri: μ (mu)- este și σ ( sigma)- este (abatere standard). Parametrul μ determină poziția centrului densitatea de probabilitate distributie normala, iar σ este răspândirea relativă la centru (medie).

Nota: Influența parametrilor μ și σ asupra formei distribuției este descrisă în articolul despre și în fișier exemplu pe fișa Influența parametrilorÎl puteți folosi pentru a observa schimbarea formei curbei.

Distribuție normală în MS EXCEL

În MS EXCEL, începând cu versiunea 2010, pt Distribuție normală există o funcție NORM.DIST(), numele în engleză este NORM.DIST(), care vă permite să calculați densitatea de probabilitate(vezi formula de mai sus) și funcția de distribuție cumulativă(probabilitatea ca o variabilă aleatoare X să fie distribuită peste legea normală, va lua o valoare mai mică sau egală cu x). Calculele în acest ultim caz se fac folosind următoarea formulă:

Distribuția de mai sus este desemnată N(μ; σ). Notarea via N(μ; σ 2).

Nota: Înainte de MS EXCEL 2010, EXCEL avea doar funcția NORMDIST(), care vă permite, de asemenea, să calculați funcția de distribuție și densitatea probabilității. NORMDIST() este lăsat în MS EXCEL 2010 pentru compatibilitate.

Distribuție normală standard

Distribuție normală standard numit distributie normala cu μ=0 și σ=1. Distribuția de mai sus este desemnată N(0;1).

Nota: În literatura de specialitate pentru o variabilă aleatoare distribuită peste standard legea normală se atribuie o denumire specială z.

Orice distributie normala poate fi convertit în standard prin înlocuire variabilă z=(x-μ)/σ . Acest proces de conversie se numește standardizare.

Nota: MS EXCEL are o funcție NORMALIZE() care realizează conversia de mai sus. Deși în MS EXCEL această transformare este numită din anumite motive normalizare. Formule =(x-μ)/σ și =NORMALIZARE(x;μ;σ) va returna acelasi rezultat.

În MS EXCEL 2010 pentru Există o funcție specială NORM.ST.DIST() și varianta ei moștenită NORMSDIST() care efectuează calcule similare.

Vom demonstra cum se desfășoară procesul de standardizare în MS EXCEL distributie normala N(1,5; 2).

Pentru a face acest lucru, calculăm probabilitatea ca o variabilă aleatorie să fie distribuită legea normală N(1,5; 2), mai mic sau egal cu 2,5. Formula arată astfel: =NORMAL.DIST(2,5; 1,5; 2; TRUE)= 0,691462. Prin efectuarea unei modificări variabile z=(2,5-1,5)/2=0,5 , notează formula de calcul Distribuție normală standard:=NORM.ST.DIST(0,5, TRUE)=0,691462.

Desigur, ambele formule dau aceleași rezultate (vezi. exemplu fișă fișă Exemplu).

Rețineți că standardizare se aplică doar la (argument integrală este egal cu TRUE), și nu pentru densitatea de probabilitate.

Nota: În literatura de specialitate pentru o funcție care calculează probabilitățile unei variabile aleatoare distribuite peste standard legea normală se fixează o denumire specială Ф(z). În MS EXCEL această funcție este calculată folosind formula
=NORM.ST.DIST(z;TRUE). Calculele se fac folosind formula

Datorită parității funcției distribuția f(x), și anume f(x)=f(-x), funcție distribuție normală standard are proprietatea Ф(-x)=1-Ф(x).

Funcții inverse

Funcţie NORM.ST.DIST(x;TRUE) calculează probabilitatea P ca o variabilă aleatoare X să ia o valoare mai mică sau egală cu x. Dar adesea este necesar un calcul invers: cunoscând probabilitatea P, trebuie să calculați valoarea lui x. Se numește valoarea calculată a lui x standard distributie normala.

În MS EXCEL pentru calcul cuantile utilizați funcțiile NORM.ST.INV() și NORM.INV().

Grafice de funcții

Fișierul exemplu conține grafice de densitate de distribuție probabilități și funcția de distribuție cumulativă.

După cum se știe, aproximativ 68% din valorile selectate din populație au distributie normala, sunt în 1 abatere standard (σ) de μ (medie sau așteptări matematice); aproximativ 95% sunt în 2 σ și deja 99% dintre valori sunt în 3 σ. Asigurați-vă de asta pentru distribuție normală standard se poate scrie formula:

=NORM.ST.DIST(1,TRUE)-NORM.ST.DIST(-1,TRUE)

care va returna o valoare de 68,2689% - acesta este procentul valorilor care se află în +/-1 abatere standard de medie(cm. Foaie grafică în fișierul exemplu).

Datorită parității funcției densitate standard normală distributii: f(x)= f(-X), funcție distribuție normală standard are proprietatea F(-x)=1-F(x). Prin urmare, formula de mai sus poate fi simplificată:

=2*NORM.ST.DIST(1;TRUE)-1

Gratuit funcții normale de distribuție N(μ; σ) calcule similare ar trebui făcute folosind formula:

2* NORM.DIST(μ+1*σ;μ;σ;TRUE)-1

Calculele de probabilitate de mai sus sunt necesare pentru .

Nota: Pentru ușurință de scriere, formulele din fișierul exemplu sunt create pentru parametrii de distribuție: μ și σ.

Generarea numerelor aleatorii

Să generăm 3 matrice de 100 de numere fiecare cu μ și σ diferite. Pentru a face acest lucru în fereastră Generaţie numere aleatorii setați următoarele valori pentru fiecare pereche de parametri:

Nota: Dacă setați opțiunea Imprăștire aleatorie (Sămânță aleatorie), apoi puteți selecta un anumit set aleatoriu de numere generate. De exemplu, setând această opțiune la 25, puteți genera aceleași seturi de numere aleatorii pe computere diferite (dacă, desigur, alți parametri de distribuție sunt aceiași). Valoarea opțiunii poate lua valori întregi de la 1 la 32.767 Imprăștire aleatorie poate fi confuz. Ar fi mai bine să o traducem ca Formați numărul cu numere aleatorii.

Ca urmare, vom avea 3 coloane de numere, pe baza cărora putem estima parametrii distribuției din care a fost prelevat proba: μ și σ . O estimare pentru μ se poate face folosind funcția AVERAGE(), iar pentru σ folosind funcția STANDARDEV.B(), vezi exemplu fișă de fișier Generare.

Nota: Pentru a genera o matrice de numere distribuite peste legea normală, puteți folosi formula =NORM.INV(RAND(),μ,σ). Funcția RAND() generează de la 0 la 1, care corespunde exact intervalului de modificări de probabilitate (vezi. exemplu fișă de fișier Generare).

Sarcini

Problema 1. Compania produce fire de nailon cu o rezistență medie de 41 MPa și o abatere standard de 2 MPa. Consumatorul dorește să achiziționeze fire cu o rezistență de cel puțin 36 MPa. Calculați probabilitatea ca loturile de filament produse de o companie pentru un client să îndeplinească sau să depășească specificațiile.
Soluția 1: =1-NORM.DIST(36,41,2,TRUE)

Problema 2. Compania produce țevi cu un diametru exterior mediu de 20,20 mm și o abatere standard de 0,25 mm. Conform specificațiilor tehnice, țevile sunt considerate adecvate dacă diametrul este de 20,00 +/- 0,40 mm. Ce proporție de țevi fabricate respectă specificațiile?
Soluția 2: = NORM.DIST(20,00+0,40;20,20;0,25;TRUE)- NORM.DIST(20,00-0,40;20,20;0,25)
În figura de mai jos, este evidențiată gama de valori ale diametrului care îndeplinește cerințele specificației.

Soluția este dată în exemplu de fișă de sarcini pentru fișier.

Problema 3. Compania produce țevi cu un diametru exterior mediu de 20,20 mm și o abatere standard de 0,25 mm. Diametrul exterior nu trebuie să depășească o anumită valoare (presupunând că limita inferioară nu este importantă). Ce limită superioară din specificațiile tehnice trebuie stabilită astfel încât 97,5% din toate produsele fabricate să o îndeplinească?
Soluția 3: =NORM.OBR(0,975; 20,20; 0,25)=20,6899 sau
=NORM.ST.REV(0,975)*0,25+20,2(„destandardizarea” a fost efectuată, vezi mai sus)

Problema 4. Găsirea parametrilor distributie normala conform valorilor lui 2 (sau ).
Să presupunem că se știe că variabila aleatoare are o distribuție normală, dar nu sunt cunoscuți parametrii ei, ci doar a 2-a percentilă(de exemplu 0,5- percentilă, adică mediană și 0,95 percentilă). Deoarece este cunoscut, atunci știm, i.e. μ. Pentru a găsi trebuie să utilizați .
Soluția este dată în exemplu de fișă de sarcini pentru fișier.

Nota: Înainte de MS EXCEL 2010, EXCEL avea funcțiile NORMINV() și NORMSINV(), care sunt echivalente cu NORM.INV() și NORM.ST.INV() . NORMBR() și NORMSINV() sunt lăsate în MS EXCEL 2010 și versiuni superioare numai pentru compatibilitate.

Combinații liniare de variabile aleatoare distribuite normal

Se știe că o combinație liniară de variabile aleatoare distribuite normal x(i) cu parametrii μ (i) și σ (i) este de asemenea distribuit normal. De exemplu, dacă variabila aleatoare Y=x(1)+x(2), atunci Y va avea o distribuție cu parametrii μ (1)+ μ(2)Şi ROOT(σ(1)^2+ σ(2)^2). Să verificăm acest lucru folosind MS EXCEL.

Scurtă teorie

Normală este distribuția de probabilitate a unei variabile aleatoare continue a cărei densitate are forma:

unde este așteptarea matematică și este abaterea standard.

Probabilitatea ca acesta să ia o valoare aparținând intervalului:

unde este functia Laplace:

Probabilitatea ca valoarea absolută a abaterii să fie mai mică decât un număr pozitiv:

În special, atunci când egalitatea este valabilă:

Când rezolvați problemele pe care le pune practica, trebuie să faceți față cu diverse distribuții de variabile aleatoare continue.

Pe lângă distribuția normală, legile de bază ale distribuției variabilelor aleatoare continue:

Exemplu de rezolvare a problemei

O piesă este realizată pe o mașină. Lungimea sa este o variabilă aleatoare distribuită după o lege normală cu parametri , . Aflați probabilitatea ca lungimea piesei să fie între 22 și 24,2 cm de la ce abatere a lungimii piesei poate fi garantată cu o probabilitate de 0,92; 0,98? În ce limite, simetrice față de , se vor afla aproape toate dimensiunile pieselor?

Soluţie:

Probabilitatea ca o variabilă aleatoare distribuită conform unei legi normale să fie în intervalul:

Primim:

Probabilitatea ca o variabilă aleatoare distribuită normal să se abate de la medie cu cel mult .

Legea distribuției normale a probabilității a unei variabile aleatoare continue ocupă un loc special printre diversele legi teoretice, deoarece este fundamentală în multe studii practice. Descrie cele mai multe fenomene aleatorii asociate cu procesele de producție.

Fenomenele aleatorii care se supun legii distribuției normale includ erorile de măsurare a parametrilor de producție, distribuția erorilor tehnologice de fabricație, înălțimea și greutatea majorității obiectelor biologice etc.

Normal este legea distribuției de probabilitate a unei variabile aleatoare continue, care este descrisă de o funcție diferențială

a - așteptarea matematică a unei variabile aleatoare;

Abaterea standard a unei distribuții normale.

Graficul funcției de distribuție normală diferențială se numește curbă normală (curba Gauss) (Fig. 7).

Orez. 7 Curba Gaussiană

Proprietățile unei curbe normale (curba Gauss):

1. curba este simetrică față de dreapta x = a;

2. curba normală este situată deasupra axei X, adică pentru toate valorile lui X, funcția f(x) este întotdeauna pozitivă;

3. Axa bou este asimptota orizontală a graficului, deoarece

4. pentru x = a, funcţia f(x) are un maxim egal cu

,

în punctele A și B la și curba are puncte de inflexiune ale căror ordonate sunt egale.

În același timp, probabilitatea ca valoarea absolută a abaterii unei variabile aleatoare distribuite normal de la așteptarea sa matematică să nu depășească abaterea standard este egală cu 0,6826.

în punctele E și G, pentru și , valoarea funcției f(x) este egală cu

iar probabilitatea ca valoarea absolută a abaterii unei variabile aleatoare distribuite normal de la așteptările ei matematice să nu depășească de două ori abaterea standard este de 0,9544.

Apropiindu-se asimptotic de axa x, curba Gaussiană în punctele C și D, la și , se apropie de axa x foarte aproape. În aceste puncte valoarea funcției f(x) este foarte mică

iar probabilitatea ca valoarea absolută a abaterii unei variabile aleatoare distribuite normal de la așteptările ei matematice să nu depășească de trei ori abaterea standard este de 0,9973. Această proprietate a curbei gaussiene se numește „ regula trei sigma".



Dacă o variabilă aleatoare este distribuită normal, atunci valoarea absolută a abaterii ei de la așteptarea matematică nu depășește de trei ori abaterea standard.

Modificarea valorii parametrului a (așteptarea matematică a unei variabile aleatoare) nu schimbă forma curbei normale, ci conduce doar la deplasarea acesteia de-a lungul axei X: la dreapta dacă a crește și la stânga dacă a scade.

Când a=0, curba normală este simetrică față de ordonată.

Modificarea valorii parametrului (deviația standard) modifică forma curbei normale: odată cu creșterea ordonatelor curbei normale, acestea scad, curba se întinde de-a lungul axei X și este apăsată împotriva acesteia. Pe măsură ce scade, ordonatele curbei normale cresc, curba se micșorează de-a lungul axei X și devine mai „ascuțită”.

În același timp, pentru orice valoare și aria delimitată de curba normală și axa X rămâne egală cu unu (adică, probabilitatea ca o variabilă aleatoare distribuită normal să ia o valoare mărginită pe axa X a curbei normale este egal cu 1).

Distribuție normală cu parametri arbitrari și , adică descrisă de o funcție diferențială

numit distribuție generală normală.

Se numește distribuția normală cu parametri distribuție normalizată(Fig. 8). Într-o distribuție normalizată, funcția de distribuție diferențială este egală cu:

Orez. 8 Curba normalizată

Funcția cumulativă a distribuției normale generale are forma:

Fie variabila aleatoare X distribuită conform legii normale în intervalul (c, d). Atunci probabilitatea ca X să ia o valoare aparținând intervalului (c, d) este egală cu

Exemplu. Variabila aleatoare X este distribuită conform legii normale. Așteptările matematice și abaterea standard a acestei variabile aleatoare sunt egale cu a=30 și . Aflați probabilitatea ca X să ia o valoare în intervalul (10, 50).

Dupa conditie: . Apoi

Folosind tabele Laplace gata făcute (vezi Anexa 3), avem.

(real, strict pozitiv)

Distribuție normală, numit și distributie gaussiana sau Gauss - Laplace- distribuția probabilității, care în cazul unidimensional este specificată de funcția de densitate de probabilitate care coincide cu funcția Gauss:

f (x) = 1 σ 2 π e − (x − μ) 2 2 σ 2 , (\displaystyle f(x)=(\frac (1)(\sigma (\sqrt (2\pi ))))\ ;e^(-(\frac ((x-\mu)^(2))(2\sigma ^(2)))),)

unde parametrul μ este așteptarea (valoarea medie), mediana și modul de distribuție, iar parametrul σ este abaterea standard (σ² este dispersia) distribuției.

Astfel, distribuția normală unidimensională este o familie de distribuții cu doi parametri. Cazul multivariat este descris în articolul „Multivariate normal distribution”.

Distribuție normală standard se numește distribuție normală cu așteptări matematice μ = 0 și abaterea standard σ = 1.

YouTube enciclopedic

  • 1 / 5

    Importanța distribuției normale în multe domenii ale științei (de exemplu, statistica matematică și fizica statistică) rezultă din teorema limită centrală a teoriei probabilităților. Dacă rezultatul unei observații este suma mai multor cantități aleatoare slab interdependente, fiecare dintre acestea având o contribuție mică față de suma totală, atunci pe măsură ce numărul de termeni crește, distribuția rezultatului centrat și normalizat tinde să fie normală. Această lege a teoriei probabilităților are ca rezultat distribuția pe scară largă a distribuției normale, care a fost unul dintre motivele denumirii sale.

    Proprietăți

    Momente

    Dacă variabile aleatorii X 1 (\displaystyle X_(1))Şi X 2 (\displaystyle X_(2)) sunt independente și au o distribuție normală cu așteptări matematice μ 1 (\displaystyle \mu _(1))Şi μ 2 (\displaystyle \mu _(2))și variații σ 1 2 (\displaystyle \sigma _(1)^(2))Şi σ 2 2 (\displaystyle \sigma _(2)^(2))în consecință, atunci X 1 + X 2 (\displaystyle X_(1)+X_(2)) are de asemenea o distribuție normală cu așteptări matematice μ 1 + μ 2 (\displaystyle \mu _(1)+\mu _(2)) si varianta σ 1 2 + σ 2 2 .(\displaystyle \sigma _(1)^(2)+\sigma _(2)^(2).)

    Rezultă că o variabilă aleatorie normală poate fi reprezentată ca suma unui număr arbitrar de variabile aleatoare normale independente.

    Entropia maximă

    Distribuția normală are entropia diferențială maximă dintre toate distribuțiile continue a căror varianță nu depășește o valoare dată.

    Modelarea variabilelor pseudoaleatoare normale Cele mai simple metode de modelare aproximativă se bazează pe teorema centrală a limitei. Și anume, dacă adăugați mai multe cantități independente distribuite identic cu varianță finită, atunci suma va fi distribuită aproximativ Amenda. De exemplu, dacă adăugați 100 de independente ca standard  uniform   variabile aleatoare distribuite, atunci distribuția sumei va fi aproximativă.

    Pentru generarea programatică de variabile pseudoaleatoare distribuite normal, este de preferat să folosiți transformarea Box-Muller. Vă permite să generați o valoare distribuită normal pe baza unei valori distribuite uniform.

    Distribuție normală în natură și aplicații

    Distribuția normală se găsește adesea în natură. De exemplu, următoarele variabile aleatoare sunt bine modelate de distribuția normală:

    • abatere la fotografiere.
    • erori de măsurare (cu toate acestea, erorile unor instrumente de măsură nu au distribuții normale).
    • unele caracteristici ale organismelor vii dintr-o populatie.

    Această distribuție este atât de răspândită deoarece este o distribuție continuă infinit divizibilă cu varianță finită. Prin urmare, unii alții îl abordează în limită, de exemplu, binom și Poisson. Această distribuție modelează multe procese fizice nedeterministe.

    Relația cu alte distribuții

    • Distribuția normală este o distribuție Pearson de tip XI.
    • Raportul unei perechi de variabile aleatoare standard independente distribuite normal are o distribuție Cauchy. Adică dacă variabila aleatoare X (\displaystyle X) reprezintă relația X = Y / Z (\displaystyle X=Y/Z)(Unde Y (\displaystyle Y)Şi Z (\displaystyle Z)- variabile aleatoare normale standard independente), atunci va avea o distribuție Cauchy.
    • Dacă z 1 , … , z k (\displaystyle z_(1),\ldots ,z_(k))- variabile aleatoare normale standard independente în comun, adică z i ∼ N (0, 1) (\displaystyle z_(i)\sim N\left(0,1\right)), apoi variabila aleatoare x = z 1 2 + … + z k 2 (\displaystyle x=z_(1)^(2)+\ldots +z_(k)^(2)) are o distribuție chi-pătrat cu k grade de libertate.
    • Dacă variabila aleatoare X (\displaystyle X) este supus distribuției lognormale, atunci logaritmul său natural are o distribuție normală. Adică dacă X ∼ L o g N (μ, σ 2) (\displaystyle X\sim \mathrm (LogN) \left(\mu,\sigma ^(2)\right)), Asta Y = ln ⁡ (X) ∼ N (μ , σ 2) (\displaystyle Y=\ln \left(X\right)\sim \mathrm (N) \left(\mu,\sigma ^(2)\right) )). Și invers, dacă Y ∼ N (μ , σ 2) (\displaystyle Y\sim \mathrm (N) \left(\mu,\sigma ^(2)\right)), Asta X = exp ⁡ (Y) ∼ L o g N (μ , σ 2) (\displaystyle X=\exp \left(Y\right)\sim \mathrm (LogN) \left(\mu,\sigma ^(2) \corect)).
    • Raportul pătratelor a două variabile aleatoare normale standard are

    Aleatoriu dacă, în urma experimentului, poate lua valori reale cu anumite probabilități. Cea mai completă și cuprinzătoare caracteristică a unei variabile aleatoare este legea distribuției. Legea distribuției este o funcție (tabel, grafic, formulă) care vă permite să determinați probabilitatea ca o variabilă aleatoare X să ia o anumită valoare xi sau să se încadreze într-un anumit interval. Dacă o variabilă aleatoare are o lege de distribuție dată, atunci se spune că este distribuită conform acestei legi sau se supune acestei legi de distribuție.

    Fiecare legea distributiei este o funcție care descrie complet o variabilă aleatoare din punct de vedere probabilistic. În practică, distribuția de probabilitate a unei variabile aleatoare X trebuie adesea apreciată numai din rezultatele testelor.

    Distribuție normală

    Distribuție normală, numită și distribuția Gaussiană, este o distribuție de probabilitate care joacă un rol critic în multe domenii de cunoaștere, în special în fizică. O mărime fizică urmează o distribuție normală atunci când este supusă influenței unui număr mare de zgomote aleatorii. Este clar că această situație este extrem de comună, așa că putem spune că dintre toate distribuțiile, distribuția normală este cea mai comună în natură - de unde și una dintre denumirile sale.

    Distribuția normală depinde de doi parametri - deplasarea și scara, adică din punct de vedere matematic, nu este o singură distribuție, ci o întreagă familie a acestora. Valorile parametrilor corespund valorilor mediei (așteptări matematice) și ale împrăștierii (abaterea standard).

    Distribuția normală standard este o distribuție normală cu o așteptare matematică de 0 și o abatere standard de 1.

    Coeficient de asimetrie

    Coeficientul de asimetrie este pozitiv dacă coada dreaptă a distribuției este mai lungă decât cea din stânga și negativ în caz contrar.

    Dacă distribuția este simetrică față de așteptarea matematică, atunci coeficientul său de asimetrie este zero.

    Coeficientul de asimetrie al eșantionului este utilizat pentru a testa distribuția pentru simetrie, precum și pentru un test preliminar brut pentru normalitate. Vă permite să respingeți, dar nu vă permite să acceptați, ipoteza normalității.

    Coeficientul de kurtoză

    Coeficientul de curtoză (coeficientul de vârf) este o măsură a clarității vârfului distribuției unei variabile aleatoare.

    „Minus trei” la sfârșitul formulei este introdus astfel încât coeficientul de curtoză al distribuției normale să fie egal cu zero. Este pozitiv dacă vârful distribuției în jurul așteptărilor matematice este ascuțit și negativ dacă vârful este neted.

    Momente ale unei variabile aleatorii

    Momentul unei variabile aleatoare este o caracteristică numerică a distribuției unei variabile aleatoare date.