Funkcija distribucije slučajne varijable. Kontinuirane slučajne varijable. Pronađite funkciju distribucije F(x)

Funkcija distribucije vjerojatnosti i njezina svojstva.

Funkcija distribucije vjerojatnosti F(x) slučajne varijable X u točki x je vjerojatnost da će, kao rezultat eksperimenta, slučajna varijabla poprimiti vrijednost manju od x, tj. F(x)=P(X< х}.
Razmotrimo svojstva funkcije F(x).

1. F(-∞)=lim (x→-∞) F(x)=0. Doista, po definiciji, F(-∞)=P(X< -∞}. Событие (X < -∞) является невозможным событием: F(-∞)=P{X < - ∞}=p{V}=0.

2. F(∞)=lim (x→∞) F(x)=1, budući da je po definiciji F(∞)=P(X< ∞}. Событие Х < ∞ является достоверным событием. Следовательно, F(∞)=P{X < ∞}=p{U}=1.

3. Vjerojatnost da će slučajna varijabla uzeti vrijednost iz intervala [Α Β] jednaka je prirastu funkcije distribucije vjerojatnosti na tom intervalu. P(Α ≤X<Β}=F(Β)-F(Α).

4. F(x 2)≥ F(x 1), ako je x 2, > x 1, tj. Funkcija distribucije vjerojatnosti je neopadajuća funkcija.

5. Funkcija distribucije vjerojatnosti ostaje kontinuirana. FΨ(x o -0)=limFΨ(x)=FΨ(x o) za x→ x o

Razlike između funkcija distribucije vjerojatnosti diskretnih i kontinuiranih slučajnih varijabli mogu se dobro ilustrirati grafovima. Neka, na primjer, diskretna slučajna varijabla ima n moguće vrijednosti, čije su vjerojatnosti jednake P(X=x k )=p k , k=1,2,..n. Ako je x ≤ x 1, tada je F(X)=0, budući da ne postoje moguće vrijednosti slučajne varijable lijevo od x. Ako je x 1< x ≤ x 2 , то левее х находится всего одно возможное значение, а именно, значение х 1 .

To znači F(x)=P(X=x 1 )=p 1 .At x 2< x ≤ x 3 слева от х находится уже два возможных значения, поэтому F(x)=P{X=x 1 }+P{X=x 2 }=p 1 +p 2 . Рассуждая аналогично,приходим к выводу, что если х k < x≤ x k+1 , то F(x)=1, так как функция будет равна сумме вероятностей всех возможных значений, которая по условию нормировки равна еденице. Таким образом, график функции распределения дискретной случайной величины является ступенчатым. Возможные значения непрерывной величины располагаются плотно на интервале задания этой величины, что обеспечивает плавное возрастания функции распределения F(x), т.е. ее непрерывность.

Razmotrimo vjerojatnost da slučajna varijabla padne u interval , Δx>0: P(x≤X< x+Δx}=F(x+ Δx)-F(x). Перейдем к пределу при Δx→0:

lim (Δx→0) P(x≤ X< x+Δx}=lim (Δx→0) F(x+Δx)-F(x). Предел равен вероятности того, что случайная величина примет значение, равное х. Если функция F(x) непрерывна в точке х, то lim (Δx→0) F(x+Δx)=F(x), т.е. P{X=x}=0.

Ako F(x) ima diskontinuitet u točki x, tada će vjerojatnost P(X=x) biti jednaka skoku funkcije u toj točki. Stoga je vjerojatnost pojave bilo koje moguće vrijednosti za kontinuiranu količinu nula. Izraz P(X=x)=0 treba shvatiti kao ograničenje vjerojatnosti da slučajna varijabla padne u infinitezimalno susjedstvo točke x za P(Α< X≤ Β},P{Α ≤ X< Β},P{Α< X< Β},P{Α ≤ X≤ Β} равны, если Х - непрерывная случайная величина.

Za diskretne varijable te vjerojatnosti nisu iste u slučaju kada se granice intervala Α i (ili) Β podudaraju s mogućim vrijednostima slučajne varijable. Za diskretnu slučajnu varijablu potrebno je strogo voditi računa o vrsti nejednakosti u formuli P(Α ≤X<Β}=F(Β)-F(Α).

Očekivana vrijednost

Disperzija kontinuirana slučajna varijabla X, čije moguće vrijednosti pripadaju cijeloj osi Ox, određena je jednakošću:

Svrha usluge. Mrežni kalkulator osmišljen je za rješavanje problema u kojima bilo gustoća distribucije f(x) ili funkcija distribucije F(x) (vidi primjer). Obično u takvim zadacima morate pronaći očekivana vrijednost, standardna devijacija, iscrtajte grafove funkcija f(x) i F(x).

upute. Odaberite vrstu izvornih podataka: gustoća distribucije f(x) ili funkcija distribucije F(x).

Gustoća distribucije f(x) dana Funkcija distribucije F(x) dana

Gustoća distribucije f(x) je dana:

Funkcija distribucije F(x) dana je:

Kontinuirana slučajna varijabla određena je gustoćom vjerojatnosti
(Rayleighov zakon distribucije – koristi se u radiotehnici). Nađi M(x) , D(x) .

Poziva se slučajna varijabla X stalan , ako je njegova distribucijska funkcija F(X)=P(X< x) непрерывна и имеет производную.
Funkcija distribucije kontinuirane slučajne varijable koristi se za izračunavanje vjerojatnosti da slučajna varijabla padne u zadani interval:
P(α< X < β)=F(β) - F(α)
Štoviše, za kontinuiranu slučajnu varijablu nije važno jesu li njezine granice uključene u ovaj interval ili ne:
P(α< X < β) = P(α ≤ X < β) = P(α ≤ X ≤ β)
Gustoća distribucije kontinuirana slučajna varijabla naziva se funkcija
f(x)=F’(x) , izvod funkcije distribucije.

Svojstva gustoće distribucije

1. Gustoća distribucije slučajne varijable je nenegativna (f(x) ≥ 0) za sve vrijednosti x.
2. Uvjet normalizacije:

Geometrijsko značenje uvjeta normalizacije: površina ispod krivulje gustoće raspodjele jednaka je jedinici.
3. Vjerojatnost da slučajna varijabla X padne u interval od α do β može se izračunati pomoću formule

Geometrijski, vjerojatnost da kontinuirana slučajna varijabla X padne u interval (α, β) jednaka je površini krivuljastog trapeza ispod krivulje gustoće distribucije na temelju ovog intervala.
4. Funkcija distribucije izražava se u smislu gustoće na sljedeći način:

Vrijednost gustoće distribucije u točki x nije jednaka vjerojatnosti prihvaćanja te vrijednosti; za kontinuiranu slučajnu varijablu možemo govoriti samo o vjerojatnosti pada u zadani interval. Neka . Numeričke karakteristike x:

Stoga, . Rješavajući ovaj sustav dobivamo dva para vrijednosti: . Budući da prema uvjetima problema konačno imamo: .

Odgovor: .

Primjer 2.11. U prosjeku, ispod 10% ugovora, osiguravajuće društvo isplaćuje osigurane iznose u vezi s pojavom osigurani slučaj. Izračunajte matematičko očekivanje i disperziju broja takvih ugovora među četiri nasumično odabrana.

Riješenje: Matematičko očekivanje i varijanca mogu se pronaći pomoću formula:

.

Moguće vrijednosti SV (broj ugovora (od četiri) s nastupom osiguranog slučaja): 0, 1, 2, 3, 4.

Koristimo Bernoullijevu formulu za izračun vjerojatnosti različitog broja ugovora (od četiri) za koje su plaćeni iznosi osiguranja:

.

Serija raspodjele IC (broj ugovora s nastupom osiguranog slučaja) ima oblik:

0,6561 0,2916 0,0486 0,0036 0,0001

Odgovor: , .

Primjer 2.12. Od pet ruža dvije su bijele. Nacrtajte zakon raspodjele slučajne varijable koja izražava broj bijelih ruža između dvije istovremeno uzete.

Riješenje: U izboru od dvije ruže, može ili biti nijedna bijela ruža ili može biti jedna ili dvije bijele ruže. Prema tome, slučajna varijabla x može poprimiti vrijednosti: 0, 1, 2. Vjerojatnosti koje x uzima ove vrijednosti, nalazimo ga pomoću formule:

Gdje -- broj ruža;

-- broj bijelih ruža;

broj ruža uzetih u isto vrijeme;

-- broj bijelih ruža među uzetima.

.

.

.

Tada će zakon raspodjele slučajne varijable biti sljedeći:

Primjer 2.13. Od 15 sklopljenih jedinica, 6 zahtijeva dodatno podmazivanje. Nacrtajte zakon raspodjele za broj jedinica koje trebaju dodatno podmazivanje između pet nasumično odabranih od ukupnog broja.

Riješenje: Slučajna vrijednost x– broj jedinica koje zahtijevaju dodatno podmazivanje među pet odabranih – može poprimiti sljedeće vrijednosti: 0, 1, 2, 3, 4, 5 i ima hipergeometrijsku raspodjelu. Vjerojatnosti koje x uzima ove vrijednosti, nalazimo ga pomoću formule:

Gdje -- broj sklopljenih jedinica;

-- broj jedinica koje zahtijevaju dodatno podmazivanje;

broj odabranih jedinica;

-- broj jedinica koje zahtijevaju dodatno podmazivanje među odabranima.

.

.

.

.

.

.

Tada će zakon raspodjele slučajne varijable biti sljedeći:

Primjer 2.14. Od 10 satova zaprimljenih na popravak, 7 zahtjeva generalno čišćenje mehanizma. Satovi nisu razvrstani po vrsti popravka. Majstor, želeći pronaći satove koje treba očistiti, pregledava ih jedan po jedan i, pronašavši takve satove, zaustavlja daljnje gledanje. Pronađite matematičko očekivanje i varijancu broja gledanih sati.

Riješenje: Slučajna vrijednost x– broj jedinica koje trebaju dodatno podmazivanje među pet odabranih – može poprimiti sljedeće vrijednosti: 1, 2, 3, 4. Vjerojatnosti da x uzima ove vrijednosti, nalazimo ga pomoću formule:

.

.

.

.

Tada će zakon raspodjele slučajne varijable biti sljedeći:

Sada izračunajmo numeričke karakteristike količine:

Odgovor: , .

Primjer 2.15. Pretplatnik je zaboravio posljednju znamenku telefonskog broja koji mu treba, ali se sjeća da je neparan. Nađite matematičko očekivanje i varijancu broja biranja telefonskog broja prije nego što dođe do željenog broja, ako nasumično bira zadnju znamenku i nakon toga ne bira biranu znamenku.

Riješenje: Slučajna varijabla može poprimiti sljedeće vrijednosti: . Budući da pretplatnik u budućnosti ne bira biranu znamenku, vjerojatnosti ovih vrijednosti su jednake.

Sastavimo niz distribucije slučajne varijable:

0,2

Izračunajmo matematičko očekivanje i varijancu broja pokušaja biranja:

Odgovor: , .

Primjer 2.16. Vjerojatnost kvara tijekom testiranja pouzdanosti za svaki uređaj u seriji jednaka je str. Odredite matematičko očekivanje broja uređaja koji nisu uspjeli ako su testirani N uređaja.

Riješenje: Diskretna slučajna varijabla X je broj neispravnih uređaja u N neovisni testovi, u svakom od njih je vjerojatnost neuspjeha jednaka p, raspoređeni prema binomnom zakonu. Matematičko očekivanje binomne distribucije jednako je broju pokušaja pomnoženom s vjerojatnošću da će se događaj dogoditi u jednom pokušaju:

Primjer 2.17. Diskretna slučajna varijabla x uzima 3 moguće vrijednosti: s vjerojatnošću ; s vjerojatnošću i s vjerojatnošću. Pronađite i , znajući da je M( x) = 8.

Riješenje: Koristimo definicije matematičkog očekivanja i zakona distribucije diskretne slučajne varijable:

Pronašli smo: .

Primjer 2.18. Odjel tehničke kontrole provjerava standardnost proizvoda. Vjerojatnost da je proizvod standardan je 0,9. Svaka serija sadrži 5 proizvoda. Nađite matematičko očekivanje slučajne varijable x– broj serija, od kojih svaka sadrži točno 4 standardna proizvoda, ako je pregledu 50 serija.

Riješenje: U u ovom slučaju svi provedeni eksperimenti su neovisni, a vjerojatnosti da svaka serija sadrži točno 4 standardna proizvoda su iste, stoga se matematičko očekivanje može odrediti formulom:

,

gdje je broj stranaka;

Vjerojatnost da serija sadrži točno 4 standardna proizvoda.

Vjerojatnost nalazimo pomoću Bernoullijeve formule:

Odgovor: .

Primjer 2.19. Pronađite varijancu slučajne varijable x– broj pojavljivanja događaja A u dva neovisna pokusa, ako su vjerojatnosti pojave događaja u tim pokusima iste i zna se da M(x) = 0,9.

Riješenje: Problem se može riješiti na dva načina.

1) Moguće vrijednosti SV x: 0, 1, 2. Koristeći Bernoullijevu formulu, određujemo vjerojatnosti ovih događaja:

, , .

Zatim zakon raspodjele x ima oblik:

Iz definicije matematičkog očekivanja određujemo vjerojatnost:

Nađimo disperziju SV x:

.

2) Možete koristiti formulu:

.

Odgovor: .

Primjer 2.20. Očekivanje i standardna devijacija normalno distribuirane slučajne varijable x redom jednak 20 i 5. Odredite vjerojatnost da kao rezultat testa xće uzeti vrijednost sadržanu u intervalu (15; 25).

Riješenje: Vjerojatnost pogađanja normalne slučajne varijable x na odsječku od do izražava se kroz Laplaceovu funkciju:

Primjer 2.21. Dana funkcija:

Na kojoj vrijednosti parametra C ova funkcija je gustoća distribucije neke kontinuirane slučajne varijable x? Nađite matematičko očekivanje i varijancu slučajne varijable x.

Riješenje: Da bi funkcija bila gustoća distribucije neke slučajne varijable, mora biti nenegativna i mora zadovoljavati svojstvo:

.

Stoga:

Izračunajmo matematičko očekivanje pomoću formule:

.

Izračunajmo varijancu pomoću formule:

T je jednako str. Potrebno je pronaći matematičko očekivanje i varijancu ove slučajne varijable.

Riješenje: Zakon raspodjele diskretne slučajne varijable X - broj pojavljivanja događaja u neovisnim pokusima, u svakom od kojih je vjerojatnost događanja događaja jednaka , naziva se binom. Matematičko očekivanje binomne distribucije jednako je umnošku broja pokušaja i vjerojatnosti pojavljivanja događaja A u jednom pokušaju:

.

Primjer 2.25. U metu se ispaljuju tri neovisna hica. Vjerojatnost da pogodite svaki hitac je 0,25. Odredite standardnu ​​devijaciju broja pogodaka s tri hica.

Riješenje: Budući da se izvode tri neovisna pokusa, a vjerojatnost pojavljivanja događaja A (pogodak) u svakom pokusu je ista, pretpostavit ćemo da je diskretna slučajna varijabla X - broj pogodaka na meti - raspoređena prema binomni zakon.

Varijanca binomne distribucije jednaka je umnošku broja pokušaja i vjerojatnosti događanja i nepojavljivanja događaja u jednom pokušaju:

Primjer 2.26. Prosječan broj klijenata koji posjećuju osiguravajuće društvo za 10 minuta, jednako je tri. Nađite vjerojatnost da će barem jedan klijent doći u sljedećih 5 minuta.

Prosječan broj klijenata koji dolaze za 5 minuta: . .

Primjer 2.29. Vrijeme čekanja aplikacije u redu čekanja procesora podliježe eksponencijalnom zakonu raspodjele s prosječnom vrijednošću od 20 sekundi. Nađite vjerojatnost da će sljedeći (slučajni) zahtjev čekati na procesoru više od 35 sekundi.

Riješenje: U ovom primjeru, matematičko očekivanje , a stopa neuspjeha jednaka je .

Tada je željena vjerojatnost:

Primjer 2.30. Grupa od 15 studenata održava sastanak u dvorani od 20 redova po 10 sjedećih mjesta. Svaki učenik nasumično zauzima mjesto u dvorani. Kolika je vjerojatnost da na sedmom mjestu u nizu neće biti više od tri osobe?

Riješenje:

Primjer 2.31.

Tada, prema klasičnoj definiciji vjerojatnosti:

Gdje -- broj dijelova u seriji;

-- broj nestandardnih dijelova u seriji;

broj odabranih dijelova;

-- broj nestandardnih dijelova među odabranima.

Tada će zakon raspodjele slučajne varijable biti sljedeći.

1.2.4. Slučajne varijable i njihove distribucije

Distribucije slučajnih varijabli i funkcije distribucije. Distribucija numeričke slučajne varijable je funkcija koja jednoznačno određuje vjerojatnost da slučajna varijabla poprimi zadanu vrijednost ili pripada nekom zadanom intervalu.

Prvi je ako slučajna varijabla ima konačan broj vrijednosti. Tada je distribucija dana funkcijom P(X = x), dodjeljivanje svakoj mogućoj vrijednosti x nasumična varijabla x vjerojatnost da X = x.

Drugi je ako slučajna varijabla poprima beskonačno mnogo vrijednosti. To je moguće samo kada se probabilistički prostor na kojem je definirana slučajna varijabla sastoji od beskonačnog broja elementarnih događaja. Tada je distribucija dana skupom vjerojatnosti Godišnje < x za sve parove brojeva a, b takav da a . Raspodjela se može specificirati pomoću tzv. funkcija distribucije F(x) = P(X definirajući za sve stvarne x vjerojatnost da slučajna varijabla x uzima vrijednosti manje od x. Jasno je da

Godišnje < x

Ovaj odnos pokazuje da se distribucija može izračunati iz funkcije distribucije i, obrnuto, funkcija distribucije može se izračunati iz distribucije.

Koristi se u probabilistici statističke metode donošenje odluka i drugo primijenjeno istraživanje Funkcije distribucije su diskretne ili kontinuirane ili njihove kombinacije.

Diskretne funkcije raspodjele odgovaraju diskretnim slučajnim varijablama koje uzimaju konačan broj vrijednosti ili vrijednosti iz skupa čiji se elementi mogu numerirati prirodnim brojevima (takvi skupovi se u matematici nazivaju prebrojivim). Njihov graf izgleda kao stepenaste ljestve (slika 1).

Primjer 1. Broj x neispravni artikli u seriji poprimaju vrijednost 0 s vjerojatnošću 0,3, vrijednost 1 s vjerojatnošću 0,4, vrijednost 2 s vjerojatnošću 0,2 i vrijednost 3 s vjerojatnošću 0,1. Graf funkcije distribucije slučajne varijable x prikazano na sl. 1.

Sl. 1. Grafik funkcije raspodjele broja neispravnih proizvoda.

Kontinuirane funkcije distribucije nemaju skokove. Oni se monotono povećavaju kako argument raste - od 0 at do 1 at . Slučajne varijable koje imaju kontinuirane funkcije distribucije nazivamo kontinuiranim.

Funkcije kontinuirane distribucije koje se koriste u probabilističkim statističkim metodama odlučivanje, imaju izvedenice. Prva derivacija f(x) funkcije distribucije F(x) naziva se gustoća vjerojatnosti,

Pomoću gustoće vjerojatnosti možete odrediti funkciju distribucije:

Za bilo koju distribucijsku funkciju

Navedena svojstva funkcija distribucije stalno se koriste u probabilističkim i statističkim metodama odlučivanja. Konkretno, posljednja jednakost implicira poseban oblik konstanti u formulama za gustoće vjerojatnosti koje se razmatraju u nastavku.

Primjer 2.Često se koristi sljedeća funkcija distribucije:

(1)

Gdje a I b– neki brojevi, a . Nađimo gustoću vjerojatnosti ove funkcije distribucije:

(u točkama x = a I x = b izvod funkcije F(x) ne postoji).

Slučajna varijabla s funkcijom distribucije (1) naziva se "jednoliko raspoređena na intervalu [ a; b]».

Mješovite funkcije distribucije pojavljuju se, posebice, kada promatranje prestane u nekoj točki. Na primjer, pri analizi statističkih podataka dobivenih korištenjem planova ispitivanja pouzdanosti koji predviđaju prekid testiranja nakon određenog razdoblja. Ili pri analizi podataka o tehničkim proizvodima koji su zahtijevali popravke u jamstvenom roku.

Primjer 3. Neka je, na primjer, životni vijek električne žarulje slučajna varijabla s funkcijom raspodjele F(t), i ispitivanje se provodi dok žarulja ne prestane, ako se to dogodi za manje od 100 sati od početka ispitivanja, ili dok t 0= 100 sati. Neka G(t)– funkcija raspodjele vremena rada žarulje u dobrom stanju tijekom ovog ispitivanja. Zatim

Funkcija G(t) ima skok u točki t 0, budući da odgovarajuća slučajna varijabla uzima vrijednost t 0 s vjerojatnošću 1- F(t 0)> 0.

Obilježja slučajnih varijabli. U probabilističko-statističkim metodama odlučivanja koristi se niz karakteristika slučajnih varijabli izraženih kroz funkcije distribucije i gustoće vjerojatnosti.

Kada se opisuje diferencijacija dohotka, kada se pronalaze granice pouzdanosti za parametre distribucije slučajnih varijabli, iu mnogim drugim slučajevima, koristi se koncept kao što je "kvantil reda". R", gdje je 0< str < 1 (обозначается x str). Kvantil reda R– vrijednost slučajne varijable za koju vrijednost uzima funkcija distribucije R ili postoji "skok" s vrijednosti manje R na veću vrijednost R(slika 2). Može se dogoditi da je ovaj uvjet zadovoljen za sve vrijednosti x koje pripadaju ovom intervalu (tj. funkcija raspodjele je konstantna na ovom intervalu i jednaka je R). Tada se svaka takva vrijednost naziva "kvantil reda" R" Za kontinuirane funkcije distribucije u pravilu postoji jedan kvantil x str narudžba R(Slika 2), i

F(x p) = p. (2)

sl.2. Definicija kvantila x str narudžba R.

Primjer 4. Nađimo kvantil x str narudžba R za distribucijsku funkciju F(x) iz (1).

U 0< str < 1 квантиль x str nalazi se iz jednadžbe

oni. x str = a + p(b – a) = a( 1- p) +bp. Na str= 0 bilo koji x < a je kvantil reda str= 0. Kvantil reda str= 1 je bilo koji broj x > b.

Za diskretne raspodjele u pravilu nema x str, zadovoljavajući jednadžbu (2). Točnije, ako je raspodjela slučajne varijable dana u tablici 1. gdje x 1< x 2 < … < x k , zatim jednakost (2), promatrana kao jednadžba s obzirom na x str, ima rješenja samo za k vrijednosti str, naime,

p = p 1 ,

p = p 1 + p 2 ,

p = p 1 + p 2 + p 3 ,

p = p 1 + p 2 + …+ p m, 3 < m < k,

str = str 1 + str 2 + … + p k.

Stol 1.

Distribucija diskretne slučajne varijable

Za navedene k vrijednosti vjerojatnosti str riješenje x str jednadžba (2) nije jedinstvena, naime,

F(x) = p 1 + p 2 + … + p m

za sve x takav da x m< x < x m+1. Oni. x p – bilo koji broj iz intervala (x m; x m+1]. Za sve ostale R iz intervala (0;1), koji nije uključen u popis (3), dolazi do "skoka" s vrijednosti manje R na veću vrijednost R. Naime, ako

p 1 + p 2 + … + p m

Da x p = x m+1.

Razmotreno svojstvo diskretnih distribucija stvara značajne poteškoće pri tabeliranju i korištenju takvih distribucija, budući da je nemoguće točno održavati tipične numeričke vrijednosti karakteristika distribucije. Ovo posebno vrijedi za kritične vrijednosti i razine značajnosti neparametarskih statističkih testova (vidi dolje), budući da su distribucije statistike ovih testova diskretne.

Redoslijed kvantila je od velike važnosti u statistici R= ½. Zove se medijan (slučajna varijabla x odnosno njegovu distribucijsku funkciju F(x)) i naznačen je Ja (X). U geometriji postoji koncept "medijana" - ravna crta koja prolazi kroz vrh trokuta i dijeli njegovu suprotnu stranu na pola. U matematičkoj statistici medijan ne dijeli stranicu trokuta na pola, već distribuciju slučajne varijable: jednakost F(x 0,5)= 0,5 znači da je vjerojatnost skretanja ulijevo x 0,5 i vjerojatnost da dođete udesno x 0,5(ili izravno na x 0,5) međusobno su jednaki i jednaki ½, tj.

P(x < x 0,5) = P(x > x 0,5) = ½.

Medijan označava "središte" distribucije. Sa stajališta jednog od modernih koncepata - teorije stabilnih statističkih postupaka - medijan je bolja karakteristika slučajne varijable od matematičkog očekivanja. Kod obrade rezultata mjerenja na ordinalnoj ljestvici (vidi poglavlje o teoriji mjerenja) može se koristiti medijan, ali ne i matematičko očekivanje.

Karakteristika slučajne varijable kao što je mod ima jasno značenje - vrijednost (ili vrijednosti) slučajne varijable koja odgovara lokalnom maksimumu gustoće vjerojatnosti za kontinuiranu slučajnu varijablu ili lokalnom maksimumu vjerojatnosti za diskretnu slučajnu varijablu .

Ako x 0– način slučajne varijable s gustoćom f(x), tada, kao što je poznato iz diferencijalnog računa, .

Slučajna varijabla može imati mnogo načina. Dakle, za jednoliku raspodjelu (1) svaka točka x takav da a< x < b , je moda. Međutim, ovo je iznimka. Većina slučajnih varijabli koje se koriste u probabilističkim statističkim metodama odlučivanja i drugim primijenjenim istraživanjima imaju jedan način. Slučajne varijable, gustoće, distribucije koje imaju jedan mod nazivaju se unimodalne.

O matematičkom očekivanju za diskretne slučajne varijable s konačnim brojem vrijednosti raspravlja se u poglavlju “Događaji i vjerojatnosti”. Za kontinuiranu slučajnu varijablu x očekivana vrijednost M(X) zadovoljava jednakost

koja je analogna formuli (5) iz izjave 2 poglavlja “Događaji i vjerojatnosti”.

Primjer 5. Očekivanje za jednoliko raspodijeljenu slučajnu varijablu x jednaki

Za slučajne varijable koje se razmatraju u ovom poglavlju, sva ona svojstva matematičkih očekivanja i varijanci koja su ranije razmatrana za diskretne slučajne varijable s konačnim brojem vrijednosti su istinita. Međutim, ne dajemo dokaze o tim svojstvima, jer zahtijevaju produbljivanje u matematičke suptilnosti, što nije potrebno za razumijevanje i kvalificiranu primjenu probabilističko-statističkih metoda odlučivanja.

Komentar. Ovaj udžbenik namjerno izbjegava matematičke suptilnosti povezane, posebice, s konceptima mjerljivih skupova i mjerljivih funkcija, algebre događaja itd. Oni koji žele svladati ove pojmove trebali bi se obratiti specijaliziranoj literaturi, posebice enciklopediji.

Svaka od tri karakteristike - matematičko očekivanje, medijan, način - opisuje "središte" distribucije vjerojatnosti. Pojam "centra" može se definirati na različite načine - otud tri različite karakteristike. Međutim, za važnu klasu distribucija - simetrične unimodalne - sve tri karakteristike se podudaraju.

Gustoća distribucije f(x)– gustoća simetrične distribucije, ako postoji broj x 0 takav da

. (3)

Jednakost (3) znači da graf funkcije y = f(x) simetrična u odnosu na okomitu crtu koja prolazi središtem simetrije x = x 0 . Iz (3) slijedi da funkcija simetrične distribucije zadovoljava relaciju

(4)

Za simetričnu distribuciju s jednim modom, matematičko očekivanje, medijan i mod podudaraju se i jednaki su x 0.

Najvažniji slučaj je simetrija oko 0, tj. x 0= 0. Tada (3) i (4) postaju jednakosti

(6)

odnosno. Gornje relacije pokazuju da nema potrebe tabelarizirati simetrične distribucije za sve x, dovoljno je imati stolove x > x 0.

Napomenimo još jedno svojstvo simetričnih distribucija, koje se stalno koristi u probabilističko-statističkim metodama odlučivanja i drugim primijenjenim istraživanjima. Za kontinuiranu funkciju raspodjele

P(|X| < a) = P(-a < x < a) = F(a) – F(-a),

Gdje F– funkcija distribucije slučajne varijable x. Ako funkcija distribucije F je simetričan oko 0, tj. onda za njega vrijedi formula (6).

P(|X| < a) = 2F(a) – 1.

Često se koristi i druga formulacija dotične tvrdnje: ako

.

Ako su i kvantili reda, odnosno (vidi (2)) funkcije distribucije simetrične oko 0, tada iz (6) slijedi da

Od karakteristika pozicije – matematičko očekivanje, medijan, mod – prijeđimo na karakteristike širenja slučajne varijable x: varijanca, prosjek kvadratno odstupanje i koeficijent varijacije v. O definiciji i svojstvima disperzije za diskretne slučajne varijable raspravljalo se u prethodnom poglavlju. Za kontinuirane slučajne varijable

Standardna devijacija je nenegativna vrijednost kvadratnog korijena varijance:

Koeficijent varijacije je omjer standardne devijacije i matematičkog očekivanja:

Koeficijent varijacije se primjenjuje kada M(X)> 0. Mjeri širenje u relativnim jedinicama, dok je standardna devijacija u apsolutnim jedinicama.

Primjer 6. Za jednoliko raspodijeljenu slučajnu varijablu x Nađimo disperziju, standardnu ​​devijaciju i koeficijent varijacije. Varijanca je:

Promjena varijable omogućuje pisanje:

Gdje c = (ba)/ 2. Prema tome, standardna devijacija je jednaka a koeficijent varijacije je:

Za svaku slučajnu varijablu x odrediti još tri veličine – centrirano Y, normalizirano V i dano U. Centrirana slučajna varijabla Y je razlika između date slučajne varijable x i njegovo matematičko očekivanje M(X), oni. Y = X – M(X). Očekivanje centrirane slučajne varijable Y jednaka je 0, a varijanca je varijanca dane slučajne varijable: M(Y) = 0, D(Y) = D(x). Funkcija distribucije F Y(x) centrirana slučajna varijabla Y vezane uz funkciju distribucije F(x) originalna slučajna varijabla x omjer:

F Y(x) = F(x + M(x)).

Gustoće ovih slučajnih varijabli zadovoljavaju jednakost

f Y(x) = f(x + M(x)).

Normalizirana slučajna varijabla V je omjer zadane slučajne varijable x svojoj standardnoj devijaciji, tj. . Očekivanje i varijanca normalizirane slučajne varijable V izražen kroz karakteristike x Tako:

,

Gdje v– koeficijent varijacije izvorne slučajne varijable x. Za distribucijsku funkciju F V(x) i gustoća f V(x) normalizirana slučajna varijabla V imamo:

Gdje F(x) – funkcija distribucije izvorne slučajne varijable x, A f(x) – njegovu gustoću vjerojatnosti.

Smanjena slučajna varijabla U je centrirana i normalizirana slučajna varijabla:

.

Za zadanu slučajnu varijablu

Normalizirane, centrirane i reducirane slučajne varijable stalno se koriste kako u teorijskim studijama tako iu algoritmima, softverski proizvodi, normativno-tehnička i instruktivno-metodička dokumentacija. Konkretno, jer jednakosti omogućuju pojednostavljenje obrazloženja metoda, formulacije teorema i formula za izračun.

Koriste se transformacije slučajnih varijabli i drugo opći plan. Dakle, ako Y = sjekira + b, Gdje a I b– onda neke brojke

Primjer 7. Ako tada Y je reducirana slučajna varijabla, a formule (8) pretvaraju se u formule (7).

Uz svaku slučajnu varijablu x možete pridružiti mnoge slučajne varijable Y, dano formulom Y = sjekira + b na različitim a> 0 i b. Ovaj skup se zove obitelj pomaka na ljestvici, koju generira slučajna varijabla x. Funkcije raspodjele F Y(x) čine familiju distribucija s pomakom na skali koju generira funkcija distribucije F(x). Umjesto Y = sjekira + bčesto koriste snimanje

Broj S naziva se parametar posmaka, a broj d- parametar mjerila. Formula (9) to pokazuje x– rezultat mjerenja određene veličine – ulazi u U– rezultat mjerenja iste veličine ako se početak mjerenja pomakne na točku S, a zatim upotrijebite novu mjernu jedinicu, in d puta veći od starog.

Za obitelj pomaka na skali (9), distribucija X naziva se standardna. U probabilističkim statističkim metodama odlučivanja i drugim primijenjenim istraživanjima koriste se standardna normalna distribucija, standardna Weibull-Gnedenko distribucija, standardna gama distribucija itd. (vidi dolje).

Također se koriste i druge transformacije slučajnih varijabli. Na primjer, za pozitivnu slučajnu varijablu x razmatraju Y= log x, gdje je lg x– decimalni logaritam broja x. Lanac jednakosti

F Y (x) = P( lg x< x) = P(X < 10x) = F( 10x)

povezuje distribucijske funkcije x I Y.

Pri obradi podataka koriste se sljedeće karakteristike slučajne varijable x kao momenti reda q, tj. matematička očekivanja slučajne varijable Xq, q= 1, 2, ... Dakle, samo matematičko očekivanje je trenutak reda 1. Za diskretnu slučajnu varijablu, trenutak reda q može se izračunati kao

Za kontinuiranu slučajnu varijablu

Trenuci reda q također se nazivaju početni trenuci reda q, za razliku od srodnih karakteristika – središnji momenti reda q, zadan formulom

Dakle, disperzija je središnji moment reda 2.

Normalna distribucija i središnji granični teorem. U probabilističko-statističkim metodama odlučivanja često se govori o normalnoj raspodjeli. Ponekad ga pokušavaju upotrijebiti za modeliranje distribucije početnih podataka (ti pokušaji nisu uvijek opravdani - vidi dolje). Što je još važnije, mnoge metode obrade podataka temelje se na činjenici da izračunate vrijednosti imaju raspodjele bliske normalnim.

Neka x 1 , x 2 ,…, X n M(X i) = m i odstupanja D(X i) = , ja = 1, 2,…, n,... Kao što slijedi iz rezultata prethodnog poglavlja,

Razmotrimo smanjenu slučajnu varijablu U n za iznos , naime,

Kao što slijedi iz formula (7), M(U n) = 0, D(U n) = 1.

(za identično raspoređene pojmove). Neka x 1 , x 2 ,…, X n, … – neovisne identično distribuirane slučajne varijable s matematičkim očekivanjima M(X i) = m i odstupanja D(X i) = , ja = 1, 2,…, n,... Tada za svaki x postoji granica

Gdje F(x)– funkcija standardne normalne distribucije.

Više o značajci F(x) – ispod (čitaj "fi od x", jer F- grčko veliko slovo "phi").

Centralni granični teorem (CLT) dobio je svoje ime jer je središnji, najčešće korišteni matematički rezultat teorije vjerojatnosti i matematičke statistike. Povijest CLT-a traje oko 200 godina - od 1730. godine, kada je engleski matematičar A. Moivre (1667.-1754.) objavio prvi rezultat vezan uz CLT (vidi dolje o Moivre-Laplaceovom teoremu), do dvadesetih i tridesetih godina prošlog stoljeća. dvadesetog stoljeća, kada je Finn J.W. Lindeberg, Francuz Paul Levy (1886-1971), Jugoslaven V. Feller (1906-1970), Rus A.Ya. Khinchin (1894-1959) i drugi znanstvenici dobili su potrebne i dovoljne uvjete za valjanost klasičnog središnjeg graničnog teorema.

Razvoj teme koja se razmatra nije tu stao - proučavali su slučajne varijable koje nemaju disperziju, tj. oni za koje

(akademik B.V. Gnedenko i dr.), situacija kada se zbrajaju slučajne varijable (točnije, slučajni elementi) složenije prirode od brojeva (akademici Yu.V. Prohorov, A.A. Borovkov i njihovi suradnici), itd. .d.

Funkcija distribucije F(x) je dana jednakošću

,

gdje je gustoća standardne normalne distribucije, koja ima prilično složen izraz:

.

Ovdje =3,1415925… je broj poznat u geometriji, jednak omjeru opsega i promjera, e = 2,718281828... - baza prirodnih logaritama (kako biste zapamtili ovaj broj, imajte na umu da je 1828. godina rođenja pisca L.N. Tolstoja). Kako je poznato iz matematička analiza,

Pri obradi rezultata promatranja funkcija normalne distribucije se ne izračunava prema zadanim formulama, već se nalazi pomoću posebnih tablica ili računalni programi. Najbolje "Tablice matematičke statistike" na ruskom jeziku sastavili su dopisni članovi Akademije znanosti SSSR-a L.N. Bolšev i N.V. Smirnov.

Oblik gustoće standardne normalne distribucije slijedi iz matematičke teorije, koju ovdje ne možemo razmatrati, kao ni dokaz CLT-a.

Za ilustraciju donosimo male tablice funkcije distribucije F(x)(tablica 2) i njegove kvantile (tablica 3). Funkcija F(x) simetrično oko 0, što se odražava u tablici 2-3.

Tablica 2.

Standardna funkcija normalne distribucije.

Ako je slučajna varijabla x ima distribucijsku funkciju F(x), Da M(X) = 0, D(x) = 1. Ova tvrdnja je dokazana u teoriji vjerojatnosti na temelju tipa gustoće vjerojatnosti. To je u skladu sa sličnom tvrdnjom za karakteristike reducirane slučajne varijable U n, što je sasvim prirodno, budući da CLT kaže da s neograničenim povećanjem broja članova funkcija distribucije U n teži standardnoj normalnoj funkciji distribucije F(x), i za bilo koje x.

Tablica 3.

Kvantili standardne normalne distribucije.

Kvantil reda R

Kvantil reda R

Uvedimo pojam obitelji normalnih distribucija. Po definiciji, normalna distribucija je distribucija slučajne varijable x, za koju je distribucija reducirane slučajne varijable F(x). Kao što slijedi iz općih svojstava obitelji distribucija s pomakom na skali (vidi gore), normalna distribucija je distribucija slučajne varijable

Gdje x– slučajna varijabla s distribucijom F(X), i m = M(Y), = D(Y). Normalna razdioba s parametrima pomaka m a mjerilo je obično naznačeno N(m, ) (ponekad se koristi oznaka N(m, ) ).

Kao što slijedi iz (8), gustoća vjerojatnosti normalne distribucije N(m, ) Tamo je

Normalne distribucije tvore obitelj pomaka na skali. U ovom slučaju, parametar razmjera je d= 1/ , i parametar posmaka c = - m/ .

Za središnje momente trećeg i četvrtog reda normalne distribucije vrijede sljedeće jednakosti:

Ove jednakosti čine osnovu klasičnih metoda za provjeru slijede li opažanja normalnu distribuciju. Danas se obično preporučuje testiranje normalnosti pomoću kriterija W Shapiro - Wilka. Problem testiranja normalnosti raspravlja se u nastavku.

Ako slučajne varijable X 1 I X 2 imaju distribucijske funkcije N(m 1 , 1) I N(m 2 , 2) prema tome, dakle X 1+ X 2 ima distribuciju Prema tome, ako slučajne varijable x 1 , x 2 ,…, X n N(m, ) , zatim njihova aritmetička sredina

ima distribuciju N(m, ) . Ova svojstva normalne razdiobe stalno se koriste u različitim probabilističkim i statističkim metodama odlučivanja, posebice u statističkoj regulaciji tehnoloških procesa iu statističkoj kontroli prihvatljivosti na temelju kvantitativnih kriterija.

Pomoću normalne distribucije definirane su tri distribucije koje se danas često koriste u statističkoj obradi podataka.

Distribucija (chi - kvadrat) – distribucija slučajne varijable

gdje su slučajne varijable x 1 , x 2 ,…, X n nezavisni i imaju istu distribuciju N(0,1). U ovom slučaju broj termina, tj. n, naziva se "broj stupnjeva slobode" distribucije hi-kvadrat.

Distribucija t Studentov t je distribucija slučajne varijable

gdje su slučajne varijable U I x neovisan, U ima standardnu ​​normalnu distribuciju N(0,1), i x– chi raspodjela – kvadrat c n stupnjevi slobode. pri čemu n naziva se “broj stupnjeva slobode” Studentove distribucije. Ovu raspodjelu uveo je 1908. engleski statističar W. Gosset, koji je radio u tvornici piva. Probabilističke statističke metode korištene su za izradu ekonomskih i tehnička rješenja u ovoj tvornici, stoga je njezino vodstvo zabranilo V. Gossetu objavljivanje znanstveni članci pod svojim imenom. Na taj način je zaštićena poslovna tajna, “know-how” u obliku probabilističkih i statističkih metoda koje je razvio V. Gosset. No, imao je priliku objavljivati ​​pod pseudonimom “Student”. Priča Gosset-Student pokazuje da su još stotinu godina menadžeri Velike Britanije bili svjesni velikog ekonomska učinkovitost probabilističke i statističke metode odlučivanja.

Fisherova distribucija je distribucija slučajne varijable

gdje su slučajne varijable X 1 I X 2 neovisni su i imaju hi-kvadrat distribuciju s brojem stupnjeva slobode k 1 I k 2 odnosno. U isto vrijeme, par (k 1 , k 2 ) – par “stupnjeva slobode” Fisherove distribucije, naime, k 1 je broj stupnjeva slobode brojnika, i k 2 – broj stupnjeva slobode nazivnika. Distribucija slučajne varijable F nazvana je po velikom engleskom statističaru R. Fisheru (1890.-1962.), koji ju je aktivno koristio u svojim radovima.

Izrazi za hi-kvadrat, Studentove i Fisherove distribucijske funkcije, njihove gustoće i karakteristike, kao i tablice mogu se naći u stručnoj literaturi (vidi, na primjer,).

Kao što je već navedeno, normalne distribucije sada se često koriste u probabilističkim modelima u raznim primijenjenim područjima. Koji je razlog zašto je ova obitelj distribucija s dva parametra toliko raširena? Pojašnjava ga sljedeći teorem.

Centralni granični teorem(za različito raspoređene pojmove). Neka x 1 , x 2 ,…, X n,… - nezavisne slučajne varijable s matematičkim očekivanjima M(x 1 ), M(x 2 ),…, M(x n), ... i odstupanja D(x 1 ), D(x 2 ),…, D(x n), ... redom. Neka

Zatim, ako su istiniti određeni uvjeti koji osiguravaju mali doprinos bilo kojeg od izraza u U n,

za bilo koga x.

Ovdje nećemo formulirati uvjete o kojima je riječ. Mogu se naći u stručnoj literaturi (vidi, na primjer,). "Pojašnjenje uvjeta pod kojima CPT djeluje zasluga je izvanrednih ruskih znanstvenika A.A. Markova (1857.-1922.) i, posebno, A.M. Lyapunova (1857.-1918.)."

Središnji granični teorem pokazuje da u slučaju kada rezultat mjerenja (promatranja) nastaje pod utjecajem mnogih uzroka, svaki od njih daje samo mali doprinos, a ukupni rezultat je određen aditivno, tj. zbrajanjem, tada je distribucija rezultata mjerenja (opažanja) bliska normalnoj.

Ponekad se vjeruje da je za normalnu distribuciju dovoljno da rezultat mjerenja (opažanja) x se formira pod utjecajem mnogih razloga, od kojih svaki ima mali utjecaj. To je pogrešno. Važno je kako ti uzroci djeluju. Ako je aditiv, onda x ima približno normalnu distribuciju. Ako višestruko(t. j. djelovanja pojedinih uzroka množe se a ne zbrajaju), zatim raspodjela x blizu ne normalnog, nego tzv. logaritamski normalan, tj. Ne x, a log X ima približno normalnu distribuciju. Ako nema razloga vjerovati da je na djelu jedan od ova dva mehanizma za formiranje konačnog rezultata (ili neki drugi dobro definirani mehanizam), onda o distribuciji x ne može se ništa određeno reći.

Iz navedenog proizlazi da se u konkretnom primijenjenom problemu normalnost rezultata mjerenja (opažanja) u pravilu ne može utvrditi iz općih razmatranja, već je treba provjeriti pomoću statističkih kriterija. Ili koristiti neparametarske statističke metode koje se ne temelje na pretpostavkama o pripadnosti funkcija distribucije rezultata mjerenja (opažanja) jednoj ili drugoj parametarskoj obitelji.

Kontinuirane distribucije koje se koriste u probabilističkim i statističkim metodama odlučivanja. Uz familiju normalnih distribucija s pomakom na skali, naširoko se koriste brojne druge obitelji distribucija - lognormalna, eksponencijalna, Weibull-Gnedenko, gama distribucija. Pogledajmo ove obitelji.

Slučajna vrijednost x ima lognormalnu distribuciju ako je slučajna varijabla Y= log x ima normalnu distribuciju. Zatim Z= log x = 2,3026…Y također ima normalnu distribuciju N(a 1 ,σ 1), gdje je ln x - prirodni logaritam x. Gustoća lognormalne distribucije je:

Iz središnjeg graničnog teorema slijedi da je umnožak x = x 1 x 2 X n nezavisne pozitivne slučajne varijable X i, ja = 1, 2,…, n, u cjelini n može se aproksimirati lognormalnom distribucijom. Konkretno, multiplikativni model formacije plaće ili dohotka dovodi do preporuke da se distribucije plaća i dohotka aproksimiraju logaritamski normalni zakoni. Za Rusiju se ova preporuka pokazala opravdanom - to potvrđuju statistički podaci.

Postoje i drugi probabilistički modeli koji vode do logaritamskog normalnog zakona. Klasičan primjer takvog modela dao je A. N. Kolmogorov, koji je iz fizički utemeljenog sustava postulata došao do zaključka da veličine čestica pri drobljenju komada rude, ugljena itd. u kuglastim mlinovima imaju lognormalnu raspodjelu.

Prijeđimo na drugu obitelj distribucija, široko korištenu u raznim probabilističko-statističkim metodama odlučivanja i drugim primijenjenim istraživanjima - obitelj eksponencijalnih distribucija. Počnimo s probabilističkim modelom koji dovodi do takvih distribucija. Da biste to učinili, razmotrite "tijek događaja", tj. slijed događaja koji se događaju jedan za drugim u određenim vremenskim točkama. Primjeri uključuju: protok poziva u telefonskoj centrali; tijek kvarova opreme u tehnološkom lancu; tijek kvarova proizvoda tijekom ispitivanja proizvoda; tijek zahtjeva klijenata do poslovnice banke; tok kupaca koji se prijavljuju za robu i usluge itd. U teoriji tokova događaja vrijedi teorem sličan središnjem graničnom teoremu, ali se ne radi o zbrajanju slučajnih varijabli, već o zbrajanju tokova događaja. Smatramo da se ukupni tok sastoji od veliki broj neovisni tokovi od kojih niti jedan nema dominantan utjecaj na ukupni tok. Na primjer, tijek poziva koji ulazi u telefonsku centralu sastoji se od velikog broja neovisnih tokova poziva koji potječu od pojedinačnih pretplatnika. Dokazano je da se u slučaju kada karakteristike strujanja ne ovise o vremenu, ukupan protok u potpunosti opisuje jednim brojem - intenzitetom strujanja. Za ukupni protok, razmotrite slučajnu varijablu x- duljina vremenskog intervala između uzastopnih događaja. Njegova distribucijska funkcija ima oblik

(10)

Ova se distribucija naziva eksponencijalna distribucija jer formula (10) uključuje eksponencijalnu funkciju ex. Vrijednost 1/λ je parametar skale. Ponekad se uvodi i parametar pomaka S, distribucija slučajne varijable naziva se eksponencijalna X + s, gdje je distribucija x dana je formulom (10).

Eksponencijalne distribucije poseban su slučaj tzv. Weibull - Gnedenko distribucije. Nazvane su po imenima inženjera V. Weibulla, koji je ove distribucije uveo u praksu analize rezultata ispitivanja zamora, i matematičara B. V. Gnedenka (1912.-1995.), koji je takve distribucije dobio kao granice pri proučavanju maksimuma rezultate testa. Neka x- slučajna varijabla koja karakterizira trajanje rada proizvoda, složenog sustava, elementa (tj. resursa, vremena rada do graničnog stanja itd.), trajanje rada poduzeća ili života živog bića itd. Intenzitet kvara igra važnu ulogu

(11)

Gdje F(x) I f(x) - funkcija distribucije i gustoća slučajne varijable x.

Opišimo tipično ponašanje stope neuspjeha. Cijeli vremenski interval može se podijeliti u tri razdoblja. Na prvom od njih funkcija λ(x) Ima visoke vrijednosti te jasnu tendenciju smanjenja (najčešće monotono opada). To se može objasniti prisutnošću u seriji predmetnih jedinica proizvoda s očitim i skrivenim nedostacima, koji dovode do relativno brzog kvara tih jedinica proizvoda. Prvo razdoblje naziva se "razdoblje provale" (ili "provala"). To je ono što obično pokriva jamstveni rok.

Zatim dolazi razdoblje normalnog rada, karakterizirano približno konstantnom i relativno niskom stopom kvarova. Priroda kvarova tijekom tog razdoblja je iznenadna (nesreće, pogreške operativnog osoblja itd.) i ne ovisi o trajanju rada jedinice proizvoda.

Konačno, posljednje razdoblje rada je razdoblje starenja i trošenja. Priroda kvarova tijekom ovog razdoblja je u nepovratnim fizičkim, mehaničkim i kemijskim promjenama u materijalima, što dovodi do progresivnog pogoršanja kvalitete jedinice proizvoda i njenog konačnog kvara.

Svako razdoblje ima svoju vrstu funkcije λ(x). Razmotrimo klasu ovisnosti o snazi

λ(x) = λ 0bx b -1 , (12)

Gdje λ 0 > 0 i b> 0 - neki numerički parametri. Vrijednosti b < 1, b= 0 i b> 1 odgovaraju vrsti stope kvarova tijekom razdoblja uhodavanja, normalnog rada i starenja.

Odnos (11) pri danoj stopi neuspjeha λ(x)- diferencijalna jednadžba za funkciju F(x). Iz teorije diferencijalne jednadžbe slijedi to

(13)

Zamjenom (12) u (13) dobivamo to

(14)

Distribucija dana formulom (14) naziva se Weibull-Gnedenkova distribucija. Jer

onda iz formule (14) proizlazi da je količina A, dan formulom (15), je parametar mjerila. Ponekad se uvodi i parametar pomaka, tj. Funkcije distribucije Weibull-Gnedenko nazivaju se F(x - c), Gdje F(x) dana je formulom (14) za neki λ 0 i b.

Weibull-Gnedenko gustoća distribucije ima oblik

(16)

Gdje a> 0 - parametar skale, b> 0 - parametar obrasca, S- parametar pomaka. U ovom slučaju, parametar A iz formule (16) pridružuje se parametru λ 0 iz formule (14) odnosom navedenim u formuli (15).

Eksponencijalna razdioba vrlo je poseban slučaj Weibull-Gnedenkove razdiobe, koja odgovara vrijednosti parametra oblika b = 1.

Weibull-Gnedenko distribucija također se koristi u konstrukciji probabilističkih modela situacija u kojima je ponašanje objekta određeno "najslabijom karikom". Postoji analogija s lancem, čija je sigurnost određena karikom koja ima najmanju snagu. Drugim riječima, neka x 1 , x 2 ,…, X n- neovisne identično distribuirane slučajne varijable,

X(1)=min( X 1, X 2,…, X n), X(n)=max( X 1, X 2,…, X n).

U nizu primijenjenih problema igraju važnu ulogu x(1) I x(n) , posebno kada se proučavaju najveće moguće vrijednosti ("zapisi") određenih vrijednosti, na primjer, plaćanja osiguranja ili gubici zbog komercijalnih rizika, kada se proučavaju granice elastičnosti i izdržljivosti čelika, niz karakteristika pouzdanosti itd. . Pokazuje se da za velike n raspodjele x(1) I x(n) , u pravilu, dobro opisuju Weibull-Gnedenko distribucije. Temeljni doprinos proučavanju distribucija x(1) I x(n) pridonio sovjetski matematičar B.V. Gnedenko. Korištenju dobivenih rezultata u ekonomiji, menadžmentu, tehnologiji i drugim područjima posvećeni su radovi V. Weibulla, E. Gumbela, V.B. Nevzorova, E.M. Kudlaev i mnogi drugi stručnjaci.

Prijeđimo na obitelj gama distribucija. Imaju široku primjenu u ekonomiji i menadžmentu, teoriji i praksi pouzdanosti i ispitivanja, u raznim područjima tehnologije, meteorologije itd. Konkretno, u mnogim situacijama, gama distribucija podliježe takvim veličinama kao što su ukupni životni vijek proizvoda, duljina lanca vodljivih čestica prašine, vrijeme kada proizvod dosegne granično stanje tijekom korozije, vrijeme rada do k-th odbijanje, k= 1, 2, … itd. Očekivano trajanje života pacijenata kronična bolest, vrijeme za postizanje određenog učinka tijekom liječenja u nekim slučajevima ima gama distribuciju. Ova distribucija najprikladnija je za opisivanje potražnje u ekonomskim i matematičkim modelima upravljanja zalihama (logistike).

Gustoća gama distribucije ima oblik

(17)

Gustoću vjerojatnosti u formuli (17) određuju tri parametra a, b, c, Gdje a>0, b>0. pri čemu a je parametar obrasca, b- parametar mjerila i S- parametar pomaka. Faktor 1/Γ(a) se normalizira, uvedeno je

Ovdje Γ(a)- jedan od onih koji se koriste u matematici posebne funkcije, tzv. “gama funkcija”, po kojoj je nazvana distribucija definirana formulom (17),

Na fiksnom A formula (17) specificira obitelj distribucija s pomakom na skali generiranu distribucijom s gustoćom

(18)

Distribucija oblika (18) naziva se standardna gama distribucija. Dobiva se iz formule (17) na b= 1 i S= 0.

Poseban slučaj gama distribucije za A= 1 su eksponencijalne distribucije (s λ = 1/b). S prirodnim A I S=0 gama distribucije nazivaju se Erlangove distribucije. Iz radova danskog znanstvenika K.A.Erlanga (1878.-1929.), zaposlenika Kopenhagenske telefonske kompanije, koji je studirao 1908.-1922. funkcioniranjem telefonskih mreža započeo je razvoj teorije čekanja u redu. Ova teorija bavi se probabilističkim i statističkim modeliranjem sustava u kojima se servisira tijek zahtjeva u svrhu donošenja optimalnih odluka. Erlangove distribucije koriste se u istim područjima primjene u kojima se koriste eksponencijalne distribucije. Ovo se temelji na sljedećoj matematičkoj činjenici: zbroj k nezavisnih slučajnih varijabli eksponencijalno distribuiranih s istim parametrima λ i S, ima gama distribuciju s parametrom oblika a =k, parametar mjerila b= 1/λ i parametar pomaka kc. Na S= 0 dobivamo Erlangovu distribuciju.

Ako je slučajna varijabla x ima gama distribuciju s parametrom oblika A takav da d = 2 a- cijeli broj, b= 1 i S= 0, zatim 2 x ima hi-kvadrat distribuciju sa d stupnjevi slobode.

Slučajna vrijednost x s gvmma distribucijom ima sljedeće karakteristike:

Očekivana vrijednost M(X) =ab + c,

Varijanca D(x) = σ 2 = ab 2 ,

Koeficijent varijacije

Asimetrija

Višak

Normalna distribucija je ekstremni slučaj gama distribucije. Preciznije, neka je Z slučajna varijabla koja ima standardnu ​​gama distribuciju danu formulom (18). Zatim

za bilo koji realni broj x, Gdje F(x)- standardna funkcija normalne distribucije N(0,1).

U primijenjenim istraživanjima koriste se i druge parametarske obitelji distribucija, od kojih su najpoznatiji sustav Pearsonovih krivulja, Edgeworthov i Charlierov niz. Oni se ovdje ne razmatraju.

Diskretna distribucije koje se koriste u probabilističkim i statističkim metodama odlučivanja. Najčešće se koriste tri obitelji diskretnih distribucija - binomna, hipergeometrijska i Poissonova, kao i neke druge obitelji - geometrijska, negativna binomna, multinomna, negativna hipergeometrijska itd.

Kao što je već spomenuto, binomna distribucija pojavljuje se u neovisnim pokusima, u svakom od njih s vjerojatnošću R pojavljuje se događaj A. Ako ukupni broj testovi n dano, zatim broj testova Y, u kojem se pojavio događaj A, ima binomnu distribuciju. Za binomnu distribuciju, vjerojatnost da bude prihvaćena kao slučajna varijabla je Y vrijednosti g određuje se formulom

Broj kombinacija od n elementi po g, poznato iz kombinatorike. Za sve g, osim 0, 1, 2, …, n, imamo P(Y= g)= 0. Binomna distribucija s fiksnom veličinom uzorka n određen je parametrom str, tj. binomne distribucije čine jednoparametarsku obitelj. Koriste se u analizi podataka iz studija uzoraka, posebice u proučavanju preferencija potrošača, selektivnoj kontroli kvalitete proizvoda prema planovima jednostupanjske kontrole, pri ispitivanju populacije pojedinaca u demografiji, sociologiji, medicini, biologiji itd. .

Ako Y 1 I Y 2 - nezavisne binomne slučajne varijable s istim parametrom str 0 , određeno iz uzoraka s volumenima n 1 I n 2 prema tome, dakle Y 1 + Y 2 - binomna slučajna varijabla s distribucijom (19). R = str 0 I n = n 1 + n 2 . Ova opaska proširuje primjenjivost binomne distribucije dopuštajući kombiniranje rezultata nekoliko skupina testova kada postoji razlog za vjerovanje da isti parametar odgovara svim tim skupinama.

Ranije su izračunate karakteristike binomne distribucije:

M(Y) = n.p., D(Y) = n.p.( 1- str).

U odjeljku "Događaji i vjerojatnosti" zakon velikih brojeva dokazan je za binomnu slučajnu varijablu:

za bilo koga . Koristeći teorem o središnjoj granici, zakon velikih brojeva može se precizirati navođenjem koliko Y/ n razlikuje se od R.

De Moivre-Laplaceov teorem. Za bilo koje brojeve a i b, a< b, imamo

Gdje F(x) je funkcija standardne normalne distribucije s matematičkim očekivanjem 0 i varijancom 1.

Da bismo to dokazali, dovoljno je upotrijebiti prikaz Y u obliku zbroja neovisnih slučajnih varijabli koje odgovaraju ishodima pojedinačnih testova, formule za M(Y) I D(Y) i središnji granični teorem.

Ovaj teorem je za slučaj R= ½ dokazao je engleski matematičar A. Moivre (1667.-1754.) 1730. U gornjoj formulaciji to je 1810. dokazao francuski matematičar Pierre Simon Laplace (1749. - 1827.).

Hipergeometrijska distribucija se događa tijekom selektivne kontrole konačnog skupa objekata volumena N prema alternativnom kriteriju. Svaki kontrolirani objekt klasificiran je kao da ima atribut A, ili kao da nema ovu karakteristiku. Hipergeometrijska distribucija ima slučajnu varijablu Y, jednak broju objekti koji imaju svojstvo A u slučajnom uzorku volumena n, Gdje n< N. Na primjer, broj Y neispravne jedinice proizvoda u slučajnom uzorku volumena n iz volumena serije N ima hipergeometrijsku raspodjelu ako n< N. Drugi primjer je lutrija. Neka znak A ulaznica je znak "biti dobitnik". Neka ukupan broj ulaznica N, a neka osoba stekla n od njih. Tada broj dobitnih listića za tu osobu ima hipergeometrijsku distribuciju.

Za hipergeometrijsku distribuciju, vjerojatnost da slučajna varijabla Y prihvati vrijednost y ima oblik

(20)

Gdje D– broj objekata koji imaju atribut A, u razmatranom skupu volumena N. pri čemu g uzima vrijednosti od max(0, n - (N - D)) do min( n, D), druge stvari g vjerojatnost u formuli (20) jednaka je 0. Dakle, hipergeometrijsku razdiobu određuju tri parametra - volumen populacije N, broj objekata D u njemu, posjedujući karakteristiku o kojoj je riječ A i veličina uzorka n.

Jednostavno slučajno uzorkovanje volumena n od ukupnog volumena N je uzorak dobiven kao rezultat slučajnog odabira u kojem bilo koji od skupova n objekti imaju istu vjerojatnost da budu odabrani. Metode slučajnog odabira uzoraka ispitanika (ispitanika) ili jedinica komadne robe razmatraju se u uputama, metodološkim i regulatornim dokumentima. Jedna od metoda odabira je sljedeća: objekti se biraju jedan iz drugog, au svakom koraku svaki od preostalih objekata u skupu ima istu šansu da bude odabran. U literaturi se za vrste uzoraka koji se razmatraju također koriste izrazi "slučajni uzorak" i "slučajni uzorak bez povrata".

Budući da su količine populacije (serija) N i uzorci n obično poznati, tada je parametar hipergeometrijske distribucije koji treba procijeniti D. U statističkim metodama upravljanja kvalitetom proizvoda D– obično broj neispravnih jedinica u seriji. Karakteristika distribucije također je zanimljiva D/ N– razina nedostataka.

Za hipergeometrijsku raspodjelu

Posljednji faktor u izrazu za varijancu je blizu 1 if N>10 n. Ako izvršite zamjenu str = D/ N, tada će se izrazi za matematičko očekivanje i varijancu hipergeometrijske distribucije pretvoriti u izraze za matematičko očekivanje i varijancu binomne distribucije. Ovo nije slučajnost. Može se pokazati da

na N>10 n, Gdje str = D/ N. Vrijedi granični omjer

a ovaj ograničavajući odnos se može koristiti kada N>10 n.

Treća široko korištena diskretna distribucija je Poissonova distribucija. Slučajna varijabla Y ima Poissonovu distribuciju ako

,

gdje je λ parametar Poissonove distribucije, i P(Y= g)= 0 za sve ostale g(za y=0 označava se 0! =1). Za Poissonovu distribuciju

M(Y) = λ, D(Y) = λ.

Ova je distribucija nazvana po francuskom matematičaru S. D. Poissonu (1781-1840), koji ju je prvi dobio 1837. Poissonova distribucija je granični slučaj binomne distribucije, kada je vjerojatnost R provedba događaja je mala, ali broj testova n super, i n.p.= λ. Točnije, vrijedi granična relacija

Stoga se Poissonova distribucija (u staroj terminologiji “zakon distribucije”) često naziva i “zakon rijetkih događaja”.

Poissonova distribucija javlja se u teoriji tokova događaja (vidi gore). Dokazano je da za najjednostavniji tok konstantnog intenziteta Λ broj događaja (poziva) koji su se dogodili tijekom vremena t, ima Poissonovu distribuciju s parametrom λ = Λ t. Stoga je vjerojatnost da tijekom vremena t nijedan događaj se neće dogoditi, jednako e - Λ t, tj. funkcija raspodjele duljine intervala između događaja je eksponencijalna.

Poissonova distribucija koristi se u analizi rezultata uzorka marketinških istraživanja potrošača, izračunavanju operativnih karakteristika statističkih planova kontrole prihvatljivosti u slučaju malih vrijednosti razine prihvatljivosti nedostataka, za opisivanje broja kvarova statistički kontroliranog tehnološki proces po jedinici vremena, broj "zahtjeva za uslugu" primljenih po jedinici vremena u sustavu čekanja, statistički obrasci nezgoda i rijetke bolesti itd.

Opis ostalih parametarskih obitelji diskretnih distribucija i njihovih mogućnosti praktičnu upotrebu razmatraju se u literaturi.


U nekim slučajevima, na primjer, kada se proučavaju cijene, obujmi proizvodnje ili ukupno vrijeme između kvarova u problemima pouzdanosti, funkcije distribucije su konstantne u određenim intervalima u koje vrijednosti proučavanih slučajnih varijabli ne mogu pasti.

Prethodno

Funkcija raspodjele slučajne varijable X je funkcija F(x), koja za svaki x izražava vjerojatnost da će slučajna varijabla X poprimiti vrijednost, manji x

Primjer 2.5. Zadan niz distribucije slučajne varijable

Pronađite i grafički predočite njegovu funkciju raspodjele. Riješenje. Prema definiciji

F(jc) = 0 at x x

F(x) = 0,4 + 0,1 = 0,5 at 4 F(x) = 0,5 + 0,5 = 1 at x > 5.

Dakle (vidi sliku 2.1):


Svojstva funkcije distribucije:

1. Funkcija distribucije slučajne varijable je nenegativna funkcija između nula i jedan:

2. Funkcija raspodjele slučajne varijable je neopadajuća funkcija na cijeloj numeričkoj osi, t.j. na x 2 >x

3. Na minus beskonačno funkcija raspodjele jednaka je nuli, na plus beskonačno jednaka je jedinici, tj.

4. Vjerojatnost pogađanja slučajne varijable x u intervalu jednak određeni integral od njegove gustoće vjerojatnosti u rasponu od A prije b(vidi sliku 2.2), tj.


Riža. 2.2

3. Funkcija distribucije kontinuirane slučajne varijable (vidi sliku 2.3) može se izraziti kroz gustoću vjerojatnosti prema formuli:

F(x)= Jp(*)*. (2.10)

4. Nepravi integral u beskonačnim granicama gustoće vjerojatnosti kontinuirane slučajne varijable jednak je jedinici:

Geometrijska svojstva / i 4 gustoće vjerojatnosti znače da je njegov graf distribucijska krivulja - ne leži ispod x-osi, I ukupna površina figure, omeđen krivuljom distribucije i osi x, jednako jedan.

Za kontinuiranu slučajnu varijablu x očekivana vrijednost M(X) i varijanca D(X) određuju se formulama:

(ako je integral apsolutno konvergentan); ili

(ako gornji integrali konvergiraju).

Uz gore navedene numeričke karakteristike, za opisivanje slučajne varijable koristi se koncept kvantila i postotnih bodova.

Kvantilna razina q(ili q-kvantil) je takva vrijednostx qnasumična varijabla, pri kojoj njegova funkcija raspodjele poprima vrijednost, jednako q, tj.

  • 100q%-ou točka je kvantil X~ q.
  • ? Primjer 2.8.

Na temelju podataka u primjeru 2.6 pronađite kvantil xqj i 30% slučajna varijabla točka X.

Riješenje. Po definiciji (2.16) F(xo t3)= 0,3, tj.

~Y~ = 0,3, odakle dolazi kvantil? x 0 3 = 0,6. 30% bodova slučajne varijable x, ili kvantil X)_o,z = xoj"nalazi se na sličan način iz jednadžbe ^ = 0,7. gdje je *,= 1,4. ?

Među numeričkim karakteristikama slučajne varijable postoje početni v* i središnji R* momenti k-tog reda, određena za diskretne i kontinuirane slučajne varijable formulama: