Usporedba srednjeg u smislu statističke značajnosti. Glavni uvjeti i koncepti medicinske statistike

Danas je stvarno previše jednostavno: možete pristupiti računalu i praktično bez znanja što radite, stvorite razumnu i besmislica s doista nevjerojatnim brzinom. (J. Boxing)

Glavni uvjeti i koncepti medicinske statistike

U ovom članku predstavljamo neke ključne pojmove statistike, relevantnih u medicinskim istraživanjima. Detaljnije, uvjeti se shvaćaju u relevantnim člancima.

Varijacija

Definicija. Stupanj raspršenja podataka (znakova) u smislu vrijednosti

Vjerojatnost

Definicija, Vjerojatnost je stupanj sposobnosti određenog događaja u određenim uvjetima.

Primjer. Objasniti definiciju termina o prijedlogu "vjerojatnost oporavka prilikom primjene lijek Arimidex je 70%. " Događaj je "oporavak pacijenta", stanje "pacijent usvaja arimidex", stupanj mogućnosti je 70% (grubo govoreći, od 100 ljudi koji prihvaćaju Arimidex, oporavak 70).

Kumulativna vjerojatnost

Definicija. Kumulativna vjerojatnost preživljavanja (kumulativna vjerojatnost preživljavanja) u vremenu t je ista kao i udio preživjelih pacijenata u to vrijeme.

Primjer. Ako kaže da je kumulativna vjerojatnost preživljavanja nakon petogodišnje stope liječenja 0,7, to znači da je 70% početnog broja bolesnika koji se razmatra, a 30% umrlo. Drugim riječima, od svakih stotinu ljudi, 30 umro je tijekom prvih 5 godina.

Vrijeme za događaj

Definicija. Vrijeme za događaj je vrijeme izraženo u nekim jedinicama, koje je prošlo od početnog vremena prije početka određenog događaja.

Obrazloženje. Kao jedinice vremena u medicinsko istraživanje Obavljati dane, mjesece i godine.

Tipični primjeri početnih vremenskih točaka:

    početak promatranja pacijenta

    izvođenje kirurškog liječenja

Tipični primjeri događaja koji se razmatraju:

    progresija bolesti

    pojavu relapsa

    smrt pacijenta

Uzorak

Definicija. Dio populacije dobivenog odabirom.

Prema rezultatima analize uzorka, postoje zaključci o cijeloj populaciji, što je legitimno samo ako je odabir bio slučajni. Budući da je slučajni odabir iz populacije gotovo nemoguće provesti, treba nastojati osigurati da uzorak je barem reprezentativan u odnosu na populaciju.

Ovisni i neovisni uzorci

Definicija. Uzorci u kojima su objekti studije stekli neovisno međusobno. Alternativa neovisnim uzorcima - ovisni (spojeni, par) uzoraka.

Hipoteza

Bilateralna i jednostrana hipoteza

Prvo, objasniti primjenu termina hipoteze u statistici.

Svrha većine studija je provjeriti istinu o nekom odobrenju. Svrha testiranja lijekova najčešće provjerava hipotezu da je jedan lijek učinkovitiji od drugog (na primjer, Arimidex je učinkovitiji od tamoksifena).

Da bi legendirala strogost istraživanja, provjerljiva izjava izražena je matematički. Na primjer, ako je A broj godina koji će živjeti pacijentu koji prihvaća arimidex, a na to je broj godina koji će živjeti pacijenta uzimajući tamoksifen, tada se provjerena hipoteza može napisati kao\u003e t.

Definicija. Hipoteza se naziva bilateralna (dvostrana), ako se sastoji u jednakosti dviju vrijednosti.

Primjer dvostrane hipoteze: a \u003d t.

Definicija. Hipoteza se naziva jednostrana (1 -straed), ako se sastoji od nejednakosti dviju vrijednosti.

Primjeri jednosmjernih hipoteza:

Dihotomous (binarni) podaci

Definicija. Podaci izraženi samo s dvije dopuštene alternativne vrijednosti

Primjer: pacijent "zdrav" - "bolestan". Edem je "-" Ne ".

Interval povjerenja

Definicija. Interval pouzdanosti (interval pouzdanosti) za određenu vrijednost je raspon oko vrijednosti vrijednosti u kojoj se nalazi prava vrijednost ove vrijednosti (s određenom razinom povjerenja).

Primjer. Neka vrijednost u studiju je broj pacijenata godišnje. U prosjeku je njihov broj jednak 500, a 95% -former interval - (350, 900). To znači da, najvjerojatnije (s vjerojatnošću od 95%), najmanje 350, a ne više od 900 ljudi će se tijekom godine obratiti klinici.

Oznaka. Redukcija se vrlo često koristi: di 95% (Ci 95%) je interval pouzdanosti s razinom pouzdanosti od 95%.

Točnost, statistička značajnost (P - Razina)

Definicija. Statistička značajnost Rezultat je mjera povjerenja u njegovu "istinu".

Svaka studija temelji se na samo dijelu objekata. Proučavanje učinkovitosti lijeka provodi se na temelju svih bolesnika na planeti općenito, ali samo određena skupina bolesnika (za provođenje analize na temelju svih pacijenata je jednostavno nemoguće).

Pretpostavimo da je kao rezultat analize napravljen neki zaključak (na primjer, upotreba arimideksa kao adekvatnu terapiju je 2 puta učinkovitije od tamoksifen lijeka).

Pitanje koje treba tražiti: "Koliko možete vjerovati ovom rezultatu?".

Zamislite da smo proveli studiju na temelju samo dva pacijenta. Naravno, u ovom slučaju, potrebno je liječiti rezultate s zabrinutošću. Ako je ispitan veliki broj pacijenata (numeričko značenje " veliki broj"Ovisi o situaciji), a zatim je već moguće vjerovati zaključcima.

Dakle, stupanj povjerenja i određuje se vrijednost P-razine (p-vrijednost).

Viša razina p odgovara više niska razina Povjerenje na rezultate dobivene pri analizi uzorka. Na primjer, P-razina jednaka 0,05 (5%) ukazuje na to da je zaključak u analizi određene skupine samo slučajna značajka tih objekata s vjerojatnošću od samo 5%.

Drugim riječima, uz vrlo visoku vjerojatnost (95%), izlaz se može proširiti na sve objekte.

U mnogim studijama, 5% se smatra prihvatljivom vrijednošću p-razine. To znači da, ako, na primjer, p \u003d 0,01, moguće je vjerovati rezultatima, a ako je p \u003d 0,06, to je nemoguće.

Studija

Potencijalna studija - Ovo je studija u kojoj se uzorci raspoređuju na temelju izvora faktora, a neki nastali čimbenik se analizira u uzorcima.

Retrospektivna studija - Ovo je studija u kojem se uzorci dodjeljuju na temelju dobivenog faktora, a neki početni faktor se analizira u uzorcima.

Primjer. Izvorni faktor je trudna žena mlađa / više od 20 godina. Rezultirajući čimbenik - dijete je lakše / teže od 2,5 kg. Analiziramo hoće li težina djeteta ovisi o dobi majke.

Ako regrutiramo 2 uzorke, u jednoj - majku do 20 godina, u drugom - stariji, a zatim analizirati masu djece u svakoj skupini, onda je to potencijalna studija.

Ako upišemo 2 uzorke, u jednoj - majci koja je rađala djeci lakše od 2,5 kg, na drugo - teže, a zatim analizirati dob majki u svakoj skupini, tada se ta retrospektivna studija (naravno, takva studija može nositi samo kada je dovršeno iskustvo, oni. Sve su djeca rođena).

Egzodus

Definicija. Klinički značajan fenomen, laboratorijski pokazatelj ili znak koji služi kao predmet interesa istraživača. Prilikom provođenja kliničkih ispitivanja, ishodi služe kao kriteriji za procjenu učinkovitosti terapijskog ili preventivnog utjecaja.

Klinička epidemiologija

Definicija. Znanost, koja omogućuje predviđanje jednog ili drugog ishoda za svaki određeni pacijent na temelju studije klinički protok Bolesti u sličnim slučajevima koriste stroge znanstvene metode Proučavanje pacijenata kako bi se osigurala točnost prognoza.

Kohort

Definicija. Skupina sudionika za istraživanje ujedinila je za bilo koju opći znak U vrijeme njezina formacije i proučavano dugo vremena.

Kontrola

Povijesna kontrola

Definicija. Kontrolna skupina formirana i ispitana tijekom razdoblja koja prethodi istraživanju.

Paralelno kontrolirati

Definicija. Kontrolna skupina formirana istovremeno s formiranjem glavne skupine.

Poveznica

Definicija. Statistička veza dva znaka (kvantitativna ili redna) koja pokazuju to veća vrijednost Jedna značajka u određenom dijelu slučajeva odgovara više - u slučaju pozitivne (ravne) korelacije - vrijednost druge značajke ili manje vrijednosti - u slučaju negativne (obrnute) korelaciju.

Primjer. Značajna korelacija je otkrivena između razine trombocita i leukocita u krvi pacijenta. Koeficijent korelacije je 0,76.

Koeficijent rizika (CR)

Definicija. Koeficijent rizika (omjer opasnosti) je omjer vjerojatnosti pojave nekih ("loših") događaja za prvu skupinu objekata na vjerojatnost početka istog događaja za drugu skupinu objekata.

Primjer. Ako je vjerojatnost pojave raka pluća u nepušačima 20%, a pušači su 100%, onda će Kirgist republika biti jednaka jednom petom. U ovom primjeru, prva skupina predmeta su ljudi za nepušače, druga skupina - pušači i kao "loš" događaj, se razmatra pojava raka pluća.

Očito je da:

1) ako je KR \u003d 1, onda vjerojatnost događaja u skupinama iste

2) Ako CR\u003e 1, događaj se češće događa s objektima iz prve skupine nego od drugog

3) ako je CR<1, то событие чаще происходит с объектами из второй группы, чем из первой

Meta-analiza

Definicija. Stadistička analiza, generaliziranje rezultata nekoliko studija, istražujući isti problem (obično učinkovitost liječenja, prevencije, dijagnostike). Proučavanje istraživanja pruža veći uzorak za analizu i veliku statističku snagu United Research. Koristi se za poboljšanje dokaza ili povjerenja u sklapanje učinkovitosti proučade metode.

Metoda Kaplan - Meyer (multimitacije Kaplan - Meyer)

Ova metoda je izumljena statistikom e.l. Kaplan i Meyer polje.

Metoda se koristi za izračunavanje različitih vrijednosti povezanih s vremenom praćenja bolesnika. Primjeri takvih vrijednosti:

    vjerojatnost oporavka za jednu godinu kada se koristi lijek

    mogućnost ponovnog pojavljivanja nakon operacije tri godine nakon operacije

    kumulativna vjerojatnost preživljavanja pet godina među bolesnika s rakom prostate s amputacijom organa

Razjasnimo prednosti korištenja metode Kaplan - Meyer.

Vrijednost vrijednosti pod "običnom" analizom (ne koristeći metodu kovanice) izračunava se na temelju podjele vremenskog intervala u razmatranju tijekom intervala.

Na primjer, ako istražimo vjerojatnost smrti pacijenta 5 godina, vremenski interval može biti podijeljen kao 5 dijelova (manje od 1 godine, 1-2 godine, 2-3 godine, 3-4 godine, 4-5 godina), tako i 10 (po pola sata), ili drugi broj intervala. Rezultati različitih stranaka će se razlikovati.

Izbor najprikladnijeg particije nije lak zadatak.

Procjene vrijednosti vrijednosti dobivenih od Kaplan-Meyer metoda ne ovise o podjeli promatranja u razmacima i ovise o životu svakog pojedinog pacijenta.

Stoga je istraživač lakše provesti analizu, a rezultati se često ispostavljaju da su kvalitativni rezultati "normalne" analize.

Kaplan-Meier krivulja (krivulja Kaplan - Meier) je graf krivulje preživljavanja dobivene pomoću metode Kaplan-Meier.

Model cox

Ovaj model je izumio Sir David Rocksby Coke (str.1924), poznati engleski statističari, autor više od 300 članaka i knjiga.

Model koksa koristi se u situacijama u kojima se analiziraju vrijednosti u istraživačima tijekom funkcija vremena. Na primjer, vjerojatnost ponavljanja kroz te godine (t \u003d 1.2, ...) može ovisiti o logaritamu dnevnika (t).

Važna prednost metode koju je predložio Cola je primjenjivost ove metode u velikom broju situacija (model ne nameće ozbiljne ograničenja prirode ili oblik distribucije vjerojatnosti).

Na temelju modela koksa, moguće je provesti analizu (pod nazivom Coala analiza (COX analiza)), od kojih je rezultat vrijednosti grafikona rizika i povjerenja za koeficijent rizika.

Neparametrične statističke metode

Definicija.Klasa statističkih metoda koje se uglavnom koriste za analizu kvantitativnih podataka koji ne čine normalnu distribuciju, kao i za analizu kvalitete podataka.

Primjer. Da bismo identificirali značaj razlika u sistoličkom tlaku bolesnika, ovisno o vrsti liječenja, koristimo neparametarski kriterij Mann-Whitney.

Znak (varijabla)

Definicija. H.aristruom objekta studija (promatranje). Razlikovati kvalitetne i kvantitativne znakove.

Randomizacija

Definicija.Metoda slučajnog raspodjele istraživačkih objekata u glavnu i kontrolnu skupinu pomoću posebnih sredstava (tablica ili slučajnih brojeva, bacanje kovanice i druge načine da slučajno dodijelite broj grupe u uključenom promatranju). Uz pomoć randomizacije, razlike između skupina u skladu s poznatim i nepoznatim značajkama koje potencijalno utječu na egzodus u studiju su minimizirane.

Rizik

Atribut - dodatni rizik od nepovoljnog ishoda (na primjer, bolesti) zbog prisutnosti određenog karakteristika (faktor rizika) u objektu studije. To je dio rizika od razvoja bolesti, koji je povezan s ovim čimbenikom rizika, objašnjava ih i može se eliminirati ako se taj faktor rizika eliminira.

Relativni rizik - omjer rizika od nastanka nepovoljnog stanja u jednoj skupini na rizik od ovog stanja u drugoj skupini. Koristi se u prospektivnim i promatračkim studijama, kada se grupe formiraju unaprijed, a pojava državnog studija još se nije dogodila.

Klizni ispit

Definicija.Metoda provjere stabilnosti, pouzdanosti, izvedbe (valjanosti) statističkog modela alternativnim uklanjanjem opažanja i preračunavanja modela. Što je dobiveno sličniji modeli, stabilniji, pouzdaniji model.

Događaj

Definicija.Klinički ishod koji se primjećuje u studiji, na primjer, pojavu komplikacija, recidiva, početka oporavka, smrti.

Stratifikacija

Definicija. M.ovaj uzorak formiranje, u kojem se skup svih sudionika koji odgovara kriterijima uključivanja u studiju prvo se podijeli u skupine (Strata) na temelju jedne ili više karakteristika (obično spol, dob), potencijalno utječu na ishod ishod, a zatim Iz svake od tih skupina (Stratus) samostalno posjeduje skup sudionika u eksperimentalnoj i kontrolnoj skupini. To omogućuje istraživaču da promatra ravnotežu važnih karakteristika između eksperimentalnih i kontrolnih skupina.

Tablica

Definicija.Tablica apsolutnih frekvencija (količina) opažanja, stupovi koji odgovaraju vrijednostima iste značajke, a žice su vrijednosti druge značajke (u slučaju dvodimenzionalne konotacijske tablice). Apsolutne vrijednosti frekvencije nalaze se u stanicama na raskrižju redova i stupaca.

Dajmo primjer konjugijskog stola. Operacija na aneurizmi je napravljena 194 bolesnika. Poznat je po ozbiljnosti edema u bolesnika prije operacije.

Edem egzodus

bez edema 20 6 26
umjereno oticanje 27 15 42
izraženo edem 8 21 29
j. 55 42 194

Tako, od 26 bolesnika koji nemaju edem, nakon operacije preživjeli 20 bolesnika, umro - 6 bolesnika. Od 42 pacijenta koji imaju umjereno otekline preživjele 27 pacijenata, umrli su - 15, itd.

Kriterij CHI-Square za cignute stolove

Da bi se utvrdilo značaj (pouzdanost) razlika u istoj značajki, ovisno o drugoj (na primjer, ishod operacije, ovisno o težini edema), kriterij CHI-Square koristi se kriterij za konjugucije:


Prilika

Neka vjerojatnost određenog događaja bude jednaka p. Tada vjerojatnost da se događaj ne dogodi jednak 1-p.

Na primjer, ako je vjerojatnost da će pacijent ostati živ nakon pet godina jednak 0,8 (80%), onda je vjerojatnost da će umrijeti 0,2 u ovom vremenskom intervalu (20%).

Definicija. Prilika je omjer vjerojatnosti da će se događaji dogoditi po vjerojatnosti da se događaj ne događa.

Primjer. U našem primjeru (o pacijentu), prilika je 4, kao 0,8 / 0,2 \u003d 4

Dakle, vjerojatnost oporavka je 4 puta veći vjerojatnost smrti.

Tumačenje vrijednosti vrijednosti.

1) ako je mogućnost \u003d 1, onda je vjerojatnost da je vjerojatnost vjerojatnosti da se događaj ne dogodi;

2) ako je mogućnost\u003e 1, onda vjerojatnost pojave događaja veća od vjerojatnosti da se događaj ne događa;

3) Ako je prilika<1, то вероятность наступления события меньше вероятности того, что событие не произойдёт.

Stavova

Definicija. Omjer šansa (omjer kns) je omjer šanse za prvu skupinu objekata na stav šanse za drugu skupinu objekata.

Primjer. Pretpostavimo da su neki tretman i muškarci i žene prolaze.

Vjerojatnost da će muški bolesni ostati živ pet godina kasnije jednak 0,6 (60%); Vjerojatnost da će umrijeti 0,4 (40%) tijekom tog vremenskog intervala).

Slične vjerojatnosti za žene jednake su 0,8 i 0,2.

Omjer prilike u ovom primjeru je jednak

Tumačenje vrijednosti vrijednosti.

1) Ako je omjer šanse \u003d 1, prilika za prvu skupinu jednaka priliku za drugu skupinu

2) ako je omjer šanse\u003e 1, onda je prilika za prvu skupinu veća od šanse za drugu skupinu

3) Ako je omjer šansi<1, то шанс для первой группы меньше шанса для второй группы

Zadatak 3. Pet predškolaca prikazano je test. Vrijeme za rješavanje svakog zadatka je zabilježeno. Hoće li statistički značajne razlike pronaći između vremena za rješavanje prvih triju zadataka testa?

Testni broj

Referentni materijal

Ovaj zadatak se temelji na teoriji analize disperzije. U općem slučaju, problem analize disperzije je identificirati te čimbenike koji imaju značajan utjecaj na rezultat eksperimenta. Analiza disperzije može se koristiti za usporedbu uzoraka srednje veličine ako je broj uzoraka više od dva. U tu svrhu služi jednokratnu analizu disperzije.

Kako bi se riješili zadaci dodijeljeni sljedeće. Ako disperzija dobivenih vrijednosti parametra optimizacije u slučaju utjecaja čimbenika razlikuju od disperzija rezultata u nedostatku utjecaja čimbenika, takav se takav čimbenik priznaje kao značajno.

Kao što se može vidjeti iz teksta zadatka, ovdje se koriste metode testiranja statističkih hipoteza, naime, zadatak provjere dviju empirijskih disperzija. Slijedom toga, analiza disperzije temelji se na provjeri disperzija kriterija Fishera. U tom zadatku potrebno je provjeriti jesu li potrebne razlike između vremena rješavanja prvih triju zadataka testa svaki od šest predškolaca.

Zero (glavna) naziva se hipoteza H o. Suština E pretpostavlja se da je razlika između usporednih parametara nula (stoga i naziv hipoteze je nula) i da su promatrane razlike slučajne.

Natjecanje (alternativa) naziva se H1 hipoteza, što je proturječi nuli.

Odluka:

Metoda disperzijske analize na razini značajnosti α \u003d 0,05 Provjerite nultu hipotezu (H o) o postojanju statistički značajnih razlika između vremena rješavanja prvih triju zadataka testa u šest predškolaca.

Razmotrite tablicu stanja zadatka u kojoj smatramo prosječno rješenje za svaki od tri testne zadatke

Testni broj

Faktorske razine

Vrijeme je za rješavanje prvog zadatka testa (u sek.).

Vrijeme za rješavanje drugog testnog zadatka (u sek.).

Vrijeme rješavanja trećeg zadatka testa (u sek.).

Prosjek grupe

Nalazimo zajednički prosjek:

Kako bi se uzeo u obzir važnost privremenih razlika između svakog testa, ukupna selektivna disperzija podijeljena je na dva dijela, od kojih se prvi naziva faktor, a drugi je ostatak

Izračunati ukupni iznos kvadrata odstupanja opcije iz ukupnog prosjeka pomoću formule

ili gdje je p broj mjerenja vremenskih rješenja testnih zadataka, Q - broj ispitanika. Da biste to učinili, napravite tablicu kvadrata

Testni broj

Faktorske razine

Vrijeme je za rješavanje prvog zadatka testa (u sek.).

Vrijeme za rješavanje drugog testnog zadatka (u sek.).

Vrijeme rješavanja trećeg zadatka testa (u sek.).

Glavne značajke bilo koje ovisnosti između varijabli.

Možete zabilježiti dvije najjednostavnija svojstva odnosa između varijabli: (a) vrijednost ovisnosti i (b) pouzdanost ovisnosti.

- Vrijednost , Količina ovisnosti je lakše razumjeti i mjeriti od pouzdanosti. Na primjer, ako je bilo koji čovjek u uzorku imao vrijednost broja leukocita (WCC) viši od bilo koje žene, onda možete reći da je odnos između dvije varijable (pod i WCC) vrlo visok. Drugim riječima, možete predvidjeti vrijednosti jedne varijable različitim vrijednostima.

- Pouzdanost ("Istina"). Pouzdanost međuovisnosti je manje vizualni koncept od veličine ovisnosti, ali iznimno važan. Pouzdanost ovisnosti je izravno povezana s reprezentativnošću određenog uzorka, na temelju zaključaka. Drugim riječima, pouzdanost ukazuje na to kako je vjerojatno da će ovisnost biti novo otkrivena (drugim riječima, to je potvrđeno) na ovim drugim uzorcima izvađenim iz iste populacije.

Treba pamtiti da je krajnji cilj gotovo da nikada ne proučava ovaj uzorak vrijednosti; Uzorak je od interesa samo inspiriran jer daje informacije o cijeloj populaciji. Ako studija zadovoljava neke posebne kriterije, pouzdanost pronađenih ovisnosti između varijabli uzorka može se kvantificirati i podnijeti korištenjem standardne statističke mjere.

Veličina ovisnosti i pouzdanosti predstavlja dvije različite karakteristike ovisnosti između varijabli. Ipak, nemoguće je reći da su potpuno neovisni. Što je veća veličina ovisnosti (komunikacija) između varijabli u uzorku uobičajenog volumena, to je više pouzdano (vidi sljedeći odjeljak).

Statistička značajnost rezultata (razina P) je procijenjena mjera povjerenja u njegovu "istinu" (u smislu "predstavnika uzorkovanja"). Ovladavanje više tehnički, P-razina je pokazatelj u smanjenju ovisnosti o pouzdanosti rezultata. Veća p-razina odgovara nižoj razini povjerenja u ovisnost koja se nalazi u odabiru između varijabli. To je da P-razina predstavlja vjerojatnost pogreške povezane s širenjem promatranog rezultata na cijeloj populaciji.

Na primjer, p-level \u003d 0,05 (tj. 1/20) pokazuje da postoji 5% šanse da je veza pronađena u uzorku između varijabli samo slučajna značajka ovog uzorka. U mnogim studijama, p-level 0,05 se smatra "prihvatljivom graničnom" razinom pogreške.

Ne postoji način da se izbjegne arbitrarnost pri donošenju odluke o kojoj se razina značajnosti treba smatrati "značajnim". Izbor određene razine značaja, iznad koje su rezultati odbačeni kao lažni, prilično je proizvoljno.



U praksi, konačno rješenje obično ovisi o tome je li rezultat predviđen a priori (tj. Prije pokusa) ili je otkrio primatelja kao rezultat mnogih analiza i usporedbi s različitim podacima, kao i na tradiciji koja je dostupna u ovo područje istraživanja.

Obično u mnogim područjima rezultat je str .05 je prihvatljiva granica statističkog značaja, ali treba pamtiti da ova razina još uvijek uključuje prilično veću vjerojatnost pogreške (5%).

Rezultati koji su značajni na razini p .01 obično se smatraju statistički značajnim, a rezultati s razinom p .005 ili str. 001 koliko vrlo značajna. Međutim, treba podrazumijevati da je ova klasifikacija razine značaja prilično proizvoljna i samo je neformalni sporazum usvojen na temelju praktičnog iskustva u jednom području istraživanja.

Jasno je da će se veći broj analiza provoditi s skup prikupljenih podataka, što je veći broj relevantnih rezultata (na odabranoj razini) otkrit će se isključivo slučajno.

Neke statističke metode koje uključuju mnoge usporedbe, i tako imaju značajnu priliku da ponavljaju ovu vrstu pogreške, proizvode posebnu prilagodbu ili amandman za ukupan broj usporedbi. Međutim, mnoge statističke metode (posebno jednostavne metode istraživanja podataka) ne nude nikakav način rješavanja ovog problema.

Ako je veza između varijable "objektivno" slaba, onda ne postoji drugi način da provjerite ovu ovisnost osim da istražite uzorak velikog volumena. Čak i ako je uzorak apsolutno reprezentativan, učinak neće biti statistički značajan ako je uzorak mali. Slično tome, ako je ovisnost "objektivno" vrlo jaka, onda se može otkriti s visokim stupnjem značaja čak i na vrlo malom uzorku.

Slabiji odnos između varijabli, veći je uzorak potreban je da ga značajno detektira.

Mnogo različitih razvijenih mjere međusobnog povezivanja Između varijabli. Izbor određene mjere u određenoj studiji ovisi o broju varijabli koje koriste mjerne ljestvice, prirodu ovisnosti, itd.

Većina tih mjera ipak su podređene općem načelu: pokušavaju procijeniti promatranu ovisnost, uspoređujući ga s "maksimalnom zamislivom ovisnošću" između razmatranja varijabli. Tehnički govori, uobičajeni način ispunjavanja takvih procjena je da se vidi koliko varijabilne vrijednosti variraju, a zatim izračunavaju koji dio cjelokupne varijacije može objasniti prisutnošću "opće" ("zajedničke") varijacije dva (ili više ) varijable.

Značaj ovisi uglavnom o veličini uzorka. Kao što je već već objašnjeno, u vrlo velikim uzorcima, čak i vrlo slabi ovisnosti između varijabli bit će značajne, dok su u malim uzorcima, čak i vrlo jake ovisnosti nisu pouzdane.

Dakle, kako bi se odredila razina statističkog značaja, funkcija je potrebna funkcija koja bi predstavljala odnos između "magnitude" i "značajnosti" odnosa između varijabli za svaku veličinu uzorka.

Takva bi funkcija ukazivala točno "koliko će vjerojatno dobiti ovisnost ove vrijednosti (ili više) u uzorku ovog volumena, pod pretpostavkom da ne postoji takva ovisnost u populaciji." Drugim riječima, ova funkcija bi dala razinu značajnosti
(P-stupanj), i, dakle, vjerojatnost pogrešnog odbijanja pretpostavke o odsustvu ove ovisnosti u populaciji.

Ova "alternativna" hipoteza (koja se sastoji od činjenice da ne postoji ovisnost u populaciji) obično se zove nula hipoteza.

Bilo bi savršeno ako je funkcija koja izračunava vjerojatnost da je pogreška bila linearna i imala samo različite padine za različite količine uzorkovanja. Nažalost, ova značajka je znatno složenija i nije uvijek ista. Međutim, u većini slučajeva, njegov oblik je poznat i može se koristiti za određivanje razine značajnosti u proučavanju uzoraka uzoraka. Većina tih funkcija povezana je s klasom distribucije normalan .

Razmotrite tipičan primjer primjene statističkih metoda u medicini. Stvoritelji lijeka sugeriraju da povećava diureza proporcionalna usvojenoj dozi. Da bi se potvrdila ova pretpostavka, oni su propisani pet volontera različitih doza lijeka.

Prema rezultatima opažanja, grafički grafikon dius kruga doze je izgrađen (sl. 1.2a). Ovisnost je vidljiva golog oka. Istraživači čestitaju jedni drugima s otkrićem, a svijet je s novim diuretikom.

Zapravo, podaci dopuštaju pouzdano tvrditi da je u ovim pet volontera opažena ovisnost dius kruga iz doze. Da će se ova ovisnost očitovati u svim ljudima koji će uzeti lijek - ništa više nego
zy.

s

, Nemoguće je reći da je sigurno - inače, zašto stavljate eksperimente?

Ali lijek je otišao na prodaju. Sve više ljudi uzima u nadi da će povećati svoju diurezu. I što vidimo? Vidimo sliku 1.2b, što ukazuje na odsutnost bilo kakvog odnosa između doze lijeka i diureza. Crni krugovi označili su podatke o početnim istraživanjima. Statistike imaju metode koje nam omogućuju procjenu vjerojatnosti dobivanja takvog "ne-privremenog", štoviše, što zbunjuje uzorak. Ispada se u odsustvu komunikacije između direurome i doze lijeka, rezultirajuća "ovisnost" bi se primijetila u približno 5 od 1000 eksperimenata. Dakle, u ovom slučaju istraživači jednostavno nisu sretni. Ako su primijenili čak i najnaprednije statističke metode, još ih ne bi spasilo od pogreške.

Ovaj fiktivni, ali ne uopće daleko od stvarnosti, nismo doveli da ne ukazivamo
statistika. Govori o drugom, o probabilističkoj prirodi svojih zaključaka. Kao rezultat primjene statističke metode, ne dobivamo istinu u posljednjem slučaju, već samo procjenu vjerojatnosti jedne ili druge pretpostavke. Osim toga, svaka statistička metoda temelji se na vlastitom matematičkom modelu, a njegovi rezultati su točni koliko ovim modelom odgovara stvarnosti.

Čak i na temu pouzdanosti i statističke značajnosti:

  1. Statistički značajne razlike u kvaliteti života
  2. Statistički agregat. Računi. Koncept čvrstih i selektivnih studija. Zahtjevi za statističku agregat i korištenje računovodstvenih dokumenata
  3. ESEJ. Istraživanje pouzdanosti svjedočanstva o ispitivanju za mjerenje intraokularnog tlaka kroz očni kapak 20118, 2018

Studija obično počinje s nekom pretpostavkom koja zahtijeva provjeru s privlačenjem činjenica. Ova pretpostavka je hipoteza - formulirana je u smislu komunikacije fenomena ili nekretnina u nekoj objektnom vijeću.

Da biste provjerili takve pretpostavke o činjenicama, potrebno je mjeriti odgovarajuća svojstva od njihovih nosača. Ali nemoguće je mjeriti tjeskobu u svim ženama i muškarcima, jer je nemoguće izmjeriti agresivnost svih adolescenata. Stoga, pri provođenju istraživanja, ograničeno je samo na relativno malu skupinu predstavnika relevantnih skupova ljudi.

Opći agregat- To su svi mnogi objekti u vezi s kojima je formulirana istraživačka hipoteza.

Na primjer, svi muškarci; ili sve žene; Ili svi stanovnici bilo kojeg grada. Opći agregati, u odnosu na koji istraživač će izvući zaključke na temelju rezultata istraživanja, može biti u brojevima i skroman, na primjer, svi prvi razreda ove škole.

Dakle, opći agregat je iako ne beskonačan u brojevima, ali, u pravilu, mnogi potencijalni testovi nedostupni za solidnu studiju.

Uzorak ili selektivni agregat- Ovo je ograničena skupina objekata (u psihologiji - testovi, ispitanici), posebno odabrani od opće populacije za proučavanje njezinih svojstava. Prema tome, zove se studija o odabiru svojstava opće populacije selektivna istraživanja. Gotovo sve psihološke studije su selektivne, a njihovi zaključci primjenjuju se na opće agregate.

Dakle, nakon što se formulira hipoteza i identificiraju odgovarajući opći agregati, određuje se problem organizacije uzorkovanja. Uzorak bi trebao biti takav da je dokazana generalizacija zaključaka uzorka uzorka - generalizacija, raspodjela njih na općoj populaciji. Glavni kriteriji za reviziju zaključaka za istraživanjeto je reprezentativnost uzorkovanja i statističke točnosti (empirijski) rezultati.

Reprezentativni uzorak- Drugim riječima, njegova reprezentativnost je sposobnost uzorka za predstavljanje proučavanih pojava dovoljno pola ne - sa stajališta njihove varijabilnosti u općoj populaciji.

Naravno, potpuna slika proučavanog fenomena, u svim njezinim područjima i nijansama varijabilnosti, može dati samo opću populaciju. Stoga je reprezentativnost uvijek ograničena u mjeri u kojoj je uzorak ograničen. I upravo je reprezentativnost uzorka glavna kukinja pri određivanju granica generalizacije zaključaka za istraživanje. Ipak, postoje tehnike koje vam omogućuju da dobijete dovoljnu reprezentativnost uzorka dovoljan za IS-istražitelj (te tehnike su u tijeku za tečaj "Eksperimentalna psihologija").


Prvi i primarni prijem je jednostavan slučajni (randomizirani) odabir. On pretpostavlja da osigurava takve uvjete kako bi svaki član opće populacije jednak s drugim šansi za ulazak u uzorak. Odabir plovidbe pruža mogućnost uzimanja u uzorak različitih predstavnika opće populacije. U isto vrijeme, poduzimaju se posebne mjere, isključujući pojavu bilo kojeg uzorka u odabiru. A to vam omogućuje da se nadate da će u konačnici u uzorku Izu-čaja imovine biti predstavljen ako ne u svemu, onda je u maksimalnoj mogućoj raznolikosti.

Drugi način pružanja reprezentativnosti je stratificirani slučajni odabir ili odabir prema svojstvima opće populacije. To podrazumijeva preliminarnu definiciju tih kvaliteta koje mogu utjecati na varijabilnost imovine koja se proučava (može biti pod, razina mužnje ili obrazovanja, itd.). Odnos postotka broja skupina razlikuje se u ovim kvalitetama skupina (Strata) u općoj populaciji i utvrđuje se i identičan postotni omjer odgovarajućih skupina u uzorku. Zatim, u svakoj podskupini uzorkovanja, subjekti su odabrani na principu jednostavnog slučajnog odabira.

Statistička točnostili statističko značenje, rezultati istraživanja određuju se metodama statističkog postojanja.

Jesmo li osigurani od izražavanja pogrešaka pri donošenju odluka, s određenim zaključcima iz rezultata istraživanja? Naravno da ne. Uostalom, naše odluke oslanjaju se na rezultate proučavanja uzorkovanja, kao i na razinu naših psiholoških znanja. U potpunosti nismo osigurani protiv pogrešaka. U statistici, takve se pogreške smatraju dopuštenim ako se ne pojave ne više nego u jednom slučaju od 1000 (vjerojatnost pogreške α \u003d 0,001 ili vrijednost vjerojatnosti pouzdanosti pravilnog izlaza P \u003d 0,9999); U jednom slučaju, od 100 (vjerojatnost pogreške α \u003d 0,01 ili vrijednost vjerojatnosti pouzdanosti pravilnog izlaza P \u003d 0,99) ili u pet slučajeva od 100 (vjerojatnost pogreške α \u003d 0,05 ili vjerojatnosti pouzdanosti ispravnog povlačenje p \u003d 0,95). Nalazi se na posljednje dvije razine i uobičajeno je donositi odluke u psihologiji.

Ponekad, govoreći o statističkoj pouzdanosti, upotrijebite koncept "razine značajnosti" (označen kao α). Numeričke vrijednosti P i α nadopunjuju jedni druge na 1.000 - kompletan skup događaja: ili smo napravili pravi zaključak, ili smo pogriješili. Te razine nisu izračunate, navele su. Razina značaja može se razumjeti kao vrsta "crvene" linije ", čija raskrižje će omogućiti da govori o ovom događaju kao nesumcinski. U svakom nadležnom znanstvenom izvješću ili objavljivanju, zaključci bi trebali biti popraćeni naznakom P ili α vrijednosti na kojima su doneseni zaključci.

Statističke metode izlaza detaljno se razmatraju tijekom "matematičke statistike". Sada imamo samo samo da nameću određene brojeve za brojeve ili uzorkovanje.

Nažalost, ne postoje stroge preporuke o preliminarnoj definiciji potrebnog uzorkovanja. Štoviše, odgovor na pitanje ne-akredita i dovoljan broj njezina broja obično se prekasno - tek nakon analize podataka već ispitanog izbora. Ipak, možete formulirati najviše opće preporuke:

1. Najveća veličina uzorka je potrebna pri razvoju dijagnostičkih metoda - od 200 do 1000-2500 ljudi.

2. Ako trebate usporediti 2 uzorka, njihovi ukupni brojevi trebaju biti najmanje 50 osoba; Broj usporednih uzoraka mora biti približno isti.

3. Ako se proučava odnos između bilo kojeg svojstva, volumen uzorka mora biti najmanje 30-35 osoba.

4. Veći varijabilnostproučavana svojstva, to bi trebala biti veća veličina uzorka. Stoga se varijabilnost može smanjiti povećanjem homogenosti uzorka, na primjer, na podu, dob, itd. U isto vrijeme, naravno, su smanjene mogućnosti generizacije zaključaka.

Ovisni i neovisni uzorci.Situacija istraživanja je česta kada se imovina istraživača proučava na dva ili više uzoraka u svrhu njihove daljnje usporedbe. Ovi uzorci mogu biti u različitim omjerima - ovisno o postupku njihove organizacije. Neovisni uzorci karakterizira se činjenicom da vjerojatnost odabira bilo kojeg predmeta jednog uzorka ne ovisi o odabiru bilo kojeg subjekata drugog uzorka. Baš suprotno ovisni uzorcikarakterizira činjenica da je svaki test jedan uzorak napravljen u skladu s određenim kriterijom koji subjekt iz drugog uzorka.

Općenito, ovisni uzorci ukazuju na primjeru radnog raspona korištenog u usporedbi uzoraka, a neovisni uzorci su neovisni odabir testova.

Treba napomenuti da su slučajevi "djelomično ovisni" (ili "djelomično neovisni") uzorci neprihvatljivi: to nepredvidljivo krši njihovu reprezentativnost.

U zaključku, napominjemo da se mogu razlikovati dvije paradigme psiholoških istraživanja.

Takozvani R-metodologijaona namjerava proučiti varijabilnost neke imovine (psihološko) pod utjecajem neke izloženosti, faktore ili druge imovine. Uzorak je simbol subjekata.

Drugi pristup Q-metodologija,to uključuje proučavanje varijabilnosti subjekta (pojedinačnog) pod utjecajem različitih poticaja (uvjetima, situacijama itd.). Odgovara situaciji kada uzorak je mnogo poticaja.