Primerjava povprečij po stopnji statistične pomembnosti. Osnovni izrazi in pojmi medicinske statistike

Danes je to res prelahko: lahko stopite do računalnika in z malo ali nič znanja o tem, kaj počnete, ustvarjate inteligenco in neumnosti z resnično osupljivo hitrostjo. (J. Box)

Osnovni izrazi in pojmi medicinske statistike

V tem članku bomo predstavili nekatere ključni pojmi statistike, pomembne za medicinske raziskave. Pogoji so podrobneje obravnavani v ustreznih člankih.

Različica

Opredelitev. Stopnja razpršenosti podatkov (vrednosti atributov) v območju vrednosti

Verjetnost

Opredelitev. Verjetnost je stopnja možnosti, da se določen dogodek zgodi pod določenimi pogoji.

Primer. Razložimo definicijo pojma v stavku »Verjetnost izterjave pri uporabi zdravilni izdelek Arimidex je 70 %." Dogodek je "ozdravitev pacienta", pogoj "pacient jemlje Arimidex", stopnja možnosti je 70% (grobo rečeno, od 100 ljudi, ki jemljejo Arimidex, jih 70 ozdravi).

Kumulativna verjetnost

Opredelitev. Kumulativna verjetnost preživetja v času t je enaka deležu bolnikov, ki so takrat živi.

Primer. Če rečemo, da je kumulativna verjetnost preživetja po petletnem zdravljenju 0,7, potem to pomeni, da je od obravnavane skupine bolnikov 70% začetnega števila ostalo živih, 30% pa je umrlo. Z drugimi besedami, od vsakih sto ljudi jih je 30 umrlo v prvih 5 letih.

Čas pred dogodkom

Opredelitev.Čas pred dogodkom je čas, izražen v nekaterih enotah, ki je pretekel od neke začetne točke v času do nastopa nekega dogodka.

Razlaga. Kot enote za čas v medicinske raziskave pojavijo se dnevi, meseci in leta.

Tipični primeri začetnih časov:

    začnite spremljati bolnika

    kirurško zdravljenje

Tipični primeri obravnavanih dogodkov:

    napredovanje bolezni

    pojav recidiva

    smrt bolnika

Vzorec

Opredelitev. Del populacije, pridobljen s selekcijo.

Na podlagi rezultatov analize vzorca se sklepa o celotni populaciji, kar velja le, če je bil izbor naključen. Ker je praktično nemogoče naključno izbrati iz populacije, si je treba prizadevati zagotoviti, da je vzorec vsaj reprezentativen za populacijo.

Odvisni in neodvisni vzorci

Opredelitev. Vzorci, v katerih so bili preiskovanci izbrani neodvisno drug od drugega. Alternativa neodvisnim vzorcem so odvisni (povezani, seznanjeni) vzorci.

Hipoteza

Dvostranske in enostranske hipoteze

Najprej pojasnimo uporabo izraza hipoteza v statistiki.

Namen večine raziskav je preizkusiti resničnost neke izjave. Namen testiranja zdravil je največkrat preveriti hipotezo, da je eno zdravilo učinkovitejše od drugega (npr. Arimidex je učinkovitejši od tamoksifena).

Da bi zagotovili natančnost študije, je izjava, ki se preverja, izražena matematično. Na primer, če je A število let, ki jih bo živel bolnik, ki jemlje Arimidex, in je T število let, ki jih bo živel bolnik, ki jemlje tamoksifen, potem lahko hipotezo, ki se testira, zapišemo kot A>T.

Opredelitev. Hipoteza se imenuje dvostranska, če je sestavljena iz enakosti dveh količin.

Primer dvostranske hipoteze: A=T.

Opredelitev. Hipoteza se imenuje enostranska (1-stranska), če je sestavljena iz neenakosti dveh količin.

Primeri enostranskih hipotez:

Dihotomni (binarni) podatki

Opredelitev. Podatki so izraženi samo z dvema veljavnima alternativnima vrednostma

Primer: Pacient je "zdrav" - "bolan". Edem "je" - "ne".

Interval zaupanja

Opredelitev. Interval zaupanja za količino je razpon okoli vrednosti količine, v katerem je prava vrednost te količine (z določeno stopnjo zaupanja).

Primer. Naj bo preučevana količina število bolnikov na leto. V povprečju je njihovo število 500, 95-odstotni interval zaupanja pa (350, 900). To pomeni, da se bo najverjetneje (z verjetnostjo 95 %) med letom na kliniko obrnilo najmanj 350 in ne več kot 900 ljudi.

Imenovanje. Zelo pogosto uporabljena okrajšava je: IZ 95 % je interval zaupanja s stopnjo zaupanja 95 %.

Zanesljivost, statistična značilnost (P - raven)

Opredelitev. Statistična pomembnost Rezultat je merilo zaupanja v njegovo "resnico".

Vsaka raziskava se izvaja le na podlagi dela predmetov. Študija učinkovitosti zdravila se ne izvaja na podlagi vseh bolnikov na planetu, ampak le na določeni skupini bolnikov (preprosto je nemogoče opraviti analizo na podlagi vseh bolnikov).

Predpostavimo, da je bila na podlagi analize narejena določena ugotovitev (na primer, uporaba zdravila Arimidex kot ustrezne terapije je 2-krat učinkovitejša od tamoksifena).

Vprašanje, ki si ga je treba zastaviti, je: "Koliko lahko zaupate temu rezultatu?"

Predstavljajte si, da smo izvedli raziskavo samo na dveh bolnikih. Seveda je v tem primeru treba rezultate obravnavati previdno. Če je bilo pregledanih veliko število bolnikov (številčna vrednost " velika količina»odvisno od situacije), potem lahko sklepom že zaupamo.

Torej je stopnja zaupanja določena z vrednostjo p-ravni (p-vrednost).

Višja p-raven ustreza več nizka stopnja zaupanje v rezultate, dobljene z analizo vzorca. Na primer, p-nivo, ki je enak 0,05 (5 %), pomeni, da je sklep iz analize določene skupine le naključna lastnost teh objektov z verjetnostjo le 5 %.

Z drugimi besedami, z zelo visoko verjetnostjo (95 %) se sklep lahko razširi na vse predmete.

Številne študije menijo, da je 5 % sprejemljiva vrednost p-ravni. To pomeni, da če je na primer p = 0,01, potem je rezultatom mogoče zaupati, če pa je p = 0,06, potem ne.

Študij

Prospektivna študija je študija, pri kateri se vzorci izberejo na osnovi začetnega faktorja, v vzorcih pa se analizira nek posledični faktor.

Retrospektivna študija je študija, pri kateri se vzorci izbirajo na podlagi nastalega faktorja, v vzorcih pa se analizira nek začetni faktor.

Primer. Izhodiščni dejavnik je nosečnica mlajša/nad 20 let. Rezultat tega je, da je otrok lažji/težji od 2,5 kg. Analiziramo, ali je teža otroka odvisna od starosti matere.

Če zberemo 2 vzorca, enega z materami, mlajšimi od 20 let, drugega s starejšimi materami, in nato analiziramo maso otrok v vsaki skupini, potem je to prospektivna študija.

Če zberemo 2 vzorca, v enem - matere, ki so rodile otroke, lažje od 2,5 kg, v drugem - težje, in nato analiziramo starost mater v vsaki skupini, potem je to retrospektivna študija (seveda taka študija se lahko izvede šele, ko je poskus zaključen, tj. ko so vsi otroci rojeni).

Eksodus

Opredelitev. Klinično pomemben pojav, laboratorijski indikator ali znak, ki služi kot predmet zanimanja raziskovalca. Pri izvajanju kliničnih preskušanj rezultati služijo kot merilo za ocenjevanje učinkovitosti terapevtskega ali preventivnega posega.

Klinična epidemiologija

Opredelitev. Znanost, ki omogoča napovedovanje določenega rezultata za vsakega posameznega bolnika na podlagi študije klinični potek bolezni v podobnih primerih z uporabo strogih znanstvene metode preučevanje bolnikov, da se zagotovi točnost napovedi.

Kohorta

Opredelitev. Skupina udeležencev študije, ki jih združujejo nekateri skupna lastnost v času njenega nastajanja in preučevana v daljšem časovnem obdobju.

Nadzor

Zgodovinski nadzor

Opredelitev. Kontrolna skupina, oblikovana in pregledana v obdobju pred študijo.

Vzporedni nadzor

Opredelitev. Kontrolna skupina je nastala sočasno z oblikovanjem glavne skupine.

Korelacija

Opredelitev. Statistični odnos med dvema karakteristikama (kvantitativnim ali ordinalnim), ki kaže, da višja vrednost Ena značilnost v določenem delu primerov ustreza večji vrednosti - v primeru pozitivne (direktne) korelacije - vrednosti druge značilnosti ali manjši vrednosti - v primeru negativne (inverzne) korelacije.

Primer. Med ravnmi trombocitov in levkocitov v bolnikovi krvi je bila ugotovljena pomembna korelacija. Korelacijski koeficient je 0,76.

Koeficient tveganja (RR)

Opredelitev. Razmerje tveganja je razmerje med verjetnostjo pojava nekega (»slabega«) dogodka za prvo skupino objektov in verjetnostjo pojava istega dogodka za drugo skupino objektov.

Primer. Če je verjetnost razvoja pljučnega raka pri nekadilcih 20%, pri kadilcih pa 100%, potem bo CR enak eni petini. V tem primeru so prva skupina objektov nekadilci, druga skupina so kadilci, pojav pljučnega raka pa štejemo kot »slab« dogodek.

Očitno je, da:

1) če je KR = 1, potem je verjetnost, da se dogodek zgodi v skupinah, enaka

2) če je KP>1, se dogodek pojavlja pogosteje pri objektih iz prve skupine kot iz druge

3) če je KR<1, то событие чаще происходит с объектами из второй группы, чем из первой

Meta-analiza

Opredelitev. Z statistična analiza, ki povzema rezultate več študij, ki raziskujejo isti problem (običajno učinkovitost zdravljenja, preventive, diagnostičnih metod). Združevanje študij zagotavlja večji vzorec za analizo in večjo statistično moč za kombinirane študije. Uporablja se za povečanje dokazov ali zaupanja v sklep o učinkovitosti preučevane metode.

Kaplan-Meierjeva metoda (ocene Kaplan-Meierjevega množitelja)

To metodo sta izumila statistika E.L. Kaplan in Paul Meyer.

Metoda se uporablja za izračun različnih količin, povezanih s časom opazovanja bolnika. Primeri takih količin:

    verjetnost okrevanja v enem letu pri uporabi zdravila

    možnost ponovitve po operaciji v treh letih po operaciji

    kumulativna verjetnost petletnega preživetja pri bolnikih z rakom prostate po amputaciji organa

Razložimo prednosti uporabe Kaplan-Meierjeve metode.

Vrednosti vrednosti v "konvencionalni" analizi (brez uporabe metode Kaplan-Meier) se izračunajo na podlagi razdelitve obravnavanega časovnega intervala na intervale.

Na primer, če proučujemo verjetnost bolnikove smrti v 5 letih, lahko časovni interval razdelimo na 5 delov (manj kot 1 leto, 1-2 leti, 2-3 leta, 3-4 leta, 4- 5 let), torej in za 10 (po šest mesecev) ali za drugo število intervalov. Rezultati za različne particije bodo različni.

Izbira najprimernejše particije ni lahka naloga.

Ocene vrednosti, pridobljene s Kaplan-Meierjevo metodo, niso odvisne od razdelitve opazovalnega časa na intervale, ampak so odvisne le od življenjske dobe vsakega posameznega bolnika.

Zato raziskovalec lažje izvede analizo, rezultati pa so pogosto boljši od rezultatov »konvencionalne« analize.

Kaplan - Meierjeva krivulja je graf krivulje preživetja, pridobljene s Kaplan-Meierjevo metodo.

Cox model

Ta model je izumil sir David Roxby Cox (r. 1924), slavni angleški statistik, avtor več kot 300 člankov in knjig.

Coxov model se uporablja v situacijah, ko so količine, ki jih proučujemo v analizi preživetja, odvisne od funkcij časa. Na primer, verjetnost ponovitve po t letih (t=1,2,...) je lahko odvisna od logaritma časa log(t).

Pomembna prednost metode, ki jo predlaga Cox, je uporabnost te metode v velikem številu situacij (model ne nalaga strogih omejitev glede narave ali oblike verjetnostne porazdelitve).

Na podlagi Coxovega modela se lahko izvede analiza (imenovana Coxova analiza), katere rezultat je vrednost koeficienta tveganja in intervala zaupanja za koeficient tveganja.

Neparametrične statistične metode

Opredelitev. Razred statističnih metod, ki se uporabljajo predvsem za analizo kvantitativnih podatkov, ki ne tvorijo normalne porazdelitve, pa tudi za analizo kvalitativnih podatkov.

Primer. Za ugotavljanje pomembnosti razlik v sistoličnem tlaku bolnikov glede na vrsto zdravljenja bomo uporabili neparametrični Mann-Whitneyjev test.

Znak (spremenljivka)

Opredelitev. X značilnosti predmeta študija (opazovanje). Obstajajo kvalitativne in kvantitativne značilnosti.

Randomizacija

Opredelitev. Metoda naključne porazdelitve predmetov raziskovanja v glavne in kontrolne skupine s posebnimi sredstvi (tabele ali števec naključnih števil, met kovanca in druge metode naključnega dodeljevanja številke skupine vključenemu opazovanju). Randomizacija zmanjša razlike med skupinami glede znanih in neznanih značilnosti, ki lahko vplivajo na preučevani rezultat.

Tveganje

Atributivna- dodatno tveganje za neugoden izid (na primer bolezen) zaradi prisotnosti določene lastnosti (dejavnika tveganja) pri subjektu študije. To je del tveganja za razvoj bolezni, ki je povezan z dejavnikom tveganja, ga je mogoče razložiti in ga je mogoče odpraviti, če je dejavnik tveganja odpravljen.

Relativno tveganje- razmerje med tveganjem za nastanek neugodnega stanja v eni skupini in tveganjem za nastanek tega stanja v drugi skupini. Uporablja se v prospektivnih in opazovalnih študijah, ko so skupine oblikovane vnaprej in se stanje, ki ga proučujemo, še ni pojavilo.

Tekoči izpit

Opredelitev. Metoda za preverjanje stabilnosti, zanesljivosti, delovanja (veljavnosti) statističnega modela z zaporednim odstranjevanjem opazovanj in ponovnim izračunom modela. Bolj ko so si modeli podobni, bolj stabilen in zanesljiv je model.

Dogodek

Opredelitev. Klinični izid, opažen v študiji, kot je pojav zapleta, ponovitev, okrevanje ali smrt.

Stratifikacija

Opredelitev. M tehnika vzorčenja, pri kateri je populacija vseh udeležencev, ki izpolnjujejo merila vključitve v študijo, najprej razdeljena v skupine (stratume) na podlagi ene ali več značilnosti (običajno spol, starost), ki lahko vplivajo na izid, ki ga zanima, in nato iz vsake od Udeleženci teh skupin (stratum) so neodvisno izbrani v eksperimentalno in kontrolno skupino. To omogoča raziskovalcu, da uravnoteži pomembne značilnosti med eksperimentalno in kontrolno skupino.

Kontingenčna tabela

Opredelitev. Tabela absolutnih frekvenc (številk) opazovanj, katere stolpci ustrezajo vrednostim ene značilnosti, vrstice pa vrednostim druge značilnosti (v primeru dvodimenzionalne tabele nepredvidljivih dogodkov). Vrednosti absolutne frekvence se nahajajo v celicah na presečišču vrstic in stolpcev.

Navedimo primer kontingenčne tabele. Operacija anevrizme je bila opravljena pri 194 bolnikih. Znana je resnost edema pri bolnikih pred operacijo.

Edem \ Rezultat

brez otekline 20 6 26
zmerno otekanje 27 15 42
izrazit edem 8 21 29
m j 55 42 194

Tako je od 26 bolnikov brez edema po operaciji preživelo 20 bolnikov, 6 bolnikov pa je umrlo. Od 42 bolnikov z zmernim edemom jih je 27 preživelo, 15 jih je umrlo itd.

Hi-kvadrat test za kontingenčne tabele

Za določitev pomembnosti (zanesljivosti) razlik v enem znaku glede na drugega (na primer izid operacije glede na resnost edema) se za kontingenčne tabele uporablja test hi-kvadrat:


Priložnost

Naj bo verjetnost nekega dogodka enaka p. Potem je verjetnost, da se dogodek ne zgodi, 1-p.

Na primer, če je verjetnost, da bo bolnik ostal živ po petih letih, 0,8 (80%), potem je verjetnost, da bo umrl v tem času, 0,2 (20%).

Opredelitev. Možnost je razmerje med verjetnostjo, da se bo dogodek zgodil, in verjetnostjo, da se dogodek ne bo zgodil.

Primer. V našem primeru (pri bolniku) je možnost 4, saj je 0,8/0,2=4

Tako je verjetnost ozdravitve 4-krat večja od verjetnosti smrti.

Razlaga vrednosti količine.

1) Če je možnost=1, je verjetnost, da se dogodek zgodi, enaka verjetnosti, da se dogodek ne bo zgodil;

2) če je možnost >1, potem je verjetnost, da se dogodek zgodi, večja od verjetnosti, da se dogodek ne bo zgodil;

3) če je možnost<1, то вероятность наступления события меньше вероятности того, что событие не произойдёт.

Razmerje obetov

Opredelitev. Razmerje obetov je razmerje obetov za prvo skupino objektov in razmerje obetov za drugo skupino objektov.

Primer. Predpostavimo, da se tako moški kot ženske zdravijo.

Verjetnost, da bo bolnik ostal živ po petih letih, je 0,6 (60%); verjetnost, da bo v tem času umrl, je 0,4 (40%).

Podobni verjetnosti za ženske sta 0,8 in 0,2.

Razmerje obetov v tem primeru je

Razlaga vrednosti količine.

1) Če je razmerje kvot = 1, potem je možnost za prvo skupino enaka možnosti za drugo skupino

2) Če je razmerje verjetnosti >1, potem je možnost za prvo skupino večja od možnosti za drugo skupino

3) Če razmerje obetov<1, то шанс для первой группы меньше шанса для второй группы

Naloga 3. Pet predšolskih otrok ima test. Zabeležen je čas, porabljen za rešitev posamezne naloge. Ali bodo ugotovljene statistično značilne razlike med časom reševanja prvih treh testnih nalog?

Št. predmetov

Referenčni material

Ta naloga temelji na teoriji analize variance. Na splošno je naloga analize variance identificirati tiste dejavnike, ki pomembno vplivajo na rezultat poskusa. Analiza variance se lahko uporabi za primerjavo srednjih vrednosti več vzorcev, če sta vzorca več kot dva. V ta namen se uporablja enosmerna analiza variance.

Za reševanje zastavljenih nalog je sprejeto naslednje. Če se variance dobljenih vrednosti parametra optimizacije v primeru vpliva dejavnikov razlikujejo od variance rezultatov v odsotnosti vpliva dejavnikov, potem se tak dejavnik šteje za pomembnega.

Kot je razvidno iz formulacije problema, so tu uporabljene metode za preverjanje statističnih hipotez, in sicer naloga testiranja dveh empiričnih varianc. Zato analiza variance temelji na testiranju variance s Fisherjevim testom. Pri tej nalogi je treba preveriti, ali so razlike med časom reševanja prvih treh testnih nalog vsakega od šestih predšolskih otrok statistično značilne.

Ničelna (glavna) hipoteza se imenuje postavljena hipoteza H o. Bistvo e se spušča v predpostavko, da je razlika med primerjanimi parametri nič (od tod tudi ime hipoteze - nič) in da so opazovane razlike naključne.

Konkurenčna (alternativna) hipoteza se imenuje H1, ki je v nasprotju z ničelno hipotezo.

rešitev:

Z metodo analize variance na stopnji pomembnosti α = 0,05 bomo preverili ničelno hipotezo (H o) o obstoju statistično značilnih razlik med časom reševanja prvih treh testnih nalog za šest predšolskih otrok.

Poglejmo tabelo pogojev nalog, v kateri bomo našli povprečni čas reševanja vsake od treh testnih nalog

Št. predmetov

Stopnje faktorjev

Čas za rešitev prve testne naloge (v sekundah).

Čas za rešitev druge testne naloge (v sekundah).

Čas za rešitev tretje testne naloge (v sekundah).

Skupinsko povprečje

Iskanje skupnega povprečja:

Da bi upoštevali pomembnost časovnih razlik v vsakem testu, je skupna varianca vzorca razdeljena na dva dela, od katerih se prvi imenuje faktorialni, drugi pa rezidualni.

S formulo izračunajmo skupno vsoto kvadratov odstopanj od skupnega povprečja

oz , kjer je p število meritev časa za reševanje testnih nalog, q število testirancev. Če želite to narediti, ustvarimo tabelo kvadratov

Št. predmetov

Stopnje faktorjev

Čas za rešitev prve testne naloge (v sekundah).

Čas za rešitev druge testne naloge (v sekundah).

Čas za rešitev tretje testne naloge (v sekundah).

Glavne značilnosti katere koli povezave med spremenljivkami.

Opazimo lahko dve najpreprostejši lastnosti razmerja med spremenljivkami: (a) velikost razmerja in (b) zanesljivost razmerja.

- Magnituda . Velikost odvisnosti je lažje razumeti in izmeriti kot zanesljivost. Na primer, če ima katerikoli moški v vzorcu vrednost števila belih krvnih celic (WCC) višjo kot katera koli ženska, potem lahko rečete, da je razmerje med dvema spremenljivkama (spol in WCC) zelo visoko. Z drugimi besedami, lahko predvidevate vrednosti ene spremenljivke iz vrednosti druge.

- Zanesljivost (»resnica«). Zanesljivost soodvisnosti je manj intuitiven koncept kot obseg odvisnosti, vendar je izjemno pomemben. Zanesljivost razmerja je neposredno povezana z reprezentativnostjo določenega vzorca, na podlagi katerega se sklepa. Z drugimi besedami, zanesljivost se nanaša na to, kako verjetno je, da bo razmerje ponovno odkrito (z drugimi besedami potrjeno) z uporabo podatkov iz drugega vzorca, vzetega iz iste populacije.

Ne smemo pozabiti, da končni cilj skoraj nikoli ni preučevanje tega posebnega vzorca vrednot; vzorec je zanimiv le toliko, kolikor daje informacije o celotni populaciji. Če študija izpolnjuje določene specifične kriterije, potem je mogoče zanesljivost ugotovljenih odnosov med vzorčnimi spremenljivkami kvantificirati in predstaviti z uporabo standardne statistične mere.

Velikost odvisnosti in zanesljivost predstavljata dve različni značilnosti odvisnosti med spremenljivkami. Vendar pa ni mogoče reči, da so popolnoma neodvisni. Večja kot je velikost razmerja (povezave) med spremenljivkami v vzorcu normalne velikosti, bolj zanesljiv je (glej naslednji razdelek).

Statistična pomembnost rezultata (raven p) je ocenjena mera zaupanja v njegovo »resničnost« (v smislu »reprezentativnosti vzorca«). Bolj tehnično gledano, je p-raven ukrep, ki se spreminja v padajočem vrstnem redu z zanesljivostjo rezultata. Višja p-raven ustreza nižji stopnji zaupanja v razmerje med spremenljivkami, najdenimi v vzorcu. P-nivo namreč predstavlja verjetnost napake, povezano s porazdelitvijo opazovanega rezultata na celotno populacijo.

na primer p-raven = 0,05(tj. 1/20) pomeni, da obstaja 5 % verjetnost, da je razmerje med spremenljivkami, najdenimi v vzorcu, samo naključna lastnost vzorca. V številnih študijah se p-raven 0,05 šteje za "sprejemljivo mejo" za stopnjo napake.

Nikakor se ne moremo izogniti samovolji pri odločanju, katera raven pomembnosti se resnično šteje za "pomembno". Izbira določene ravni pomembnosti, nad katero so rezultati zavrnjeni kot napačni, je precej poljubna.



V praksi je končna odločitev običajno odvisna od tega, ali je bil rezultat napovedan a priori (tj. pred izvedbo poskusa) ali odkrit posteriori kot rezultat številnih analiz in primerjav, opravljenih na različnih podatkih, pa tudi na podlagi tradicija študijskega področja.

Na splošno je na mnogih področjih rezultat p 0,05 sprejemljiva meja za statistično pomembnost, vendar ne pozabite, da ta raven še vedno vključuje precej veliko mejo napake (5 %).

Rezultati, ki so pomembni na ravni p .01, se na splošno štejejo za statistično pomembne, medtem ko se rezultati na ravni p .005 ali p .00 na splošno štejejo za statistično pomembne. 001 kot zelo pomemben. Vendar je treba razumeti, da je ta razvrstitev stopenj pomembnosti precej poljubna in le neformalen dogovor, sprejet na podlagi praktičnih izkušenj. na določenem študijskem področju.

Jasno je, da večje število analiz, ki jih izvedemo na celoti zbranih podatkov, večje število pomembnih (na izbrani ravni) rezultatov bo odkritih povsem naključno.

Nekatere statistične metode, ki vključujejo veliko primerjav in imajo tako veliko možnost ponovitve te vrste napake, naredijo posebno prilagoditev ali popravek za skupno število primerjav. Vendar številne statistične metode (zlasti enostavne raziskovalne metode analize podatkov) ne ponujajo nobenega načina za rešitev tega problema.

Če je razmerje med spremenljivkami »objektivno« šibko, potem ni drugega načina za testiranje takega razmerja, razen preučevanja velikega vzorca. Tudi če je vzorec popolnoma reprezentativen, učinek ne bo statistično značilen, če je vzorec majhen. Podobno, če je razmerje »objektivno« zelo močno, potem ga je mogoče zaznati z visoko stopnjo pomembnosti tudi v zelo majhnem vzorcu.

Čim šibkejše je razmerje med spremenljivkami, večja je velikost vzorca, ki je potrebna za smiselno odkrivanje.

Veliko različnih merila razmerja med spremenljivkami. Izbira določenega merila v posamezni študiji je odvisna od števila spremenljivk, uporabljenih merilnih lestvic, narave odnosov itd.

Večina teh ukrepov pa sledi splošnemu načelu: poskušajo oceniti opazovano razmerje tako, da ga primerjajo z "največjim možnim razmerjem" med zadevnimi spremenljivkami. Tehnično gledano je običajen način za izdelavo takšnih ocen, da pogledamo, kako se vrednosti spremenljivk spreminjajo, in nato izračunamo, koliko skupne prisotne variacije je mogoče razložiti s prisotnostjo "skupne" ("skupne") variacije v dve (ali več) spremenljivk.

Pomembnost je odvisna predvsem od velikosti vzorca. Kot že pojasnjeno, bodo v zelo velikih vzorcih tudi zelo šibke povezave med spremenljivkami pomembne, medtem ko v majhnih vzorcih niti zelo močne povezave niso zanesljive.

Zato je za določitev stopnje statistične pomembnosti potrebna funkcija, ki predstavlja razmerje med »magnitudo« in »pomembnostjo« razmerja med spremenljivkami za vsako velikost vzorca.

Takšna funkcija bi natančno pokazala, "kako verjetno je pridobiti odvisnost dane vrednosti (ali več) v vzorcu dane velikosti, ob predpostavki, da v populaciji ni takšne odvisnosti." Z drugimi besedami, ta funkcija bi dala raven pomembnosti
(p-raven), in s tem verjetnost napačne zavrnitve predpostavke o odsotnosti te odvisnosti v populaciji.

Ta "alternativna" hipoteza (da v populaciji ni razmerja) se običajno imenuje ničelna hipoteza.

Idealno bi bilo, če bi bila funkcija, ki izračuna verjetnost napake, linearna in bi imela samo različne naklone za različne velikosti vzorcev. Na žalost je ta funkcija veliko bolj zapletena in ni vedno popolnoma enaka. Vendar je v večini primerov njegova oblika znana in se lahko uporablja za določanje stopenj pomembnosti v študijah vzorcev dane velikosti. Večina teh funkcij je povezanih z razredom distribucij, imenovanim normalno .

Oglejmo si tipičen primer uporabe statističnih metod v medicini. Ustvarjalci zdravila kažejo, da poveča diurezo sorazmerno z odmerkom. Da bi preverili to hipotezo, dajo petim prostovoljcem različne odmerke zdravila.

Na podlagi rezultatov opazovanja se izriše graf diureze v odvisnosti od odmerka (slika 1.2A). Odvisnost je vidna s prostim očesom. Raziskovalci drug drugemu čestitajo za odkritje, svetu pa za nov diuretik.

Pravzaprav nam podatki omogočajo le zanesljivo trditev, da so pri teh petih prostovoljcih opazili od odmerka odvisno diurezo. Dejstvo, da se bo ta odvisnost pokazala pri vseh ljudeh, ki jemljejo drogo, ni več kot domneva.
ZY

z

življenje Ne moremo reči, da je neutemeljeno - drugače, zakaj izvajati poskuse?

Toda zdravilo je šlo v prodajo. Vse več ljudi ga jemlje v upanju, da bodo povečali izločanje urina. Kaj torej vidimo? Vidimo sliko 1.2B, ki kaže na odsotnost kakršne koli povezave med odmerkom zdravila in diurezo. Črni krogi označujejo podatke iz prvotne študije. Statistika ima metode, ki nam omogočajo, da ocenimo verjetnost, da dobimo tak »nereprezentativen« in dejansko zmeden vzorec. Izkazalo se je, da bi v odsotnosti povezave med diurezo in odmerkom zdravila nastalo "odvisnost" opazili v približno 5 od 1000 poskusov. Torej v tem primeru raziskovalci preprosto niso imeli sreče. Tudi če bi uporabili najnaprednejše statistične metode, jim to še vedno ne bi preprečilo napak.

Navedli smo ta izmišljen, a prav nič daleč od realnosti primer, ne da bi opozarjali na nekoristnost
statistike. Govori o nečem drugem, o verjetnosti njenih sklepov. Z uporabo statistične metode ne dobimo končne resnice, temveč le oceno verjetnosti posamezne predpostavke. Poleg tega vsaka statistična metoda temelji na svojem lastnem matematičnem modelu in njeni rezultati so pravilni do te mere, da ta model ustreza realnosti.

Več na temo ZANESLJIVOST IN STATISTIČNA POMEMBNOST:

  1. Statistično značilne razlike v kazalnikih kakovosti življenja
  2. Statistična populacija. Računovodske značilnosti. Koncept kontinuiranega in selektivnega raziskovanja. Zahteve za statistične podatke in uporabo računovodskih in poročevalskih listin
  3. POVZETEK. ŠTUDIJA ZANESLJIVOSTI TONOMETRSKIH INDIKACIJ ZA MERITEV INTRAOKULARNEGA TISKA SKOZI VEKO 2018, 2018

Raziskava se običajno začne z neko predpostavko, ki zahteva preverjanje z uporabo dejstev. Ta predpostavka - hipoteza - je oblikovana v zvezi s povezavo pojavov ali lastnosti v določenem nizu predmetov.

Da bi takšne predpostavke preizkusili glede na dejstva, je treba izmeriti ustrezne lastnosti njihovih nosilcev. Nemogoče pa je izmeriti anksioznost pri vseh ženskah in moških, tako kot ni mogoče izmeriti agresivnosti pri vseh mladostnikih. Zato je pri izvajanju raziskav omejena le na relativno majhno skupino predstavnikov relevantnih populacij ljudi.

Prebivalstvo— to je celoten niz predmetov, v zvezi s katerimi je formulirana raziskovalna hipoteza.

Na primer vsi moški; ali vse ženske; ali vsi prebivalci mesta. Splošne populacije, v zvezi s katerimi bo raziskovalec sklepal na podlagi rezultatov študije, so lahko skromnejše po številu, na primer vsi prvošolci določene šole.

Tako je splošna populacija, čeprav ne neskončna, vendar praviloma nedostopna za kontinuirano raziskovanje, skupek potencialnih subjektov.

Vzorec ali vzorčna populacija- to je številčno omejena skupina objektov (v psihologiji - subjekti, anketiranci), posebej izbranih iz splošne populacije za preučevanje njegovih lastnosti. V skladu s tem se imenuje študija lastnosti splošne populacije z uporabo vzorca študija vzorčenja. Skoraj vse psihološke študije so selektivne in njihovi zaključki veljajo za splošno populacijo.

Tako se po oblikovanju hipoteze in identificiranju ustreznih populacij raziskovalec sooči s problemom organiziranja vzorca. Vzorec mora biti takšen, da je generalizacija zaključkov vzorčne študije upravičena - generalizacija, razširitev na splošno populacijo. Glavna merila za veljavnost raziskovalnih zaključkovto sta reprezentativnost vzorca in statistična zanesljivost (empiričnih) rezultatov.

Reprezentativnost vzorca- z drugimi besedami, njegova reprezentativnost je zmožnost vzorca, da povsem v celoti predstavlja preučevane pojave - z vidika njihove variabilnosti v splošni populaciji.

Seveda pa lahko samo splošna populacija poda popolno sliko preučevanega pojava, v vsem njegovem obsegu in niansah variabilnosti. Zato je reprezentativnost vedno omejena toliko, kolikor je omejen vzorec. In prav reprezentativnost vzorca je glavni kriterij pri določanju meja posploševanja raziskovalnih ugotovitev. Vendar pa obstajajo tehnike, ki omogočajo pridobitev reprezentativnosti vzorca, ki je zadostna za raziskovalca (Te tehnike se preučujejo pri predmetu "Eksperimentalna psihologija").


Prva in glavna tehnika je preprosta naključna (randomizirana) izbira. Gre za zagotavljanje takšnih pogojev, da ima vsak član populacije enake možnosti kot drugi za vključitev v vzorec. Naključni izbor zagotavlja, da lahko v vzorec vključimo različne predstavnike splošne populacije. V tem primeru se sprejmejo posebni ukrepi, ki preprečujejo nastanek kakršnega koli vzorca med selekcijo. In to nam omogoča upati, da bo na koncu v vzorcu preučevana lastnost zastopana, če ne v celoti, pa v največji možni raznolikosti.

Drugi način zagotavljanja reprezentativnosti je stratificirano naključno vzorčenje oziroma izbor na podlagi lastnosti splošne populacije. Vključuje predhodno določitev tistih lastnosti, ki lahko vplivajo na variabilnost preučevane lastnosti (to je lahko spol, stopnja dohodka ali izobrazba itd.). Nato se določi odstotno razmerje števila skupin (stratumov), ki se razlikujejo po teh lastnostih v splošni populaciji, in zagotovi enako odstotno razmerje ustreznih skupin v vzorcu. Nato se preiskovanci izberejo v vsako podskupino vzorca po principu preprostega naključnega izbora.

statistična pomembnost, ali statistične pomembnosti so rezultati študije določeni z uporabo metod statističnega sklepanja.

Ali smo zavarovani pred napakami pri odločanju, pri sklepanju iz rezultatov raziskave? Seveda ne. Navsezadnje naše odločitve temeljijo na rezultatih študije vzorčne populacije, pa tudi na ravni našega psihološkega znanja. Nismo popolnoma imuni na napake. V statistiki se takšne napake štejejo za sprejemljive, če se ne pojavljajo pogosteje kot v enem primeru od 1000 (verjetnost napake α = 0,001 ali z njo povezana verjetnost zaupanja pravilnega zaključka p = 0,999); v enem primeru od 100 (verjetnost napake α = 0,01 ali povezana verjetnost zaupanja pravilnega zaključka p = 0,99) ali v petih primerih od 100 (verjetnost napake α = 0,05 ali povezana verjetnost zaupanja pravilnega zaključka izhod p=0,95). V psihologiji se odloča na zadnjih dveh ravneh.

Včasih, ko govorijo o statistični pomembnosti, uporabljajo koncept "stopnje pomembnosti" (označeno z α). Številčni vrednosti p in α se dopolnjujeta do 1000 - celoten niz dogodkov: ali smo naredili pravilen zaključek ali pa smo naredili napako. Te ravni niso izračunane, ampak podane. Stopnjo pomembnosti lahko razumemo kot nekakšno "rdečo" črto, presečišče katere nam bo omogočilo, da o tem dogodku govorimo kot o nenaključnem. V vsakem dobrem znanstvenem poročilu ali publikaciji mora sprejete zaključke spremljati navedba vrednosti p ali α, pri katerih so bili sklepi narejeni.

Metode statističnega sklepanja so podrobno obravnavane pri predmetu Matematična statistika. Zdaj le ugotavljamo, da imajo določene zahteve glede števila, oz Velikost vzorca.

Na žalost ni strogih smernic za vnaprejšnjo določitev zahtevane velikosti vzorca. Še več, odgovor na vprašanje o potrebnem in zadostnem številu raziskovalec običajno dobi prepozno – šele po analizi podatkov že anketiranega vzorca. Vendar pa je mogoče oblikovati najbolj splošna priporočila:

1. Pri razvoju diagnostične tehnike je potrebna največja velikost vzorca - od 200 do 1000-2500 ljudi.

2. Če je treba primerjati 2 vzorca, mora biti njihovo skupno število vsaj 50 oseb; število primerjanih vzorcev mora biti približno enako.

3. Če se preučuje razmerje med kakršnimi koli lastnostmi, mora biti velikost vzorca vsaj 30-35 ljudi.

4. Več variabilnost lastnosti, ki se proučuje, večji mora biti vzorec. Zato lahko variabilnost zmanjšamo tako, da povečamo homogenost vzorca, na primer po spolu, starosti ipd. To pa seveda zmanjša zmožnost posploševanja sklepov.

Odvisni in neodvisni vzorci. Običajna raziskovalna situacija je, ko raziskovalca zanimivo lastnost proučujemo na dveh ali več vzorcih z namenom nadaljnje primerjave. Ti vzorci so lahko v različnih razmerjih, odvisno od postopka njihove organizacije. Neodvisni vzorci zanje je značilno, da verjetnost izbire katerega koli subjekta v enem vzorcu ni odvisna od izbire katerega koli subjekta v drugem vzorcu. proti, odvisni vzorci zanje je značilno, da se vsakemu subjektu iz enega vzorca po določenem kriteriju ujema subjekt iz drugega vzorca.

Na splošno odvisni vzorci vključujejo parno izbiro oseb v primerjane vzorce, neodvisni vzorci pa neodvisno izbiro oseb.

Opozoriti je treba, da so primeri "delno odvisnih" (ali "delno neodvisnih") vzorcev nesprejemljivi: to nepredvidljivo krši njihovo reprezentativnost.

Na koncu omenimo, da lahko ločimo dve paradigmi psihološkega raziskovanja.

Tako imenovani R-metodologija vključuje preučevanje variabilnosti določene lastnosti (psihološke) pod vplivom določenega vpliva, dejavnika ali druge lastnosti. Vzorec je niz predmetov.

Drug pristop Q-metodologija, vključuje preučevanje variabilnosti subjekta (posameznika) pod vplivom različnih dražljajev (pogojev, situacij itd.). Ustreza situaciji, ko vzorec je skupek dražljajev.