Porovnanie priemerov podľa úrovne štatistickej spoľahlivosti. Základné pojmy a pojmy lekárskej štatistiky

Dnes je to naozaj príliš jednoduché: môžete kráčať k počítaču a pri minimálnych alebo žiadnych znalostiach o tom, čo robíte, vytvárať sentiment a nezmysly skutočne úžasnou rýchlosťou. (J. Box)

Základné pojmy a pojmy lekárskej štatistiky

V tomto článku uvádzame niektoré kľúčové štatistické koncepty, ktoré sú relevantné v lekárskom výskume. Podrobnejšie sa týmto pojmom rozumejú v príslušných článkoch.

zmena

Definícia. Miera rozptylu údajov (hodnoty funkcií) v rozsahu hodnôt

pravdepodobnosť

definícia... Pravdepodobnosť - miera možnosti prejavu určitej udalosti za určitých podmienok.

Príklad. Vysvetlíme si definíciu pojmu vo vete „Pravdepodobnosť zotavenia pri použití liek Arimidex je 70%. ““ Udalosťou je „uzdravenie pacienta“, stav „pacient užíva Arimidex“, miera pravdepodobnosti - 70% (zhruba povedané, zo 100 ľudí užívajúcich Arimidex sa 70 uzdraví).

Kumulatívna pravdepodobnosť

Definícia. Kumulatívna pravdepodobnosť prežitia v čase t je rovnaká ako podiel prežívajúcich pacientov v tom čase.

Príklad. Ak sa hovorí, že kumulatívna pravdepodobnosť prežitia po päťročnej liečbe je 0,7, znamená to, že z uvažovanej skupiny pacientov zostalo nažive 70% pôvodného počtu a 30% zomrelo. Inými slovami, z každých sto ľudí 30 zomrelo počas prvých 5 rokov.

Čas pred udalosťou

Definícia. Čas pred udalosťou je čas vyjadrený v niektorých jednotkách, ktorý uplynul od počiatočného časového okamihu do výskytu nejakej udalosti.

Vysvetlenie. Ako časové jednotky v zdravotný výskum objavujú sa dni, mesiace a roky.

Typické príklady východiskových bodov v čase:

    začatie sledovania pacienta

    chirurgická liečba

Typické príklady daných udalostí:

    progresie ochorenia

    opakovanie

    smrť pacienta

vzorka

Definícia. Časť populácie získaná výberom.

Na základe výsledkov analýzy vzorky sa robia závery o celej populácii, čo je legitímne, iba ak bol výber náhodný. Pretože je prakticky nemožné náhodne vybrať z populácie, cieľom by malo byť zabezpečiť, aby vzorka bola aspoň reprezentatívna pre populáciu.

Závislé a nezávislé vzorky

Definícia. Vzorky, do ktorých sa získavali študované objekty nezávisle na sebe. Alternatívou k nezávislým vzorkám sú závislé (spojené, spárované) vzorky.

hypotéza

Obojstranné a jednostranné hypotézy

Najprv si vysvetlíme použitie termínu hypotéza v štatistike.

Účelom väčšiny výskumov je testovanie pravdivosti tvrdenia. Cieľom testovania na drogy je najčastejšie otestovať hypotézu, že jedna droga je účinnejšia ako iná (napríklad Arimidex je účinnejší ako tamoxifén).

Na vyjadrenie presnosti štúdie je testovateľné tvrdenie vyjadrené matematicky. Napríklad, ak A je počet rokov, v ktorých bude pacient užívajúci Arimidex žiť, a T je počet rokov, v ktorých bude žiť pacient užívajúci Tamoxifen, potom možno testovanú hypotézu napísať ako A\u003e T.

Definícia. Hypotéza sa nazýva obojstranná, ak sa skladá z dvoch rovnakých hodnôt.

Príklad obojstrannej hypotézy: A \u003d T.

Definícia. Hypotéza sa nazýva jednostranná, ak sa skladá z dvoch nerovností.

Príklady jednostranných hypotéz:

Dichotomické (binárne) údaje

Definícia. Údaje sú vyjadrené iba s dvoma platnými alternatívnymi hodnotami

Príklad: Pacient je „zdravý“ - „chorý“. Edém „je“ - „nie“.

Interval spoľahlivosti

Definícia. Interval spoľahlivosti pre hodnotu je rozsah okolo hodnoty veličiny, v ktorej spočíva skutočná hodnota tejto veličiny (s určitou úrovňou spoľahlivosti).

Príklad. Nech je študovaným množstvom počet pacientov za rok. V priemere je ich počet 500 a 95% interval spoľahlivosti je (350, 900). To znamená, že s najväčšou pravdepodobnosťou (s 95% pravdepodobnosťou) kliniku v priebehu roka navštívi najmenej 350 a nie viac ako 900 ľudí.

Označenie. Používa sa veľmi častá skratka: 95% CI (95% CI) je interval spoľahlivosti s 95% úrovňou spoľahlivosti.

Spoľahlivosť, štatistická významnosť (úroveň P)

Definícia. Štatistická významnosť výsledkom je miera dôvery v jeho „pravdu“.

Akýkoľvek výskum sa vykonáva iba na základe časti objektov. Štúdia účinnosti lieku sa vykonáva na základe nie všeobecne všetkých pacientov na planéte, ale iba určitej skupiny pacientov (je nemožné vykonať analýzu založenú na všetkých pacientoch).

Predpokladajme, že na základe analýzy dôjde k určitému záveru (napríklad užívanie lieku Arimidex ako adekvátnej terapie je dvakrát účinnejšie ako liečivo tamoxifén).

Otázka, ktorá si treba položiť, znie: „Ako veľmi môžete dôverovať tomuto výsledku?“

Predstavte si, že robíme štúdiu iba s dvoma pacientmi. V takom prípade by sa samozrejme malo s výsledkami zaobchádzať s obavou. Ak bolo vyšetrených veľa pacientov (číselná hodnota „ vysoké číslo„Závisí to od situácie), potom je možné spoľahnúť sa na prijaté závery.

Miera dôveryhodnosti je teda určená hodnotou p.

Vyššia úroveň p zodpovedá viac nízky level spoľahlivosť výsledkov získaných pri analýze vzorky. Napríklad úroveň p 0,05 (5%) ukazuje, že záver vykonaný pri analýze určitej skupiny je iba náhodným znakom týchto objektov s pravdepodobnosťou iba 5%.

Inými slovami, existuje veľmi vysoká pravdepodobnosť (95%), že výstup možno rozšíriť na všetky objekty.

V mnohých štúdiách sa 5% považuje za prijateľnú p-hodnotu. To znamená, že ak je napríklad p \u003d 0,01, potom sa dá spoľahnúť na výsledky, ale ak je p \u003d 0,06, je to nemožné.

študovať

Perspektívna štúdia je štúdia, v ktorej sú vzorky alokované na základe počiatočného faktora a niektorý výsledný faktor je vo vzorkách analyzovaný.

Retrospektívna štúdia je štúdia, v ktorej sú vzorky alokované na základe výsledného faktora a vo vzorkách je analyzovaný nejaký počiatočný faktor.

Príklad. Východiskovým faktorom je tehotná žena mladšia / staršia ako 20 rokov. Výsledným faktorom je dieťa ľahšie / ťažšie ako 2,5 kg. Analyzujeme, či váha dieťaťa závisí od veku matky.

Ak zhromaždíme 2 vzorky, u jednej - matiek mladších ako 20 rokov, v druhej - staršej, a potom analyzujeme množstvo detí v každej skupine, potom ide o perspektívnu štúdiu.

Ak zhromaždíme 2 vzorky, v jednej - matkách, ktoré porodili deti ľahšie ako 2,5 kg, v druhej - ťažšej, a potom analyzujeme vek matiek v každej skupine, potom ide o retrospektívnu štúdiu (samozrejme, takúto štúdiu je možné uskutočniť až po skončení experimentu, tj všetky deti sa narodili).

exodus

Definícia. Klinicky významná udalosť, laboratórny parameter alebo vlastnosť, ktorá je zaujímavá pre výskumného pracovníka. V klinických štúdiách slúžia výsledky ako kritériá na hodnotenie účinnosti terapeutického alebo profylaktického zásahu.

Klinická epidemiológia

Definícia. Veda, ktorá umožňuje predvídať konkrétny výsledok pre každého konkrétneho pacienta na základe štúdie klinický priebeh chorôb v podobných prípadoch s použitím prísnych vedecké metódy študovať pacientov, aby sa zabezpečila presnosť predpovedí.

kohorta

Definícia. Skupina účastníkov štúdie, ktorých spája každý spoločná vlastnosť v čase svojho vzniku a študoval dlho.

ovládanie

Historická kontrola

Definícia. Kontrolná skupina sa vytvorila a skúmala v období pred štúdiou.

Paralelné riadenie

Definícia. Kontrolná skupina sa formovala súčasne s formovaním hlavnej skupiny.

Korelácia

Definícia. Štatistický vzťah medzi dvoma znakmi (kvantitatívnym alebo ordinálnym), ktorý to ukazuje viac zmyslu jeden znak v určitej časti prípadov zodpovedá väčšej - v prípade kladnej (priamej) korelácie - hodnote iného znaku alebo menšej hodnote - v prípade zápornej (inverznej) korelácie.

Príklad. Zistila sa významná korelácia medzi hladinou krvných doštičiek a leukocytov v krvi pacienta. Korelačný koeficient je 0,76.

Pomer rizika (CR)

Definícia. Miera nebezpečnosti je pomer pravdepodobnosti istej („zlej“) udalosti, ktorá sa vyskytne pre prvú skupinu objektov, a pravdepodobnosti toho, že rovnaká udalosť sa stane pre druhú skupinu objektov.

Príklad. Ak je pravdepodobnosť vzniku rakoviny pľúc u nefajčiarov 20% a u fajčiarov 100%, potom bude ČR pätinová. V tomto príklade sú prvou skupinou objektov nefajčiari, druhou skupinou sú fajčiari a výskyt rakoviny pľúc sa považuje za „zlú“ udalosť.

Je zrejmé, že:

1) ak KP \u003d 1, potom je pravdepodobnosť udalosti v skupinách rovnaká

2) ak KP\u003e 1, potom sa udalosť vyskytuje častejšie u objektov z prvej skupiny ako z druhej

3) ak KR<1, то событие чаще происходит с объектами из второй группы, чем из первой

Metaanalýza

Definícia. FROMštatistická analýza zhrňujúca výsledky niekoľkých štúdií skúmajúcich rovnaký problém (zvyčajne účinnosť liečby, prevencia, diagnostika). Kombinácia štúdií poskytuje veľkú vzorku na analýzu a viac štatistickej sily na kombinovanie štúdií. Používa sa na zvýšenie dôkazov alebo dôvery v záver o účinnosti skúmanej metódy.

Metóda Kaplan - Meier (viac odhadov Kaplan - Meier)

Túto metódu vymysleli štatistici E.L. Kaplan a Paul Meyer.

Metóda sa používa na výpočet rôznych hodnôt týkajúcich sa času pozorovania pacienta. Príklady takýchto množstiev:

    pravdepodobnosť zotavenia do jedného roka pri užívaní drogy

    pravdepodobnosť recidívy po operácii do troch rokov po operácii

    kumulatívna pravdepodobnosť prežitia u pacientov s rakovinou prostaty po amputácii orgánu počas piatich rokov

Vysvetlíme si výhody použitia metódy Kaplan - Meier.

Hodnoty hodnôt v „obvyklej“ analýze (bez použitia Kaplan-Meierovej metódy) sa počítajú na základe rozdelenia uvažovaného časového intervalu do intervalov.

Napríklad, ak študujeme pravdepodobnosť smrti pacienta do 5 rokov, potom je možné časový interval rozdeliť na 5 častí (menej ako 1 rok, 1 - 2 roky, 2 - 3 roky, 3 - 4 roky, 4 - 5 rokov), takže a 10 (každý šesť mesiacov) alebo ďalší počet intervalov. Výsledky budú pre rôzne oddiely odlišné.

Vybrať najvhodnejšie rozdelenie nie je ľahká úloha.

Odhady hodnôt veličín získaných metódou Kaplan-Meier nezávisia od rozdelenia času pozorovania na intervaly, ale závisia iba od života každého jednotlivého pacienta.

Preto je pre výskumného pracovníka uskutočnenie analýzy jednoduchšie a výsledky sa často ukážu ako kvalitnejšie ako výsledky „obvyklej“ analýzy.

Kaplan-Meierova krivka je graf krivky prežitia získaný metódou Kaplan-Meier.

Coxov model

Tento model vynašiel Sir David Roxby Cox (nar. 1924), slávny anglický štatistik, autor viac ako 300 článkov a kníh.

Coxov model sa používa v situáciách, keď veličiny študované pri analýze prežitia závisia od funkcií času. Napríklad pravdepodobnosť opakovania v t rokoch (t \u003d 1,2, ...) môže závisieť od logaritmu časového protokolu (t).

Dôležitou výhodou metódy navrhnutej Coxom je uplatniteľnosť tejto metódy na veľké množstvo situácií (model neukladá prísne obmedzenia týkajúce sa povahy alebo formy rozdelenia pravdepodobnosti).

Na základe Coxovho modelu je možné vykonať analýzu (nazývanú Coxova analýza), ktorej výsledkom je pomer rizika a interval spoľahlivosti pre pomer rizika.

Neparametrické štatistické metódy

Definícia.Trieda štatistických metód, ktoré sa používajú predovšetkým na analýzu kvantitatívnych údajov, ktoré nie sú bežne distribuované, a na analýzu kvalitatívnych údajov.

Príklad. Na identifikáciu významnosti rozdielov v systolickom krvnom tlaku pacientov v závislosti od typu liečby používame neparametrický Mann-Whitneyov test.

Funkcia (premenná)

Definícia. Xcharakteristika objektu výskumu (pozorovania). Rozlišujte medzi kvalitatívnymi a kvantitatívnymi charakteristikami.

randomizácie

Definícia.Metóda náhodného rozdelenia výskumných objektov do hlavnej a kontrolnej skupiny pomocou špeciálnych prostriedkov (tabuľky alebo počítadlo náhodných čísel, vrhanie mincí a ďalšie metódy náhodného priradenia čísla skupiny k zahrnutému pozorovaniu). Randomizácia minimalizuje rozdiely medzi skupinami pre známe a neznáme vlastnosti, ktoré potenciálne ovplyvňujú študovaný výsledok.

nebezpečenstvo

atributivní - ďalšie riziko nepriaznivého výsledku (napríklad choroby) v dôsledku prítomnosti určitej charakteristiky (rizikového faktora) vo výskumnom objekte. Toto je časť rizika vzniku ochorenia, ktorá je spojená s týmto rizikovým faktorom, je ním vysvetlená a je možné ju vylúčiť, ak sa tento rizikový faktor vylúči.

Relatívne riziko - pomer rizika nepriaznivého stavu v jednej skupine k riziku tohto stavu v inej skupine. Používa sa v prospektívnych a pozorovacích štúdiách, keď sa skupiny vytvárajú vopred, a nástup študovaného stavu ešte nenastal.

Záverečná skúška

Definícia.Metóda kontroly stability, spoľahlivosti, výkonnosti (platnosti) štatistického modelu striedavým mazaním pozorovaní a prepočítaním modelu. Čím sú získané modely podobnejšie, tým je model stabilnejší a spoľahlivejší.

udalosť

Definícia.Klinické výsledky pozorované v štúdii, ako sú komplikácie, relaps, zotavenie, smrť.

stratifikácia

Definícia. Mmetóda vzorkovania, pri ktorej je populácia všetkých účastníkov, ktorí spĺňajú kritériá na zaradenie do štúdie, najskôr rozdelená do skupín (vrstiev) na základe jednej alebo viacerých charakteristík (zvyčajne pohlavia, veku), ktoré potenciálne ovplyvňujú študovaný výsledok, a potom z každej z týchto skupín ( strat) nezávisle prijímali účastníkov do experimentálnej a kontrolnej skupiny. To umožňuje výskumníkovi vyvážiť dôležité charakteristiky medzi experimentálnou a kontrolnou skupinou.

Pohotovostná tabuľka

Definícia.Tabuľka absolútnych frekvencií (počtu) pozorovaní, ktorých stĺpce zodpovedajú hodnotám jedného znaku a riadky zodpovedajú hodnotám iného znaku (v prípade dvojrozmernej pohotovostnej tabuľky). Absolútne frekvencie sa nachádzajú v bunkách na priesečníku riadkov a stĺpcov.

Uveďme príklad pohotovostnej tabuľky. Aneuryzmatický zákrok bol vykonaný u 194 pacientov. Je známy indikátor závažnosti edému u pacientov pred chirurgickým zákrokom.

Edém \\ Výsledok

bez edému 20 6 26
mierny edém 27 15 42
výrazný edém 8 21 29
m j 55 42 194

Z 26 pacientov bez edémov teda 20 pacientov po operácii prežilo a 6 pacientov zomrelo. Zo 42 pacientov so stredne ťažkým edémom prežilo 27 pacientov, 15 zomrelo atď.

Chi-kvadrát test pre pohotovostné tabuľky

Na stanovenie významnosti (spoľahlivosti) rozdielov jedného znamienka v závislosti na druhom (napríklad výsledok operácie v závislosti od závažnosti edému) sa pre pohotovostné tabuľky používa test chí kvadrát:


šanca

Pravdepodobnosť nejakej udalosti nech je str. Potom je pravdepodobnosť, že k udalosti nedôjde, 1-s.

Napríklad ak je pravdepodobnosť, že pacient zostane nažive po piatich rokoch, 0,8 (80%), potom je pravdepodobnosť, že počas tohto časového obdobia zomrie, 0,2 (20%).

Definícia. Šanca je pomerom pravdepodobnosti, že k udalosti dôjde, a pravdepodobnosti, že k udalosti nedôjde.

Príklad. V našom príklade (o pacientovi) je šanca 4, pretože 0,8 / 0,2 \u003d 4

Pravdepodobnosť zotavenia teda predstavuje 4-násobok pravdepodobnosti smrti.

Výklad hodnoty množstva.

1) Ak je Šanca \u003d 1, potom je pravdepodobnosť výskytu udalosti rovná pravdepodobnosti, že k udalosti nedôjde;

2) ak je Šanca\u003e 1, potom je pravdepodobnosť výskytu udalosti väčšia ako pravdepodobnosť, že k udalosti nedôjde;

3) ak je šanca<1, то вероятность наступления события меньше вероятности того, что событие не произойдёт.

Pomer šancí

Definícia. Kurzový pomer je pomer šancí pre prvú skupinu predmetov k koeficientu šancí pre druhú skupinu predmetov.

Príklad. Predpokladajme, že muži aj ženy podstupujú určitú liečbu.

Pravdepodobnosť, že mužský pacient zostane nažive po piatich rokoch, je 0,6 (60%); pravdepodobnosť, že počas tohto časového obdobia zomrie, je 0,4 (40%).

Podobné pravdepodobnosti u žien sú 0,8 a 0,2.

Pomer šancí v tomto príklade je

Výklad hodnoty množstva.

1) Ak je pomer šancí \u003d 1, potom sa šanca pre prvú skupinu rovná šanci pre druhú skupinu

2) Ak je pomer šancí\u003e 1, potom je šanca pre prvú skupinu väčšia ako šanca pre druhú skupinu

3) Ak je pomer šancí<1, то шанс для первой группы меньше шанса для второй группы

Úloha 3. Test absolvuje päť predškolákov. Zaznamenáva sa čas na riešenie každej úlohy. Nájdu sa štatisticky významné rozdiely medzi časom potrebným na vyplnenie prvých troch testovaných položiek?

Počet predmetov

Referenčný materiál

Táto úloha je založená na teórii analýzy variancie. Úlohou analýzy odchýlky je vo všeobecnosti identifikovať tie faktory, ktoré majú významný vplyv na výsledok experimentu. ANOVA sa môže použiť na porovnanie priemerov viacerých vzoriek, ak je počet vzoriek viac ako dva. Na tento účel sa používa jednosmerná analýza odchýlky.

Na vyriešenie stanovených úloh sa prijíma toto. Ak sa odchýlky získaných hodnôt optimalizačného parametra v prípade vplyvu faktorov líšia od odchýlok výsledkov pri absencii vplyvu faktorov, potom sa takýto faktor považuje za významný.

Ako je zrejmé z formulácie problému, používajú sa tu metódy testovania štatistických hypotéz, konkrétne problém testovania dvoch empirických odchýlok. Následne je analýza rozptylu založená na kontrole odchýlok pomocou Fisherovho testu. Pri tejto úlohe je potrebné skontrolovať, či sú rozdiely medzi časom riešenia prvých troch úloh testu každým zo šiestich predškolákov štatisticky významné.

Nulová (základná) hypotéza sa nazýva H о. Podstata e sa redukuje na predpoklad, že rozdiel medzi porovnávanými parametrami sa rovná nule (preto je názov hypotézy nulový) a že pozorované rozdiely majú náhodný charakter.

Konkurenčná (alternatívna) hypotéza sa nazýva hypotéza H 1, ktorá je v rozpore s nulovou.

rozhodnutie:

Pomocou metódy analýzy rozptylu na hladine významnosti α \u003d 0,05 preveríme nulovú hypotézu (H о) o existencii štatisticky významných rozdielov medzi časom riešenia prvých troch úloh testu u šiestich predškolákov.

Zvážte tabuľku podmienok úlohy, v ktorej nájdeme priemerný čas na vyriešenie každej z troch testovacích úloh

Počet predmetov

Úrovne faktorov

Čas na vyriešenie prvej úlohy z testu (v sekundách).

Čas na vyriešenie druhej úlohy testu (v sekundách).

Čas na vyriešenie tretej testovacej úlohy (v sekundách).

Skupinový priemer

Nájdite celkový priemer:

S cieľom zohľadniť význam časových rozdielov každého testu sa celková odchýlka vzorky rozdelí na dve časti, z ktorých prvá sa nazýva faktoriál a druhá zvyšková.

Vypočítajme celkový súčet druhých mocnín odchýlok variantu z celkového priemeru podľa vzorca

alebo , kde p je počet meraní času riešenia testovacích úloh, q je počet predmetov. Ak to chcete urobiť, urobte možnosť tabuľky štvorcov

Počet predmetov

Úrovne faktorov

Čas na vyriešenie prvej úlohy z testu (v sekundách).

Čas na vyriešenie druhej úlohy testu (v sekundách).

Čas na vyriešenie tretej testovacej úlohy (v sekundách).

Hlavné črty akejkoľvek závislosti medzi premennými.

Možno poznamenať dve z najjednoduchších vlastností závislosti medzi premennými: (a) veľkosť závislosti a (b) spoľahlivosť závislosti.

- Množstvo ... Rozsah vzťahu je ľahšie pochopiteľný a merateľný ako spoľahlivosť. Napríklad ak mal ktorýkoľvek muž vo vzorke vyššiu hodnotu počtu bielych krviniek (WCC) ako ktorákoľvek žena, dalo by sa povedať, že vzťah medzi dvoma premennými (pohlavie a WCC) je veľmi vysoký. Inými slovami, mohli by ste predpovedať hodnoty jednej premennej z hodnôt druhej.

- Spoľahlivosť ( "Pravda"). Spoľahlivosť vzájomnej závislosti je menej intuitívna ako veľkosť závislosti, ale je mimoriadne dôležitá. Spoľahlivosť vzťahu priamo súvisí s reprezentatívnosťou konkrétnej vzorky, na základe ktorej sa vyvodzujú závery. Inými slovami, spoľahlivosť naznačuje, ako pravdepodobné je, že vzťah bude znovu objavený (inými slovami potvrdený) na dátach z inej vzorky odobratej z tej istej populácie.

Malo by sa pamätať na to, že konečným cieľom nie je takmer nikdy preskúmať danú konkrétnu vzorku hodnôt; vzorka je zaujímavá, iba ak poskytuje informácie o celej populácii. Ak štúdia spĺňa niektoré špeciálne kritériá, potom je možné spoľahlivosť zistených vzťahov medzi vzorovými premennými kvantifikovať a prezentovať pomocou štandardného štatistického merania.

Veľkosť a spoľahlivosť závislosti predstavujú dve rôzne charakteristiky závislostí medzi premennými. Nedá sa však povedať, že sú úplne nezávislé. Čím vyššia je hodnota vzťahu (vzťahu) medzi premennými vo vzorke bežnej veľkosti, tým je spoľahlivejšia (pozri nasledujúcu časť).

Štatistická významnosť výsledku (úroveň p) je odhadovanou mierou dôvery v jeho „pravdivosť“ (v zmysle „reprezentatívnosti vzorky“). Odbornejšie povedané, úroveň p je indikátor, ktorý klesá so spoľahlivosťou výsledku. Vyššia úroveň p zodpovedá nižšej úrovni dôvery v závislosť medzi premennými zistenými vo vzorke. Konkrétne úroveň p predstavuje pravdepodobnosť chyby spojenej s rozšírením pozorovaného výsledku na celú populáciu.

Napríklad, úroveň p \u003d 0,05 (t. j. 1/20) ukazuje, že existuje 5% pravdepodobnosť, že vzťah medzi premennými zistenými vo vzorke je iba náhodným znakom danej vzorky. V mnohých štúdiách sa hladina p 0,05 považuje za „prijateľnú hranicu“ úrovne chyby.

Neexistuje spôsob, ako sa vyhnúť svojvôli pri rozhodovaní, ktorá úroveň významnosti by sa mala skutočne považovať za „významnú“. Voľba určitej úrovne významnosti, nad ktorou sú výsledky odmietnuté ako nepravdivé, je dosť svojvoľná.



V praxi konečné rozhodnutie zvyčajne závisí od toho, či bol výsledok predpovedaný a priori (t. J. Pred experimentom) alebo či sa objavil a posteriori ako výsledok mnohých analýz a porovnaní vykonaných s veľkým počtom údajov, ako aj od tradície v danej oblasti výskumu.

Výsledok p .05 je zvyčajne v mnohých oblastiach prijateľným medzným bodom štatistickej významnosti, treba však pamätať na to, že táto úroveň stále obsahuje pomerne vysokú pravdepodobnosť chyby (5%).

Výsledky, ktoré sú významné na úrovni p. 01, sa všeobecne považujú za štatisticky významné, zatiaľ čo tie, ktoré majú p. 005 alebo p. 001 ako veľmi významnú. Malo by sa však chápať, že táto klasifikácia úrovní významnosti je dosť svojvoľná a je to iba neformálna dohoda prijatá na základe praktických skúseností. v konkrétnej oblasti výskumu.

Je zrejmé, že čím viac analýz bude vykonaných so súborom zhromaždených údajov, tým významnejšie (na zvolenej úrovni) budú výsledky objavené čisto náhodne.

Niektoré štatistické metódy, ktoré zahŕňajú veľa porovnaní, a teda majú značnú šancu opakovať tieto chyby, vykonajú špeciálne úpravy alebo opravy pre celkový počet porovnaní. Mnoho štatistických metód (najmä jednoduché metódy analýzy prieskumných údajov) však neponúka žiadny spôsob riešenia tohto problému.

Ak je vzťah medzi premennými „objektívne“ slabý, potom neexistuje žiadny iný spôsob, ako otestovať takýto vzťah okrem preskúmania veľkej vzorky. Aj keď je vzorka dokonale reprezentatívna, efekt nebude štatisticky významný, ak je vzorka malá. Podobne, ak je vzťah „objektívne“ veľmi silný, potom ho možno nájsť s vysokým stupňom významnosti aj vo veľmi malej vzorke.

Čím je vzťah medzi premennými slabší, tým väčšia je veľkosť vzorky, aby sa mohla zmysluplne zistiť.

Mnoho rôznych väzby medzi premennými. Výber konkrétneho opatrenia v konkrétnej štúdii závisí od počtu premenných, použitých mierok, povahy závislostí atď.

Väčšina z týchto opatrení sa však riadi všeobecným princípom: snažia sa vyhodnotiť pozorovaný vzťah porovnaním s „maximálnym mysliteľným vzťahom“ medzi príslušnými premennými. Z technického hľadiska je bežným spôsobom, ako sa dajú také odhady, pozrieť na to, ako sa menia hodnoty premenných, a potom vypočítať, koľko z celkovej dostupnej variácie možno vysvetliť prítomnosťou „spoločnej“ („spoločnej“) variácie dvoch (alebo viacerých) premenných.

Význam závisí hlavne od veľkosti vzorky. Ako už bolo vysvetlené, vo veľmi veľkých vzorkách budú významné aj veľmi slabé vzťahy medzi premennými, zatiaľ čo v malých vzorkách nie sú spoľahlivé ani veľmi silné vzťahy.

Preto je na určenie úrovne štatistickej významnosti potrebná funkcia, ktorá by predstavovala vzťah medzi „veľkosťou“ a „významnosťou“ vzťahu medzi premennými pre každú veľkosť vzorky.

Takáto funkcia by presne naznačovala „pravdepodobnosť získania závislosti danej hodnoty (alebo viac) vo vzorke danej veľkosti za predpokladu, že takáto závislosť v populácii neexistuje.“ Inými slovami, táto funkcia by poskytla významnú úroveň
(p-úroveň), a teda pravdepodobnosť chybného odmietnutia predpokladu, že tento vzťah v populácii chýba.

Táto „alternatívna“ hypotéza (že v populácii neexistuje žiadna závislosť) sa zvyčajne nazýva nulová hypotéza.

Bolo by ideálne, keby funkcia výpočtu pravdepodobnosti chyby bola lineárna a mala len rôzne sklony pre rôzne veľkosti vzoriek. Táto funkcia je, bohužiaľ, oveľa komplexnejšia a nie vždy úplne rovnaká. Avšak vo väčšine prípadov je jeho tvar známy a môže sa použiť na stanovenie hladín významnosti pri skúmaní vzoriek danej veľkosti. Väčšina týchto funkcií je spojená s triedou nazývaných distribúcií normálne .

Pozrime sa na typický príklad aplikácie štatistických metód v medicíne. Tvorcovia lieku naznačujú, že zvyšuje produkciu moču v pomere k prijatej dávke. Aby sa otestoval tento predpoklad, podali rôzne dávky lieku piatim dobrovoľníkom.

Na základe výsledkov pozorovania je vynesený graf závislosti diurézy na dávke (obrázok 1.2A). Závislosť je viditeľná voľným okom. Vedci si navzájom zablahožeňujú k objavu a svet zablahožeňuje novému diuretiku.

Údaje skutočne umožňujú spoľahlivo konštatovať, že u týchto piatich dobrovoľníkov bola pozorovaná diuréza závislá od dávky. Skutočnosť, že táto závislosť sa prejaví u všetkých ľudí, ktorí užívajú drogu, nie je ničím iným ako predpokladom
zy

z

žiť. To neznamená, že je to neopodstatnené - inak, prečo experimentovať?

Droga sa však predávala. Stále viac ľudí to berie v nádeji, že zvýšia svoju diurézu. A čo vidíme? Vidíme obrázok 1.2B, ktorý ukazuje, že neexistuje žiadny vzťah medzi dávkou liečiva a diurézou. Čierne krúžky označujú údaje z pôvodnej štúdie. Štatistika má metódy na vyhodnotenie pravdepodobnosti získania takejto „nereprezentatívnej“ vzorky a navyše nejasnej vzorky. Ukazuje sa, že v neprítomnosti vzťahu medzi diurézou a dávkou lieku by sa výsledná „závislosť“ pozorovala v približne 5 z 1 000 experimentov. V tomto prípade mali vedci jednoducho smolu. Ak by použili aj najpokročilejšie štatistické metódy, stále by ich nezachránili pred chybami.

Tento fiktívny príklad, ktorý však nie je vôbec vzdialený od reality, sme nepriniesli, aby sme naznačili, že je zbytočný
štatistika. Hovorí o niečom inom, o pravdepodobnosti jej záverov. V dôsledku uplatňovania štatistickej metódy nezískame konečnú pravdu, ale iba odhad pravdepodobnosti konkrétneho predpokladu. Každá štatistická metóda je navyše založená na vlastnom matematickom modeli a jej výsledky sú správne, pokiaľ tento model zodpovedá skutočnosti.

Viac na tému SPOĽAHLIVOSŤ A ŠTATISTICKÁ VÝZNAM:

  1. Štatisticky významné rozdiely v ukazovateľoch kvality života
  2. Štatistická populácia. Registračné značky. Pojem nepretržité a vzorové štúdie. Požiadavky na štatistický súbor a použitie účtovných a výkazníckych dokumentov
  3. Esej. VÝSKUM PLATNOSTI TONOMETROVÝCH ČÍTANÍ NA MERANIE INTRAOKULÁRNEHO TLAKU V OBDOBÍ 2018, 2018

Výskum zvyčajne začína určitým predpokladom, ktorý si vyžaduje overenie na základe faktov. Tento predpoklad - hypotéza - je formulovaný vo vzťahu k prepojeniu javov alebo vlastností v určitej skupine objektov.

Na testovanie týchto predpokladov na faktoch je potrebné zmerať zodpovedajúce vlastnosti ich nosičov. Nie je možné zmerať úzkosť u všetkých žien a mužov, rovnako ako nie je možné zmerať agresivitu u všetkých adolescentov. Štúdia sa preto obmedzuje iba na relatívne malú skupinu zástupcov príslušných populácií ľudí.

Všeobecná populácia- toto je celý súbor objektov, v súvislosti s ktorými je formulovaná výskumná hypotéza.

Napríklad všetci muži; alebo všetky ženy; alebo všetci obyvatelia mesta. Všeobecná populácia, v súvislosti s ktorou výskumný pracovník vyvodí závery na základe výsledkov výskumu, môže byť skromnejšia, napríklad všetkých prvostupňov danej školy.

Všeobecná populácia je teda síce nekonečná, ale spravidla neprístupná pre nepretržitý výskum, množstvo potenciálnych subjektov.

Vzorka alebo vzorka- Toto je skupina objektov s obmedzeným počtom (v psychológii - predmety, respondenti), špeciálne vybraná zo všeobecnej populácie na štúdium jej vlastností. Preto sa nazýva štúdia na vzorke vlastností všeobecnej populácie vzorový výskum. Takmer všetky psychologické štúdie sú selektívne a ich zistenia sa týkajú všeobecnej populácie.

Teda po formulovaní hypotézy a stanovení zodpovedajúcich všeobecných populácií výskumný pracovník čelí problému usporiadania vzorky. Vzorka by mala byť taká, aby zovšeobecnenie záverov výberovej štúdie bolo opodstatnené - zovšeobecnenie, ich distribúcia do všeobecnej populácie. Hlavné kritériá platnosti výsledkov výskumuje to reprezentatívnosť vzorky a štatistická spoľahlivosť (empirických) výsledkov.

Reprezentatívnosť vzorky- inými slovami, jeho reprezentatívnosť je schopnosť vzorky úplne reprezentovať študované javy - z hľadiska ich variability v bežnej populácii.

Samozrejme iba všeobecná populácia môže poskytnúť úplný obraz o skúmanom fenoméne, v celom jeho rozsahu a jemných variáciách. Reprezentatívnosť je preto vždy obmedzená v rozsahu, v akom je vzorka obmedzená. A je to reprezentatívnosť vzorky, ktorá je hlavným kritériom pri určovaní hraníc zovšeobecnenia výsledkov výskumu. Napriek tomu existujú techniky, ktoré vám umožňujú získať dostatočnú reprezentatívnosť vzorky pre výskumného pracovníka (Tieto techniky sú študované v kurze „Experimentálna psychológia“).


Prvý a hlavný trik je jednoduchý náhodný odber vzoriek. Zahŕňa to zabezpečenie toho, aby každý člen populácie mal rovnakú šancu byť zahrnutý do vzorky. Náhodný výber zabezpečí, aby sa do vzorky mohli zaradiť najrôznejší zástupcovia všeobecnej populácie. V takom prípade sa prijímajú osobitné opatrenia na vylúčenie výskytu akýchkoľvek pravidelností pri výbere. A to nám umožňuje dúfať, že na konci bude skúmaná vlastnosť zastúpená, ak nie vo všetkom, potom v maximálnej možnej rozmanitosti.

Druhým spôsobom, ako zabezpečiť reprezentatívnosť, je stratifikovaný náhodný výber vzoriek alebo výber založený na vlastnostiach všeobecnej populácie. Predpokladá predbežnú definíciu tých vlastností, ktoré môžu ovplyvniť variabilitu skúmaného majetku (môže to byť pohlavie, úroveň príjmu alebo vzdelanie atď.). Potom sa stanoví percento počtu skupín (vrstiev), ktoré sa líšia v týchto vlastnostiach, vo všeobecnej populácii a poskytuje sa rovnaké percento zodpovedajúcich skupín vo vzorke. Ďalej, v každej podskupine vzorky sa subjekty vyberajú podľa princípu jednoduchého náhodného výberu.

Štatistická spoľahlivosť,alebo štatistická významnosť, výsledky výskumu sa určujú pomocou metód štatistickej inferencie.

Sme poistení proti chybám pri rozhodovaní, s určitými závermi z výsledkov výskumu? Samozrejme, že nie. Koniec koncov, naše rozhodnutia sú založené na výsledkoch štúdie o vzorke populácie, ako aj na úrovni našich psychologických znalostí. Nie sme úplne imunní voči chybám. V štatistike sa takéto chyby považujú za prípustné, ak sa nevyskytujú častejšie ako v jednom prípade z 1000 (pravdepodobnosť chyby α \u003d 0,001 alebo pridružená hodnota pravdepodobnosti spoľahlivosti správneho záveru p \u003d 0,999); v jednom prípade zo 100 (pravdepodobnosť chyby α \u003d 0,01 alebo súvisiaca hodnota pravdepodobnosti spoľahlivosti správneho záveru p \u003d 0,99) alebo v piatich prípadoch zo 100 (pravdepodobnosť chyby α \u003d 0,05 alebo pridružená hodnota) výstup p \u003d 0,95). Psychologické rozhodnutia sa prijímajú na posledných dvoch úrovniach.

Keď sa hovorí o štatistickej spoľahlivosti, niekedy sa používa pojem „úroveň závažnosti“ (označený ako α). Numerické hodnoty p a α sa navzájom dopĺňajú do 1 000 - kompletný súbor udalostí: buď sme urobili správny záver, alebo sme sa mýlili. Tieto úrovne nie sú vypočítané, sú stanovené. Úroveň významnosti sa dá chápať ako druh „červenej“ čiary, ktorej priesečník umožní hovoriť o tejto udalosti ako o náhodnej udalosti. V každej príslušnej vedeckej správe alebo publikácii by sa k záverom mali pripojiť údaje o hodnotách p alebo α, pri ktorých boli závery vyvodené.

Metódy štatistickej inferencie sú podrobne rozobrané v kurze „Matematická štatistika“. Zatiaľ si len uvedomujeme, že pre dané číslo stanovujú určité požiadavky, alebo veľkosť vzorky.

Žiaľ, neexistujú žiadne prísne usmernenia na predbežné stanovenie požadovanej veľkosti vzorky. Navyše, výskumný pracovník zvyčajne dostane odpoveď na otázku o potrebnom a dostatočnom počte prípadov príliš neskoro - až po analýze údajov už skúmanej vzorky. Naj všeobecnejšie odporúčania však možno formulovať:

1. Pri vývoji diagnostickej techniky sa vyžaduje najväčšia veľkosť vzorky - od 200 do 1 000 - 2 500 ľudí.

2. Ak je potrebné porovnať 2 vzorky, ich celkový počet musí byť najmenej 50 ľudí; počet porovnávaných vzoriek by mal byť približne rovnaký.

3. Ak sa skúma vzťah medzi akýmikoľvek vlastnosťami, veľkosť vzorky by mala byť najmenej 30 - 35 ľudí.

4. Čím viac premenlivosťak študovaná vlastnosť, tým väčšia by mala byť veľkosť vzorky. Preto sa dá variabilita znížiť zvýšením homogenity vzorky, napríklad podľa pohlavia, veku atď. To prirodzene znižuje možnosti zovšeobecnenia záverov.

Závislé a nezávislé vzorky.Typická výskumná situácia je, keď sa vlastnosť, ktorá je predmetom záujmu výskumníka, študuje na dvoch alebo viacerých vzorkách za účelom ich ďalšieho porovnania. Tieto vzorky môžu byť v rôznych pomeroch - v závislosti od postupu ich organizácie. Nezávislé vzorky sú charakterizované skutočnosťou, že pravdepodobnosť výberu ktoréhokoľvek subjektu z jednej vzorky nezávisí od výberu ktoréhokoľvek zo subjektov z inej vzorky. Naopak, závislé vzorkycharakterizovaný skutočnosťou, že každý subjekt z jednej vzorky je spárovaný podľa určitého kritéria, subjekt z inej vzorky.

Vo všeobecnosti závislé vzorky znamenajú párový výber subjektov v porovnávaných vzorkách a nezávislé vzorky - nezávislý výber subjektov.

Malo by sa poznamenať, že prípady „čiastočne závislých“ (alebo „čiastočne nezávislých“) vzoriek sú neprijateľné: to nepredvídateľným spôsobom narúša ich reprezentatívnosť.

Na záver poznamenávame, že možno rozlíšiť dve paradigmy psychologického výskumu.

takzvaný R-metodológiezahŕňa štúdium variability určitej vlastnosti (psychologickej) pod vplyvom nejakého vplyvu, faktora alebo inej vlastnosti. Vzorka je súbor predmetov.

Iný prístup, Q-metodológie,zahŕňa štúdium variability jedinca (jednotlivca) pod vplyvom rôznych podnetov (podmienky, situácie atď.). Zodpovedá to situácii, keď vzorka je súbor stimulov.