Čo je štatistická významnosť. Úroveň štatistickej významnosti

Uvažujme o typickom príklade aplikácie štatistické metódy v medicíne. Tvorcovia lieku naznačujú, že zvyšuje vylučovanie moču úmerne s užitou dávkou. Na vyskúšanie tohto predpokladu podali päť dobrovoľníkov rôzne dávky drogy.

Na základe výsledkov pozorovania sa vynesie graf závislosti diurézy na dávke (obrázok 1.2A). Závislosť je viditeľná voľným okom. Vedci si navzájom blahoželajú k objavu a svet blahoželá novému diuretiku.

Údaje nám v skutočnosti umožňujú iba spoľahlivo konštatovať, že u týchto piatich dobrovoľníkov bola pozorovaná diuréza závislá od dávky. Skutočnosť, že sa táto závislosť prejaví u všetkých ľudí, ktorí drogu užijú, nie je nič iné ako predpoklad
zy

z

žiť. To neznamená, že je to neopodstatnené - inak, prečo experimentovať?

Ale droga sa začala predávať. všetko viac ľudí ber to v nádeji, že zvýšime ich vylučovanie moču. A čo vidíme? Vidíme obrázok 1.2B, ktorý naznačuje absenciu vzťahu medzi dávkou lieku a diurézou. Čierne krúžky označujú údaje z pôvodnej štúdie. Štatistiky majú metódy na hodnotenie pravdepodobnosti získania takejto „nereprezentatívnej“ a skutočne mätúcej vzorky. Ukazuje sa, že pri absencii vzťahu medzi diurézou a dávkou lieku by sa výsledná „závislosť“ pozorovala asi v 5 z 1 000 experimentov. Takže dovnútra v tomto prípade vedci jednoducho nemali šťastie. Keby použili aj tie najpokročilejšie štatistické metódy, stále by ich to nezachránilo pred chybami.

Tento fiktívny, ale vôbec nie ďaleko od reality príklad, sme dali, aby sme nepoukazovali na zbytočnosti
štatistika. Hovorí o niečom inom, o pravdepodobnosti jej záverov. V dôsledku použitia štatistickej metódy nezískame konečnú pravdu, ale iba odhad pravdepodobnosti jedného alebo druhého predpokladu. Každá štatistická metóda navyše vychádza z vlastného matematického modelu a jej výsledky sú správne, pokiaľ tento model zodpovedá realite.

Viac k téme SPOĽAHLIVOSŤ A ŠTATISTICKÁ VÝZNAM:

  1. Štatisticky významné rozdiely v ukazovateľoch kvality života
  2. Štatistická populácia. Registračné značky. Koncepcia kontinuálnych a vzorkových štúdií. Požiadavky na štatistický agregát a na použitie účtovných dokladov a správ
  3. Esej. VÝSKUM SPOĽAHLIVOSTI ČÍTANÍ TONOMETRA NA MERANIE INTRAOKULÁRNEHO TLAKU VEČKOU VEČKA 2018, 2018

Dnes je to naozaj príliš jednoduché: môžete kráčať k počítaču a pri minimálnych alebo žiadnych znalostiach o tom, čo robíte, vytvárať sentiment a nezmysly skutočne úžasnou rýchlosťou. (J. Box)

Základné pojmy a pojmy lekárskej štatistiky

V tomto článku uvádzame niektoré kľúčové štatistické koncepty, ktoré sú relevantné v lekárskom výskume. Podrobnejšie sa týmto pojmom rozumejú v príslušných článkoch.

zmena

Definícia. Miera rozptylu údajov (hodnoty funkcií) v rozsahu hodnôt

pravdepodobnosť

definícia... Pravdepodobnosť - miera možnosti prejavu určitej udalosti za určitých podmienok.

Príklad. Vysvetlíme si definíciu pojmu vo vete „Pravdepodobnosť zotavenia pri použití liek Arimidex je 70%. ““ Udalosťou je „uzdravenie pacienta“, stav „pacient užíva Arimidex“, miera pravdepodobnosti - 70% (zhruba povedané, zo 100 ľudí užívajúcich Arimidex sa 70 uzdraví).

Kumulatívna pravdepodobnosť

Definícia. Kumulatívna pravdepodobnosť prežitia v čase t je rovnaká ako podiel prežívajúcich pacientov v tom čase.

Príklad. Ak sa hovorí, že kumulatívna pravdepodobnosť prežitia po päťročnej liečbe je 0,7, znamená to, že z uvažovanej skupiny pacientov zostalo nažive 70% pôvodného počtu a 30% zomrelo. Inými slovami, z každých sto ľudí 30 zomrelo počas prvých 5 rokov.

Čas pred udalosťou

Definícia. Čas pred udalosťou je čas vyjadrený v niektorých jednotkách, ktorý uplynul od počiatočného časového okamihu do výskytu nejakej udalosti.

Vysvetlenie. Ako časové jednotky v zdravotný výskum objavujú sa dni, mesiace a roky.

Typické príklady východiskových bodov v čase:

    začatie sledovania pacienta

    chirurgická liečba

Typické príklady daných udalostí:

    progresie ochorenia

    opakovanie

    smrť pacienta

vzorka

Definícia. Časť populácie získaná výberom.

Na základe výsledkov analýzy vzorky sa robia závery o celej populácii, čo je legitímne, iba ak bol výber náhodný. Pretože je prakticky nemožné náhodne vybrať z populácie, cieľom by malo byť zabezpečiť, aby vzorka bola aspoň reprezentatívna pre populáciu.

Závislé a nezávislé vzorky

Definícia. Vzorky, do ktorých sa získavali študované objekty nezávisle na sebe. Alternatívou k nezávislým vzorkám sú závislé (spojené, spárované) vzorky.

hypotéza

Obojstranné a jednostranné hypotézy

Najprv si vysvetlíme použitie termínu hypotéza v štatistike.

Účelom väčšiny výskumov je testovanie pravdivosti tvrdenia. Cieľom testovania na drogy je najčastejšie otestovať hypotézu, že jedna droga je účinnejšia ako iná (napríklad Arimidex je účinnejší ako tamoxifén).

Na vyjadrenie presnosti štúdie je testovateľné tvrdenie vyjadrené matematicky. Napríklad, ak A je počet rokov, v ktorých bude pacient užívajúci Arimidex žiť, a T je počet rokov, v ktorých bude žiť pacient užívajúci Tamoxifen, potom možno testovanú hypotézu napísať ako A\u003e T.

Definícia. Hypotéza sa nazýva obojstranná, ak sa skladá z dvoch rovnakých hodnôt.

Príklad obojstrannej hypotézy: A \u003d T.

Definícia. Hypotéza sa nazýva jednostranná, ak sa skladá z dvoch nerovností.

Príklady jednostranných hypotéz:

Dichotomické (binárne) údaje

Definícia. Údaje sú vyjadrené iba s dvoma platnými alternatívnymi hodnotami

Príklad: Pacient je „zdravý“ - „chorý“. Edém „je“ - „nie“.

Interval spoľahlivosti

Definícia. Interval spoľahlivosti pre hodnotu je rozsah okolo hodnoty veličiny, v ktorej spočíva skutočná hodnota tejto veličiny (s určitou úrovňou spoľahlivosti).

Príklad. Nech je študovaným množstvom počet pacientov za rok. V priemere je ich počet 500 a 95% interval spoľahlivosti je (350, 900). To znamená, že s najväčšou pravdepodobnosťou (s 95% pravdepodobnosťou) kliniku v priebehu roka navštívi najmenej 350 a nie viac ako 900 ľudí.

Označenie. Používa sa veľmi častá skratka: 95% CI (95% CI) je interval spoľahlivosti s 95% úrovňou spoľahlivosti.

Spoľahlivosť, štatistická významnosť (úroveň P)

Definícia. Štatistická významnosť výsledku je mierou dôvery v jeho „pravdivosť“.

Akýkoľvek výskum sa vykonáva iba na základe časti objektov. Štúdia účinnosti lieku sa vykonáva na základe nie všeobecne všetkých pacientov na planéte, ale iba určitej skupiny pacientov (je nemožné vykonať analýzu založenú na všetkých pacientoch).

Predpokladajme, že na základe analýzy dôjde k určitému záveru (napríklad užívanie lieku Arimidex ako adekvátnej terapie je dvakrát účinnejšie ako liečivo tamoxifén).

Otázka, ktorá si treba položiť, znie: „Ako veľmi môžete dôverovať tomuto výsledku?“

Predstavte si, že robíme štúdiu iba s dvoma pacientmi. V takom prípade by sa samozrejme malo s výsledkami zaobchádzať s obavou. Ak bolo vyšetrených veľa pacientov (číselná hodnota „ vysoké číslo„Závisí to od situácie), potom je možné spoľahnúť sa na prijaté závery.

Miera dôveryhodnosti je teda určená hodnotou p.

Vyššia úroveň p zodpovedá viac nízky level spoľahlivosť výsledkov získaných pri analýze vzorky. Napríklad úroveň p 0,05 (5%) ukazuje, že záver vykonaný pri analýze určitej skupiny je iba náhodným znakom týchto objektov s pravdepodobnosťou iba 5%.

Inými slovami, existuje veľmi vysoká pravdepodobnosť (95%), že výstup možno rozšíriť na všetky objekty.

V mnohých štúdiách sa 5% považuje za prijateľnú p-hodnotu. To znamená, že ak je napríklad p \u003d 0,01, potom sa dá spoľahnúť na výsledky, ale ak je p \u003d 0,06, je to nemožné.

študovať

Perspektívna štúdia je štúdia, v ktorej sú vzorky alokované na základe počiatočného faktora a niektorý výsledný faktor je vo vzorkách analyzovaný.

Retrospektívna štúdia je štúdia, v ktorej sú vzorky alokované na základe výsledného faktora a vo vzorkách je analyzovaný nejaký počiatočný faktor.

Príklad. Východiskovým faktorom je tehotná žena mladšia / staršia ako 20 rokov. Výsledným faktorom je dieťa ľahšie / ťažšie ako 2,5 kg. Analyzujeme, či váha dieťaťa závisí od veku matky.

Ak zhromaždíme 2 vzorky, u jednej - matiek mladších ako 20 rokov, v druhej - staršej, a potom analyzujeme množstvo detí v každej skupine, potom ide o perspektívnu štúdiu.

Ak zhromaždíme 2 vzorky, v jednej - matkách, ktoré porodili deti ľahšie ako 2,5 kg, v druhej - ťažšej, a potom analyzujeme vek matiek v každej skupine, potom ide o retrospektívnu štúdiu (samozrejme, takúto štúdiu je možné uskutočniť až po skončení experimentu, tj všetky deti sa narodili).

exodus

Definícia. Klinicky významná udalosť, laboratórny parameter alebo vlastnosť, ktorá je zaujímavá pre výskumného pracovníka. V klinických štúdiách slúžia výsledky ako kritériá na hodnotenie účinnosti terapeutického alebo profylaktického zásahu.

Klinická epidemiológia

Definícia. Veda, ktorá umožňuje predvídať konkrétny výsledok pre každého konkrétneho pacienta na základe štúdie klinický priebeh chorôb v podobných prípadoch s použitím prísnych vedecké metódy študovať pacientov, aby sa zabezpečila presnosť predpovedí.

kohorta

Definícia. Skupina účastníkov štúdie, ktorých spája každý spoločná vlastnosť v čase svojho vzniku a študoval dlho.

ovládanie

Historická kontrola

Definícia. Kontrolná skupina sa vytvorila a skúmala v období pred štúdiou.

Paralelné riadenie

Definícia. Kontrolná skupina sa formovala súčasne s formovaním hlavnej skupiny.

Korelácia

Definícia. Štatistický vzťah medzi dvoma znakmi (kvantitatívnym alebo ordinálnym), ktorý to ukazuje viac zmyslu jeden znak v určitej časti prípadov zodpovedá väčšej - v prípade kladnej (priamej) korelácie - hodnote iného znaku alebo menšej hodnote - v prípade zápornej (inverznej) korelácie.

Príklad. Zistila sa významná korelácia medzi hladinou krvných doštičiek a leukocytov v krvi pacienta. Korelačný koeficient je 0,76.

Pomer rizika (CR)

Definícia. Miera nebezpečnosti je pomer pravdepodobnosti istej („zlej“) udalosti, ktorá sa vyskytne pre prvú skupinu objektov, a pravdepodobnosti toho, že rovnaká udalosť sa stane pre druhú skupinu objektov.

Príklad. Ak je pravdepodobnosť vzniku rakoviny pľúc u nefajčiarov 20% a u fajčiarov 100%, potom bude ČR pätinová. V tomto príklade sú prvou skupinou objektov nefajčiari, druhou skupinou sú fajčiari a výskyt rakoviny pľúc sa považuje za „zlú“ udalosť.

Je zrejmé, že:

1) ak KP \u003d 1, potom je pravdepodobnosť udalosti v skupinách rovnaká

2) ak KP\u003e 1, potom sa udalosť vyskytuje častejšie u objektov z prvej skupiny ako z druhej

3) ak KR<1, то событие чаще происходит с объектами из второй группы, чем из первой

Metaanalýza

Definícia. FROMštatistická analýza zhrňujúca výsledky niekoľkých štúdií skúmajúcich rovnaký problém (zvyčajne účinnosť liečby, prevencia, diagnostika). Kombinácia štúdií poskytuje veľkú vzorku na analýzu a viac štatistickej sily na kombinovanie štúdií. Používa sa na zvýšenie dôkazov alebo dôvery v záver o účinnosti skúmanej metódy.

Metóda Kaplan - Meier (viac odhadov Kaplan - Meier)

Túto metódu vymysleli štatistici E.L. Kaplan a Paul Meyer.

Metóda sa používa na výpočet rôznych hodnôt týkajúcich sa času pozorovania pacienta. Príklady takýchto množstiev:

    pravdepodobnosť zotavenia do jedného roka pri užívaní drogy

    pravdepodobnosť recidívy po operácii do troch rokov po operácii

    kumulatívna pravdepodobnosť prežitia u pacientov s rakovinou prostaty po amputácii orgánu počas piatich rokov

Vysvetlíme si výhody použitia metódy Kaplan - Meier.

Hodnoty hodnôt v „obvyklej“ analýze (bez použitia Kaplan-Meierovej metódy) sa počítajú na základe rozdelenia uvažovaného časového intervalu do intervalov.

Napríklad, ak študujeme pravdepodobnosť smrti pacienta do 5 rokov, potom je možné časový interval rozdeliť na 5 častí (menej ako 1 rok, 1 - 2 roky, 2 - 3 roky, 3 - 4 roky, 4 - 5 rokov), takže a 10 (každý šesť mesiacov) alebo ďalší počet intervalov. Výsledky budú pre rôzne oddiely odlišné.

Vybrať najvhodnejšie rozdelenie nie je ľahká úloha.

Odhady hodnôt veličín získaných metódou Kaplan-Meier nezávisia od rozdelenia času pozorovania na intervaly, ale závisia iba od života každého jednotlivého pacienta.

Preto je pre výskumného pracovníka uskutočnenie analýzy jednoduchšie a výsledky sa často ukážu ako kvalitnejšie ako výsledky „obvyklej“ analýzy.

Kaplan-Meierova krivka je graf krivky prežitia získaný metódou Kaplan-Meier.

Coxov model

Tento model vynašiel Sir David Roxby Cox (nar. 1924), slávny anglický štatistik, autor viac ako 300 článkov a kníh.

Coxov model sa používa v situáciách, keď veličiny študované pri analýze prežitia závisia od funkcií času. Napríklad pravdepodobnosť opakovania v t rokoch (t \u003d 1,2, ...) môže závisieť od logaritmu časového protokolu (t).

Dôležitou výhodou metódy navrhnutej Coxom je uplatniteľnosť tejto metódy na veľké množstvo situácií (model neukladá prísne obmedzenia týkajúce sa povahy alebo formy rozdelenia pravdepodobnosti).

Na základe Coxovho modelu je možné vykonať analýzu (nazývanú Coxova analýza), ktorej výsledkom je pomer rizika a interval spoľahlivosti pre pomer rizika.

Neparametrické štatistické metódy

Definícia.Trieda štatistických metód, ktoré sa používajú predovšetkým na analýzu kvantitatívnych údajov, ktoré nie sú bežne distribuované, a na analýzu kvalitatívnych údajov.

Príklad. Na identifikáciu významnosti rozdielov v systolickom krvnom tlaku pacientov v závislosti od typu liečby používame neparametrický Mann-Whitneyov test.

Funkcia (premenná)

Definícia. Xcharakteristika objektu výskumu (pozorovania). Rozlišujte medzi kvalitatívnymi a kvantitatívnymi charakteristikami.

randomizácie

Definícia.Metóda náhodného rozdelenia výskumných objektov do hlavnej a kontrolnej skupiny pomocou špeciálnych prostriedkov (tabuľky alebo počítadlo náhodných čísel, vrhanie mincí a ďalšie metódy náhodného priradenia čísla skupiny k zahrnutému pozorovaniu). Randomizácia minimalizuje rozdiely medzi skupinami pre známe a neznáme vlastnosti, ktoré potenciálne ovplyvňujú študovaný výsledok.

nebezpečenstvo

atributivní - ďalšie riziko nepriaznivého výsledku (napríklad choroby) v dôsledku prítomnosti určitej charakteristiky (rizikového faktora) vo výskumnom objekte. Toto je časť rizika vzniku ochorenia, ktorá je spojená s týmto rizikovým faktorom, je ním vysvetlená a je možné ju vylúčiť, ak sa tento rizikový faktor vylúči.

Relatívne riziko - pomer rizika nepriaznivého stavu v jednej skupine k riziku tohto stavu v inej skupine. Používa sa v prospektívnych a pozorovacích štúdiách, keď sa skupiny vytvárajú vopred, a nástup študovaného stavu ešte nenastal.

Záverečná skúška

Definícia.Metóda kontroly stability, spoľahlivosti, výkonnosti (platnosti) štatistického modelu striedavým mazaním pozorovaní a prepočítaním modelu. Čím sú získané modely podobnejšie, tým je model stabilnejší a spoľahlivejší.

udalosť

Definícia.Klinické výsledky pozorované v štúdii, ako sú komplikácie, relaps, zotavenie, smrť.

stratifikácia

Definícia. Mmetóda vzorkovania, pri ktorej je populácia všetkých účastníkov, ktorí spĺňajú kritériá na zaradenie do štúdie, najskôr rozdelená do skupín (vrstiev) na základe jednej alebo viacerých charakteristík (zvyčajne pohlavia, veku), ktoré potenciálne ovplyvňujú študovaný výsledok, a potom z každej z týchto skupín ( strat) nezávisle prijímali účastníkov do experimentálnej a kontrolnej skupiny. To umožňuje výskumníkovi vyvážiť dôležité charakteristiky medzi experimentálnou a kontrolnou skupinou.

Pohotovostná tabuľka

Definícia.Tabuľka absolútnych frekvencií (počtu) pozorovaní, ktorých stĺpce zodpovedajú hodnotám jedného znaku a riadky zodpovedajú hodnotám iného znaku (v prípade dvojrozmernej pohotovostnej tabuľky). Absolútne frekvencie sa nachádzajú v bunkách na priesečníku riadkov a stĺpcov.

Uveďme príklad pohotovostnej tabuľky. Aneuryzmatický zákrok bol vykonaný u 194 pacientov. Je známy indikátor závažnosti edému u pacientov pred chirurgickým zákrokom.

Edém \\ Výsledok

bez edému 20 6 26
mierny edém 27 15 42
výrazný edém 8 21 29
m j 55 42 194

Z 26 pacientov bez edémov teda 20 pacientov po operácii prežilo a 6 pacientov zomrelo. Zo 42 pacientov so stredne ťažkým edémom prežilo 27 pacientov, 15 zomrelo atď.

Chi-kvadrát test pre pohotovostné tabuľky

Na stanovenie významnosti (spoľahlivosti) rozdielov jedného znamienka v závislosti na druhom (napríklad výsledok operácie v závislosti od závažnosti edému) sa pre pohotovostné tabuľky používa test chí kvadrát:


šanca

Pravdepodobnosť nejakej udalosti nech je str. Potom je pravdepodobnosť, že k udalosti nedôjde, 1-s.

Napríklad ak je pravdepodobnosť, že pacient zostane nažive po piatich rokoch, 0,8 (80%), potom je pravdepodobnosť, že počas tohto časového obdobia zomrie, 0,2 (20%).

Definícia. Šanca je pomerom pravdepodobnosti, že k udalosti dôjde, a pravdepodobnosti, že k udalosti nedôjde.

Príklad. V našom príklade (o pacientovi) je šanca 4, pretože 0,8 / 0,2 \u003d 4

Pravdepodobnosť zotavenia teda predstavuje 4-násobok pravdepodobnosti smrti.

Výklad hodnoty množstva.

1) Ak je Šanca \u003d 1, potom je pravdepodobnosť výskytu udalosti rovná pravdepodobnosti, že k udalosti nedôjde;

2) ak je Šanca\u003e 1, potom je pravdepodobnosť výskytu udalosti väčšia ako pravdepodobnosť, že k udalosti nedôjde;

3) ak je šanca<1, то вероятность наступления события меньше вероятности того, что событие не произойдёт.

Pomer šancí

Definícia. Kurzový pomer je pomer šancí pre prvú skupinu predmetov k koeficientu šancí pre druhú skupinu predmetov.

Príklad. Predpokladajme, že muži aj ženy podstupujú určitú liečbu.

Pravdepodobnosť, že mužský pacient zostane nažive po piatich rokoch, je 0,6 (60%); pravdepodobnosť, že počas tohto časového obdobia zomrie, je 0,4 (40%).

Podobné pravdepodobnosti u žien sú 0,8 a 0,2.

Pomer šancí v tomto príklade je

Výklad hodnoty množstva.

1) Ak je pomer šancí \u003d 1, potom sa šanca pre prvú skupinu rovná šanci pre druhú skupinu

2) Ak je pomer šancí\u003e 1, potom je šanca pre prvú skupinu väčšia ako šanca pre druhú skupinu

3) Ak je pomer šancí<1, то шанс для первой группы меньше шанса для второй группы

Štatistická významnosť

Výsledky získané pomocou špecifického výskumného postupu sa nazývajú Štatistický významnýak je pravdepodobnosť ich náhodného výskytu veľmi malá. Tento koncept je možné ilustrovať otočením mince. Predpokladajme, že je minca otočená 30-krát; Hlavy padli 17-krát a chvosty 13-krát. Robí to významnýodchýlka tohto výsledku od očakávaného (15 „hláv“ a 15 - „chvostov“), alebo je táto odchýlka náhodná? Na zodpovedanie tejto otázky môžete napríklad hodiť tú istú mincu mnohokrát 30-krát za sebou a zároveň si uvedomiť, koľkokrát sa bude opakovať pomer „hláv“ a „chvostov“ rovných 17:13. Štatistická analýza nás zbavuje tohto zdĺhavého procesu. S jeho pomocou je možné po prvých 30 hodoch mincou odhadnúť možný počet náhodných poklesov 17 „hláv“ a 13 „chvostov“. Toto hodnotenie sa nazýva pravdepodobnostné tvrdenie.

Vo vedeckej literatúre o priemyselno-organizačnej psychológii je pravdepodobnostné tvrdenie v matematickej forme označené výrazom r(Pravdepodobnosť)< (менее) 0,05 (5 %), которое следует читать как «вероятность менее 5 %». В примере с киданием монеты это утверждение будет означать, что если исследователь проведет 100 опытов, каждый раз кидая монету по 30 раз, то он может ожидать случайного выпадения комбинации из 17 «орлов» и 13 «решек» менее, чем в 5 опытах. Этот результат будет сочтен статистически значимым, поскольку в индустриально-организационной психологии уже давно приняты стандарты статистической значимости 0,05 и 0,01 (R< 0,01). Táto skutočnosť je dôležitá pre pochopenie literatúry, ale nemalo by sa predpokladať, že hovorí o nezmyselnosti robiť pozorovania, ktoré nespĺňajú tieto štandardy. Takzvané nepodstatné výsledky výskumu (pozorovania, ktoré je možné získať náhodou) viacjeden alebo päťkrát zo 100) môžu byť veľmi užitočné pri identifikácii trendov a ako pomôcka pre budúci výskum.

Je tiež potrebné poznamenať, že nie všetci psychológovia súhlasia s tradičnými štandardmi a postupmi (napr. Cohen, 1994; Sauley & Bedeian, 1989). Mnoho výskumníkov, ktorí sa zaoberajú presnosťou metód merania a predpokladmi, ktoré sú základom existujúcich metód a štandardov, ako aj vývojom nových lekárov a prístrojov, je hlavným zameraním na otázky merania. Možno niekedy v budúcnosti zmení výskum tohto orgánu tradičné štandardy pre hodnotenie štatistickej významnosti a tieto zmeny získajú všeobecné uznanie. (Piata kapitola Americkej psychologickej asociácie združuje psychológov, ktorí sa špecializujú na štúdium odhadov, meraní a štatistík.)

Vo výskumných správach sa uvádza pravdepodobnostné tvrdenie ako napr r< 0,05, spojené s niektorými štatistiky,to znamená číslo, ktoré sa získa ako výsledok určitej množiny matematických výpočtových postupov. Potvrdenie pravdepodobnosti sa získa porovnaním týchto štatistík s údajmi zo špeciálnych tabuliek, ktoré sa na tento účel zverejňujú. V priemyselno-organizačnej psychologický výskum často existujú štatistiky ako napr r, F, t, r\u003e(čítať „štvorec chi“) a R(znie „množné číslo R ").V obidvoch prípadoch možno štatistiku (jedno číslo) získanú z analýzy série pozorovaní porovnať s číslami zo zverejnenej tabuľky. Potom je možné formulovať pravdepodobnostné tvrdenie o pravdepodobnosti náhodného získania tohto počtu, to znamená urobiť záver o význame pozorovaní.

Aby sme pochopili výskum popísaný v tejto knihe, postačuje mať jasné pochopenie pojmu štatistická významnosť a nie je potrebné vedieť, ako sa vyššie uvedené štatistiky počítajú. Bolo by však užitočné prediskutovať jeden predpoklad, ktorý je základom všetkých týchto postupov. To je predpoklad, že všetky pozorované premenné sú distribuované približne podľa normálneho zákona. Pri čítaní správ o priemyselno-organizačnom psychologickom výskume sa navyše často zistí, že dôležitú úlohu zohrávajú ďalšie tri pojmy - po prvé, korelácia a korelácia, po druhé, determinantná / prediktívna premenná a „ANOVA“ (analýza odchýlky), v -tretina, skupina štatistických metód pod spoločný názov "Metaanalýza".

ŠTATISTIKA SPOĽAHLIVOSTI

- angličtina dôveryhodnosť / platnosť, štatistická; nemec Validitat, statistische. Konzistentnosť, objektívnosť a nejednoznačnosť v štatistickom teste alebo v K.-L. súbor meraní. D. s. možno overiť opakovaním toho istého testu (alebo dotazníka) proti rovnakému subjektu, aby sa zistilo, či sa dosiahnu rovnaké výsledky; alebo porovnanie rôzne časti testy, ktoré majú merať rovnaký objekt.

Antinazi. Encyklopédia sociológie, 2009

Zistite, čo je „ŠTATISTICKÁ SPOĽAHLIVOSŤ“ v iných slovníkoch:

    ŠTATISTIKA SPOĽAHLIVOSTI - Angličtina. dôveryhodnosť / platnosť, štatistická; Nemec Validitat, statistische. Konzistencia, objektívnosť a nejasnosť v štatistickom teste alebo v K. l. súbor meraní. D. s. možno overiť opakovaním toho istého testu (alebo ... ... Vysvetľujúci slovník v sociológii

    V štatistike sa hodnota nazýva štatisticky významná, ak je pravdepodobnosť jej náhodného výskytu alebo ešte extrémnejších hodnôt malá. Extrém sa tu chápe ako miera odchýlky štatistických údajov testu od nulovej hypotézy. Rozdiel sa nazýva ... ... Wikipedia

    Fyzikálnym javom štatistickej stability je to, že so zvyšovaním veľkosti vzorky sa zvyšuje frekvencia náhodná udalosť alebo priemer fyzikálna veličina inklinuje k nejakému pevnému číslu. Fenomén štatistických ... ... Wikipedia

    PLATNOSŤ ROZDIELOV (Podobnosť) - analyticko-štatistický postup na stanovenie úrovne významnosti rozdielov alebo podobností medzi vzorkami pre študované ukazovatele (premenné) ... Moderný vzdelávací proces: základné pojmy a pojmy

    SPRÁVA, ŠTATISTICKÁ Veľký účtovnícky slovník

    SPRÁVA, ŠTATISTICKÁ - forma štátneho štatistického pozorovania, v rámci ktorej príslušné orgány dostávajú od podnikov (organizácií a inštitúcií) informácie, ktoré potrebujú, vo forme povinných správ (štatistické správy) za ... Veľký slovník ekonomiky

    Veda zaoberajúca sa štúdiom techník systematické pozorovanie nad masovými javmi spoločenského života človeka, zostavenie ich číselných opisov a vedecké spracovanie týchto popisov. Teoretická štatistika je teda veda ... ... encyklopedický slovník F. Brockhaus a I.A. Efron

    Korelačný koeficient - (Korelačný koeficient) Korelačný koeficient je štatistický ukazovateľ závislosti dvoch náhodné premenné Stanovenie korelačného koeficientu, typy korelačných koeficientov, vlastnosti korelačného koeficientu, výpočet a použitie ... ... Encyklopédia investorov

    štatistika - (Štatistika) Štatistika je všeobecná teoretická veda, ktorá skúma kvantitatívne zmeny javov a procesov. Štátna štatistika, štatistické služby, Rosstat (Goskomstat), štatistické údaje, štatistika dotazov, štatistika predaja, ... ... Encyklopédia investorov

    Korelácia - (Korelácia) Korelácia je štatistický vzťah dvoch alebo viacerých náhodných premenných. Pojem korelácia, typy korelácie, korelačný koeficient, korelačná analýza, korelácia cien, korelácia menových párov na forexovom obsahu ... ... Encyklopédia investorov

knihy

  • Výskum v matematike a matematike vo výskume: Metodický zborník o výskumných aktivitách študentov, V.I. Borzenko. metodický vývoj, použiteľné pri organizácii výskumných aktivít študentov. Prvá časť zborníka je venovaná aplikácii výskumného prístupu v ...

Pri zdôvodňovaní štatistického záveru je potrebné vyriešiť otázku, kde je hranica medzi prijatím a odmietnutím nulovej hypotézy. Z dôvodu prítomnosti náhodných vplyvov v experimente nie je možné túto hranicu určiť úplne presne. Je založený na koncepcii úroveň významnosti. Úroveň významnosti je pravdepodobnosť chybného odmietnutia nulovej hypotézy. Alebo, inými slovami, úroveň významnosti - je to pravdepodobnosť chyby typu I pri rozhodovaní. Na určenie tejto pravdepodobnosti sa spravidla používa grécke písmeno α alebo latinské písmeno r.V nasledujúcom použijeme písmeno r.

Historicky sa v aplikovaných vedách, ktoré využívajú štatistiku, a najmä v psychológii, predpokladá, že najnižšia úroveň štatistickej významnosti je úroveň p \u003d0,05; dostatočná - úroveň r\u003d 0,01 a vyššie p \u003d0.001. Preto sú v štatistických tabuľkách, ktoré sú uvedené v prílohe k učebniciam štatistík, zvyčajne uvedené tabuľkové hodnoty pre úrovne. p \u003d0,05, p \u003d0,01 a r\u003d 0,001. Niekedy sú uvedené hodnoty pre úrovne r -0,025 a p \u003d0,005.

Hodnoty 0,05, 0,01 a 0,001 sú takzvané štandardné úrovne štatistickej významnosti. Pri štatistickej analýze experimentálnych údajov si psychológ musí zvoliť požadovanú úroveň závažnosti v závislosti od úloh a hypotéz štúdie. Ako vidíte, tu sa najvyššia hodnota alebo dolná hranica úrovne štatistickej významnosti rovná 0,05, čo znamená, že vo vzorke sto prvkov (prípady, subjekty) alebo jednej chyby z dvadsiatich prvkov (prípady, subjekty) je povolených päť chýb. Verí sa, že si nás nemožno pomýliť šesť, sedem alebo viackrát zo sto. Cena takýchto chýb by bola príliš vysoká.

Upozorňujeme, že v moderných štatistických balíkoch v počítači sa nepoužívajú štandardné úrovne významnosti, ale úrovne vypočítané priamo v procese práce so zodpovedajúcou štatistickou metódou. Tieto úrovne, označené písmenom r,môže mať rôzne číselný výraz v rozmedzí od 0 do 1, napríklad p \u003d0,7, r\u003d 0,23 alebo r\u003d 0,012. Je zrejmé, že v prvých dvoch prípadoch sú získané úrovne významnosti príliš vysoké a nedá sa povedať, že výsledok je významný. Zároveň sú v druhom prípade výsledky významné na úrovni 12 tisícin. Toto je platná úroveň.

Pravidlo pre akceptovanie štatistického záveru je nasledujúce: na základe získaných experimentálnych údajov psychológ vypočíta tzv. Empirickú štatistiku alebo empirickú hodnotu podľa ním zvolenej štatistickej metódy. Je vhodné označiť toto množstvo ako H zam . Potom empirická štatistika H zam sa porovnáva s dvoma kritickými hodnotami, ktoré zodpovedajú 5% a 1% hladinám významnosti pre zvolenú štatistickú metódu a ktoré sú označené ako H cr . Množstvá H cr sa nachádzajú pre danú štatistickú metódu podľa zodpovedajúcich tabuliek uvedených v prílohe ku ktorejkoľvek učebnici o štatistike. Tieto množstvá sa spravidla vždy líšia a v nasledujúcom ich možno pre pohodlie nazvať ako H cR1 a H cR2 . Hodnoty kritických hodnôt zistené z tabuliek H cR1 a H cR2 je vhodné reprezentovať v nasledujúcej štandardnej notácii:

Zdôrazňujeme však, že sme použili notáciu H zam a H cr ako skratka pre slovo „number“. Všetky štatistické metódy majú pre všetky tieto veličiny svoje vlastné symbolické označenia: empirickú hodnotu vypočítanú pomocou príslušnej štatistickej metódy aj kritické hodnoty zistené v zodpovedajúcich tabuľkách. Napríklad pri výpočte Spearmanovho korelačného koeficientu z tabuľky kritických hodnôt tohto koeficientu sa našli nasledujúce kritické hodnoty, ktoré sú pre túto metódu označené gréckym písmenom ρ („ro“). Toľko za p \u003d0,05 podľa tabuľky hodnota ρ cr 1 \u003d 0,61 a pre p \u003dVeľkosť 0,01 ρ cr 2 = 0,76.

V štandardnej forme zápisu prijatej v nasledujúcom texte to vyzerá takto:

Teraz musíme porovnať našu empirickú hodnotu s dvoma kritickými hodnotami zistenými z tabuliek. Najlepšie sa to dá umiestnením všetkých troch čísel na takzvanú „osu významnosti“. „Os významnosti“ je priamka, na ľavom konci ktorej je umiestnená 0, aj keď spravidla nie je na tejto priamke vyznačená, a zľava doprava sa číselná rada zväčšuje. V skutočnosti je to obvyklá os na vodorovnej osi OHkarteziánsky súradnicový systém. Zvláštnosťou tejto osi je však to, že má tri úseky, „zóny“. Jedna extrémna zóna sa nazýva zóna bezvýznamnosti, druhá extrémna zóna sa nazýva zóna významnosti a stredná zóna sa nazýva zóna neistoty. Hranice všetkých troch zón sú H cR1 pre p \u003d0,05 a H cR2 pre p \u003d0,01, ako je znázornené na obrázku.

V závislosti od pravidla rozhodovania (pravidla odvodzovania) predpísaného v tejto štatistickej metóde sú možné dve možnosti.

Prvá možnosť: alternatívna hypotéza sa prijíma, ak H zamH cr .

Alebo druhá možnosť: akceptuje sa alternatívna hypotéza, ak H zamH cr .

počítané H zam akoukoľvek štatistickou metódou musí nevyhnutne spadať do jednej z troch zón.

Ak empirická hodnota spadá do zóny bezvýznamnosti, potom sa akceptuje hypotéza H 0 o absencii rozdielov.

Ak H zam spadol do zóny významnosti, akceptuje sa alternatívna hypotéza H1 o prítomnosť rozdielov a hypotéza H 0 je odmietnutá.

Ak H zam spadá do zóny neistoty, výskumník čelí dileme. Takže v závislosti od dôležitosti riešeného problému môže považovať získaný štatistický odhad za spoľahlivý na úrovni 5%, a tak prijať hypotézu H 1, odmietnuť hypotézu H 0 , alebo - nespoľahlivá na úrovni 1%, čím akceptuje hypotézu H °. Zdôrazňujeme však, že to je presne ten prípad, keď psychológ môže urobiť chyby prvého alebo druhého druhu. Ako už bolo uvedené vyššie, za týchto okolností je najlepšie zväčšiť veľkosť vzorky.

Zdôrazňujeme tiež, že množstvo H zam sa môže presne zhodovať H cR1 alebo H cR2 . V prvom prípade môžeme predpokladať, že odhad je spoľahlivý presne na 5% a prijať hypotézu H 1, alebo naopak prijať hypotézu H 0. V druhom prípade sa spravidla prijíma alternatívna hypotéza H 1 o prítomnosti rozdielov a hypotéza H 0 sa zamieta.