Statistinis skirtumų tarp mėginių reikšmingumas. Bendroji populiacija ir imties tyrimai. Statistinis patikimumas

Reikšmingumo lygis statistikoje yra svarbus rodiklis, atspindinčio pasitikėjimo gautų (numatomų) duomenų tikslumu, teisingumu laipsnį. Ši sąvoka plačiai naudojama įvairiose srityse: nuo dirigavimo sociologiniai tyrimai, prieš atliekant statistinius mokslinių hipotezių patikrinimus.

Apibrėžimas

Lygis statistinis reikšmingumas (arba statistiškai reikšmingas rezultatas) parodo, kokia yra atsitiktinio tiriamų rodiklių atsiradimo tikimybė. Bendras statistinis reiškinio reikšmingumas išreiškiamas p vertės (p lygio) koeficientu. Bet kokio eksperimento ar stebėjimo metu yra galimybė, kad gautus duomenis lemia atrankos klaidos. Tai ypač pasakytina apie sociologiją.

Tai yra, statistiškai reikšminga reikšmė yra ta vertė, kurios atsitiktinio įvykio tikimybė yra labai maža arba linkusi į kraštutinumą. Šiame kontekste kraštutinumas yra statistikos nukrypimo nuo nulinės hipotezės laipsnis (hipotezė, kurios tikrinimas yra suderinamas su gautais imties duomenimis). Mokslinėje praktikoje reikšmingumo lygis pasirenkamas prieš renkant duomenis ir paprastai jo koeficientas yra 0,05 (5%). Sistemoms, kuriose tikslios vertės yra nepaprastai svarbios, šis skaičius gali būti 0,01 (1%) arba mažesnis.

Išleidimo istorija

Reikšmingumo lygio sąvoką britų statistikas ir genetikas Ronaldas Fisheris įvedė 1925 m., Kai jis kūrė statistinių hipotezių tikrinimo metodą. Analizuojant procesą, yra tam tikra tam tikrų reiškinių tikimybė. Sunkumų kyla dirbant su mažais (arba neaiškiais) procentais tikimybių, kurios patenka į „matavimo paklaidos“ sąvoką.

Dirbdami su statistiniais duomenimis, kurie nėra pakankamai konkretūs, kad juos būtų galima patikrinti, mokslininkai susiduria su nulinės hipotezės problema, kuri „trukdo“ veikti su mažomis reikšmėmis. Fišeris pasiūlė tokioms sistemoms nustatyti įvykių tikimybę esant 5% (0,05) kaip patogų pavyzdį, kad būtų atmesta nulinė hipotezė skaičiavimuose.

Fiksuoto koeficiento įvedimas

1933 m mokslininkai Jerzy Neumannas ir Egonas Pearsonai savo darbuose rekomendavo iš anksto (prieš renkant duomenis) nustatyti tam tikrą reikšmingumo lygį. Šių taisyklių naudojimo pavyzdžiai yra aiškiai matomi per rinkimus. Tarkime, yra du kandidatai, vienas iš jų yra labai populiarus, o kitas mažai žinomas. Akivaizdu, kad pirmasis kandidatas laimės rinkimus, o antrojo šansai linkę nulį. Jie siekia - bet nėra lygūs: visada yra nenugalimos jėgos, sensacingos informacijos, netikėtų sprendimų, kurie gali pakeisti numatomus rinkimų rezultatus, galimybė.

Neumannas ir Pearsonas sutarė, kad patogiausias yra Fischerio siūlomas reikšmingumo lygis 0,05 (žymimas α). Tačiau pats Fischeris 1956 m. Priešinosi šios vertės nustatymui. Jis tikėjo, kad α lygis turėtų būti nustatytas atsižvelgiant į konkrečias aplinkybes. Pavyzdžiui, dalelių fizikoje jis yra 0,01.

P lygio vertė

Pirmą kartą p-vertės terminą Brownlee pavartojo 1960 m. P reikšmė (p reikšmė) yra matas, atvirkščiai susijęs su rezultatų tiesa. Didžiausia p reikšmė atitinka mažiausią pasitikėjimo lygį kintamųjų sąsajų imtyje.

Ši vertė atspindi klaidų, susijusių su rezultatų aiškinimu, tikimybę. Tarkime, kad p lygis \u003d 0,05 (1/20). Tai rodo penkių procentų tikimybę, kad imtyje nustatytas ryšys tarp kintamųjų yra tik atsitiktinis imties bruožas. Tai yra, jei šios priklausomybės nėra, tada atliekant pakartotinius panašius eksperimentus, vidutiniškai kiekviename dvidešimtajame tyrime galima tikėtis tokios pačios ar didesnės priklausomybės tarp kintamųjų. Dažnai p lygis laikomas klaidų lygio „priimtina riba“.

Beje, p reikšmė gali neatspindėti realaus kintamųjų ryšio, o prielaidose rodo tik tam tikrą vidutinę vertę. Galutinė duomenų analizė taip pat priklausys nuo pasirinktų šio koeficiento verčių. Esant p lygiui \u003d 0,05, bus vieni rezultatai, o esant koeficientui 0,01, kiti.

Statistinių hipotezių tikrinimas

Statistinio reikšmingumo lygis yra ypač svarbus tikrinant hipotezes. Pavyzdžiui, skaičiuojant dvipusį testą, atmetimo sritis padalijama po lygiai abiejuose mėginio pasiskirstymo galuose (lyginant su nuline koordinate) ir apskaičiuojama gautų duomenų teisingumas.

Tarkime, stebint procesą (reiškinį) paaiškėjo, kad nauja statistinė informacija rodo nedidelius pokyčius, palyginti su ankstesnėmis reikšmėmis. Tuo pačiu rezultatų neatitikimai yra nedideli, nėra akivaizdūs, tačiau svarbūs tyrimams. Specialistė susiduria su dilema: ar pokyčiai iš tikrųjų įvyksta, ar tai yra atrankos klaidos (matavimo netikslumas)?

Šiuo atveju nulinė hipotezė yra arba taikoma, arba atmetama (viskas nurašoma į klaidą, arba sistemos pakeitimas pripažįstamas kaip faktinis įvykis). Problemos sprendimo procesas grindžiamas bendro statistinio reikšmingumo (p reikšmės) ir reikšmingumo lygio (α) santykiu. Jei p lygis< α, значит, нулевую гипотезу отвергают. Чем меньше р-value, тем более значимой является тестовая статистика.

Panaudotos vertės

Reikšmingumo lygis priklauso nuo analizuojamos medžiagos. Praktiškai naudojamos šios fiksuotos vertės:

  • α \u003d 0,1 (arba 10%);
  • α \u003d 0,05 (arba 5%);
  • α \u003d 0,01 (arba 1%);
  • α \u003d 0,001 (arba 0,1%).

Kuo tikslesni skaičiavimai, tuo mažesnis koeficientas α. Natūralu, kad statistikos fizikos, chemijos, farmacijos, genetikos prognozės reikalauja didesnio tikslumo nei politikos mokslai ir sociologija.

Reikšmingumo ribos konkrečiose srityse

Didelio tikslumo srityse, tokiose kaip dalelių fizika ir gamyba, statistinis reikšmingumas dažnai išreiškiamas kaip standartinio nuokrypio santykis (žymimas sigmos koeficientu - σ), palyginti su normaliu tikimybės pasiskirstymu (Gauso skirstinys). σ yra statistinis rodiklis, nustatantis tam tikro dydžio reikšmių dispersiją, palyginti su matematiniai lūkesčiai... Naudojamas įvykių tikimybei nubrėžti.

Priklausomai nuo žinių srities, koeficientas σ labai skiriasi. Pvz., Numatant Higso bozono egzistavimą, parametras σ yra penki (σ \u003d 5), o tai atitinka p-reikšmę \u003d 1/3, 5 mln. Genomo tyrimuose reikšmingumo lygis gali būti 5 × 10 -8, o tai nėra įprasta. srityje.

Efektyvumas

Atkreipkite dėmesį, kad koeficientai α ir p reikšmės nėra tikslios charakteristikos. Kad ir koks būtų reikšmingumo lygis tiriamo reiškinio statistikoje, tai nėra besąlyginis pagrindas priimti hipotezę. Pavyzdžiui, nei mažiau vertės α, tuo didesnė tikimybė, kad nustatoma hipotezė yra reikšminga. Tačiau yra klaidų rizika, dėl kurios sumažėja statistinė tyrimo galia (reikšmingumas).

Tyrėjai, susitelkę tik į statistiškai reikšmingus rezultatus, gali gauti klaidinančias išvadas. Tuo pačiu metu sunku dar kartą patikrinti jų darbą, nes jie taiko prielaidas (kurios iš tikrųjų yra α ir p vertės reikšmės). Todėl visada rekomenduojama kartu su statistinio reikšmingumo apskaičiavimu nustatyti kitą rodiklį - statistinio efekto dydį. Poveikio dydis yra kiekybinis efekto stiprumo matas.

Pagrindiniai bet kokios priklausomybės tarp kintamųjų bruožai.

Galima pažymėti dvi paprasčiausias priklausomybės tarp kintamųjų savybes: (a) priklausomybės dydis ir (b) priklausomybės patikimumas.

- Kiekis ... Santykio dydį lengviau suprasti ir išmatuoti nei patikimumą. Pavyzdžiui, jei kuriam nors iš atrinktų vyrų baltųjų kraujo kūnelių skaičius (WCC) buvo didesnis nei bet kurios moters, tuomet galite sakyti, kad ryšys tarp dviejų kintamųjų (lytis ir WCC) yra labai didelis. Kitaip tariant, jūs galite nuspėti vieno kintamojo reikšmes iš kito vertės.

- Patikimumas ("tiesa"). Tarpusavio priklausomybės patikimumas yra mažiau intuityvus nei priklausomybės dydis, tačiau nepaprastai svarbus. Santykio patikimumas yra tiesiogiai susijęs su tam tikros imties reprezentatyvumu, kurio pagrindu daromos išvados. Kitaip tariant, patikimumas rodo, kiek tikėtina, kad ryšys bus iš naujo atrastas (kitaip tariant, patvirtintas) naudojant duomenis iš kitos tos pačios populiacijos imties.

Reikėtų prisiminti, kad galutinis tikslas beveik niekada nėra ištirti tam tikrą konkrečią vertybių imtį; imtis domina tik tiek, kiek joje pateikiama informacija apie visus gyventojus. Jei tyrimas atitinka kai kuriuos specialius kriterijus, rastų ryšių tarp imties kintamųjų patikimumą galima kiekybiškai įvertinti ir pateikti naudojant standartinę statistinę priemonę.

Priklausomybės dydis ir patikimumas yra du įvairios charakteristikos priklausomybė tarp kintamųjų. Tačiau negalima sakyti, kad jie yra visiškai nepriklausomi. Kuo didesnė santykio (ryšio) tarp kintamųjų reikšmė įprasto dydžio imtyje, tuo patikimesnė (žr. Kitą skyrių).

Statistinis rezultato reikšmingumas (p lygis) yra įvertintas pasitikėjimo savo „tiesa“ („imties reprezentatyvumo“ prasme) matas. Kalbant techniškai, p lygis yra rodiklis, kuris mažėja, kai rezultatas patikimas. Aukštesnis p lygis atitinka daugiau žemas lygis pasitikėjimas priklausomybe tarp imtyje rastų kintamųjų. Būtent, p lygis yra klaidos tikimybė, susijusi su stebimo rezultato išplėtimu visai populiacijai.

Pavyzdžiui, p lygis \u003d 0,05 (t. y. 1/20) rodo, kad yra 5% tikimybė, kad ryšys tarp imtyje rastų kintamųjų yra tik atsitiktinis duotosios imties bruožas. Daugelyje tyrimų 0,05 p lygis yra laikomas „priimtina klaidų lygio riba“.

Jokiu būdu negalima išvengti savivalės sprendžiant, koks reikšmingumo lygis iš tikrųjų turėtų būti laikomas „reikšmingu“. Tam tikro reikšmingumo lygio, kurį viršijus rezultatai atmetami kaip klaidingi, pasirinkimas yra gana savavališkas.



Dėl praktikos paskutinis sprendimas paprastai priklauso nuo to, ar rezultatas buvo numatytas a priori (t. y. prieš eksperimentą), ar atrado a posteriori dėl daugelio analizių ir palyginimų, atliktų su įvairiais duomenimis, taip pat nuo nurodytos tyrimo srities tradicijos.

Paprastai daugelyje sričių statistinis reikšmingumas yra priimtinas p. 05 rezultatas, tačiau reikia atsiminti, kad šis lygis vis tiek apima gana didelę klaidų tikimybę (5%).

Rezultatai, reikšmingi p .01 lygiu, paprastai laikomi statistiškai reikšmingais, o tie, kurių p .005 arba p. 001 kaip labai reikšmingas. Tačiau reikėtų suprasti, kad šis reikšmingumo lygių klasifikavimas yra gana savavališkas ir yra tik neformalus susitarimas, priimtas remiantis praktine patirtimi. tam tikroje tyrimų srityje.

Aišku, kad ką daugiau analizės bus atliekamos naudojant surinktų duomenų rinkinį, tuo daugiau reikšmingų (pasirinktu lygiu) rezultatų bus atrasta visiškai atsitiktinai.

Kai kurie statistiniai metodai, apimantys daugybę palyginimų ir todėl turintys didelę galimybę pakartoti tokio pobūdžio klaidas, atlieka specialų pataisymą arba iš viso palyginimai. Tačiau daugelis statistinių metodų (ypač paprastus metodus tiriamoji duomenų analizė) nepasiūlo šios problemos sprendimo.

Jei ryšys tarp kintamųjų yra „objektyviai“ silpnas, tai nėra kito būdo išbandyti tokį ryšį, kaip tik ištyrus didelę imtį. Net jei imtis yra visiškai tipiška, poveikis nebus statistiškai reikšmingas, jei imtis yra maža. Panašiai, jei santykis yra „objektyviai“ labai stiprus, tada jį galima rasti labai reikšmingu net ir labai mažoje imtyje.

Kuo silpnesnis ryšys tarp kintamųjų, tuo didesnis imties dydis reikalingas norint jį prasmingai aptikti.

Daug skirtingų sąsajos tarp kintamųjų. Tam tikro mato pasirinkimas konkrečiame tyrime priklauso nuo kintamųjų skaičiaus, naudojamų skalių, priklausomybių pobūdžio ir kt.

Tačiau daugumai šių priemonių taikoma bendrasis principasJie bando įvertinti pastebėtą ryšį, lygindami jį su „maksimaliu įsivaizduojamu santykiu“ tarp aptariamų kintamųjų. Techniškai kalbant, įprastas būdas atlikti tokius įvertinimus yra pažvelgti į tai, kaip kintamųjų reikšmės skiriasi, ir paskui apskaičiuoti, kiek viso turimo varianto galima paaiškinti dviejų (ar daugiau) kintamųjų „bendru“ („jungtiniu“) variantu.

Reikšmė daugiausia priklauso nuo imties dydžio. Kaip jau paaiškinta, labai didelėse imtyse net labai silpni kintamųjų ryšiai bus reikšmingi, tuo tarpu mažose imtyse net labai tvirti ryšiai nėra patikimi.

Taigi, norint nustatyti statistinio reikšmingumo lygį, reikalinga funkcija, kuri atspindėtų santykį tarp kiekvieno kintamojo dydžio kintamųjų „dydžio“ ir „reikšmingumo“.

Tokia funkcija tiksliai parodytų, „kokia tikimybė gauti tam tikros vertės (ar daugiau) priklausomybę tam tikro dydžio imtyje, darant prielaidą, kad populiacijoje tokios priklausomybės nėra“. Kitaip tariant, ši funkcija suteiktų reikšmingumo lygį
(p-lygis), ir todėl tikimybė klaidingai atmesti prielaidą, kad šio ryšio nėra populiacijoje.

Ši „alternatyvi“ hipotezė (kad populiacijoje nėra priklausomybės) paprastai vadinama nulinė hipotezė.

Būtų idealu, jei paklaidos tikimybę apskaičiuojanti funkcija būtų tiesinė ir skirtingiems imties dydžiams turėtų tik skirtingus nuolydžius. Deja, ši funkcija yra daug sudėtingesnė ir ne visada tiksliai tokia pati. Tačiau daugeliu atvejų jo forma yra žinoma ir ji gali būti naudojama reikšmingumo lygiams nustatyti tiriant tam tikro dydžio mėginius. Dauguma šių funkcijų yra susijusios su vadinamų paskirstymų klase normalus .

3 užduotis. Penkiems ikimokyklinukams suteikiamas testas. Kiekvienos užduoties sprendimas užfiksuojamas. Ar bus nustatyti statistiškai reikšmingi skirtumai tarp laiko, per kurį reikia užpildyti pirmuosius tris bandomuosius dalykus?

Tiriamųjų skaičius

Etaloninė medžiaga

Ši užduotis yra pagrįsta dispersijos analizės teorija. Apskritai dispersijos analizės užduotis yra nustatyti tuos veiksnius, kurie daro didelę įtaką eksperimento rezultatui. ANOVA gali būti naudojama kelių mėginių vidurkiui palyginti, jei mėginių skaičius yra didesnis nei du. Tam naudojama vienpusė dispersijos analizė.

Siekiant išspręsti nustatytas užduotis, priimami šie veiksmai. Jei faktorių įtakos atveju gautų optimizavimo parametro reikšmių dispersijos skiriasi nuo rezultatų dispersijų, nesant faktorių įtakos, tai toks faktorius laikomas reikšmingu.

Kaip matyti iš problemos formulavimo, čia naudojami statistinių hipotezių tikrinimo metodai, būtent dviejų empirinių dispersijų tikrinimo problema. Taigi dispersijos analizė grindžiama dispersijų patikrinimu Fišerio testu. Atliekant šią užduotį būtina patikrinti, ar kiekvieno iš šešių ikimokyklinukų pirmųjų trijų testo užduočių sprendimo laiko skirtumai yra statistiškai reikšmingi.

Nulinė (pagrindinė) hipotezė vadinama H о. E esmė sutrumpinama darant prielaidą, kad skirtumas tarp lyginamų parametrų yra lygus nuliui (taigi hipotezės pavadinimas lygus nuliui) ir kad pastebėti skirtumai yra atsitiktinio pobūdžio.

Konkuruojanti (alternatyvi) hipotezė vadinama hipoteze H 1, kuri prieštarauja nulinei.

Sprendimas:

Naudodamiesi dispersijos analizės metodu, kai reikšmingumo lygis yra α \u003d 0,05, patikrinsime nulinę hipotezę (H о) apie statistiškai reikšmingų skirtumų tarp pirmųjų trijų testo užduočių sprendimo laiko egzistavimą šešiuose ikimokyklinukuose.

Apsvarstykite užduoties sąlygos lentelę, kurioje randame vidutinį laiką kiekvienai iš trijų testo užduočių išspręsti

Tiriamųjų skaičius

Faktoriaus lygiai

Laikas išspręsti pirmąją testo užduotį (sekundėmis).

Laikas išspręsti antrąją testo užduotį (sekundėmis).

Laikas išspręsti trečiąją testo užduotį (sekundėmis).

Grupės vidurkis

Raskite bendrą vidurkį:

Siekiant atsižvelgti į kiekvieno bandymo laiko skirtumų reikšmingumą, bendras imties dispersija padalijama į dvi dalis, iš kurių pirmoji vadinama faktoriumi, o antroji - likutine.

Apskaičiuokime bendrą varianto nuokrypių kvadratų sumą iš bendro vidurkio pagal formulę

arba , kur p - testo užduočių sprendimo laiko matavimų skaičius, q - tiriamųjų skaičius. Norėdami tai padaryti, sudarykite kvadratų lentelės parinktį

Tiriamųjų skaičius

Faktoriaus lygiai

Laikas išspręsti pirmąją testo užduotį (sekundėmis).

Laikas išspręsti antrąją testo užduotį (sekundėmis).

Laikas išspręsti trečiąją testo užduotį (sekundėmis).

Kaip manote, kuo jūsų sielos draugas yra ypatingas, prasmingas? Ar tai susiję su jos (jo) asmenybe, ar kaip tu jautiesi dėl šio žmogaus? O gal su paprastas faktaskad jūsų patinkančio atsitiktinumo hipotezė, kaip rodo tyrimai, yra mažesnė nei 5% tikimybė? Jei paskutinis teiginys yra patikimas, tada nebus sėkmingos pažinčių svetainės:

Atliekant oro kondicionavimo bandymus ar bet kokią kitą savo svetainės analizę, neteisingas „statistinio reikšmingumo“ supratimas gali sukelti neteisingą rezultatų interpretavimą ir dėl to klaidingą konversijų optimizavimo proceso supratimą. Tai pasakytina apie tūkstančius kitų statistinių testų, atliekamų kasdien bet kurioje egzistuojančioje pramonėje.

Norėdami suprasti, kas yra „statistinis reikšmingumas“, turite pasinerti į šio termino istoriją, sužinoti jo tikrąją prasmę ir suprasti, kaip šis „naujas“ senas supratimas padės teisingai interpretuoti jūsų tyrimo rezultatus.

Šiek tiek istorijos

Nors žmonija daugelį amžių naudojo statistiką tam tikroms problemoms spręsti, šiuolaikinis statistinio reikšmingumo supratimas, hipotezių tikrinimas, atsitiktinių imčių parinkimas ir netgi eksperimentų planavimas („Experiment Design“ (DOE) pradėjo formuotis tik 20 amžiaus pradžioje ir yra neatsiejamai susijęs su sero Ronaldo vardu Fišeris (seras Ronaldas Fišeris, 1890–1962):

Ronaldas Fischeris buvo evoliucijos biologas ir statistikas, turintis ypatingą aistrą evoliucijos ir natūralios atrankos tyrimams gyvūnų ir augalų karalystėje. Per savo žymią karjerą jis sukūrė ir išpopuliarino daugybę naudingų statistikos priemonių, kurias naudojame iki šiol.

Fischeris savo sukurtas metodikas paaiškino biologijos procesus, tokius kaip dominavimas, mutacijos ir genetinės anomalijos. Šiandien galime naudoti tuos pačius įrankius, kad optimizuotume ir tobulintume interneto išteklių turinį. Tai, kad šias analizės priemones galima naudoti dirbant su objektais, kurių jų sukūrimo metu net nebuvo, atrodo gana stebina. Lygiai taip pat stebina tai, kad žmonės atlikdavo sudėtingiausius skaičiavimus be skaičiuotuvų ar kompiuterių.

Fischeris vartojo žodį reikšmingumas apibūdindamas statistinio eksperimento rezultatus kaip turinčius didelę tikimybę būti tiesa.

Taip pat vieną įdomiausių Fischerio įvykių galima pavadinti „seksualaus sūnaus“ hipoteze. Remiantis šia teorija, moterys pirmenybę teikia iškiliems vyrams (vaikštynėms), nes tai leis iš šių vyrų gimusiems sūnums būti vienodai linkusiems ir pagimdyti daugiau savo atžalų (atkreipkite dėmesį, kad tai tik teorija).

Tačiau niekas, net ir puikūs mokslininkai, nėra apsaugoti nuo klaidų. „Fischer“ ydos kamuoja specialistus iki šiol. Tačiau prisimink Alberto Einšteino žodžius: „Kas niekada nepadarė klaidų, tas nieko naujo ir nesukūrė“.

Prieš pereidami prie kito punkto, nepamirškite: statistinis reikšmingumas yra situacija, kai rezultatų skirtumas testavimo metu yra toks didelis, kad šio skirtumo negalima paaiškinti atsitiktinių veiksnių įtaka.

Kokia jūsų hipotezė?

Norėdami suprasti, ką reiškia „statistinis reikšmingumas“, pirmiausia turite suprasti, kas yra „hipotezės tikrinimas“, nes abu terminai yra glaudžiai susiję.
Hipotezė yra tik teorija. Sukūrę bet kurią teoriją, turėsite nustatyti pakankamo įrodymų kiekio surinkimo procedūrą ir iš tikrųjų surinkti šiuos įrodymus. Yra dviejų tipų hipotezės.

Obuoliai ar apelsinai - kas geriau?

Nulinė hipotezė

Kaip taisyklė, daugeliui kyla sunkumų būtent šioje vietoje. Reikėtų nepamiršti, kad nulinė hipotezė nėra kažkas, ką galima įrodyti, nes, pavyzdžiui, jūs įrodote, kad tam tikri svetainės pakeitimai padidins konversijų skaičių, bet atvirkščiai. Nulinė hipotezė yra teorija, kad atlikus bet kokius svetainės pakeitimus nieko neįvyks. Tyrėjo tikslas yra paneigti šią teoriją, o ne ją įrodyti.

Jei atsigręžtume į nusikaltimų sprendimo patirtį, kai tyrėjai taip pat pateikia hipotezes apie tai, kas yra kaltininkas, nulinė hipotezė pasireiškia vadinamosios nekaltumo prezumpcijos forma - koncepcija, pagal kurią kaltinamasis laikomas nekaltu, kol kaltė neįrodoma teisme.

Jei nulinė hipotezė yra ta, kad du objektai yra lygūs savo savybėmis, ir jūs bandote įrodyti, kad vienas iš jų vis tiek yra geresnis (pavyzdžiui, A yra geriau nei B), turite atsisakyti nulinės hipotezės alternatyvos naudai. Pavyzdžiui, lyginate vieną ar kitą konversijų optimizavimo įrankį. Pagal nulinę hipotezę jie abu turi tą patį poveikį taikiniui (arba neturi jokio poveikio). Arba vieno iš jų poveikis yra geresnis.

Alternatyvioje hipotezėje gali būti skaitinė vertė, pavyzdžiui, B - A\u003e 20%. Šiuo atveju nulinė hipotezė ir alternatyva gali būti tokios formos:

Kitas alternatyvios hipotezės pavadinimas yra tiriamoji hipotezė, nes tyrėjui visada rūpi įrodyti šią hipotezę.

Statistinė reikšmė ir p reikšmė

Grįžkime prie Ronaldo Fischerio ir jo statistinio reikšmingumo sampratos.

Dabar, kai turite nulinę hipotezę ir alternatyvią hipotezę, kaip galite įrodyti vieną ir paneigti kitą?

Kadangi pagal savo pobūdį statistika apima konkrečios populiacijos (imties) tyrimą, niekada negali būti 100% tikras dėl gautų rezultatų. Iliustracinis pavyzdys: dažnai rinkimų rezultatai skiriasi nuo išankstinių apklausų rezultatų ir netgi pasitraukimo grupių.

Dr. Fisheris norėjo sukurti skiriamąją liniją, norėdamas pasakyti, ar jūsų eksperimentas buvo sėkmingas, ar ne. Taip atsirado pasitikėjimo indeksas. Patikimumas yra tas lygis, kurį mes imamės norėdami pasakyti, ką mes laikome „reikšmingu“, o kas ne. Jei „p“, pasitikėjimo indeksas, yra 0,05 arba mažesnis, tada rezultatai yra patikimi.

Nesijaudinkite, tai tikrai nėra taip painu, kaip atrodo.

Gauso tikimybių pasiskirstymas. Briaunose - mažiau tikėtinos kintamojo vertės, centre - labiausiai tikėtinos. P balas (žalios spalvos šešėlis) yra stebimo rezultato tikimybė atsirasti atsitiktinai.

Normalus tikimybių pasiskirstymas (Gauso skirstinys) yra visų atstovavimas galimas vertybes tam tikras grafiko kintamasis (aukščiau esančiame paveikslėlyje) ir jų dažnis. Jei atliksite teisingą tyrimą ir grafike užrašysite visus gautus atsakymus, gausite šį paskirstymą. Pagal įprastą pasiskirstymą gausite didelį procentą panašių atsakymų, o likusios parinktys bus išdėstytos grafiko kraštuose (vadinamosios „uodegos“). Toks kiekių pasiskirstymas dažnai būna gamtoje, todėl jis vadinamas „normaliu“.

Naudodami lygtį, pagrįstą jūsų imtimi ir testo rezultatais, galite apskaičiuoti vadinamąją „testo statistiką“, kuri nurodo, kiek skiriasi rezultatai. Tai taip pat pasakys, kiek arti esate, kad nulle hipotezė būtų teisinga.

Norėdami nenuleisti galvos, naudokite internetinius skaičiuotuvus, kad apskaičiuotumėte statistinę reikšmingumą:

Vienas tokių skaičiuotuvų pavyzdžių

Raidė „p“ reiškia tikimybę, kad nulinė hipotezė yra teisinga. Mažas skaičius parodytų skirtumą tarp tiriamųjų grupių, tuo tarpu niekinė hipotezė būtų, kad jie yra vienodi. Grafiškai atrodys, kad jūsų bandymo statistika yra arčiau vienos iš varpelio formos pasiskirstymo uodegų.

Dr Fišeris nusprendė nustatyti rezultatų patikimumo ribą, kai p ≤ 0,05. Tačiau šis teiginys taip pat yra prieštaringas, nes jis sukelia du sunkumus:

1. Pirma, tai, kad įrodėte negaliojančią hipotezę negaliojančia, dar nereiškia, kad įrodėte alternatyvią hipotezę. Visa ši reikšmė reiškia, kad negalite įrodyti nei A, nei B.

2. Antra, jei p balas yra 0,049, tai reiškia, kad nulinės hipotezės tikimybė yra 4,9%. Tai gali reikšti, kad jūsų bandymo rezultatai tuo pačiu metu gali būti teisingi ir klaidingi.

Galite naudoti p-eksponentą arba jo atsisakyti, bet tada jums reikės kiekvieno konkrečiu atveju apskaičiuokite nulinės hipotezės įvykdymo tikimybę ir nuspręskite, ar ji yra pakankamai didelė, kad neatliktų jūsų numatytų ir patikrintų pakeitimų.

Šiandien labiausiai paplitęs statistinio tyrimo atlikimo scenarijus yra nustatyti reikšmingumo ribą p ≤ 0,05, prieš pradedant patį testą. Tik nepamirškite atidžiai pažiūrėti p-vertės, kai tikrinate rezultatus.

1 ir 2 klaidos

Jau tiek laiko klaidos, kurios gali atsirasti naudojant statistinio reikšmingumo rodiklį, netgi turi savo pavadinimus.

1 klaida (1 tipo klaidos)

Kaip minėta aukščiau, p vertė 0,05 reiškia, kad nulinės hipotezės teisingumo tikimybė yra 5%. Jei to atsisakysite, padarysite klaidą Nr. 1. Rezultatai sako, kad jūsų naujoje svetainėje padidėjo konversijų rodikliai, tačiau yra 5% tikimybė, kad taip nėra.

2 klaida (2 tipo klaidos)

Ši klaida yra priešinga 1 klaidai: jūs sutinkate su nuline hipoteze, nors ji klaidinga. Pvz., Bandymo rezultatai jums sako, kad atlikti pakeitimai svetainėje nepadarė jokio pagerėjimo, o pokyčių buvo. Esmė: jūs praleidote galimybę pagerinti savo našumą.

Ši klaida yra įprasta nedalyvavusių testų metu, todėl atminkite: kuo didesnis pavyzdys, tuo patikimesnis rezultatas.

Išvada

Turbūt nė vienas kitas terminas tyrinėtojų tarpe nėra toks populiarus, kaip statistinė reikšmė. Kai testų rezultatai nelaikomi statistiškai reikšmingais, pasekmės gali būti labai įvairios: nuo konversijų rodiklių kilimo iki įmonės žlugimo.

Ir kadangi rinkodaros specialistai naudoja šį terminą optimizuodami savo turtą, turite žinoti, ką jis iš tikrųjų reiškia. Testo sąlygos gali skirtis, tačiau pavyzdžių dydis ir sėkmės kriterijai visada yra svarbūs. Prisimink tai.

Statistinis reikšmingumas arba p-reikšmingumo lygis yra pagrindinis bandymo rezultatas

statistinė hipotezė. Kalbėjimas techninė kalba, tai yra tikimybė tai gauti

mėginio tyrimo rezultatas, su sąlyga, kad tai iš tikrųjų bendrajam

gyventojų, nullinė statistinė hipotezė yra teisinga - tai yra, nėra ryšio. Kitaip tariant, yra

tikimybė, kad atrasti santykiai yra atsitiktiniai, o ne nuosavybė

agregatas. Tai yra statistinis reikšmingumas, p reikšmingumo lygis yra

kiekybiškai įvertinti komunikacijos patikimumas: kuo mažesnė ši tikimybė, tuo patikimesnė komunikacija.

Tarkime, lyginant du imties vidurkius, buvo gauta lygio vertė

statistinis reikšmingumas p \u003d 0,05. Tai reiškia, kad išbandoma statistinė hipotezė apie

lygių galimybių paskirstymas bendroje populiacijoje parodė, kad jei tai teisinga, tai tikimybė

atsitiktinai aptikti skirtumai yra ne daugiau kaip 5%. Kitaip tariant, jei

du mėginiai buvo pakartotinai paimti iš tos pačios populiacijos, tada iš 1

20 atvejų parodytų tą patį ar didesnį skirtumą tarp šių mėginių vidurkio.

Tai yra, yra 5% tikimybė, kad rasti skirtumai yra atsitiktiniai.

charakteris, o ne visumos savybė.

Santykiuose mokslinė hipotezė statistinio reikšmingumo lygis yra kiekybinis

rodomas nepasitikėjimo laipsnis išvadoje apie ryšio egzistavimą, apskaičiuotas iš rezultatų

selektyvus, empirinis šios hipotezės patikrinimas. Kuo mažesnė p lygio vertė, tuo didesnė

statistinė tyrimo rezultato reikšmė, patvirtinanti mokslinę hipotezę.

Naudinga žinoti, kas daro įtaką reikšmingumo lygiui. Reikšmingumo lygis, kiti dalykai yra lygūs

sąlygos aukštesnės (p lygio vertė mažesnė), jei:

Ryšio suma (skirtumas) yra didesnė;

Bruožo (-ų) kintamumas yra mažesnis;

Imties dydis (pavyzdžiai) yra didesnis.

Vienpusisdvipusio reikšmingumo testo kriterijus

Jei tyrimo tikslas yra nustatyti dviejų bendrųjų parametrų skirtumą

kolekcijas, atitinkančias įvairias jos gamtos sąlygas ( gyvenimo sąlygos,

tiriamųjų amžius ir kt.), tada dažnai nežinoma, kuris iš šių parametrų bus didesnis ir

kuris yra mažesnis.

Pvz., Jei jus domina rezultatų kintamumas kontrolėje ir

eksperimentinės grupės, tada paprastai nėra pasitikėjimo skirtumų skirtumų ženklu ar

standartiniai nuokrypiai rezultatai, pagal kuriuos vertinamas kintamumas. Tokiu atveju

nulinė hipotezė yra ta, kad dispersijos yra vienodos, o tyrimo tikslas yra

įrodyti kitaip, t.y. skirtumas tarp dispersijų. Be to, daroma prielaida, kad

skirtumas gali būti bet koks ženklas. Tokios hipotezės vadinamos dvipusėmis.

Bet kartais iššūkis yra įrodyti parametro padidėjimą ar sumažėjimą;

pavyzdžiui, vidutinis eksperimentinės grupės rezultatas yra didesnis nei kontrolinės grupės. Kur

nebepripažįstama, kad skirtumas gali būti kito ženklo. Tokios hipotezės vadinamos

Vienpusis.

Vadinami reikšmingumo kriterijai, naudojami dvipusiškoms hipotezėms patikrinti

Dvišalė, o vienašališkai - vienašalė.

Iškyla klausimas, kurį iš kriterijų reikėtų pasirinkti tokiu ar kitu atveju. Atsakymas

Šis klausimas nėra formalus statistiniai metodai ir visiškai

Priklauso nuo tyrimo tikslų. Jokiu būdu negalima pasirinkti vieno ar kito kriterijaus

Atlikite eksperimentą, pagrįstą eksperimentinių duomenų analize, kiek tai įmanoma

Veda prie klaidingų išvadų. Jei prieš eksperimentą daroma prielaida, kad skirtumas

Palyginami parametrai gali būti teigiami arba neigiami, tada išplaukia