Namunalar orasidagi farqlarning statistik ahamiyati. Umumiy populyatsiya va namunaviy o'rganish. Statistik ahamiyati

Statistikada muhimlik darajasi muhim ko'rsatkich, qabul qilingan (prognoz qilingan) ma'lumotlarning to'g'riligi va haqiqatiga ishonch darajasini aks ettiruvchi. Kontseptsiya turli sohalarda keng qo'llaniladi: dirijyorlikdan sotsiologik tadqiqotlar, ilmiy farazlarni statistik tekshirishdan oldin.

Ta'rif

Daraja statistik ahamiyatga ega(yoki statistik ahamiyatga ega natija) o'rganilayotgan ko'rsatkichlarning tasodifiy paydo bo'lish ehtimoli qanday ekanligini ko'rsatadi. Hodisaning umumiy statistik ahamiyati p-qiymat koeffitsienti (p-daraja) bilan ifodalanadi. Har qanday tajriba yoki kuzatishda olingan ma'lumotlar tanlab olish xatolari tufayli yuzaga kelgan bo'lishi mumkin. Bu, ayniqsa, sotsiologiyaga tegishli.

Ya'ni, statistik ahamiyatga ega bo'lgan qiymat tasodifiy yuzaga kelish ehtimoli juda kichik bo'lgan yoki ekstremalga moyil bo'lgan qiymatdir. Bu kontekstdagi ekstremal statistik ma'lumotlarning nol gipotezadan chetga chiqish darajasidir (gipoteza olingan namunaviy ma'lumotlarga muvofiqligi tekshiriladi). Ilmiy amaliyotda ahamiyatlilik darajasi ma'lumotlarni yig'ishdan oldin tanlanadi va qoida tariqasida uning koeffitsienti 0,05 (5%) ni tashkil qiladi. Aniq qiymatlar juda muhim bo'lgan tizimlar uchun bu ko'rsatkich 0,01 (1%) yoki undan kam bo'lishi mumkin.

Fon

Muhimlik darajasi tushunchasi ingliz statistik va genetiki Ronald Fisher tomonidan 1925 yilda statistik gipotezalarni tekshirish texnikasini ishlab chiqayotganda kiritilgan. Har qanday jarayonni tahlil qilishda ma'lum bir hodisalarning ma'lum bir ehtimoli mavjud. "O'lchov xatosi" tushunchasiga kiruvchi ehtimollarning kichik (yoki aniq bo'lmagan) foizlari bilan ishlashda qiyinchiliklar paydo bo'ladi.

Sinov uchun yetarli bo'lmagan statistik ma'lumotlar bilan ishlashda olimlar nol gipoteza muammosiga duch kelishadi, bu esa kichik miqdorlar bilan ishlashga "to'sqinlik qiladi". Fisher bunday tizimlar uchun hisob-kitoblarda nol gipotezani rad etishga imkon beruvchi qulay tanlab olish usuli sifatida hodisalarning 5% (0,05) ehtimolini aniqlashni taklif qildi.

Belgilangan koeffitsientlarni joriy etish

1933 yilda Jerzy olimlari Neyman va Egon Pirson o'z ishlarida ma'lum bir ahamiyat darajasini oldindan belgilashni tavsiya qildilar (ma'lumotlarni yig'ishdan oldin). Ushbu qoidalardan foydalanish misollari saylov jarayonida yaqqol ko'zga tashlanadi. Aytaylik, ikkita nomzod bor, ulardan biri juda mashhur, ikkinchisi esa unchalik mashhur emas. Ko'rinib turibdiki, birinchi nomzod saylovda g'alaba qozonadi, ikkinchisining imkoniyati esa nolga teng. Ular intilishadi - lekin teng emas: har doim fors-major holatlari, shov-shuvli ma'lumotlar, bashorat qilingan saylov natijalarini o'zgartirishi mumkin bo'lgan kutilmagan qarorlar ehtimoli bor.

Neyman va Pirson Fisherning ahamiyatlilik darajasi 0,05 (a bilan belgilanadi) eng mos kelishiga kelishib oldilar. Biroq, 1956 yilda Fisherning o'zi bu qiymatni belgilashga qarshi chiqdi. Uning fikricha, a darajasi aniq holatlarga qarab belgilanishi kerak. Masalan, zarralar fizikasida u 0,01 ga teng.

p darajasidagi qiymat

P-qiymati atamasi birinchi marta 1960 yilda Braunli tomonidan ishlatilgan. P-darajasi (p-qiymati) natijalarning haqiqatiga teskari bog'liq bo'lgan ko'rsatkichdir. Eng yuqori p-qiymat koeffitsienti o'zgaruvchilar o'rtasidagi tanlanma munosabatlarga ishonchning eng past darajasiga to'g'ri keladi.

Ushbu qiymat natijalarni talqin qilish bilan bog'liq xatolar ehtimolini aks ettiradi. Faraz qilaylik p-daraja = 0,05 (1/20). Bu namunada topilgan o'zgaruvchilar o'rtasidagi bog'liqlik namunaning tasodifiy xususiyati ekanligining besh foizlik ehtimolini ko'rsatadi. Ya'ni, agar bu bog'liqlik bo'lmasa, takroriy o'xshash tajribalar bilan, o'rtacha har yigirmanchi tadqiqotda o'zgaruvchilar o'rtasida bir xil yoki kattaroq bog'liqlikni kutish mumkin. p-darajasi ko'pincha xatolik darajasi uchun "marja" sifatida ko'riladi.

Aytgancha, p-qiymati o'zgaruvchilar orasidagi haqiqiy munosabatni aks ettirmasligi mumkin, lekin faqat taxminlar doirasida ma'lum bir o'rtacha qiymatni ko'rsatadi. Xususan, ma'lumotlarning yakuniy tahlili ushbu koeffitsientning tanlangan qiymatlariga ham bog'liq bo'ladi. p-darajada = 0,05 ba'zi natijalar bo'ladi va 0,01 ga teng koeffitsientda turli natijalar bo'ladi.

Statistik gipotezalarni tekshirish

Gipotezalarni tekshirishda statistik ahamiyatga egalik darajasi ayniqsa muhimdir. Misol uchun, ikki tomonlama testni hisoblashda rad etish hududi namunalar taqsimotining har ikki uchida (nol koordinataga nisbatan) teng ravishda bo'linadi va natijada olingan ma'lumotlarning haqiqati hisoblanadi.

Aytaylik, ma'lum bir jarayonni (hodisani) kuzatishda yangi statistik ma'lumotlar shuni ko'rsatadi kichik o'zgarishlar oldingi qiymatlarga nisbatan. Shu bilan birga, natijalardagi nomuvofiqliklar kichik, aniq emas, ammo tadqiqot uchun muhimdir. Mutaxassis bir dilemma bilan duch keladi: o'zgarishlar haqiqatan ham sodir bo'ladimi yoki bu tanlab olish xatolarmi (o'lchov noto'g'ri)?

Bunday holda, ular nol gipotezadan foydalanadilar yoki rad etadilar (hamma narsani xatoga bog'laydilar yoki tizimdagi o'zgarishlarni bajarilgan deb tan oladilar). Muammoni hal qilish jarayoni umumiy statistik ahamiyatlilik (p-qiymat) va muhimlik darajasi (a) nisbatiga asoslanadi. Agar p-daraja< α, значит, нулевую гипотезу отвергают. Чем меньше р-value, тем более значимой является тестовая статистика.

Foydalanilgan qiymatlar

Muhimlik darajasi tahlil qilinadigan materialga bog'liq. Amalda quyidagi qat'iy qiymatlar qo'llaniladi:

a = 0,1 (yoki 10%);
a = 0,05 (yoki 5%);
a = 0,01 (yoki 1%);
a = 0,001 (yoki 0,1%).

Hisob-kitoblar qanchalik aniq bo'lsa, a koeffitsienti shunchalik past bo'ladi. Tabiiyki, fizika, kimyo, farmatsevtika va genetika fanlaridagi statistik prognozlar siyosatshunoslik va sotsiologiyaga qaraganda ko‘proq aniqlikni talab qiladi.

Muayyan sohalarda ahamiyatlilik chegaralari

Zarrachalar fizikasi va ishlab chiqarish kabi yuqori aniqlikdagi sohalarda statistik ahamiyat ko'pincha standart og'ishning (sigma koeffitsienti bilan belgilanadi - s) normal ehtimollik taqsimotiga (Gauss taqsimoti) nisbati sifatida ifodalanadi. s - ma'lum bir miqdor qiymatlarining tarqalishini aniqlaydigan statistik ko'rsatkich. matematik taxminlar. Voqealarning ehtimolini chizish uchun ishlatiladi.

Bilim sohasiga qarab s koeffitsienti katta farq qiladi. Masalan, Xiggs bozonining mavjudligini bashorat qilishda s parametri beshga teng (s = 5), bu p-qiymati = 1/3,5 millionga to'g'ri keladi, genom tadqiqotlarida ahamiyatlilik darajasi 5 × 10 bo'lishi mumkin. 8, bu sohalar uchun odatiy emas.

Samaradorlik

Shuni hisobga olish kerakki, a va p-qiymat koeffitsientlari aniq xarakteristikalar emas. O'rganilayotgan hodisaning statistikasida qanday ahamiyatga ega bo'lishidan qat'i nazar, u gipotezani qabul qilish uchun shartsiz asos bo'lmaydi. Masalan, dan kamroq qiymat a bo'lsa, gipotezani o'rnatish imkoniyati shunchalik katta bo'ladi. Biroq, tadqiqotning statistik kuchini (ahamiyatini) kamaytiradigan xatolik xavfi mavjud.

Faqat statistik ahamiyatga ega natijalarga e'tibor qaratadigan tadqiqotchilar noto'g'ri xulosalarga kelishlari mumkin. Shu bilan birga, ularning ishini ikki marta tekshirish qiyin, chunki ular taxminlarni qo'llaydilar (aslida a va p-qiymatlari). Shuning uchun har doim statistik ahamiyatlilikni hisoblash bilan bir qatorda boshqa ko'rsatkichni - statistik ta'sirning kattaligini aniqlash tavsiya etiladi. Ta'sir hajmi - bu ta'sir kuchining miqdoriy o'lchovidir.

O'zgaruvchilar o'rtasidagi har qanday munosabatlarning asosiy xususiyatlari.

O'zgaruvchilar o'rtasidagi munosabatlarning ikkita eng oddiy xususiyatini qayd etishimiz mumkin: (a) munosabatlarning kattaligi va (b) munosabatlarning ishonchliligi.

- Kattalik . Ishonchlilikdan ko'ra qaramlik kattaligini tushunish va o'lchash osonroq. Misol uchun, agar namunadagi har qanday erkakda oq qon hujayralari soni (WCC) har qanday ayolga qaraganda yuqori bo'lsa, unda ikkita o'zgaruvchi (jins va WCC) o'rtasidagi munosabatlar juda yuqori deb aytishingiz mumkin. Boshqacha qilib aytganda, siz bir o'zgaruvchining qiymatlarini boshqasining qiymatlaridan taxmin qilishingiz mumkin.

- Ishonchlilik ("haqiqat"). O'zaro bog'liqlikning ishonchliligi bog'liqlik kattaligiga qaraganda kamroq intuitiv tushunchadir, ammo bu juda muhim. O'zaro munosabatlarning ishonchliligi to'g'ridan-to'g'ri ma'lum bir namunaning vakili bilan bog'liq bo'lib, uning asosida xulosalar chiqariladi. Boshqacha qilib aytadigan bo'lsak, ishonchlilik bir xil populyatsiyadan olingan boshqa namunadagi ma'lumotlardan foydalangan holda munosabatlarning qayta ochilishi (boshqacha aytganda, tasdiqlanishi) qanchalik ehtimolini anglatadi.

Shuni esda tutish kerakki, yakuniy maqsad deyarli hech qachon bu alohida qadriyatlar namunasini o'rganish emas; Namuna faqat butun populyatsiya haqida ma'lumot beradigan darajada qiziqish uyg'otadi. Agar tadqiqot muayyan aniq mezonlarga javob bersa, u holda namunaviy o'zgaruvchilar o'rtasidagi topilgan munosabatlarning ishonchliligi standart statistik o'lchov yordamida aniqlanishi va taqdim etilishi mumkin.

Bog'liqlik va ishonchlilikning kattaligi ikkitani ifodalaydi turli xil xususiyatlar o'zgaruvchilar orasidagi bog'liqliklar. Biroq, ularni butunlay mustaqil deb aytish mumkin emas. Oddiy o'lchamdagi namunadagi o'zgaruvchilar orasidagi munosabatlar (bog'lanish) qanchalik katta bo'lsa, u shunchalik ishonchli bo'ladi (keyingi bo'limga qarang).

Natijaning statistik ahamiyati (p-daraja) uning "haqiqatiga" ishonchning taxminiy o'lchovidir ("namuna vakili" ma'nosida). Ko'proq texnik jihatdan aytganda, p-darajasi natijaning ishonchliligi bilan kattalikning kamayish tartibida o'zgarib turadigan o'lchovdir. Ko'proq yuqori p darajasi ko'proq mos keladi past daraja namunada topilgan o'zgaruvchilar o'rtasidagi munosabatlarga ishonch. Ya'ni, p-daraja kuzatilgan natijani butun populyatsiyaga taqsimlash bilan bog'liq xatolik ehtimolini ifodalaydi.

Masalan, p-daraja = 0,05(ya'ni 1/20) tanlovda topilgan o'zgaruvchilar o'rtasidagi bog'liqlik tanlovning tasodifiy xususiyati bo'lishining 5% ehtimoli borligini ko'rsatadi. Ko'pgina tadqiqotlarda p-darajasi 0,05 xatolik darajasi uchun "qabul qilinadigan chegara" hisoblanadi.

Qaysi ahamiyatga egalik darajasini haqiqatan ham "ahamiyatli" deb hisoblash kerakligini hal qilishda o'zboshimchalikdan qochishning hech qanday usuli yo'q. Natijalar noto'g'ri deb rad etiladigan ma'lum bir muhimlik darajasini tanlash juda o'zboshimchalikdir.

Amalda yakuniy qaror odatda turli ma’lumotlar bo‘yicha olib borilgan ko‘plab tahlillar va taqqoslashlar natijasida natijaning apriori (ya’ni, tajriba o‘tkazilgunga qadar) bashorat qilinganligiga yoki posteriori kashf etilganiga, shuningdek, tadqiqot sohasi an’analariga bog‘liq.

Umuman olganda, ko'p sohalarda p .05 natijasi statistik ahamiyatga ega bo'lgan maqbul chegara hisoblanadi, ammo shuni yodda tutingki, bu daraja hali ham juda katta xatolik chegarasini (5%) o'z ichiga oladi.

p .01 darajasida muhim natijalar odatda statistik ahamiyatga ega, p .005 yoki p .00 darajasidagi natijalar esa odatda statistik ahamiyatga ega deb hisoblanadi. 001 juda muhim. Ammo shuni tushunish kerakki, ahamiyat darajalarining ushbu tasnifi o'zboshimchalik bilan amalga oshiriladi va amaliy tajriba asosida qabul qilingan norasmiy kelishuvdir. ma'lum bir ta'lim sohasida.

Nima ekanligi aniq kattaroq raqam to'plangan ma'lumotlarning jami bo'yicha tahlillar o'tkaziladi, muhim (tanlangan darajadagi) natijalar soni qanchalik ko'p bo'lsa, shunchaki tasodifan topiladi.

Ko'p taqqoslashni o'z ichiga olgan va shuning uchun bunday turdagi xatolarni takrorlash uchun sezilarli imkoniyatga ega bo'lgan ba'zi statistik usullar uchun maxsus tuzatish yoki tuzatish kiritiladi. umumiy soni taqqoslashlar. Biroq, ko'plab statistik usullar (ayniqsa oddiy usullar tadqiqot ma'lumotlarini tahlil qilish) ushbu muammoni hal qilishning hech qanday usulini taklif qilmaydi.

Agar o'zgaruvchilar o'rtasidagi munosabatlar "ob'ektiv" zaif bo'lsa, unda katta namunani o'rganishdan boshqa bunday munosabatlarni tekshirishning boshqa usuli yo'q. Namuna mukammal vakili bo'lsa ham, namuna kichik bo'lsa, ta'sir statistik ahamiyatga ega bo'lmaydi. Xuddi shunday, agar munosabatlar "ob'ektiv" juda kuchli bo'lsa, u juda kichik namunada ham yuqori darajadagi ahamiyatga ega bo'lishi mumkin.

O'zgaruvchilar o'rtasidagi munosabatlar qanchalik zaif bo'lsa, uni mazmunli aniqlash uchun namuna hajmi shunchalik katta bo'ladi.

Ko'p turli munosabatlar o'lchovlari o'zgaruvchilar orasida. Muayyan tadqiqotda muayyan o'lchovni tanlash o'zgaruvchilar soniga, ishlatiladigan o'lchov shkalalariga, munosabatlarning tabiatiga va boshqalarga bog'liq.

Biroq, ushbu chora-tadbirlarning aksariyati qo'llaniladi umumiy tamoyil: Ular kuzatilayotgan bog'liqlikni ko'rib chiqilayotgan o'zgaruvchilar orasidagi "maksimal mumkin bo'lgan bog'liqlik" bilan solishtirish orqali baholashga harakat qilishadi. Texnik nuqtai nazardan, bunday hisob-kitoblarni amalga oshirishning odatiy usuli - o'zgaruvchilarning qiymatlari qanday o'zgarishini ko'rib chiqish va keyin mavjud bo'lgan umumiy o'zgarishlarning qancha qismini "umumiy" ("qo'shma") o'zgarishlar mavjudligi bilan izohlash mumkinligini hisoblash. ikki (yoki undan ko'p) o'zgaruvchilar.

Muhimligi asosan namuna hajmiga bog'liq. Yuqorida aytib o'tilganidek, juda katta namunalarda o'zgaruvchilar orasidagi juda zaif munosabatlar ham muhim bo'ladi, kichik namunalarda esa hatto juda kuchli munosabatlar ishonchli emas.

Shunday qilib, statistik ahamiyatga egalik darajasini aniqlash uchun har bir tanlama hajmi uchun o'zgaruvchilar o'rtasidagi munosabatlarning "kattaligi" va "ahamiyati" o'rtasidagi munosabatni ifodalovchi funktsiya kerak.

Bunday funktsiya "malum o'lchamdagi namunadagi ma'lum qiymatga (yoki undan ko'p) bog'liqlikni olish ehtimoli qanchalik yuqori ekanligini, agar populyatsiyada bunday bog'liqlik yo'qligini" aniq ko'rsatadi. Boshqacha qilib aytganda, bu funktsiya ahamiyat darajasini beradi
(p-daraja) va shuning uchun populyatsiyada ushbu qaramlikning yo'qligi haqidagi taxminni noto'g'ri rad etish ehtimoli.

Bu "alternativ" gipoteza (populyatsiyada hech qanday munosabat yo'qligi) odatda deyiladi nol gipoteza.

Xatolik ehtimolini hisoblaydigan funktsiya chiziqli bo'lsa va faqat turli xil o'lchamlar uchun turli xil qiyaliklarga ega bo'lsa, ideal bo'lar edi. Afsuski, bu funktsiya ancha murakkab va har doim ham bir xil emas. Biroq, aksariyat hollarda uning shakli ma'lum va ma'lum o'lchamdagi namunalarni o'rganishda ahamiyatlilik darajasini aniqlash uchun ishlatilishi mumkin. Ushbu funktsiyalarning aksariyati deb nomlangan taqsimotlar sinfi bilan bog'liq normal .

Vazifa 3. Beshta maktabgacha yoshdagi bolalarga test topshiriladi. Har bir vazifani hal qilish uchun sarflangan vaqt qayd etiladi. Birinchi uchta test topshirig'ini yechish vaqti o'rtasida statistik jihatdan muhim farqlar topiladimi?

Mavzular soni

Malumot materiali

Bu topshiriq dispersiyani tahlil qilish nazariyasiga asoslanadi. Umuman olganda, dispersiyani tahlil qilish vazifasi eksperiment natijasiga sezilarli ta'sir ko'rsatadigan omillarni aniqlashdan iborat. Dispersiyani tahlil qilish, agar ikkitadan ortiq namunalar mavjud bo'lsa, bir nechta namunalarning o'rtachalarini solishtirish uchun ishlatilishi mumkin. Buning uchun dispersiyaning bir tomonlama tahlili qo'llaniladi.

Belgilangan vazifalarni hal qilish uchun quyidagilar qabul qilinadi. Agar omillar ta'sirida optimallashtirish parametrining olingan qiymatlarining farqlari omillar ta'siri bo'lmaganda natijalarning farqlaridan farq qilsa, bunday omil muhim hisoblanadi.

Muammoni shakllantirishdan ko'rinib turibdiki, bu erda statistik gipotezalarni tekshirish usullari, ya'ni ikkita empirik dispersiyani tekshirish vazifasi qo'llaniladi. Shuning uchun dispersiya tahlili Fisher testi yordamida dispersiyalarni tekshirishga asoslanadi. Ushbu topshiriqda oltita maktabgacha yoshdagi bolalarning har biri tomonidan dastlabki uchta test topshiriqlarini echish vaqti o'rtasidagi farqlar statistik ahamiyatga ega yoki yo'qligini tekshirish kerak.

Nol (asosiy) gipoteza ilgari surilgan gipoteza H o deyiladi. E ning mohiyati taqqoslanayotgan parametrlar orasidagi farq nolga teng (gipotezaning nomi shu sababli - nolga teng) va kuzatilgan farqlar tasodifiy ekanligi haqidagi farazdan kelib chiqadi.

Raqobatchi (alternativ) gipoteza H1 deb ataladi, bu nol gipotezaga ziddir.

Yechim:

A = 0,05 ahamiyatlilik darajasida dispersiya usulini tahlil qilishdan foydalanib, oltita maktabgacha yoshdagi bolalar uchun dastlabki uchta test topshirig'ini yechish vaqti o'rtasida statistik jihatdan muhim farqlar mavjudligi haqidagi nol gipotezani (H o) sinab ko'ramiz.

Keling, topshiriq shartlari jadvalini ko'rib chiqaylik, unda biz uchta test topshirig'ining har birini hal qilish uchun o'rtacha vaqtni topamiz.

Mavzular soni	Faktor darajalari
Mavzular soni	Birinchi test topshirig'ini hal qilish vaqti (sekundlarda).	Ikkinchi test topshirig'ini hal qilish vaqti (sekundlarda).	Uchinchi test topshirig'ini hal qilish vaqti (sekundlarda).






O'rtacha guruh

Umumiy o'rtachani toping:

Har bir testda vaqt farqlarining ahamiyatini hisobga olish uchun tanlovning umumiy dispersiyasi ikki qismga bo'linadi, birinchisi faktorial, ikkinchisi esa qoldiq deb ataladi.

Formuladan foydalanib, umumiy o'rtacha qiymatdan kvadrat og'ishlarning umumiy yig'indisini hisoblaymiz

yoki , bu erda p - test topshiriqlarini echish uchun vaqt o'lchovlari soni, q - test topshiruvchilar soni. Buning uchun kvadratlar jadvalini tuzamiz

Mavzular soni	Faktor darajalari
Mavzular soni	Birinchi test topshirig'ini hal qilish vaqti (sekundlarda).	Ikkinchi test topshirig'ini hal qilish vaqti (sekundlarda).	Uchinchi test topshirig'ini hal qilish vaqti (sekundlarda).

Nima deb o'ylaysiz, sizning "boshqa yarmi"ni o'ziga xos va mazmunli qiladi? Bu uning shaxsiyati bilan bog'liqmi yoki bu odamga bo'lgan his-tuyg'ularingiz bilan bog'liqmi? Yoki, ehtimol, bilan oddiy fakt Tadqiqotlar shuni ko'rsatadiki, sizning hamdardligingizning tasodifiyligi haqidagi gipoteza ehtimoli 5% dan kammi? Agar oxirgi bayonotni ishonchli deb hisoblasak, muvaffaqiyatli tanishuv saytlari printsipial jihatdan mavjud bo'lmaydi:

Split test yoki veb-saytingizning boshqa tahlillarini o'tkazganingizda, "statistik ahamiyatga ega" ni noto'g'ri tushunish natijalarning noto'g'ri talqin qilinishiga va shuning uchun konvertatsiyani optimallashtirish jarayonida noto'g'ri harakatlarga olib kelishi mumkin. Bu har bir mavjud sanoatda har kuni o'tkaziladigan minglab boshqa statistik testlar uchun amal qiladi.

"Statistik ahamiyatga ega" nima ekanligini tushunish uchun siz atama tarixiga sho'ng'ishingiz, uning haqiqiy ma'nosini bilib olishingiz va ushbu "yangi" eski tushuncha tadqiqotingiz natijalarini to'g'ri talqin qilishga qanday yordam berishini tushunishingiz kerak.

Bir oz tarix

Garchi insoniyat ko'p asrlar davomida turli muammolarni hal qilish uchun statistikadan foydalangan bo'lsa-da, statistik ahamiyatga ega bo'lgan zamonaviy tushunchalar, gipotezalarni tekshirish, tasodifiylashtirish va hatto eksperimentlarni loyihalash (DOE) faqat 20-asrning boshlarida shakllana boshladi va bu bilan uzviy bog'liq. Ser Ronald Fisherning ismi (Ser Ronald Fisher, 1890-1962):

Ronald Fisher evolyutsion biolog va statistik bo'lib, hayvon va o'simlik dunyosidagi evolyutsiya va tabiiy tanlanishni o'rganishga alohida ishtiyoqi bor edi. O'zining mashhur faoliyati davomida u ko'plab foydali statistik vositalarni ishlab chiqdi va ommalashtirdi, ulardan biz hozir ham foydalanamiz.

Fisher biologiyadagi hukmronlik, mutatsiyalar va genetik og'ishlar kabi jarayonlarni tushuntirish uchun o'zi ishlab chiqqan usullardan foydalangan. Bugungi kunda biz veb-resurslar tarkibini optimallashtirish va yaxshilash uchun xuddi shu vositalardan foydalanishimiz mumkin. Ushbu tahlil vositalaridan yaratilgan vaqtda hatto mavjud bo'lmagan ob'ektlar bilan ishlashda foydalanish mumkinligi juda hayratlanarli ko'rinadi. Xuddi avvalgidek hayratlanarli murakkab hisob-kitoblar odamlar kalkulyatorlar yoki kompyuterlarsiz bajardilar.

Statistik eksperiment natijalarini haqiqat bo'lish ehtimoli yuqori deb ta'riflash uchun Fisher "ahamiyat" so'zini ishlatgan.

Bundan tashqari, Fisherning eng qiziqarli ishlanmalaridan biri "jinsiy o'g'il" gipotezasi deb atash mumkin. Ushbu nazariyaga ko'ra, ayollar jinsiy aloqada bo'lgan erkaklarni (fohisha) afzal ko'radilar, chunki bu bu erkaklardan tug'ilgan o'g'illarning bir xil moyillikka ega bo'lishiga va ko'proq nasl tug'ishiga imkon beradi (e'tibor bering, bu shunchaki nazariya).

Ammo hech kim, hatto ajoyib olimlar ham xato qilishdan himoyalanmagan. Fisherning kamchiliklari hali ham mutaxassislarni bezovta qilmoqda. Ammo Albert Eynshteynning so'zlarini eslang: "Kim hech qachon xato qilmagan bo'lsa, hech qachon yangi narsa yaratmagan."

Keyingi nuqtaga o'tishdan oldin, esda tuting: statistik ahamiyatga ega bo'lganida, test natijalaridagi farq juda katta bo'lib, farqni tasodifiy omillar bilan izohlab bo'lmaydi.

Sizning gipotezangiz qanday?

"Statistik ahamiyatga ega" nimani anglatishini tushunish uchun, avvalo, "gipoteza testi" nima ekanligini tushunishingiz kerak, chunki bu ikki atama bir-biri bilan chambarchas bog'liq.
Gipoteza shunchaki nazariyadir. Bir nazariyani ishlab chiqqaningizdan so'ng, etarli dalillarni to'plash va haqiqatda bu dalillarni to'plash jarayonini o'rnatishingiz kerak bo'ladi. Gipotezalarning ikki turi mavjud.

Olma yoki apelsin - qaysi biri yaxshiroq?

Nol gipoteza

Qoida tariqasida, bu erda ko'p odamlar qiyinchiliklarga duch kelishadi. Shuni yodda tutish kerakki, null gipoteza isbotlanishi kerak bo'lgan narsa emas, masalan, veb-saytdagi ma'lum bir o'zgarish konversiyalarning ko'payishiga olib kelishini isbotlash kabi, lekin aksincha. Nol gipoteza - bu saytga biron bir o'zgartirish kiritsangiz, hech narsa bo'lmaydi, degan nazariya. Tadqiqotchining maqsadi esa bu nazariyani isbotlash emas, balki rad etishdir.

Agar jinoyatlarni ochish tajribasiga nazar tashlasak, bunda tergovchilar jinoyatchi kim ekanligi to‘g‘risida gipotezalarni ham shakllantiradilar, nol gipoteza aybsizlik prezumpsiyasi deb ataladigan shaklni oladi, unga ko‘ra ayblanuvchi aybi isbotlanmaguncha aybsiz deb hisoblanadi. sudda.

Agar nol gipoteza ikkita ob'ektning xossalari bo'yicha teng bo'lsa va siz ulardan biri yaxshiroq ekanligini isbotlamoqchi bo'lsangiz (masalan, A B dan yaxshiroq), alternativ foydasiga nol gipotezani rad qilishingiz kerak. Masalan, siz u yoki bu konvertatsiyani optimallashtirish vositasini solishtirasiz. Nol gipotezada ularning ikkalasi ham maqsadga bir xil ta'sir ko'rsatadi (yoki hech qanday ta'sir qilmaydi). Shu bilan bir qatorda, ulardan birining ta'siri yaxshiroq.

Sizning muqobil gipotezangiz B - A > 20% kabi raqamli qiymatni o'z ichiga olishi mumkin. Bunday holda, nol gipoteza va muqobil quyidagi shaklni olishi mumkin:

Muqobil gipotezaning yana bir nomi tadqiqot gipotezasidir, chunki tadqiqotchi doimo ushbu maxsus gipotezani isbotlashdan manfaatdor.

Statistik ahamiyatlilik va p qiymati

Keling, yana Ronald Fisherga va uning statistik ahamiyatlilik tushunchasiga qaytaylik.

Endi sizda nol gipoteza va muqobil bor ekan, qanday qilib birini isbotlab, ikkinchisini inkor eta olasiz?

Statistik ma'lumotlar o'zining tabiatiga ko'ra ma'lum bir populyatsiyani (namuna) o'rganishni o'z ichiga olganligi sababli, siz hech qachon olingan natijalarga 100% ishonch hosil qila olmaysiz. Yaxshi misol: saylov natijalari ko'pincha dastlabki so'rovlar va hatto chiqish pullari natijalaridan farq qiladi.

Doktor Fisher sizning tajribangiz muvaffaqiyatli bo'lgan yoki yo'qligini bilish imkonini beruvchi ajratuvchi chiziq yaratmoqchi edi. Ishonchlilik indeksi shunday paydo bo'ldi. Ishonchlilik - bu biz nimani "muhim" deb hisoblaganimizni va nima bo'lmasligimizni aytish uchun oladigan darajamiz. Agar "p" ahamiyatlilik indeksi 0,05 yoki undan kam bo'lsa, natijalar ishonchli bo'ladi.

Xavotir olmang, bu aslida ko'rinadigan darajada chalkash emas.

Gauss ehtimollik taqsimoti. Qirralar bo'ylab o'zgaruvchining kamroq ehtimoliy qiymatlari, markazda esa eng ehtimoliy qiymatlar joylashgan. P-skor (yashil soyali maydon) - kuzatilgan natijaning tasodifan yuzaga kelish ehtimoli.

Oddiy ehtimollik taqsimoti (Gauss taqsimoti) hamma narsani ifodalaydi mumkin bo'lgan qiymatlar grafikdagi ma'lum bir o'zgaruvchi (yuqoridagi rasmda) va ularning chastotalari. Agar siz tadqiqotingizni to'g'ri bajarsangiz va keyin barcha javoblaringizni grafikda chizsangiz, aynan shu taqsimotni olasiz. Oddiy taqsimotga ko'ra, siz shunga o'xshash javoblarning katta foizini olasiz va qolgan variantlar grafikning chetlarida joylashgan bo'ladi ("dumlar" deb ataladi). Qadriyatlarning bunday taqsimoti ko'pincha tabiatda uchraydi, shuning uchun uni "normal" deb atashadi.

Namuna va test natijalariga asoslangan tenglamadan foydalanib, siz "sinov statistikasi" deb ataladigan narsani hisoblashingiz mumkin, bu sizning natijalaringiz qanchalik og'ishganligini ko'rsatadi. Shuningdek, u nol gipoteza haqiqatiga qanchalik yaqin ekanligingizni ham aytib beradi.

Buni tushunishga yordam berish uchun statistik ahamiyatni hisoblash uchun onlayn kalkulyatorlardan foydalaning:

Bunday kalkulyatorlarga misol

"P" harfi nol gipotezaning to'g'ri bo'lish ehtimolini ifodalaydi. Agar raqam kichik bo'lsa, bu test guruhlari orasidagi farqni ko'rsatadi, nol gipoteza esa ular bir xil bo'ladi. Grafik jihatdan, sizning test statistikangiz qo'ng'iroq shaklidagi taqsimotingizning dumlaridan biriga yaqinroq bo'ladi.

Doktor Fisher ahamiyatlilik chegarasini p ≤ 0,05 da belgilashga qaror qildi. Biroq, bu bayonot munozarali, chunki u ikkita qiyinchilikka olib keladi:

1. Birinchidan, siz nol gipoteza noto'g'ri ekanligini isbotlaganingiz muqobil gipotezani isbotlaganingizni anglatmaydi. Bularning barchasi A yoki B ni isbotlay olmasligingizni anglatadi.

2. Ikkinchidan, agar p-bal 0,049 bo'lsa, bu nol gipoteza ehtimoli 4,9% bo'lishini bildiradi. Bu sizning test natijalari bir vaqtning o'zida ham to'g'ri, ham noto'g'ri bo'lishi mumkinligini anglatishi mumkin.

Siz p-skordan foydalanishingiz mumkin yoki undan voz kechishingiz mumkin, lekin keyin sizga har bir narsa kerak bo'ladi maxsus holat Nol gipotezaning to'g'ri bo'lish ehtimolini hisoblang va u siz rejalashtirgan va sinab ko'rgan o'zgarishlarni amalga oshirishga to'sqinlik qiladigan darajada kattami yoki yo'qligini aniqlang.

Bugungi kunda statistik testni o'tkazishning eng keng tarqalgan stsenariysi testni o'tkazishdan oldin p ≤ 0,05 ahamiyatlilik chegarasini belgilashdir. Natijalaringizni tekshirishda p-qiymatiga diqqat bilan qarang.

1 va 2 xatolar

Ko'p vaqt o'tdiki, statistik ahamiyatga ega bo'lgan ko'rsatkichdan foydalanishda yuzaga kelishi mumkin bo'lgan xatolar hatto o'z nomlarini ham oldi.

1-toifa xatolar

Yuqorida aytib o'tilganidek, p-qiymati 0,05, nol gipotezaning to'g'ri bo'lish ehtimoli 5% ni bildiradi. Agar shunday qilmasangiz, 1-sonli xatoga yo'l qo'ygan bo'lasiz. Natijalar shuni ko'rsatadiki, yangi veb-saytingiz konversiya stavkalaringizni oshirgan, ammo bunday bo'lmasligi ehtimoli 5%.

2-turdagi xatolar

Bu xato 1-xatoning teskarisi: nol gipoteza noto'g'ri bo'lsa, uni qabul qilasiz. Masalan, test natijalari shuni ko'rsatadiki, saytga kiritilgan o'zgarishlar hech qanday yaxshilanishlar keltirmagan, ammo o'zgarishlar mavjud. Natijada siz o'z ish faoliyatini yaxshilash imkoniyatini qo'ldan boy berasiz.

Bu xato namuna hajmi yetarli bo‘lmagan testlarda keng tarqalgan, shuning uchun esda tuting: namuna qanchalik katta bo‘lsa, natija shunchalik ishonchli bo‘ladi.

Xulosa

Ehtimol, hech bir atama tadqiqotchilar orasida statistik ahamiyatga ega bo'lgan darajada mashhur emas. Sinov natijalari statistik jihatdan ahamiyatli deb topilmasa, oqibatlar konvertatsiya stavkalarining oshishidan kompaniyaning qulashigacha bo'ladi.

Va sotuvchilar o'z resurslarini optimallashtirishda ushbu atamani qo'llaganligi sababli, siz bu nimani anglatishini bilishingiz kerak. Sinov shartlari farq qilishi mumkin, ammo namuna hajmi va muvaffaqiyat mezonlari har doim muhim. Buni eslab qoling.

Statistik ahamiyatlilik yoki ahamiyatlilikning p-darajasi testning asosiy natijasidir

statistik gipoteza. Gapirmoqda texnik til, berilganni olish ehtimoli

umumiy uchun aslida sharti, namunaviy tadqiqot natijasi

Agregatda nol statistik gipoteza to'g'ri - ya'ni hech qanday bog'liqlik yo'q. Boshqacha aytganda, bu

aniqlangan munosabatlarning tasodifiy bo'lishi va mulk emasligi ehtimoli

umumiylik. Bu statistik ahamiyatlilik, ahamiyatlilikning p-darajasi, ya'ni

miqdoriy baholash aloqa ishonchliligi: bu ehtimollik qanchalik past bo'lsa, ulanish shunchalik ishonchli.

Aytaylik, ikkita namunaviy vositani solishtirganda daraja qiymati olindi

statistik ahamiyati p=0,05. Bu shuni anglatadiki, statistik gipotezani sinab ko'rish

aholidagi vositalarning tengligi, agar bu to'g'ri bo'lsa, ehtimollik ekanligini ko'rsatdi

Aniqlangan farqlarning tasodifiy paydo bo'lishi 5% dan oshmaydi. Boshqacha aytganda, agar

ikkita namuna bir xil populyatsiyadan qayta-qayta olingan, keyin 1 da

20 ta holat ushbu namunalar o'rtasidagi bir xil yoki kattaroq farqni aniqlaydi.

Ya'ni, topilgan farqlar tasodifga bog'liq bo'lgan 5% imkoniyat mavjud.

xarakterga ega va agregatning mulki emas.

Nisbatan ilmiy gipoteza statistik ahamiyatga egalik darajasi miqdoriy hisoblanadi

natijalar bo'yicha hisoblangan aloqaning mavjudligi haqidagi xulosaga ishonchsizlik darajasining ko'rsatkichi

bu gipotezani tanlab, empirik tekshirish. P-daraja qiymati qanchalik past bo'lsa, shuncha yuqori bo'ladi

ilmiy farazni tasdiqlovchi tadqiqot natijasining statistik ahamiyati.

Muhimlik darajasiga nima ta'sir qilishini bilish foydalidir. Muhimlik darajasi, qolgan barcha narsalar teng

sharoitlar yuqoriroq (p-daraja qiymati pastroq), agar:

Ulanishning kattaligi (farq) kattaroqdir;

Xususiyat(lar)ning o'zgaruvchanligi kamroq;

Namuna hajmi(lar)i kattaroq.

Bir tomonlama Ikki tomonlama ahamiyatlilik testlari

Agar tadqiqotning maqsadi ikkita umumiy parametrlardagi farqlarni aniqlash bo'lsa

uning turli xil tabiiy sharoitlariga mos keladigan agregatlar ( yashash sharoitlari,

sub'ektlarning yoshi va boshqalar), keyin bu parametrlarning qaysi biri kattaroq bo'lishi ko'pincha noma'lum va

Qaysi biri kichikroq?

Misol uchun, agar siz test natijalarining o'zgaruvchanligi bilan qiziqsangiz va

eksperimental guruhlarda, qoida tariqasida, dispersiya yoki farqning belgisiga ishonch yo'q.

standart og'ishlar o'zgaruvchanlik baholanadigan natijalar. Ushbu holatda

nol gipoteza - dispersiyalarning tengligi va tadqiqotning maqsadi

teskarisini isbotlash, ya'ni. dispersiyalar orasidagi farqlarning mavjudligi. Bunga ruxsat beriladi

farq har qanday belgi bo'lishi mumkin. Bunday farazlar ikki tomonlama deb ataladi.

Ammo ba'zida qiyinchilik parametrning oshishi yoki kamayishini isbotlashdir;

masalan, eksperimental guruhdagi o'rtacha natija nazorat guruhidan yuqori. Qayerda

Farq boshqa belgi bo'lishi mumkinligiga endi ruxsat berilmaydi. Bunday farazlar deyiladi

Bir tomonlama.

Ikki tomonlama gipotezalarni tekshirish uchun foydalaniladigan muhimlik testlari deyiladi

Ikki tomonlama, va bir tomonlama uchun - bir tomonlama.

Muayyan holatda qaysi mezonni tanlash kerakligi haqida savol tug'iladi. Javob

Bu savol rasmiydan tashqarida statistik usullar va butunlay

Tadqiqot maqsadlariga bog'liq. Hech qanday holatda keyin bir yoki boshqa mezonni tanlamasligingiz kerak

Eksperimental ma'lumotlarni tahlil qilish asosida eksperiment o'tkazish, bu mumkin

Noto'g'ri xulosalarga olib keladi. Agar tajriba o'tkazishdan oldin farq bor deb taxmin qilinsa

Taqqoslangan parametrlar ijobiy yoki salbiy bo'lishi mumkin, keyin kerak