Kaip apskaičiuojamas vidurkis. Vidutinių rodiklių apskaičiavimas


Vidurkis yra apibendrintas rodiklis, apibūdinantis tipinį reiškinio lygį. Tai išreiškia objekto, nurodyto populiacijos vienetui, vertę.

Vidutinis yra:

1) būdingiausia objekto vertė gyventojams;

2) populiacijos atributo apimtis, paskirstyta vienodai tarp gyventojų vienetų.

Atributas, kuriam apskaičiuojama vidutinė vertė, statistikoje vadinamas „vidurkiu“.

Vidurkis visada apibendrina kiekybinį bruožo kitimą, t. vidutinėse vertėse užgęsta individualūs populiacijos vienetų skirtumai dėl atsitiktinių aplinkybių. Priešingai nei vidurkis, absoliuti vertė, apibūdinanti atskiro populiacijos vieneto bruožo lygį, neleidžia palyginti bruožo verčių vienetuose, priklausančiuose skirtingoms populiacijoms. Taigi, jei reikia palyginti dviejų įmonių darbuotojų darbo užmokesčio lygius, tada neįmanoma palyginti dviejų skirtingų įmonių darbuotojų atlyginimų. Šioms įmonėms gali būti nebūdingas palyginimui atrinktų darbuotojų darbo užmokestis. Jei palyginsime nagrinėjamų įmonių darbo užmokesčio fondų dydį, tada į darbuotojų skaičių nebus atsižvelgiama, todėl neįmanoma nustatyti, kur yra didesnis darbo užmokesčio lygis. Galų gale galima palyginti tik vidutinius rodiklius, t. kiek vidutiniškai vienas darbuotojas gauna kiekvienoje įmonėje. Taigi reikia apskaičiuoti vidurkį kaip apibendrinančią populiacijos savybę.

Svarbu pažymėti, kad vidurkinimo metu atributo lygių bendra vertė arba jo galutinė vertė (skaičiuojant dinamikos eilutės vidutinius lygius) turėtų išlikti nepakitusi. Kitaip tariant, apskaičiuojant vidutinę vertę, tiriamo bruožo apimtis neturėtų būti iškraipoma, o išraiškos, sukauptos skaičiuojant vidurkį, būtinai turi prasmę.

Vidutinio skaičiavimas yra vienas iš įprastų apibendrinimo būdų; vidurkis neigia tai, kas bendra (tipiška) visiems tiriamos populiacijos vienetams, tuo pačiu ignoruoja atskirų vienetų skirtumus. Kiekviename reiškinyje ir jo raidoje yra atsitiktinumo ir būtinybės derinys. Skaičiuojant vidurkius, atsižvelgiant į didelių skaičių dėsnio veikimą, šansai yra panaikinami, subalansuoti, todėl galima atskirti nuo nereikšmingų reiškinio ypatybių, nuo kiekybinių atributo reikšmių kiekvienu konkrečiu atveju. Gebėjimas atskirti nuo atsitiktinių atskirų verčių, svyravimų ir melo vidurinių vertybių kaip apibendrinančių agregatų savybių.

Kad vidurkis būtų tikrai tipiškas, jis turi būti apskaičiuojamas remiantis tam tikrais principais.

Pasigilinkime į kai kuriuos bendruosius vidurkių naudojimo principus.

1. Reikėtų nustatyti populiacijų, kurias sudaro kokybiškai vienarūšiai vienetai, vidurkį.

2. Vidurkis turėtų būti apskaičiuojamas populiacijai, kurią sudaro pakankamai didelis vienetų skaičius.

3. Rezultatų, kurių vienetai yra normalioje, natūralioje būsenoje, vidurkis turėtų būti apskaičiuojamas.

4. Vidurkis turėtų būti apskaičiuojamas atsižvelgiant į tiriamo rodiklio ekonominį turinį.

5.2. Vidurkių tipai ir kaip juos apskaičiuoti

Dabar apsvarstykime vidutinių verčių tipus, jų skaičiavimo ypatybes ir apimtį. Vidurkiai yra suskirstyti į dvi dideles klases: galios vidurkius, struktūrinius vidurkius.

Galios dėsnio priemonės yra garsiausios ir dažniausiai naudojamos rūšys, tokios kaip geometrinis vidurkis, aritmetinis vidurkis ir vidurkio vidurkis.

Režimas ir mediana laikomi struktūrinėmis priemonėmis.

Pasigrožėkime galios vidurkiais. Galios vidurkiai, atsižvelgiant į pradinių duomenų pateikimą, gali būti paprasti ir įvertinti. Paprastas vidurkis apskaičiuojamas iš nesugrupuotų duomenų ir turi tokią bendrą formą:

,

kur X i - vidutinės savybės parinktys (vertė);

n yra parinkčių skaičius.

Svorio vidurkis apskaičiuojamas pagal sugrupuotus duomenis ir turi bendrą formą

,

čia X i yra vidurkio vidurkio variantas (vertė) arba intervalo, kuriuo matuojamas variantas, vidutinė vertė;

m - vidurkio laipsnio rodiklis;

f i - dažnis, parodantis, kiek kartų padidėja i-e reikšmės vidurkis.

Jei apskaičiuosime visų tipų vidurkius tiems patiems pradiniams duomenims, tada jų vertės bus nevienodos. Čia galioja vidutinio vidurkio mažėjimo taisyklė: didėjant eksponentui m, didėja ir atitinkama vidutinė vertė:

Statistinėje praktikoje dažniau nei kitų rūšių svertiniai vidurkiai naudojami aritmetiniai ir harmoniniai svertiniai vidurkiai.

Galios vidurkių tipai

Maitinimo tipas
vidutinis

Indeksas
laipsnis (m)

Skaičiavimo formulė

Paprasta

Svoris

Harmonika

Geometrinis

Aritmetika

Kvadratinis

Kubinis

Harmoninis vidurkis turi sudėtingesnę konstrukciją nei aritmetinis vidurkis. Harmoninis vidurkis naudojamas skaičiavimams, kai kaip svoriai naudojami ne jungtiniai vienetai - požymio nešiotojai, o šių vienetų sandauga pagal požymio reikšmes (t. Y. M \u003d Xf). Į vidutinį harmoninį prastovą turėtų būti atsižvelgiama nustatant, pavyzdžiui, vidutines darbo jėgos, laiko, medžiagų, tenkančių vienam gamybos vienetui, dalis vienai daliai (trims, keturioms ir tt) įmonėms, darbuotojams, dirbantiems tos pačios rūšies gaminius. , ta pati dalis, produktas.

Pagrindinis vidurkio apskaičiavimo formulės reikalavimas yra tas, kad visi skaičiavimo etapai turi realų pagrindimą; gauta vidutinė vertė turėtų pakeisti individualias kiekvieno objekto atributo reikšmes, nenutraukiant ryšio tarp atskirų ir suvestinių rodiklių. Kitaip tariant, vidutinė vertė turėtų būti apskaičiuojama taip, kad kai kiekviena atskira vidutinio rodiklio vertė būtų pakeista vidutine, kai kuris galutinis suvestinės rodiklis, vienaip ar kitaip susijęs su vidurkiu, išliktų nepakitęs. Ši suma vadinama apibrėžti, nes jo santykio su individualiomis vertėmis pobūdis lemia konkrečią vidurkio apskaičiavimo formulę. Parodykime šią taisyklę naudodamiesi geometrinio vidurkio pavyzdžiu.

Geometrinio vidurkio formulė

jis dažniausiai naudojamas apskaičiuojant vidutinę vertę remiantis individualia santykine dinamika.

Geometrinis vidurkis taikomas, jei pateikiama grandinės santykinė dinamikos reikšmių seka, nurodanti, pavyzdžiui, gamybos apimties padidėjimą, palyginti su praėjusių metų lygiu: i 1, i 2, i 3,…, i n. Akivaizdu, kad praėjusių metų gamybos apimtį lemia pradinis lygis (q 0) ir vėlesnis padidėjimas per metus:

q n \u003d q 0 × i 1 × i 2 × ... × i n.

Paėmę q n kaip apibrėžiamąjį rodiklį ir pakeisdami atskiras dinamikos reikšmes vidurkiais, gausime santykį

Iš čia



Ypatinga vidutinių verčių rūšis - struktūriniai vidurkiai - naudojama tiriant objekto verčių pasiskirstymo eilės vidinę struktūrą, taip pat norint įvertinti vidutinę vertę (galios tipą), jei pagal turimus statistinius duomenis jos apskaičiuoti negalima (pvz., Jei nagrinėjamame pavyzdyje duomenų nebuvo). gamybos apimtį ir išlaidų sumą pagal įmonių grupes).

Rodikliai dažniausiai naudojami kaip struktūriniai vidurkiai mada - dažniausiai pasikartojanti atributo reikšmė - ir mediana - objekto reikšmė, kuri padalija užsakytą jo verčių seką į dvi dalis, kurių skaičius lygus skaičiui. Dėl to vienoje pusėje populiacijos vienetų bruožo vertė neviršija vidutinio lygio, o kitoje pusėje - neviršija.

Jei tiriama ypatybė turi atskiras reikšmes, apskaičiuojant režimą ir mediana nėra jokių ypatingų sunkumų. Jei duomenys apie charakteristikos X reikšmes pateikiami kaip jo pasikeitimo intervalai (intervalų serijos), režimo ir vidurio skaičiavimas tampa šiek tiek sudėtingesnis. Kadangi mediana padalija visą populiaciją į dvi dalis, lygiomis dalimis, paaiškėja, kad ji yra kai kuriuose atributo X intervaluose. Naudojant interpoliaciją, vidutinė reikšmė randama šiame mediana:

,

kur X Me yra apatinė vidutinio intervalo riba;

h Me - jo vertė;

(Suma m) / 2 - pusė viso stebėjimų skaičiaus arba pusė rodiklio tūrio, kuris naudojamas kaip svoris formulėse apskaičiuojant vidurkį (absoliučia ar santykine prasme);

S Me-1 - stebėjimų suma (arba svėrimo bruožo tūris), sukaupta prieš pradedant vidutinę intervalą;

m Me - stebėjimų skaičius arba svėrimo bruožo tūris per vidurį (taip pat absoliučiąja ar santykine prasme).

Skaičiuojant objekto modalinę vertę, remiantis intervalų eilutės duomenimis, reikia atkreipti dėmesį į tai, kad intervalai yra vienodi, nes nuo to priklauso požymio X verčių pakartojamumo rodiklis. Intervalu serijai su vienodais intervalais režimo vertė nustatoma taip:

,

kur X Mo yra apatinė modalinio intervalo vertė;

m Mo - stebėjimų skaičius arba svėrimo ypatybės tūris modaliniame intervale (absoliučia arba santykine prasme);

m Mo-1 - tas pats intervalas prieš modalą;

m Mo + 1 - tas pats intervalas po modulio;

h - bruožo pokyčių intervalo vertė grupėse.

1 PROBLEMA

Turimi šie ataskaitinių metų pramonės įmonių grupės duomenys


įmonėms

Gamybos apimtis, milijonas rublių

Vidutinis darbuotojų, žmonių skaičius

Pelnas, tūkstantis rublių

197,7

10,0

13,5

22,8

1500

136,2

465,5

18,4

1412

97,6

296,2

12,6

1200

44,4

584,1

22,0

1485

146,0

480,0

119,0

1420

110,4

57805

21,6

1390

138,7

204,7

30,6

466,8

19,4

1375

111,8

292,2

113,6

1200

49,6

423,1

17,6

1365

105,8

192,6

30,7

360,5

14,0

1290

64,8

280,3

10,2

33,3

Reikalaujama, kad būtų keičiamasi įmonių grupe, atsižvelgiant į šiuos intervalus:

    iki 200 milijonų rublių.

    nuo 200 iki 400 milijonų rublių.

  1. nuo 400 iki 600 milijonų rublių.

    Kiekvienai grupei ir visoms kartu nustatykite įmonių skaičių, gamybos apimtį, vidutinį darbuotojų skaičių, vidutinę produkciją, tenkančią vienam darbuotojui. Grupavimo rezultatai pateikiami statistinės lentelės pavidalu. Suformuluokite išvadą.

    SPRENDIMAS

    Sugrupuokime įmones produktų mainams, apskaičiuokite įmonių skaičių, gamybos apimtį, vidutinį darbuotojų skaičių, naudodami paprastą vidurkio formulę. Grupavimo ir skaičiavimų rezultatai yra apibendrinti lentelėje.

    Grupuoti pagal produkto kiekį


    įmonėms

    Gamybos apimtis, milijonas rublių

    Vidutinė metinė ilgalaikio turto kaina, mln. Rublių

    Srednespi

    sultingas darbuotojų skaičius, žmonės

    Pelnas, tūkstantis rublių

    Vidutinis produkcijos kiekis, tenkantis vienam darbuotojui

    1-oji grupė

    iki 200 milijonų rublių.

    1,8,12

    197,7

    204,7

    192,6

    10,0

    9,4

    8,8

    900

    817

    13,5

    30,6

    30,7

    28,2

    2567

    74,8

    0,23

    Vidurinis lygis

    198,3

    24,9

    2-oji grupė

    nuo 200 iki 400 milijonų rublių.

    4,10,13,14

    196,2

    292,2

    360,5

    280,3

    12,6

    113,6

    14,0

    10,2

    1200

    1200

    1290

    44,4

    49,6

    64,8

    33,3

    1129,2

    150,4

    4590

    192,1

    0,25

    Vidurinis lygis

    282,3

    37,6

    1530

    64,0

    3 grupė

    nuo 400 iki

    600 milijonų

    2,3,5,6,7,9,11

    592

    465,5

    584,1

    480,0

    578,5

    466,8

    423,1

    22,8

    18,4

    22,0

    119,0

    21,6

    19,4

    17,6

    1500

    1412

    1485

    1420

    1390

    1375

    1365

    136,2

    97,6

    146,0

    110,4

    138,7

    111,8

    105,8

    3590

    240,8

    9974

    846,5

    0,36

    Vidurinis lygis

    512,9

    34,4

    1421

    120,9

    Iš viso iš viso

    5314,2

    419,4

    17131

    1113,4

    0,31

    Gyventojų vidurkis

    379,6

    59,9

    1223,6

    79,5

    Išėjimas. Taigi iš visų nagrinėjamų duomenų daugiausiai įmonių pagal produkciją pateko į trečiąją grupę - septynias, arba pusę įmonių. Šios grupės ilgalaikio turto vidutinių metinių išlaidų vertė, taip pat didelė vidutinio darbuotojų skaičiaus vertė - 9 974 žmonės, mažiausiai pelningos pirmosios grupės įmonės.

    2 PROBLEMA

    Yra šie duomenys apie įmonės įmones

    Įmonės numeris

    I ketvirtis

    II ketvirtis

    Gamybos produkcija, tūkstantis rublių

    Dirba darbininkai keletą dienų

    Vidutinė vieno darbuotojo produkcija per dieną, rubliai

    59390,13

Vidutinė vertė yra apibendrinantis rodiklis, apibūdinantis kokybiškai vienalytę populiaciją tam tikram kiekybiniam kriterijui nustatyti. Pavyzdžiui, vidutinis asmenų, nuteistų už vagystes, amžius.

Teismo medicinos statistikoje vidurkiai naudojami apibūdinti:

Vidutinės šios kategorijos bylų nagrinėjimo sąlygos;

Vidutinio dydžio ieškinys;

Vidutinis respondentų skaičius kiekvienoje byloje;

Vidutinė žala;

Vidutinis teisėjų darbo krūvis ir kt.

Vidurkis visada yra vardinė reikšmė ir turi tą patį matmenį kaip ir atskiro populiacijos vieneto charakteristika. Kiekviena vidutinė vertė apibūdina tiriamąją populiaciją pagal bet kurį skirtingą požymį, todėl už bet kurio vidurkio yra šios populiacijos vienetų pasiskirstymo serija pagal tiriamąjį požymį. Vidurkio tipo pasirinkimą lemia rodiklio turinys ir pradiniai vidurkio apskaičiavimo duomenys.

Visų tipų statistiniams tyrimams naudojami vidurkiai skirstomi į dvi kategorijas:

1) galios vidurkiai;

2) struktūriniai vidurkiai.

Pirmąją vidurkių kategoriją sudaro: aritmetinis vidurkis, harmoninis vidurkis, geometrinis vidurkis ir šaknies vidurkis kvadratas ... Antroji kategorija yra madair mediana ... Be to, kiekviena iš išvardytų galios įstatymų tipų reikšmių gali būti dviejų formų: paprasta ir svertinis ... Tiriamojo požymio vidutinei vertei gauti naudojama paprasta vidurkio forma, kai skaičiavimas atliekamas naudojant nesugrupuotus statistinius duomenis arba kai kiekviena jungtinio varianto galimybė pasireiškia tik vieną kartą. Svertiniai vidurkiai vadinami reikšmėmis, kuriomis atsižvelgiama į tai, kad atributo reikšmių parinktys gali turėti skirtingus skaičius, su kuriomis kiekviena galimybė turi būti padauginta iš atitinkamo dažnio. Kitaip tariant, kiekviena parinktis yra „įvertinta“ pagal dažnį. Dažnis vadinamas statistiniu svoriu.

Paprastas aritmetinis vidurkis- labiausiai paplitusi terpės rūšis. Ji yra lygi individualių charakteristikų verčių sumai, padalytai iš bendro šių verčių:

kur x 1, x 2, ..., x N - individualios kintamojo atributo vertės (parinktys), o N - vienetų skaičius populiacijoje.

Svertinis aritmetinis vidurkis jis naudojamas tais atvejais, kai duomenys pateikiami paskirstymo serijų ar grupių pavidalu. Jis apskaičiuojamas kaip variantų sandauga iš atitinkamų dažnių sumos, padalyta iš visų variantų dažnių sumos:

kur x i- vertė i-tieji bruožo variantai; f i - dažnis i-osios galimybės.

Taigi kiekvieno varianto reikšmė yra sveriama pagal jo dažnį, todėl dažniai kartais vadinami statistiniais svoriais.


Komentuok.Kai kalbama apie aritmetinį vidurkį, nenurodant jo rūšies, turimas galvoje paprastas aritmetinis vidurkis.

12 lentelė.

Sprendimas.Skaičiavimui naudojame aritmetinio svertinio vidurkio formulę:

Taigi vidutiniškai kiekvienoje baudžiamojoje byloje yra du kaltinamieji.

Jei vidutinė vertė apskaičiuojama pagal duomenis, sugrupuotus kaip paskirstymo intervalų eilutė, tada pirmiausia reikia nustatyti kiekvieno intervalo x "i medianos vidurkius, o tada apskaičiuoti vidutinę vertę pagal svertinę aritmetinę vidurkio formulę, kurioje x" i yra pakeista x i.

Pavyzdys.Duomenys apie vagysčių nuteistų nusikaltėlių amžių pateikti lentelėje:

13 lentelė.

Nustatykite nusikaltėlių, nuteistų už vagystę, vidutinį amžių.

Sprendimas.Norint nustatyti vidutinį nusikaltėlių amžių remiantis intervalų variacijų eilėmis, pirmiausia reikia surasti intervalų vidurkius. Kadangi pateikiamos intervalų eilutės su atviraisiais pirmaisiais ir paskutiniaisiais intervalais, šių intervalų vertės yra lygios gretimų uždarų intervalų vertėms. Mūsų atveju pirmojo ir paskutiniojo intervalo reikšmės yra lygios 10.

Dabar vidutinis nusikaltėlių amžius nustatomas pagal aritmetinį svertinį vidurkį:

Taigi už vagystę nuteistų nusikaltėlių amžiaus vidurkis yra maždaug 27 metai.

Vidutinė harmonika paprasta yra atributo savybių abipusių verčių aritmetinis vidurkis:

kur 1 / x i yra abipusės pasirinkimo vertės, o N - vienetų skaičius populiacijoje.

Pavyzdys. Siekiant nustatyti vidutinį metinį apygardos teismo teisėjų darbo krūvį nagrinėjant baudžiamąsias bylas, buvo atliktas 5 šio teismo teisėjų tyrimas. Vidutinis kiekvienos apklaustų teisėjų vienos baudžiamosios bylos nagrinėjimo laikas (dienomis) buvo lygus: 6, 0, 5, 6, 6, 3, 4, 9, 5, 4. Raskite vidutines vienos baudžiamosios bylos išlaidas ir vidutinį metinį darbo krūvį. prieš šio apylinkės teismo teisėjus, nagrinėjant baudžiamąsias bylas.

Sprendimas.Norėdami nustatyti vidutinį vienos baudžiamosios bylos nagrinėjimo laiką, naudosime paprastą harmoninio vidurkio formulę:

Norėdami supaprastinti skaičiavimus, pavyzdyje imame dienų skaičių per metus, lygų 365, įskaitant savaitgalius (tai neturi įtakos skaičiavimo metodikai, o praktikoje skaičiuojant panašų rodiklį, reikia pakeisti konkrečių metų darbo dienų skaičių, o ne 365 dienas). Tuomet vidutinis metinis šio apylinkės teismo teisėjų krūvis svarstant baudžiamąsias bylas bus: 365 (dienos): 5,56 ≈ 65,6 (bylos).

Jei vidutinei vienos baudžiamosios bylos nagrinėjimo trukmei nustatyti taikytume paprastą aritmetinę vidurkio formulę, gautume:

365 (dienos): 5,64 ≈ 64,7 (atvejai), t.y. vidutinis teisėjų darbo krūvis buvo mažesnis.

Patikrinkime šio požiūrio pagrįstumą. Norėdami tai padaryti, naudosime duomenis apie laiką, kurį kiekvienam teisėjui buvo skirta viena baudžiamoji byla, ir apskaičiuosime kiekvieno iš jų nagrinėjamų baudžiamųjų bylų skaičių per metus.

Mes atitinkamai gauname:

365 (dienos): 6 ≈ 61 (atvejai), 365 (dienos): 5,6 ≈ 65,2 (atvejai), 365 (dienos): 6,3 ≈ 58 (atvejai),

365 (dienos): 4,9 ≈ 74,5 (atvejai), 365 (dienos): 5,4 ≈ 68 (atvejai).

Dabar apskaičiuokime vidutinį metinį konkretaus apygardos teismo teisėjų darbo krūvį nagrinėjant baudžiamąsias bylas:

Tie. vidutinė metinė apkrova yra tokia pati kaip naudojant harmoninį vidurkį.

Taigi aritmetinio vidurkio naudojimas šiuo atveju yra neteisėtas.

Tais atvejais, kai žinomi ypatybės variantai, jų tūrinės vertės (variantų sandauga pagal dažnį), bet patys dažniai nežinomi, taikoma harmoninio svertinio vidurkio formulė:

,

kur x i yra funkcijų variantų vertės, o w i yra parinkčių tūrinės vertės ( w i \u003d x i f i).

Pavyzdys. Duomenys apie tos pačios rūšies prekės vieneto kainą, pagamintą įvairių bausmių vykdymo sistemos institucijų, ir apie jo pardavimo apimtį pateikti 14 lentelėje.

14 lentelė

Raskite vidutinę produkto pardavimo kainą.

Sprendimas.Apskaičiuodami vidutinę kainą, turime naudoti parduotos sumos ir parduotų vienetų santykį. Mes nežinome parduotų vienetų skaičiaus, tačiau mes žinome, kiek prekių parduota. Todėl norėdami rasti vidutinę parduotų prekių kainą, naudojame harmoninio svertinio vidurkio formulę. Mes gauname

Jei čia naudojate aritmetinę vidurkio formulę, galite gauti vidutinę kainą, kuri bus nerealu:

Geometrinis vidurkis apskaičiuojamas atimant N laipsnio šaknį iš visų atributo variantų verčių sandaugos:

,

kur x 1, x 2, ..., x N - individualios kintamojo atributo vertės (parinktys) ir

N- vienetų skaičius populiacijoje.

Šis vidurkio tipas naudojamas apskaičiuojant vidutinius laiko eilučių augimo tempus.

Vidutinis kvadratasnaudojamas apskaičiuoti standartiniam nuokrypiui, kuris yra variacijos matas, ir bus aptartas toliau.

Populiacijos struktūrai nustatyti naudojami specialūs vidurkiai, į kuriuos įeina mediana ir mada , arba vadinamieji struktūriniai vidurkiai. Jei aritmetinis vidurkis apskaičiuojamas pagal visų atributo verčių variantų naudojimą, tada mediana ir režimas apibūdina varianto vertę, kuri užima tam tikrą vidutinę poziciją reitinguojamoje (užsakytoje) serijoje. Statistinės populiacijos vienetus galima tirti tiriamos charakteristikos variantų didėjimo ar mažėjimo tvarka.

Vidutinė (aš) yra reikšmė, atitinkanti variantą reitinguojamos serijos viduryje. Taigi, mediana yra klasifikuotos serijos variantas, kurio abiejose pusėse turėtų būti vienodas populiacijos vienetų skaičius nurodytoje serijoje.

Norėdami rasti mediana, pirmiausia turite nustatyti eilės skaičių eiliškumo eilutėje pagal formulę:

kur N yra serijos tūris (vienetų skaičius populiacijoje).

Jei seriją sudaro nelyginis narių skaičius, tada mediana yra lygi variantui su skaičiumi N Me. Jei seką sudaro lyginis narių skaičius, mediana nustatoma kaip dviejų gretimų variantų, esančių viduryje, aritmetinis vidurkis.

Pavyzdys.Atsižvelgiant į 1, 2, 3, 3, 6, 7, 9, 9, 10 eilutes, eilutės tūris yra N \u003d 9, taigi N Me \u003d (9 + 1) / 2 \u003d 5. Todėl Me \u003d 6, tai yra ... penktas variantas. Jei eilutei suteikiama 1, 5, 7, 9, 11, 14, 15, 16, t.y. serija su lyginiu narių skaičiumi (N \u003d 8), tada N Me \u003d (8 + 1) / 2 \u003d 4,5. Taigi mediana yra lygi ketvirtojo ir penktojo variantų pusės sumai, t. Aš \u003d (9 + 11) / 2 \u003d 10.

Diskretinės variacijos eilutėje mediana nustatoma pagal sukauptus dažnius. Varianto dažniai, pradedant nuo pirmojo, pridedami, kol bus viršytas mediana. Paskutinio apibendrinto varianto vertė bus mediana.

Pavyzdys.Naudodamiesi 12 lentelės duomenimis, raskite vidutinį kaltinamųjų skaičių kiekvienoje baudžiamojoje byloje.

Sprendimas.Tokiu atveju variacijos eilutės tūris yra N \u003d 154, todėl N Me \u003d (154 + 1) / 2 \u003d 77,5. Susumavus pirmojo ir antrojo variantų dažnius, gauname: 75 + 43 \u003d 118, t.y. mes pranokome vidutinį skaičių. Vadinasi, aš \u003d 2.

Intervalo kitimo serijoje pasiskirstymas pirmiausia nurodo intervalą, kuriame bus mediana. Jis vadinamas mediana ... Tai yra pirmasis intervalas, kurio sukauptas dažnis viršija pusę intervalo variacijų eilės tūrio. Tuomet medianos skaitinė vertė nustatoma pagal formulę:

kur x aš - apatinė vidutinio intervalo riba; i yra vidutinio intervalo vertė; S Me-1 - kumuliacinis intervalo, einančio prieš medianą, dažnis; f Aš yra vidutinio intervalo dažnis.

Pavyzdys.Remdamiesi 13 lentelėje pateiktais statistiniais duomenimis, sužinokite už vagystę nuteistų pažeidėjų vidutinį amžių.

Sprendimas.Statistiniai duomenys pateikiami intervalų kitimo seka, taigi pirmiausia nustatome vidutinį intervalą. Populiacijos tūris yra N \u003d 162, todėl vidutinis intervalas yra intervalas 18-28, nes tai yra pirmasis intervalas, kurio sukauptas dažnis (15 + 90 \u003d 105) viršija pusę intervalo variacijų eilės tūrio (162: 2 \u003d 81). Dabar medianos skaitinė vertė nustatoma pagal aukščiau pateiktą formulę:

Taigi pusė nuteistųjų už vagystes yra jaunesni nei 25 metų.

Modoy (Moe) vadinkite atributo verte, kuri dažniausiai nustatoma populiacijos vienetais. Mada naudojama nustatyti dažniausiai pasitaikantį bruožą. Atskiros serijos režimas bus tas, kurio dažnis yra didžiausias. Pavyzdžiui, 3 lentelėje pateiktai atskirai serijai Moe\u003d 1, nes ši variantų reikšmė atitinka aukščiausią dažnį - 75. Norėdami nustatyti intervalų serijos režimą, pirmiausia nustatykite modalinis intervalas (intervalas su aukščiausiu dažniu). Tada per šį intervalą nustatoma objekto vertė, kuri gali būti režimas.

Jo vertė nustatoma pagal formulę:

kur x Mo - apatinė modalinio intervalo riba; i yra modalinio intervalo vertė; f Mo- modalinio intervalo dažnis; f Mo-1 - intervalo prieš modalą dažnis; f Mo + 1 yra intervalo, einančio po modalo, dažnis.

Pavyzdys.Nusikaltėlių, nuteistų už vagystes, naktinis amžius, duomenys apie juos pateikti 13 lentelėje.

Sprendimas.Didžiausias dažnis atitinka intervalą 18–28, todėl režimas turi būti šiame intervale. Jo vertė nustatoma pagal aukščiau pateiktą formulę:

Taigi didžiausias nusikaltėlių, nuteistų už vagystes, skaičius yra 24 metai.

Vidutinė vertė suteikia apibendrinančią viso tiriamojo reiškinio aibę. Tačiau dvi populiacijos, kurių vidutinės vertės yra vienodos, gali labai skirtis viena nuo kitos pagal tiriamo požymio vertės kintamumą (kitimą). Pavyzdžiui, viename teisme buvo paskirtos šios laisvės atėmimo bausmės: 3, 3, 3, 4, 5, 5, 5, 12, 12, 15 metų, kitame - 5, 5, 6, 6, 7, 7, 7 , 8, 8, 8 metai. Abiem atvejais aritmetinis vidurkis yra 6,7 \u200b\u200bmetų. Tačiau šios grupės labai skiriasi viena nuo kitos pagal paskirtos laisvės atėmimo bausmės individualių verčių intervalą, palyginti su vidutine verte.

O pirmojo teismo proceso metu, kai šis išplitimas yra gana didelis, vidutinė laisvės atėmimo bausmės vertė menkai atspindi visus gyventojus. Taigi, jei atskiros bruožo reikšmės mažai skiriasi viena nuo kitos, tada aritmetinis vidurkis bus gana orientacinis tam tikros populiacijos savybių požymis. Priešingu atveju aritmetinis vidurkis bus nepatikima šio rinkinio charakteristika, o jo taikymas praktikoje neveiksmingas. Todėl būtina atsižvelgti į tiriamo požymio verčių pokyčius.

Variacija - tai yra objekto verčių skirtumai skirtingiems tam tikros populiacijos vienetams tuo pačiu laikotarpiu ar tam tikru momentu. Terminas „variacija“ turi lotynišką kilmę - variatio, kuris reiškia skirtumą, pokyčius, svyravimus. Tai atsiranda dėl to, kad individualios bruožo reikšmės formuojasi kaupiantis įvairiems veiksniams (sąlygoms), kurie kiekvienu atskiru atveju yra derinami skirtingai. Objekto kitimui įvertinti naudojami įvairūs absoliutūs ir santykiniai rodikliai.

Pagrindiniai pokyčių rodikliai yra šie:

1) variacijos diapazonas;

2) vidutinis tiesinis nuokrypis;

3) dispersija;

4) standartinis nuokrypis;

5) variacijos koeficientas.

Trumpai pagulėkime prie kiekvieno iš jų.

Perbraukimas variantas R yra labiausiai prieinamas skaičiavimo paprastumas, absoliutus rodiklis, kuris apibūdinamas kaip skirtumas tarp didžiausių ir mažiausių bruožo verčių tam tikros populiacijos vienetuose:

Variacijos diapazonas (svyravimų intervalas) yra svarbus bruožo kintamumo rodiklis, tačiau tai leidžia pamatyti tik kraštutinius nuokrypius, o tai riboja jo taikymo sritį. Norint tiksliau apibūdinti objekto variaciją, atsižvelgiant į jo kintamumą, naudojami kiti rodikliai.

Vidutinis tiesinis nuokrypisyra atskirų atributo reikšmių nuokrypių nuo vidurkio absoliučių verčių aritmetinis vidurkis, kuris nustatomas pagal formules:

1) dėl negrupuoti duomenys

2) dėl variacijų serija

Tačiau labiausiai paplitęs variacijos matas yra sklaida ... Tai apibūdina tiriamo požymio verčių, palyginti su jo vidutine verte, pasiskirstymo matas. Variacija apibūdinama kaip kvadratinių nuokrypių vidurkis.

Paprastas dispersija nesugrupuotiems duomenims:

.

Svertinis dispersija variacijų serijai:

Komentuok.Praktiškai dispersijai apskaičiuoti geriau naudoti šias formules:

Dėl paprasto dispersijos

.

Svertiniam dispersijai

Standartinis nuokrypis yra dispersijos kvadratinė šaknis:

Standartinis nuokrypis yra vidurkio patikimumo matas. Kuo mažesnis standartinis nuokrypis, tuo vienalytesnė populiacija ir tuo geresnis aritmetinis vidurkis atspindi visą populiaciją.

Aukščiau nagrinėtos išsklaidymo priemonės (kitimo diapazonas, dispersija, standartinis nuokrypis) yra absoliutūs rodikliai, pagal kuriuos ne visada galima įvertinti bruožo kintamumo laipsnį. Kai kuriose užduotyse būtina naudoti santykinius išsibarstymo indeksus, iš kurių vienas yra variacijos koeficientas.

Variacijos koeficientas - išreikštas procentais, standartinio nuokrypio ir aritmetinio vidurkio santykis:

Variacijos koeficientas naudojamas ne tik palyginamuoju skirtingų bruožų ar tos pačios savybės kitimo skirtingose \u200b\u200bpopuliacijose įvertinimu, bet ir apibūdinant populiacijos homogeniškumą. Statistinė grupė laikoma kiekybiškai homogeniška, jei variacijos koeficientas neviršija 33% (pasiskirstymams artima normaliam pasiskirstymui).

Pavyzdys.Apie 50 nuteistųjų, paskirtų atlikti teismo paskirtą bausmę bausmės vykdymo atidėjimo sistemoje, įkalinimo terminų yra šie duomenys: 5, 4, 2, 1, 6, 3, 4, 3, 2, 2, 5, 6, 4, 3 , 10, 5, 4, 1, 2, 3, 3, 4, 1, 6, 5, 3, 4, 3, 5, 12, 4, 3, 2, 4, 6, 4, 4, 3, 1 , 5, 4, 3, 12, 6, 7, 3, 4, 5, 5, 3.

1. Sudarykite daugybę paskirstymų pagal laisvės atėmimo bausmes.

2. Raskite vidurkį, dispersiją ir standartinį nuokrypį.

3. Apskaičiuokite variacijos koeficientą ir padarykite išvadą apie tiriamos populiacijos homogeniškumą ar heterogeniškumą.

Sprendimas.Norint sukonstruoti diskretinę paskirstymo seką, būtina nustatyti variantus ir dažnius. Šios problemos variantas yra įkalinimo terminas, o dažnis - atskirų variantų skaičius. Apskaičiavę dažnius, gauname šias atskiras paskirstymo eiles:

Raskite vidurkį ir dispersiją. Kadangi statistiniai duomenys pateikiami atskira variacijų seka, joms apskaičiuoti naudosime svertinio aritmetinio vidurkio ir dispersijos formules. Mes gauname:

= = 4,1;

= 5,21.

Dabar mes apskaičiuojame standartinį nuokrypį:

Raskite variacijos koeficientą:

Taigi statistinė grupė yra kiekybiškai nevienalytė.

Pagal discipliną: Statistika

2 variantas

Vidutinės statistikoje naudojamos vertės

Įvadas ………………………………………………………………………… .3

Teorinė užduotis

Vidutinė statistikos vertė, jos esmė ir naudojimo sąlygos.

1.1. Vidutinio dydžio ir naudojimo sąlygų esmė ...................... 4

1.2. Vidutinių verčių tipai …………………………………………… 8

Praktinė užduotis

1,2,3 užduotis ……………………………………………………………………… 14

Išvada ……………………………………………………………………… .21

Naudotos literatūros sąrašas …………………………………………… ... 23

Įvadas

Šį testą sudaro dvi dalys - teorinė ir praktinė. Teorinėje dalyje bus detaliai nagrinėjama tokia svarbi statistinė kategorija kaip vidurkis, siekiant nustatyti jos esmę ir naudojimo sąlygas, taip pat išryškinti vidurkių tipus ir jų apskaičiavimo metodus.

Kaip žinote, statistika tiria masinius socialinius ir ekonominius reiškinius. Kiekvienas iš šių reiškinių gali turėti skirtingą to paties požymio kiekybinę išraišką. Pavyzdžiui, tos pačios profesijos darbuotojų atlyginimai arba kainos to paties produkto rinkoje ir pan. Vidutinės vertės apibūdina komercinės veiklos kokybinius rodiklius: paskirstymo kaštai, pelnas, pelningumas ir kt.

Norėdami ištirti įvairius kintamųjų (kiekybiškai kintančius) požymius, statistika naudoja vidurkius.

Vidutinė esmė

Vidutinė reikšmė yra apibendrinanti kiekybinė to paties tipo reiškinių charakteristika pagal vieną kintantį požymį. Ekonominėje praktikoje naudojami įvairūs rodikliai, apskaičiuojami kaip vidurkiai.

Svarbiausia vidurkio savybė yra ta, kad jis žymi tam tikro požymio vertę visame rinkinyje vienu skaičiumi, nepaisant jo kiekybinių skirtumų atskiruose rinkinio vienetuose, ir išreiškia bendrąją, būdingą visiems tiriamojo rinkinio vienetams. Taigi per populiacijos vieneto ypatybes jis apibūdina visą populiaciją kaip visumą.

Vidutinės vertės yra susijusios su daugybės dėsniu. Šio ryšio esmė slypi tame, kad atliekant vidurkinimą, atsitiktiniai atskirų verčių nuokrypiai dėl didelių skaičių dėsnio veikimo panaikina vienas kitą ir vidutiniškai išryškėja pagrindinė raidos tendencija, būtinumas, tvarkingumas. Vidurkiai leidžia palyginti rodiklius, susijusius su populiacijomis, su skirtingu vienetų skaičiumi.

Šiuolaikinėmis rinkos santykių plėtros sąlygomis ekonomikoje vidurkiai yra priemonė tiriant objektyvius socialinių ir ekonominių reiškinių dėsnius. Tačiau ekonominė analizė neturėtų apsiriboti vien tik vidurkiais, nes bendri palankūs vidurkiai gali paslėpti ir didelius rimtus atskirų ūkio subjektų veiklos trūkumus, ir naujo, progresyvaus augimą. Pavyzdžiui, gyventojų pasiskirstymas pagal pajamas leidžia nustatyti naujų socialinių grupių formavimąsi. Todėl kartu su vidutiniais statistiniais duomenimis būtina atsižvelgti ir į atskirų populiacijos vienetų ypatybes.

Vidutinė vertė yra visų veiksnių, turinčių įtakos tiriamajam reiškiniui, rezultatas. T. y., Apskaičiuojant vidutines reikšmes, abipusiai pašalinama atsitiktinių (perturbatyvių, individualių) veiksnių įtaka ir tokiu būdu galima nustatyti tiriamo reiškinio būdingą dėsningumą. Adolphe'as Quetelet pabrėžė, kad vidutinių verčių metodo reikšmė slypi galimybėje pereiti nuo pavienio prie bendro, nuo atsitiktinio prie reguliaraus, o vidutinių verčių buvimas yra objektyvios tikrovės kategorija.

Statistika tiria masinius reiškinius ir procesus. Kiekvienas iš šių reiškinių turi tiek bendrą visumą, tiek ypatingas, individualias savybes. Atskirų reiškinių skirtumas yra vadinamas variacija. Kita masinių reiškinių savybė yra būdingas atskirų reiškinių savybių artumas. Taigi aibės elementų sąveika lemia bent dalies jų savybių kitimo apribojimą. Ši tendencija egzistuoja objektyviai. Būtent objektyvumas ir lemia platų vidutinių verčių pritaikymą praktikoje ir teorijoje.

Vidutinė statistikos vertė vadinama apibendrinančiuoju rodikliu, apibūdinančiu tipinį reiškinio lygį konkrečiomis vietos ir laiko sąlygomis, atspindinčiu skirtingo požymio vertę kokybiškai vienalytės populiacijos vienetui.

Ekonominėje praktikoje naudojami įvairūs rodikliai, apskaičiuojami kaip vidurkiai.

Naudojant vidurkių metodą, statistika išsprendžia daugelį problemų.

Pagrindinę vidurkių reikšmę sudaro jų apibendrinamoji funkcija, tai yra, daugelio skirtingų individualių bruožo reikšmių pakeitimas vidurkiu, apibūdinančiu visą reiškinių rinkinį.

Jei vidurkis apibendrina kokybiškai vienarūšes objekto reikšmes, tai yra tipinė ypatybės savybė tam tikroje populiacijoje.

Tačiau neteisinga mažinti vidutinių verčių vaidmenį tik atsižvelgiant į tipiškas charakteristikų verčių savybes populiacijose, homogeniškas tam tikros charakteristikos atžvilgiu. Praktiškai šiuolaikinėje statistikoje daug dažniau naudojami vidurkiai, apibendrinantys akivaizdžiai vienarūšius reiškinius.

Vidutinės nacionalinės pajamos vienam gyventojui, vidutinis grūdinių kultūrų derlius visoje šalyje, vidutinis įvairių maisto produktų suvartojimas - tai yra valstybės, kaip vienos nacionalinės ekonominės sistemos, savybės, tai yra vadinamieji sistemos vidurkiai.

Sistemos vidurkiai gali apibūdinti tiek erdvines, tiek objektines sistemas, egzistuojančias vienu metu (valstybė, pramonė, regionas, Žemė ir kt.), Ir dinamines sistemas, kurios praplečiamos laiku (metai, dešimtmetis, sezonas ir kt.).

Svarbiausia vidurkio savybė yra tai, kad jis atspindi bendrąją reikšmę, būdingą visiems tiriamos populiacijos vienetams. Atskirų populiacijos vienetų bruožo vertės svyruoja viena ar kita kryptimi veikiamos daugelio veiksnių, tarp kurių gali būti ir pagrindinių, ir atsitiktinių. Pavyzdžiui, visos korporacijos akcijų kainą lemia jos finansinė padėtis. Tuo pačiu metu tam tikromis dienomis ir tam tikrose vertybinių popierių biržose dėl esamų aplinkybių šios akcijos gali būti parduodamos didesniu ar mažesniu kursu. Vidurkio esmė slypi tame, kad jis kompensuoja atskirų populiacijos vienetų atributo reikšmių nuokrypius dėl atsitiktinių veiksnių veikimo ir atsižvelgia į pokyčius, kuriuos sukelia pagrindinių veiksnių veiksmai. Tai leidžia vidurkiui atspindėti tipišką bruožo lygį ir abstrakčiai atskirti nuo individualių savybių, būdingų atskiriems vienetams.

Vidutinio skaičiavimas yra vienas iš įprastų apibendrinimo būdų; vidurkis atspindi tai, kas yra bendra, kas būdinga (tipiška) visiems tiriamos populiacijos vienetams, tuo pačiu ignoruodama atskirų vienetų skirtumus. Kiekviename reiškinyje ir jo raidoje yra atsitiktinumo ir būtinybės derinys.

Vidurkis yra suvestinė proceso dėsningumų, vykstančių tomis sąlygomis, charakteristika.

Kiekvienas vidurkis apibūdina tiriamą populiaciją pagal bet kurį požymį, tačiau norint nustatyti bet kurią populiaciją, apibūdinti jos tipinius bruožus ir kokybinius požymius, reikalinga vidutinių rodiklių sistema. Todėl atliekant vidaus statistikos, susijusios su socialiniais ir ekonominiais reiškiniais, praktiką, paprastai apskaičiuojama vidutinių rodiklių sistema. Taigi, pavyzdžiui, įvertinamas vidutinio darbo užmokesčio rodiklis kartu su vidutinės produkcijos, kapitalo ir darbo santykio bei galios ir darbo santykio rodikliais, darbo mechanizacijos ir automatizavimo laipsniu ir kt.

Vidurkis turėtų būti apskaičiuojamas atsižvelgiant į tiriamo rodiklio ekonominį turinį. Todėl remiantis konkrečiu rodikliu, naudojamu socialinėje ir ekonominėje analizėje, remiantis moksliniu skaičiavimo metodu galima apskaičiuoti tik vieną tikrąją vidurkio vertę.

Vidutinė vertė yra vienas iš svarbiausių apibendrinančių statistinių rodiklių, apibūdinančių to paties tipo reiškinių visumą pagal tam tikrus kiekybiškai skirtingus požymius. Statistikos vidurkiai yra apibendrinantys rodikliai, skaičiai, išreiškiantys tipinius būdingus socialinių reiškinių matmenis viename kiekybiškai kintančiame požymyje.

Vidutinių verčių tipai

Vidutinių verčių tipai pirmiausia skiriasi tuo, kokia savybė turi atitikti tai, kuris individualios charakteristikos reikšmių pradinės kintančios masės parametras neturėtų būti keičiamas.

Aritmetinis vidurkis

Aritmetinis vidurkis yra tokia vidutinė objekto vertė, kai apskaičiuojama, koks bendras požymio dydis visumoje išlieka nepakitęs. Kitaip galime pasakyti, kad aritmetinis vidurkis yra vidutinis terminas. Skaičiuojant jį, visa atributo apimtis psichiškai pasiskirsto visiems populiacijos vienetams.

Aritmetinis vidurkis naudojamas, jei žinomos atributo vidurkio (x) reikšmės ir populiacijos vienetų, turinčių tam tikrą atributo (f) vertę, skaičius.

Aritmetinis vidurkis yra paprastas ir svertinis.

Paprastas aritmetinis vidurkis

Paprastas naudojamas, jei kiekviena atributo x reikšmė atsiranda vieną kartą, t. kiekvienam x atributo reikšmė f \u003d 1 arba jei pradiniai duomenys nėra užsakyti ir nežinoma, kiek vienetų turi tam tikras atributo reikšmes.

Paprasto aritmetinio vidurkio formulė:

kur yra vidutinė vertė; x yra atributo (varianto) vidurkis, yra tiriamos populiacijos vienetų skaičius.

Svertinis aritmetinis vidurkis

Skirtingai nuo paprasto vidurkio, naudojamas aritmetinis svertinis vidurkis, jei kiekviena atributo x reikšmė atsiranda kelis kartus, t. kiekvienai atributo reikšmei f ≠ 1. Šis vidurkis yra plačiai naudojamas apskaičiuojant vidurkį remiantis diskrečiojo paskirstymo eiga:

kur yra grupių skaičius, x yra vidurkio vidurkio reikšmė, f yra bruožo vertės svoris (dažnis, jei f yra populiacijos vienetų skaičius; dažnis, jei f yra vienetų, turinčių x variantą, proporcija bendroje populiacijoje).

Vidutinė harmonika

Kartu su aritmetiniu vidurkiu, statistikoje naudojamas harmoninis vidurkis, atributo savybių abipusių reikšmių aritmetinis vidurkis. Kaip ir aritmetinis vidurkis, jis gali būti paprastas ir svertinis. Jis taikomas, kai reikiami pradinių duomenų svoriai (f i) nėra tiesiogiai nurodyti, bet yra įtraukiami kaip koeficientas į vieną iš galimų rodiklių (t. Y. Kai žinomas pradinio vidurkio santykio skaitiklis, bet jo vardiklis nežinomas).

Vidutinis harmoninis svoris

Produktas xf parodo vienetų aibės vidurkio x tūrį ir yra žymimas w. Jei pradiniuose duomenyse yra vidurkio x vertės vertės ir vidurkio vidurkio w apimtys, tada apskaičiuojant vidurkį naudojamas harmoninis svertinis:

čia x yra vidurkio x reikšmė (parinktis); w - x variantų svoris, vidutinės savybės tūris.

Nesvarus harmoninis vidurkis (paprastas)

Ši vidurkio forma, naudojama daug rečiau, turi tokią formą:

čia x yra vidurkio vertės reikšmė; n yra x reikšmių skaičius.

Tie. tai yra atributo aibės reikšmių paprastųjų aritmetinio vidurkio grįžtamasis ryšys.

Praktiškai paprastas harmoninis vidurkis retai naudojamas, kai populiacijos vienetų w vertės yra lygios.

Vidutinis kvadratinis ir kubinis vidurkis

Kai kuriais atvejais ekonominėje praktikoje reikia apskaičiuoti vidutinį objekto dydį, išreikštą kvadratiniais arba kubiniais vienetais. Tada naudojamas kvadratinis šaknies vidurkis (pavyzdžiui, norint apskaičiuoti vidutinį šoninių ir kvadratinių plotų dydį, vamzdžių, lagaminų vidutinį skersmenį) ir kubinį vidurkį (pavyzdžiui, kai nustatomas vidutinis šono ir kubelių ilgis).

Jei keičiant atskiras objekto reikšmes vidutine verte reikia nepakeisti pradinių verčių kvadratų sumos, tada vidurkis bus kvadratinis vidurkis, paprastas arba svertinis.

Vidutinis kvadratas paprastas

Paprastas naudojamas, jei kiekviena atributo x reikšmė atsiranda vieną kartą, paprastai ji turi tokią formą:

kur yra vidurkio vertės reikšmių kvadratas; - vienetų skaičius populiacijoje.

Vidutinis svertinis kvadratas

Svertinis vidutinis kvadratas taikomas, jei kiekviena atributo vidurkio x reikšmė yra f kartų:

,

čia f yra parinkčių x svoris.

Vidutinis kubinis paprastas ir svertinis

Vidutinis kubinis paprastasis yra koeficientas, padalijamas iš charakteristikos atskirų verčių kubų sumos iš skaičiaus:

kur yra objekto reikšmės, n yra jų skaičius.

Kubinis vidutinis svoris:

,

čia f yra parinkčių svoris x.

Vidutinis kvadratinis ir kubinis vidurkis statistikoje yra ribotai naudojamas. Vidutinio kvadrato statistika yra plačiai naudojama, bet ne iš pačių variantų x , ir nuo jų nukrypimų nuo vidurkio apskaičiuojant variacijos rodiklius.

Vidurkį galima apskaičiuoti ne visiems, bet daliai gyventojų vienetų. Tokio vidurkio pavyzdys gali būti progresinis vidurkis kaip vienas iš dalinių vidurkių, apskaičiuotas ne visiems, o tik „geriausiems“ (pavyzdžiui, rodikliams, esantiems aukščiau ar žemiau individualaus vidurkio).

Geometrinis vidurkis

Jei vidutinės savybės reikšmės labai skiriasi viena nuo kitos arba yra nustatomos pagal koeficientus (augimo tempai, kainų indeksai), skaičiavimui naudojamas geometrinis vidurkis.

Geometrinis vidurkis apskaičiuojamas ištraukus laipsnio šaknį ir iš atskirų reikšmių sandaugos - požymio variantų x:

kur n yra parinkčių skaičius; P yra darbo ženklas.

Geometrinis vidurkis buvo plačiausiai naudojamas nustatant vidutinį dinamikos, taip pat pasiskirstymo, pokyčių greitį.

Vidutinės vertės yra apibendrinantys rodikliai, kuriais išreiškiamas bendrųjų sąlygų veikimas, tiriamo reiškinio dėsningumas. Statistiniai vidurkiai apskaičiuojami remiantis teisingai statistiškai organizuoto (nuolatinio ar atrankinio) masės stebėjimo masės duomenimis. Tačiau statistinis vidurkis bus objektyvus ir tipiškas, jei jis bus apskaičiuotas pagal kokybiškai homogeniškos populiacijos masės duomenis (masiniai reiškiniai). Vidutiniai vidurkiai turėtų būti naudojami remiantis dialektiniu bendrųjų ir individualiųjų, masinių ir vienaskaitų kategorijų supratimu.

Bendrųjų priemonių derinimas su grupinėmis priemonėmis leidžia apriboti kokybiškai vienarūšes populiacijas. Padalijus objektų, kurie sudaro šį ar tą sudėtingą reiškinį, masę į vidiškai homogeniškas, bet kokybiškai skirtingas grupes, apibūdinant kiekvieną grupę pagal jos vidurkį, galima atskleisti atsirandančios naujos kokybės proceso atsargas. Pavyzdžiui, gyventojų pasiskirstymas pagal pajamas leidžia nustatyti naujų socialinių grupių formavimąsi. Analitinėje dalyje mes svarstėme tam tikrą vidurkio panaudojimo pavyzdį. Apibendrindami galime pasakyti, kad statistinių duomenų vidurkiai yra naudojami ir plačiai.

Praktinė užduotis

Problemos numeris 1

Nustatykite vidutinį vienos ir JAV dolerių pirkimo kursą ir vidutinį pardavimo kursą

Vidutinė pirkimo norma

Vidutinė pardavimo norma

2 problema

Čeliabinsko srities viešojo maitinimo nuosavų produktų apimties dinamika 1996–2004 m. Pateikiama lentelėje palyginamosiomis kainomis (mln. Rublių)

Uždarykite A ir B eilutes. Norėdami išanalizuoti gatavų produktų gamybos dinamiką, apskaičiuokite:

1. Absoliutus prieaugis, augimo greitis ir prieaugis, grandinė ir bazė

2. Vidutinis pagamintų gaminių kiekis per metus

3. Vidutinis metinis įmonės augimo tempas ir padidėjimas

4. Atlikite analitinį kelių dinamikų derinimą ir apskaičiuokite 2005 m. Prognozę

5. Grafiškai parodykite dinamikos seką

6. Remdamiesi dinamika, padarykite išvadą

1) yi B \u003d yi-y1 yi C \u003d yi-y1

y2 B \u003d 2,175 - 2,04 y2 C \u003d 2,175 - 2,04 \u003d 0,135

y3B \u003d 2,505 - 2,04 y3 C \u003d 2, 505 - 2,175 \u003d 0,33

y4 B \u003d 2,73 - 2,04 y4 C \u003d 2,73 - 2,505 \u003d 0,225

y5 B \u003d 1,5 - 2,04 y5 C \u003d 1,5 - 2,73 \u003d 1,23

y6 B \u003d 3,34 - 2,04 y6 C \u003d 3,34 - 1,5 \u003d 1,84

y7 B \u003d 3,6 3 - 2,04 y7 C \u003d 3, 6 3 - 3,34 \u003d 0,29

y8 B \u003d 3,96 - 2,04 y8 C \u003d 3,96 - 3,63 \u003d 0,33

y9 B \u003d 4,41–2,04 y9 C \u003d 4,41–3,96 \u003d 0,45

Tr B2 Tr C2

Tr B3 Tr C3

Tr B4 Tr C4

Tr B5 Tr C5

Tr B6 Tr C6

Tr B7 Tr C7

Tr B8 Tr C8

Tr B9 Tr C9

Tr B \u003d (TprB * 100%) - 100%

Tr B2 \u003d (1,066 * 100%) - 100% \u003d 6,6%

Tr Ts3 \u003d (1,151 * 100%) - 100% \u003d 15,1%

2) y milijonas rublių - vidutinis gamybos pajėgumas

2,921 + 0,294*(-4) = 2,921-1,176 = 1,745

2,921 + 0,294*(-3) = 2,921-0,882 = 2,039

(yt-y) \u003d (1,745–2,04) \u003d 0,087

(yt-yt) \u003d (1,745–2,921) \u003d 1,382

(y-yt) \u003d (2,04–2,921) \u003d 0,776

Tp

Autorius

y2005 \u003d 2.921 + 1.496 * 4 \u003d 2.921 + 5.984 \u003d 8.905

8,905+2,306*1,496=12,354

8,905-2,306*1,496=5,456

5,456 2005 12,354


3 problemos numeris

Statistiniai didmeninių maisto ir ne maisto produktų tiekimo ir mažmeninės prekybos tinklo duomenys 2003 ir 2004 metais pateikiami atitinkamose diagramose.

Pagal 1 ir 2 lenteles to reikalaujama

1. Suraskite bendrą didmeninių maisto produktų tiekimo indeksą faktinėmis kainomis;

2. Raskite bendrą maisto produktų pasiūlos indeksą;

3. Palyginkite bendruosius indeksus ir padarykite atitinkamas išvadas;

4. Raskite bendrą ne maisto produktų pasiūlos indeksą faktinėmis kainomis;

5. Raskite bendrą ne maisto produktų tiekimo fizinio tūrio indeksą.

6. Palyginkite gautus indeksus ir padarykite išvadą apie ne maisto produktus;

7. Raskite konsoliduotus bendruosius visos prekių masės pasiūlos indeksus faktinėmis kainomis;

8. Raskite konsoliduotą bendrąjį fizinio tūrio indeksą (visai prekių masei);

9. Palyginkite gautus sudėtinius indeksus ir padarykite atitinkamą išvadą.

Bazinis laikotarpis

Ataskaitinis laikotarpis (2004 m.)

Ataskaitinio laikotarpio pristatymai bazinio laikotarpio kainomis

1,291-0,681=0,61= - 39

Išvada

Pabaigoje apibendrinkime. Vidutinės vertės yra apibendrinantys rodikliai, kuriais išreiškiamas bendrųjų sąlygų veikimas, tiriamo reiškinio dėsningumas. Statistiniai vidurkiai apskaičiuojami remiantis teisingai statistiškai organizuoto masinio stebėjimo (tęstinio ar atrankinio) masės duomenimis. Tačiau statistinis vidurkis bus objektyvus ir tipiškas, jei jis bus apskaičiuotas pagal kokybiškai homogeniškos populiacijos masės duomenis (masiniai reiškiniai). Vidurkiai turėtų būti naudojami remiantis dialektiniu bendrųjų ir individo, masės ir individo kategorijų supratimu.

Vidurkis atspindi bendrąjį, kuris vystosi kiekviename atskirame objekte, todėl vidurkis įgyja didelę reikšmę identifikuojant masiniams socialiniams reiškiniams būdingus modelius, nepastebimus atskiriems reiškiniams.

Individo nukrypimas nuo bendro yra pasireiškimo procesas. Kai kuriais pavieniais atvejais gali būti klojami naujo, patobulinto elemento elementai. Šiuo atveju kūrimo procesą apibūdina specifinis veiksnys, atsižvelgiant į vidutines vertes. Todėl vidurkis atspindi būdingą, tipišką, realų tiriamų reiškinių lygį. Šių lygių charakteristikos ir jų pokyčiai laike ir erdvėje yra viena pagrindinių vidurkių užduočių. Taigi, per vidurį, tai pasireiškia, pavyzdžiui, būdinga įmonėms tam tikru ekonominio vystymosi etapu; gyventojų gerovės pokyčius atspindi vidutiniai darbo užmokesčio, visos šeimos pajamų ir atskirų socialinių grupių rodikliai, gaminių, prekių ir paslaugų vartojimo lygis.

Vidutinis rodiklis yra tipiška reikšmė (įprasta, normali, vyraujanti apskritai), tačiau ji yra tokia pagal tai, kas susidaro normaliomis, natūraliomis tam tikro masinio reiškinio egzistavimo sąlygomis, laikoma visuma. Vidurkis atspindi objektyvią reiškinio savybę. Realybėje dažnai egzistuoja tik nukrypstantys reiškiniai, o vidurkis kaip reiškinys gali ir neegzistuoti, nors reiškinio tipiškumo samprata yra pasiskolinta iš tikrovės. Vidutinė vertė yra tiriamo bruožo vertės atspindys, todėl ji matuojama tokiu pat dydžiu kaip ir šis bruožas. Tačiau yra įvairių būdų, kaip apytiksliai suderinti gyventojų pasiskirstymo lygį, kad būtų galima palyginti suvestines charakteristikas, kurios nėra tiesiogiai palyginamos viena su kita, pavyzdžiui, vidutinis gyventojų skaičius teritorijos atžvilgiu (vidutinis gyventojų tankis). Atsižvelgiant į tai, kurį veiksnį reikia pašalinti, taip pat bus nustatytas vidurkio kiekis.

Bendrųjų priemonių derinimas su grupinėmis priemonėmis leidžia apriboti kokybiškai vienarūšes populiacijas. Padalijus objektų, kurie sudaro šį ar tą sudėtingą reiškinį, masę į vidiškai homogeniškas, bet kokybiškai skirtingas grupes, apibūdinant kiekvieną grupę pagal jos vidurkį, galima atskleisti atsirandančios naujos kokybės proceso atsargas. Pavyzdžiui, gyventojų pasiskirstymas pagal pajamas leidžia nustatyti naujų socialinių grupių formavimąsi. Analitinėje dalyje mes svarstėme tam tikrą vidurkio panaudojimo pavyzdį. Apibendrindami galime pasakyti, kad statistinių duomenų vidurkiai yra naudojami ir plačiai.

Bibliografija

1. Gusarovas, V.M. Statistikos pagal kokybę teorija [Tekstas]: vadovėlis. pašalpa / V.M.

Gusarovo vadovas universitetams. - M., 1998 m

2. Edronova, N.N. Bendroji statistikos teorija [Tekstas]: vadovėlis / Red. N.N. Edronova - M .: Finansai ir statistika 2001. - 648 p.

3. Eliseeva I. I., Yuzbashev M.M. Bendroji statistikos teorija [Tekstas]: Vadovėlis / Red. Korespondentas narys RAS I. I. Eliseeva. - 4-asis leidimas, red. ir pridėkite. - M .: Finansai ir statistika, 1999. - 480p .: ill.

4. Efimova M. R., Petrova E. V., Rumyantsev V. N. Bendroji statistikos teorija: [Tekstas]: Vadovėlis. - M .: INFRA-M, 1996. - 416 s.

5. Ryauzova, N.N. Bendroji statistikos teorija [Tekstas]: vadovėlis / Red. N.N.

Ryauzov - M .: Finansai ir statistika, 1984 m.


Gusarovas V.M. Statistikos teorija: vadovėlis. Vadovas universitetams. - M., 1998.- 60 psl.

Eliseeva I. I., Yuzbashev M.M. Bendroji statistikos teorija. - M., 1999.-P.76.

Gusarovas V.M. Statistikos teorija: vadovėlis. Vadovas universitetams. -M., 1998.-P.61.

Vidutinės vertės reiškia apibendrinančius statistinius rodiklius, kurie pateikia apibendrinamąją (galutinę) masinių socialinių reiškinių charakteristiką, nes jie yra sukurti remiantis daugybe skirtingo požymio individualių reikšmių. Norint išaiškinti vidutinės vertės esmę, būtina atsižvelgti į tų reiškinių požymių reikšmių formavimo ypatybes, pagal kurias apskaičiuojama vidutinė vertė.

Yra žinoma, kad kiekvieno masinio reiškinio vienetai turi daugybę savybių. Kad ir kokius ženklus pasirinktume, atskirų vienetų reikšmės bus skirtingos, jie keičiasi arba, kaip sakoma statistikoje, skiriasi vienetais. Taigi, pavyzdžiui, darbuotojo atlyginimą lemia jo kvalifikacija, darbo pobūdis, darbo stažas ir daugybė kitų veiksnių, todėl jis skiriasi labai plačiomis ribomis. Bendra visų veiksnių įtaka lemia kiekvieno darbuotojo darbo užmokesčio dydį, vis dėlto galime kalbėti apie vidutinį mėnesinį įvairių ekonomikos sektorių darbuotojų darbo užmokestį. Čia mes dirbame su tipiška, būdinga kintamojo požymio, nurodyto didelės populiacijos vienetu, verte.

Vidurkis tai atspindi generolas, kuri būdinga visiems tiriamos populiacijos vienetams. Tuo pat metu jis subalansuoja visų veiksnių, turinčių įtakos atskirų agregato vienetų savybių vertei, įtaką, tarsi juos abipusiai užgesintų. Bet kokio socialinio reiškinio lygį (arba dydį) lemia dviejų veiksnių grupių veiksmai. Kai kurie iš jų yra bendrieji ir pagrindiniai, nuolat veikiantys, glaudžiai susiję su tiriamo reiškinio ar proceso pobūdžiu ir formuoja tai tipiškas visų tirtų populiacijos vienetų, o tai atsispindi vidurkyje. Kiti yra individualus, jų veiksmai nėra tokie ryškūs ir yra epizodinio, atsitiktinio pobūdžio. Jie veikia priešinga linkme, nustato skirtumus tarp atskirų populiacijos vienetų kiekybinių charakteristikų, siekdami pakeisti tiriamųjų charakteristikų pastoviąją vertę. Atskirų ženklų poveikis vidutiniškai užgęsta. Apibendrinant tipinių ir individualių veiksnių įtaką, kuri yra subalansuota ir abipusiai panaikinta apibendrinant charakteristikas, iš matematinės statistikos žinoma pagrinda pasireiškia bendrąja forma. didelių skaičių dėsnis.

Apibendrinant, atskiros bruožų reikšmės susilieja į bendrą masę ir tarsi ištirpsta. Vadinasi ir vidutinė vertė veikia kaip „beasmenis“, galintis nukrypti nuo individualių ženklų vertybių, kiekybiškai nesutampa su jokiu iš jų. Vidutinė vertė atspindi bendrą, būdingą ir būdingą visai populiacijai dėl to, kad joje abipusiai atšaukiami atsitiktiniai, netipiniai skirtumai tarp atskirų jo vienetų ypatybių, nes jos vertė, kaip ir nustatyta, nustatoma atsižvelgiant į bendrą visų priežasčių priežastį.

Tačiau norint, kad vidurkis atspindėtų tipiškiausią bruožo vertę, jis turėtų būti nustatomas ne bet kuriai populiacijai, o tik populiacijoms, kurias sudaro kokybiškai vienarūšiai vienetai. Šis reikalavimas yra pagrindinė sąlyga moksliškai pagrįstu vidutinių verčių taikymu ir suponuoja glaudų ryšį tarp vidutinių verčių metodo ir grupavimo metodo analizuojant socialinius ir ekonominius reiškinius. Taigi vidutinė vertė yra apibendrinantis rodiklis, apibūdinantis tipišką nevienodo požymio lygį vienetiniame homogeniškos populiacijos vienete konkrečiomis vietos ir laiko sąlygomis.

Taigi, apibrėžiant vidutinių verčių esmę, būtina pabrėžti, kad teisingas bet kurio vidurkio apskaičiavimas reiškia, kad turi būti įvykdyti šie reikalavimai:

  • kokybinis gyventojų homogeniškumas, per kurį apskaičiuojama vidutinė vertė. Tai reiškia, kad vidutinės vertės turėtų būti apskaičiuojamos grupavimo metodu, kuris užtikrina vienarūšių to paties tipo reiškinių identifikavimą;
  • pašalinamas poveikis apskaičiuojant atsitiktinių, grynai individualių priežasčių ir veiksnių vidurkį. Tai pasiekiama tuo atveju, kai vidurkis apskaičiuojamas remiantis pakankamai masyvia medžiaga, kurioje pasireiškia didelių skaičių dėsnis, o visos avarijos yra panaikinamos abipusiai;
  • skaičiuojant vidurkį, svarbu nustatyti jo apskaičiavimo tikslą ir vadinamąjį apibrėžti parodą-tel (nuosavybė), į kurią ji turėtų būti nukreipta.

Apibrėžiamasis rodiklis gali veikti kaip atributo vidurkio verčių suma, jo atvirkštinių verčių suma, jo verčių sandauga ir tt. Ryšys tarp apibrėžiančiojo rodiklio ir vidutinės vertės yra išreiškiamas taip: jei visos atributo vidurkio reikšmės pakeičiamos vidutine verte, tada jų suma arba sandauga šis atvejis nepakeis apibrėžiančio indikatoriaus. Remiantis šiuo ryšiu tarp nustatančio rodiklio ir vidutinės vertės, sudaromas pradinis kiekybinis santykis, leidžiantis tiesiogiai apskaičiuoti vidutinę vertę. Vadinamas vidurkių gebėjimas išsaugoti statistinių populiacijų savybes apibrėždamas turtą.

Vadinama vidutine gyventojų skaičiavimo verte bendras vidurkis; kiekvienai grupei apskaičiuotos vidutinės vertės - grupės vidurkiai. Bendras vidurkis atspindi bendruosius tiriamo reiškinio bruožus, grupės vidurkis suteikia reiškinio, kuris vystosi konkrečiomis tam tikros grupės sąlygomis, bruožą.

Skaičiavimo metodai gali būti skirtingi, todėl statistikoje yra keletas vidurkio tipų, iš kurių pagrindiniai yra aritmetinis vidurkis, harmoninis vidurkis ir geometrinis vidurkis.

Atliekant ekonominę analizę, vidutinių verčių naudojimas yra pagrindinė priemonė mokslo ir technologinės pažangos, socialinių įvykių ir ekonominės plėtros rezervų paieškai įvertinti. Tuo pačiu metu reikia atsiminti, kad per didelis entuziazmas daryti vidurkius gali padaryti šališkas išvadas atliekant ekonominę ir statistinę analizę. Taip yra todėl, kad vidutinės vertės, būdamos apibendrinančiais rodikliais, išnyksta, nekreipdamos dėmesio į tuos individualių populiacijos vienetų kiekybinių charakteristikų skirtumus, kurie iš tikrųjų egzistuoja ir kurie gali būti nepriklausomi.

Vidutinių verčių tipai

Statistikoje naudojami įvairių tipų vidurkiai, kurie yra suskirstyti į dvi dideles klases:

  • galios vidurkiai (harmoninis vidurkis, geometrinis vidurkis, aritmetinis vidurkis, vidutinis kvadratas, kubinis vidurkis);
  • struktūrinės priemonės (mada, mediana).

Suskaičiuoti galios vidurkiai turi būti naudojamos visos turimos charakteristikos. Mada ir mediana yra nustatomi tik pagal pasiskirstymo struktūrą, todėl jie vadinami struktūriniais, padėties vidurkiais. Medianos ir rėžimas dažnai naudojami kaip vidutinė charakteristika tose populiacijose, kur neįmanoma apskaičiuoti galios vidurkio ar nepraktiška.

Labiausiai paplitęs vidurkio tipas yra aritmetinis vidurkis. Pagal aritmetinis vidurkis bruožo reikšmė suprantama taip, kad kiekvienas populiacijos vienetas turėtų, jei visų objekto verčių suma būtų tolygiai paskirstyta tarp visų populiacijos vienetų. Šios vertės apskaičiavimas sumažinamas iki visų kintamojo požymio verčių susumuotos ir gautą sumą padalijant iš bendro populiacijos vienetų skaičiaus. Pavyzdžiui, penki darbuotojai įvykdė užsakymą gaminti detales, o pirmasis padarė 5 dalis, antrasis - 7, trečias - 4, ketvirtas - 10, penktas - 12. Kadangi pradiniais duomenimis kiekvieno varianto vertė buvo sutinkama tik vieną kartą, norint nustatyti vidurkį darbuotojas turėtų taikyti paprastą aritmetinę vidurkio formulę:

tai yra, mūsų pavyzdyje vidutinė vieno darbuotojo išeiga yra lygi

Kartu atlikite paprastą aritmetinį vidurkį svertinis aritmetinis vidurkis. Pavyzdžiui, apskaičiuokime vidutinį mokinių amžių 20 žmonių grupėje, kurių amžius svyruoja nuo 18 iki 22 metų, kur xi - vidutinės savybės variantai, fi - dažnis, parodantis, kiek kartų i-asis vertė suvestinėje (5.1 lentelė).

5.1 lentelė

Vidutinis studentų amžius

Taikydami aritmetinio svertinio vidurkio formulę, gauname:


Yra tam tikra svertinio aritmetinio vidurkio pasirinkimo taisyklė: jei yra duomenų eilutė apie du rodiklius, kurių vieną reikia apskaičiuoti

vidutinė vertė, o tuo pačiu ir jos loginės formulės vardiklio vardinės vertės, ir skaitiklio reikšmės nežinomos, tačiau jas galima rasti kaip šių rodiklių sandaugą, tada vidutinė vertė turėtų būti apskaičiuojama naudojant svertinio aritmetinio vidurkio formulę.

Kai kuriais atvejais pradiniai statistiniai duomenys yra tokie, kad apskaičiuojant aritmetinį vidurkį prarandama prasmė, o vienintelis apibendrinantis rodiklis gali būti tik kito tipo vidurkis - vidutinė harmonika. Šiuo metu aritmetinio vidurkio skaičiavimo savybės prarado savo aktualumą apskaičiuojant apibendrinančius statistinius rodiklius, susijusius su plačiai paplitusiu elektroninio skaičiavimo įvedimu. Vidutinė harmoninė vertė, kuri taip pat gali būti paprasta ir subalansuota, įgijo didelę praktinę reikšmę. Jei loginės formulės skaitiklio skaitinės vertės yra žinomos, o vardiklio reikšmės nežinomos, tačiau jas galima rasti kaip koeficientą, dalijantį vieną rodiklį kitu, tada vidutinė vertė apskaičiuojama naudojant harmoninio svertinio vidurkio formulę.

Pavyzdžiui, praneškime, kad automobilis pirmuosius 210 km nuvažiavo 70 km / h greičiu, o likusius 150 km - 75 km / h greičiu. Vidutinio automobilio greičio per visą 360 km atstumą neįmanoma nustatyti pagal aritmetinę vidurkio formulę. Kadangi pasirinktys yra greičiai atskirose atkarpose xj \u003d 70 km / h ir X2 \u003d 75 km / h, o svoriai (fi) yra atitinkami kelio segmentai, tada pasirinkimo koeficientai pagal svorius neturės nei fizinės, nei ekonominės prasmės. Tokiu atveju koeficientai, padalyti iš kelio atkarpų į atitinkamą greitį (xi parinktys), tai yra laikas, praleidžiamas atskiroms kelio atkarpoms pravažiuoti (fi / xi). Jei kelio segmentai žymimi fi, tada visas kelias išreiškiamas asfi, o laikas, praleistas visam keliui, išreiškiamas Σ fi / xi , Tuomet vidutinis greitis gali būti apskaičiuojamas kaip viso kelio padalijimo iš bendro sugaišto laiko dalis:

Mūsų pavyzdyje mes gauname:

Jei, naudojant visų variantų (f) vidutinius harmoninius svorius, jie yra lygūs, tada vietoj svertinio galite naudoti paprastas (nesvarus) harmoninis vidurkis:

kur xi yra individualūs variantai; n - vidutinės savybės variantų skaičius. Greičio pavyzdyje paprastasis harmoninis vidurkis galėtų būti taikomas, jei skirtingu greičiu važiuojančio kelio segmentai būtų lygūs.

Bet kuri vidutinė vertė turėtų būti apskaičiuojama taip, kad kai ji pakeičia kiekvieną vidurkio bruožo variantą, kai kurio galutinio apibendrinančio rodiklio, susieto su vidurkiu, vertė nesikeistų. Taigi, keičiant faktinius greičius atskirose kelio atkarpose jų vidutine verte (vidutiniu greičiu), bendras atstumas neturėtų pasikeisti.

Vidutinės vertės formą (formulę) lemia šio galutinio rodiklio santykio su vidurkiu pobūdis (mechanizmas), todėl vadinamas galutinis rodiklis, kurio vertė neturėtų keistis, kai opcionai pakeičiami jų vidutine verte. apibrėžiantis rodiklis. Norėdami apskaičiuoti vidurkio formulę, turite sudaryti ir išspręsti lygtį, naudodami vidurkio rodiklio santykį su jį lemiančiu. Ši lygtis sudaroma pakeičiant vidurkio ypatybės (rodiklio) variantus jų vidutine verte.

Be aritmetinio ir harmoninio vidurkio, statistikoje naudojami ir kiti vidurkio tipai (formos). Jie visi yra ypatingi atvejai. galios dėsnio vidurkis. Jei mes apskaičiuosime visų rūšių galios įstatymų vidurkius tiems patiems duomenims, tada reikšmės

jie pasirodys vienodi, čia galioja taisyklė didžiųjų vidutinis. Didėjant vidurkių eksponentui, didėja ir pati vidutinė vertė. Formulės, dažniausiai naudojamos praktiniuose tyrimuose, apskaičiuojant įvairių tipų galios įstatymų vidutines vertes, pateiktos 1 lentelėje. 5.2.

5.2 lentelė


Geometrinis vidurkis taikomas, kai yra n augimo koeficientai, tuo tarpu individualios funkcijos reikšmės, kaip taisyklė, yra santykiniai dinamikos dydžiai, sukonstruoti grandinės dydžių pavidalu, palyginti su ankstesniu kiekvieno lygio dinamikos serijos lygiu. Taigi vidurkis apibūdina vidutinį augimo greitį. Vidutinis geometrinis paprastumas apskaičiuojamas pagal formulę

Formulė geometrinis svertinis vidurkis atrodo taip:

Pateiktos formulės yra tapačios, tačiau viena taikoma esant dabartiniams spartai ar augimo tempams, o antroji - esant absoliutinėms serijos lygių vertėms.

Vidutinis kvadratas naudojamas apskaičiuojant kvadratinių funkcijų vertėmis, naudojamas norint įvertinti objekto atskirų verčių kintamumo laipsnį aplink aritmetinį vidurkį paskirstymo eilutėse ir apskaičiuojamas pagal formulę:

Vidutinis svertinis kvadratas apskaičiuojamas naudojant kitą formulę:

Vidutinis kub naudojamas apskaičiuojant kubinių funkcijų reikšmes ir apskaičiuojamas pagal formulę

vidutinis svertinis kubinis:

Visi aukščiau aptarti vidurkiai gali būti pateikti kaip bendra formulė:

kur yra vidutinė vertė; - individuali vertė; n - tiriamos populiacijos vienetų skaičius; k yra eksponentas, kuris nustato vidurkio tipą.

Naudojant tuos pačius pradinius duomenis, tuo daugiau k bendroje galios dėsnio vidurkio formulėje, tuo didesnis vidurkis. Iš to išplaukia, kad tarp vidutinių galios dydžių yra reguliarus ryšys:

Aukščiau aprašytos vidutinės vertės suteikia apibendrintą tiriamo agregato vaizdą, ir šiuo požiūriu jų teorinė, taikomoji ir pažintinė reikšmė yra neginčijamos. Bet atsitinka taip, kad vidurkio vertė nesutampa su jokiais iš tikrųjų egzistuojančiais variantais, todėl, be statistinėje analizėje nagrinėjamų vidurkių, patartina naudoti ir konkrečių variantų reikšmes, kurios užima gana apibrėžtą vietą užsakomoje (reitinguotoje) objekto verčių serijoje. Tarp šių vertybių labiausiai paplitusios struktūrinis, arba aprašomasis, vidutinis - režimas (Mo) ir mediana (Me).

Mada - savybės, dažniausiai randamos tam tikroje populiacijoje, vertė. Kalbant apie variacijų eiles, režimas yra dažniausiai pasitaikanti eilės vertė, t. Y. Variantas, turintis aukščiausią dažnį. Mada gali būti naudojama nustatant, kuriose parduotuvėse lankosi dažniau ir kokia yra produkto kaina. Tai parodo reikšmės, būdingos reikšmingai daliai gyventojų, dydį ir yra nustatomas pagal formulę

čia x0 yra apatinė intervalo riba; h - intervalo dydis; fm - intervalo dažnis; fm_1 - ankstesnio intervalo dažnis; fm +1 - kito intervalo dažnis.

Vidutinė vadinamas variantas, esantis reitinguojamos eilės centre. Vidutinė padalija eilę į dvi lygias dalis taip, kad abiejose jos pusėse būtų vienodas populiacijos vienetų skaičius. Tuo pačiu metu pusei populiacijos vienetų kintančio požymio reikšmė yra mažesnė nei mediana, kitai - didesnė. Mediana naudojama tiriant elementą, kurio vertė yra didesnė arba lygi arba tuo pat metu mažesnė ar lygi pusei paskirstymo eilės elementų. Mediana pateikia bendrą vaizdą, kur atributų reikšmės yra sukoncentruotos, kitaip tariant, kur yra jų centras.

Aprašomasis medianos pobūdis pasireiškia tuo, kad jis apibūdina kintamojo požymio verčių kiekybinę ribą, kurią turi pusė populiacijos vienetų. Diskrečios variacijos serijos mediano suradimo problemą lengva išspręsti. Jei mes priskiriame eilės numerius visiems serijos vienetams, tada vidutinis varianto eilės numeris nustatomas kaip (n +1) / 2 su nelyginiu narių skaičiumi n. Jei serijos narių skaičius yra lyginis skaičius, tada mediana bus dviejų variantų su eilės skaičiais vidurkis. n / 2 ir n / 2 + 1.

Nustatant intervalo kitimo intervalo mediana, pirmiausia nustatomas intervalas, kuriame jis yra (mediana). Šis intervalas pasižymi tuo, kad jo sukaupta dažnių suma yra lygi arba didesnė už visų serijos dažnių pusę. Intervalo kitimo eilutės mediana apskaičiuojama pagal formulę

kur X0 - apatinė intervalo riba; h - intervalo dydis; fm - intervalo dažnis; f- serialo narių skaičius;

∫m-1 - prieš tai buvusios serijos sukauptų narių suma.

Kartu su medianu, norint išsamiau apibūdinti tiriamos populiacijos struktūrą, naudojamos ir kitos variantų vertės, užimančios gana apibrėžtą poziciją reitinguojamoje serijoje. Jie apima kvartilai ir decilai. Kvartilai padalija eiles iš dažnių sumos į 4 lygias dalis, o decisles - į 10 lygių dalių. Yra trys kvartilai ir devyni decilai.

Medianas ir būdas, priešingai nei aritmetinis vidurkis, neišnyksta individualių kintančio požymio verčių skirtumų, todėl yra papildomos ir labai svarbios statistinės populiacijos savybės. Praktiškai jie dažnai naudojami vietoj vidurio arba šalia jo. Ypač patartina apskaičiuoti mediana ir režimą tais atvejais, kai tiriamoje populiacijoje yra tam tikras skaičius vienetų, turinčių labai didelę ar labai mažą kintamojo požymio vertę. Šie, nelabai būdingi bendroms pasirinkimo galimybių vertėms, turinčioms įtakos aritmetinio vidurkio reikšmei, neturi įtakos mediana ir režimo reikšmėms, todėl pastarieji yra labai vertingi rodikliai ekonominei ir statistinei analizei.

Variacijos rodikliai

Statistinio tyrimo tikslas yra nustatyti pagrindines tiriamos statistinės populiacijos savybes ir modelius. Statistinio stebėjimo duomenų suvestinio apdorojimo metu jie kaupiasi paskirstymo gretas. Yra du paskirstymo eilių tipai - atributiniai ir kintamieji, atsižvelgiant į tai, ar bruožas, kuriuo remiamasi kaip grupavimo pagrindas, yra kokybinis ar kiekybinis.

Variacinis vadinamos paskirstymo serijomis, sukurtomis kiekybiniu pagrindu. Atskirų populiacijos vienetų kiekybinių bruožų vertės nėra pastovios, daugiau ar mažiau skiriasi viena nuo kitos. Šis bruožo dydžio skirtumas vadinamas variacijos. Vadinamos individualios skaitinės bruožo vertės, atsirandančios tiriamoje populiacijoje vertybių galimybės. Variacija atskiruose populiacijos vienetuose atsiranda dėl daugybės veiksnių įtakos bruožo lygio formavimui. Simbolių kitimo pobūdis ir laipsnis atskiruose populiacijos vienetuose yra svarbiausias bet kurio statistinio tyrimo klausimas. Apibūdinant charakteristikų kintamumą, naudojami variacijos rodikliai.

Kitas svarbus statistinių tyrimų uždavinys yra nustatyti atskirų veiksnių ar jų grupių vaidmenį keičiant tam tikras gyventojų savybes. Norint išspręsti tokią statistikos problemą, variacijai tirti naudojami specialūs metodai, pagrįsti rodiklių sistemos naudojimu, kurios pagalba matuojamas variacija. Praktiškai tyrinėtojas susiduria su pakankamai dideliu atributo reikšmių pasirinkimo galimybių skaičiumi, o tai nesuteikia idėjos apie vienetų pasiskirstymą pagal atributo vertę agregate. Tam atributo reikšmių variantai išdėstomi didėjančia ar mažėjančia tvarka. Šis procesas vadinamas serijos reitingas. Išrikiuotosios serijos iš karto suteikia bendrą vaizdą apie tas reikšmes, kurias atributas užima junginyje.

Vidutinės vertės nepakankamumas išsamioms populiacijos charakteristikoms verčia papildyti vidutines reikšmes rodikliais, kurie leidžia įvertinti šių vidurkių tipiškumą išmatuojant tiriamo požymio kintamumą (kitimą). Šių variacijos rodiklių naudojimas leidžia statistinę analizę padaryti išsamesnę ir prasmingesnę, taigi geriau suprasti tiriamų socialinių reiškinių esmę.

Paprasčiausi variacijų požymiai minimumas ir maksimalus - tai yra mažiausia ir didžiausia objekto reikšmė junginyje. Vadinamas atskirų būdingų reikšmių variantų pasikartojimų skaičius pasikartojimo dažnis. Pažymėkime bruožo vertės pasikartojimo dažnį fi, dažnių suma, lygi tiriamos populiacijos apimčiai, bus:

kur k - būdingų verčių variantų skaičius. Patogu dažnius pakeisti dažniais - wi. Dažnis - santykinis dažnio rodiklis - gali būti išreikštas vieneto dalimis arba procentais ir leidžia palyginti variacijų eiles su skirtingu stebėjimų skaičiumi. Mes oficialiai turime:

Objekto kitimui įvertinti naudojami įvairūs absoliutūs ir santykiniai rodikliai. Absoliučius variacijos rodiklius sudaro vidutinis tiesinis nuokrypis, variacijos diapazonas, dispersija, standartinis nuokrypis.

Perbraukimas variantas (R) yra skirtumas tarp maksimalios ir mažiausios bruožo reikšmių tiriamoje populiacijoje: R \u003d Xmax - Xmin. Šis rodiklis pateikia tik bendriausią tiriamo požymio kintamumo idėją, nes parodo skirtumą tik tarp galimybių ribinių verčių. Tai visiškai nesusiję su variacijų eilės dažniais, tai yra, su paskirstymo pobūdžiu, ir priklausomybė gali suteikti jam nestabilų, atsitiktinį pobūdį tik nuo kraštutinių bruožo verčių. Variacijos diapazonas nepateikia jokios informacijos apie tiriamų populiacijų ypatybes ir neleidžia įvertinti gautų vidutinių verčių tipiškumo laipsnio. Šio rodiklio taikymo sritis yra apribota gana vienodomis populiacijomis, tiksliau, rodiklis apibūdina objekto variaciją, remiantis atsižvelgiant į visų objekto verčių kintamumą.

Norint apibūdinti ypatybės kitimą, būtina apibendrinti visų verčių nuokrypius nuo bet kokių verčių, būdingų tiriamai populiacijai. Tokie rodikliai

variacijos, tokios kaip vidutinis tiesinis nuokrypis, dispersija ir standartinis nuokrypis, yra pagrįstos atskirų populiacijos vienetų atributo reikšmių nuokrypiais nuo aritmetinio vidurkio.

Vidutinis tiesinis nuokrypis žymi atskirų opcionų nuokrypių nuo jų aritmetinio vidurkio absoliučių verčių aritmetinį vidurkį:


Absoliutaus varianto (modulio) nuokrypio nuo aritmetinio vidurkio; f- dažnis.

Pirmoji formulė taikoma, jei kiekviena iš variantų junginyje pasireiškia tik vieną kartą, o antroji - eilutėse su nevienodais dažniais.

Yra dar vienas būdas parinkčių nuokrypius nuo aritmetinio vidurkio suskaičiuoti. Šis metodas, labai paplitęs statistikoje, yra sumažintas iki pasirinkimo galimybių nuokrypių nuo vidurkio apskaičiavimo su jų vidurkiu. Taigi gauname naują variacijos rodiklį - dispersiją.

Dispersija (σ 2) yra požymio reikšmių variantų nuokrypių nuo jų vidurkio kvadratų vidurkis:

Antroji formulė naudojama, jei variantai turi savo svorius (arba variacijų serijos dažnius).

Atliekant ekonominę ir statistinę analizę, įprasta vertinti ypatybės kitimą naudojant standartinį nuokrypį. Standartinis nuokrypis (σ) yra dispersijos kvadratinė šaknis:

Vidutinis tiesinis ir standartinis nuokrypis parodo, kiek atributo vertė vidutiniškai svyruoja tiriamos populiacijos vienetais ir yra išreiškiama tais pačiais matavimo vienetais kaip ir parinktys.

Statistinėje praktikoje dažnai reikia palyginti įvairių savybių variacijas. Pavyzdžiui, labai įdomu palyginti personalo amžiaus ir jo kvalifikacijos, tarnybos stažo ir atlyginimo pokyčius ir pan. Tokiems palyginimams absoliučių charakteristikų kintamumo rodikliai - vidutinis tiesinis ir standartinis nuokrypis - netinka. Iš tiesų neįmanoma palyginti darbo stažo kintamumo, išreikšto metais, su darbo užmokesčio kintamumu, išreikštu rubliais ir kapeikomis.

Lyginant skirtingų simbolių kintamumą junginyje, patogu naudoti santykinius variacijos rodiklius. Šie rodikliai apskaičiuojami kaip absoliučių rodiklių santykis su aritmetiniu vidurkiu (arba mediana). Naudojant variacijos diapazoną, vidutinį tiesinį nuokrypį, standartinį nuokrypį kaip absoliučią variacijos rodiklį, gaunami santykiniai svyravimo rodikliai:


Dažniausiai naudojamas santykinio kintamumo rodiklis, apibūdinantis populiacijos homogeniškumą. Populiacija laikoma vienalyte, jei pasiskirstymo artimas normaliam kitimo koeficientas neviršija 33%.

Daugeliu atvejų duomenys yra sukoncentruoti ties kažkokiu centriniu tašku. Taigi norint apibūdinti bet kurį duomenų rinkinį, pakanka nurodyti vidutinę vertę. Panagrinėkime iš eilės tris skaitines charakteristikas, kurios naudojamos pasiskirstymo vidutinei vertei įvertinti: aritmetinį vidurkį, medianą ir režimą.

Vidutinis

Aritmetinis vidurkis (dažnai tiesiog vadinamas vidurkiu) yra labiausiai paplitęs pasiskirstymo vidurkio įvertinimas. Tai yra rezultatas, padalytas visų stebimų skaitinių verčių sumą iš jų skaičiaus. Skaičių pavyzdžiui X 1, X 2, ..., X n, imties vidurkis (žymimas ) yra lygus \u003d (X 1 + X 2 + ... + X n) / n, arba

kur yra imties vidurkis, n - imties dydis, X i - i-asis pavyzdžio elementas.

Atsisiųskite užrašą formatu arba pavyzdžius formatu

Apsvarstykite 15 labai didelės rizikos investicinių fondų penkerių metų vidutinės metinės grąžos aritmetinį vidurkį (1 pav.).

Paveikslas: 1. Vidutinė 15 labai didelės rizikos investicinių fondų metinė grąža

Imties vidurkis apskaičiuojamas taip:

Tai yra gera grąža, ypač palyginti su 3–4% pajamų, kurias banko ar kredito unijų indėlininkai gavo per tą patį laikotarpį. Jei užsisakote grąžą, nesunku pastebėti, kad aštuonių fondų grąža yra didesnė, o septynių - mažesnė už vidurkį. Aritmetinis vidurkis veikia kaip pusiausvyros taškas, kad mažas pajamas gaunantys fondai subalansuotų aukštų pajamų fondus. Visi imties elementai yra naudojami apskaičiuojant vidurkį. Nė vienas iš kitų pasiskirstymo vidurkio įvertinimų neturi šios savybės.

Kada reikia apskaičiuoti aritmetinį vidurkį.Kadangi aritmetinis vidurkis priklauso nuo visų imties elementų, kraštutinių verčių buvimas reikšmingai paveikia rezultatą. Tokiose situacijose aritmetinis vidurkis gali iškraipyti skaitinių duomenų prasmę. Todėl apibūdinant duomenų rinkinį, kuriame yra kraštutinės vertės, būtina nurodyti mediana arba aritmetinį vidurkį ir mediana. Pvz., Jei iš imties pašalinsite RS kylančio augimo fondo grąžą, vidutinė 14 fondų grąža imtyje sumažės beveik 1% iki 5,19%.

Vidutinė

Mediana yra užsakyto skaičių masyvo mediana. Jei masyve nėra pasikartojančių skaičių, tada pusė jo elementų bus mažesni, o pusė daugiau nei mediana. Jei pavyzdyje yra kraštutinės vertės, vidurkiui įvertinti geriau naudoti mediana, o ne aritmetinį vidurkį. Norėdami apskaičiuoti mėginio mediana, pirmiausia turite jį užsisakyti.

Ši formulė yra dviprasmiška. Jo rezultatas priklauso nuo to, ar skaičius yra lyginis, ar nelyginis n:

  • Jei pavyzdyje yra nelyginis elementų skaičius, mediana yra (n + 1) / 2th elementas.
  • Jei pavyzdyje yra lyginis elementų skaičius, mediana yra tarp dviejų vidutinių mėginio elementų ir yra lygi aritmetiniam vidurkiui, apskaičiuotam per šiuos du elementus.

Norėdami apskaičiuoti 15 labai didelės rizikos investicinių fondų imties mediana, pirmiausia turite surūšiuoti duomenis (2 pav.). Tuomet mediana bus priešinga mėginio vidurinio elemento skaičiui; mūsų pavyzdyje Nr. 8. „Excel“ turi specialią funkciją \u003d MEDIAN (), kuri veikia ir su netvarkingais masyvais.

Paveikslas: 2. Median 15 lėšų

Taigi mediana yra 6,5. Tai reiškia, kad vienos pusės fondų, kurių rizika labai aukšta, pelningumas neviršija 6,5, o kitos pusės pelningumas neviršija. Atkreipkite dėmesį, kad 6,5 mediana nėra daug didesnė už 6,08 vidurkį.

Jei iš imties pašalinsime RS kylančio augimo fondo grąžą, likusių 14 fondų mediana sumažės iki 6,2%, tai yra ne taip reikšmingai, kaip aritmetinis vidurkis (3 pav.).

Paveikslas: 3. Vidutinė 14 lėšų

Mada

Pirmą kartą šį terminą sukūrė Pearsonas 1894 m. Mada yra skaičius, kuris dažniausiai pasirodo pavyzdyje (madingiausias). Mada gerai apibūdina, pavyzdžiui, tipišką vairuotojų reakciją į šviesoforo signalą sustabdyti vairavimą. Klasikinis mados naudojimo pavyzdys yra batų dydžio ar tapetų spalvos pasirinkimas. Jei paskirstymas turi kelis režimus, tada jis vadinamas multimodaliniu arba multimodaliniu (jis turi dvi ar daugiau „viršūnių“). Multimodalinis paskirstymas suteikia svarbios informacijos apie tiriamojo kintamojo pobūdį. Pvz., Sociologinėse apklausose, jei kintamasis parodo pirmenybę ar požiūrį į ką nors, tada multimodalumas gali reikšti, kad yra keletas tikrai skirtingų nuomonių. Multimodalumas taip pat yra rodiklis, kad mėginys nėra vienalytis, o pastebėjimai gali būti generuojami dviem ar daugiau „persidengiančių“ pasiskirstymų. Skirtingai nei aritmetinis vidurkis, pašalinės vertės nedaro įtakos madai. Nuolat platinamų atsitiktinių kintamųjų, pavyzdžiui, investicinių fondų vidutinės metinės grąžos rodikliams, mados kartais išvis nėra (arba jos nėra prasmingos). Kadangi šie rodikliai gali įgyti labai daug įvairių verčių, pakartotinės vertės yra labai retos.

Kvartilai

Kvartilai yra metrika, dažniausiai naudojama duomenų pasiskirstymui įvertinti, apibūdinant didelių skaitinių imčių savybes. Nors mediana padalija užsakytą masyvą per pusę (50% masyvo elementų yra mažiau nei mediana ir 50% daugiau), kvartiliai padalija užsakytą duomenų rinkinį į keturias dalis. Q 1, mediana ir Q 3 vertės yra atitinkamai 25-asis, 50-asis ir 75-asis procentiliai. Pirmasis kvartilas, Q 1, yra skaičius, padalijantis imtį į dvi dalis: 25% daiktų yra mažiau, o 75% yra daugiau nei pirmasis kvartilis.

Trečiasis kvartilas, Q 3, yra skaičius, kuris taip pat padalija mėginį į dvi dalis: 75% elementų yra mažiau, o 25% yra daugiau nei trečiasis kvartilis.

Norint apskaičiuoti kvartilius „Excel“ versijose iki 2007 m., Buvo naudojama funkcija \u003d QUARTILE (masyvas; dalis). Nuo „Excel2010“ naudojamos dvi funkcijos:

  • \u003d QUARTILE.INC (masyvas, dalis)
  • \u003d QUARTILE.EXC (masyvas, dalis)

Šios dvi funkcijos suteikia šiek tiek skirtingas vertes (4 paveikslas). Pavyzdžiui, apskaičiuojant imties ketvirčius, kuriuose yra duomenų apie 15 labai didelės rizikos investicinių fondų vidutinę metinę grąžą, Q 1 \u003d 1,8 arba –0,7 atitinkamai QUARTILE.INCL ir QUARTILE.EXCL. Beje, QUARTILE funkcija, kuri buvo naudojama anksčiau, atitinka šiuolaikinę QUARTILE funkciją. Norint apskaičiuoti kvartilius „Excel“ programoje naudojant aukščiau pateiktas formules, duomenų masyvo užsakyti nereikia.

Paveikslas: 4. Kvarcių skaičiavimas „Excel“

Pabrėžkime dar kartą. „Excel“ gali apskaičiuoti keturmačius vienmatį atskira serijaturinčios atsitiktinio kintamojo reikšmes. Kvarcių skaičiavimas paskirstant dažnį yra pateiktas žemiau esančiame skyriuje.

Geometrinis vidurkis

Skirtingai nuo aritmetinio vidurkio, geometrinis vidurkis leidžia įvertinti kintamojo kitimo laipsnį per tam tikrą laiką. Geometrinis vidurkis yra šaknis n-asis laipsnis nuo darbo n reikšmės („Excel“ naudojama funkcija \u003d SRGEOM):

G \u003d (X 1 * X 2 *… * X n) 1 / n

Panašus parametras - grąžos normos geometrinis vidurkis - nustatomas pagal formulę:

G \u003d [(1 + R1) * (1 + R 2) *… * (1 + R n)] 1 / n - 1,

kur R i - grąžos norma už ith laikotarpis.

Pavyzdžiui, tarkime, kad pradinė investicija yra 100 000 USD. Pirmųjų metų pabaigoje ji sumažėja iki 50 000 USD, o antrųjų metų pabaigoje grįžta į pradinę 100 000 USD. Šios investicijos grąžos norma per dvejų metų laikotarpį lygus 0, nes pradiniai ir galutiniai fondai yra lygūs vienas kitam. Tačiau metinės grąžos normų aritmetinis vidurkis yra \u003d (–0,5 + 1) / 2 \u003d 0,25 arba 25%, nes grąžos norma pirmaisiais metais R 1 \u003d (50 000 - 100 000) / 100 000 \u003d –0,5 , o antrajame R2 \u003d (100 000 - 50 000) / 50 000 \u003d 1. Tuo pačiu metu dvejų metų pelno normos geometrinis vidurkis yra: G \u003d [(1–0,5) * (1 + 1 )] 1/2 - 1 \u003d ½ - 1 \u003d 1 - 1 \u003d 0. Taigi, geometrinis vidurkis tiksliau atspindi investicijų apimties pokyčius (tiksliau - pokyčių nebuvimą) per dvejų metų laikotarpį nei aritmetinis vidurkis.

Įdomūs faktai.Pirma, geometrinis vidurkis visada bus mažesnis už tų pačių skaičių aritmetinį vidurkį. Išskyrus tuos atvejus, kai visi paimti skaičiai yra lygūs vienas kitam. Antra, atsižvelgiant į stačiakampio trikampio savybes, jūs galite suprasti, kodėl vidurkis vadinamas geometriniu. Stačiakampio trikampio, nuleisto į hipotenuzę, aukštis yra proporcingas vidurys tarp kojų projekcijų ant hipotenuzės, o kiekviena koja yra vidutinė proporcija tarp hipotenuzės ir jos projekcijos į hipotenuzę (5 pav.). Tai suteikia geometrinį dviejų segmentų (ilgių) geometrinio vidurkio konstravimo būdą: jums reikia pastatyti apskritimą ant šių dviejų segmentų sumos, kaip ant skersmens, tada aukštis, atkurtas nuo jų sujungimo taško iki sankryžos su apskritimu, suteiks norimą vertę:

Paveikslas: 5. Geometrinio vidurkio geometrinis pobūdis (piešimas iš Vikipedijos)

Antra svarbi skaitinių duomenų savybė yra jų variacijaapibūdinantis duomenų dispersijos laipsnį. Du skirtingi mėginiai gali skirtis tiek vidutinėmis vertėmis, tiek variacijomis. Tačiau, kaip parodyta fig. 6 ir 7, abu pavyzdžiai gali turėti tą patį variantą, bet skirtingas priemones, arba tas pačias priemones ir visiškai skirtingus variantus. Duomenys, atitinkantys daugiakampį B pav. 7, keičiasi daug mažiau nei duomenys apie kurį daugiakampį A.

Paveikslas: 6. Du simetriški varpo formos pasiskirstymai, turintys vienodą sklaidą ir skirtingas vidutines reikšmes

Paveikslas: 7. Dvi simetriškos varpo formos pasiskirstymas su tomis pačiomis vidutinėmis reikšmėmis ir skirtingu išsibarstymu

Yra penki duomenų variacijų įvertinimai:

  • taikymo sritis,
  • tarpkvartilinis diapazonas,
  • dispersija,
  • standartinis nuokrypis,
  • variacijos koeficientas.

Sūpynės

Diapazonas yra skirtumas tarp didžiausių ir mažiausių imties elementų:

Braukite \u003d X „Max“ - X Min

Imties, kurioje yra duomenys apie 15 labai didelės rizikos investicinių fondų vidutines metines pajamas, diapazoną galima apskaičiuoti naudojant užsakytą masyvą (žr. 4 paveikslą): Span \u003d 18,5 - (–6,1) \u003d 24,6. Tai reiškia, kad skirtumas tarp didžiausios ir žemiausios vidutinės metinės grąžos fondams, turintiems labai didelę riziką, yra 24,6%.

Span matuoja bendrą duomenų sklaidą. Imties dydis yra labai paprastas bendro duomenų paplitimo įvertinimas, tačiau jo trūkumas yra tas, kad neatsižvelgiama į tai, kaip tiksliai paskirstomi duomenys tarp mažiausio ir maksimalaus elementų. Šis poveikis aiškiai matomas fig. 8, kuris iliustruoja pavyzdžius, kurių atstumas yra vienodas. B skalė rodo, kad jei pavyzdyje yra bent viena kraštutinė reikšmė, imties intervalas yra labai netikslus duomenų pasiskirstymo įvertinimas.

Paveikslas: 8. Trijų to paties diapazono mėginių palyginimas; trikampis simbolizuoja pusiausvyros palaikymą, o jo vieta atitinka imties vidurkį

Tarpkvartilinis diapazonas

Tarpkvartilis arba vidutinis diapazonas yra skirtumas tarp trečiojo ir pirmojo mėginio kvartilių:

Tarpkvartilinis diapazonas \u003d Q 3 - Q 1

Ši vertė leidžia įvertinti 50% elementų pasklidimą ir nepaisyti kraštutinių elementų įtakos. Tarpkvartalinis 15 labai didelės rizikos investicinių fondų vidutinės metinės grąžos imties intervalas gali būti apskaičiuojamas naudojant duomenis, pateiktus 1 pav. 4 (pavyzdžiui, funkcijai QUARTILE.EXC): Tarpkvartilinis diapazonas \u003d 9,8 - (–0,7) \u003d 10,5. Intervalas, apribotas skaičiais 9.8 ir –0.7, dažnai vadinamas vidurine puse.

Reikėtų pažymėti, kad Q 1 ir Q 3 vertės, taigi ir tarpkvartilinis intervalas, nepriklauso nuo pašalinių vietų buvimo, nes jų skaičiavimuose neatsižvelgiama į jokią vertę, kuri būtų mažesnė už Q 1 arba didesnė nei Q 3. Kiekybinių charakteristikų, tokių kaip mediana, pirmasis ir trečiasis kvartilis ir tarpkvartilinis intervalas, kuriems nedaro įtakos pašalinės vertės, suma vadinama tvirtaisiais matais.

Nors intervalas ir tarpkvartalinis diapazonas atitinkamai pateikia bendro ir vidutinio imties pasiskirstymo įverčius, nė viename iš šių įverčių neatsižvelgiama į tai, kaip pasiskirsto duomenys. Dispersija ir standartinis nuokrypisneturi šio trūkumo. Šie rodikliai leidžia įvertinti duomenų vidurkio svyravimo laipsnį. Imties dispersija yra aritmetinio vidurkio, apskaičiuoto pagal skirtumus tarp kiekvieno mėginio elemento ir mėginio vidurkio, apytikslis dydis. X 1, X 2, ... X n pavyzdžių pavyzdžių dispersija (žymima simboliu S 2) pateikiama pagal šią formulę:

Apskritai imties dispersija yra skirtumų tarp mėginio elementų ir imties vidurkio kvadratų suma, padalyta iš vertės, lygios imties dydžiui atėmus vieną:

kur - aritmetinis vidurkis, n - imties dydis, X i - ith pavyzdinis elementas X... „Excel“ programoje iki 2007 m. Imties dispersijai apskaičiuoti buvo naudojama \u003d VARP () funkcija; nuo 2010 m. Naudojama \u003d VARV () funkcija.

Pats praktiškiausias ir plačiausiai priimtas duomenų paplitimo įvertinimas yra standartinis mėginio nuokrypis... Šis indikatorius žymimas simboliu S ir yra lygus mėginio dispersijos kvadratinei šakniai:

„Excel“ programoje iki 2007 m. Standartiniam imties nuokrypiui apskaičiuoti buvo naudojama \u003d STDEV () funkcija, nuo 2010 m. Naudojama \u003d STDEV.V () funkcija. Skaičiuojant šias funkcijas, duomenų rinkinys gali būti nesutvarkytas.

Nei mėginio dispersija, nei standartinis mėginio nuokrypis negali būti neigiami. Vienintelė situacija, kai rodikliai S 2 ir S gali būti lygi nuliui, yra tada, jei visi imties elementai yra lygūs vienas kitam. Šiuo labai neįtikėtinu atveju span ir tarpkvartilinis diapazonas taip pat yra nulis.

Skaitmeniniai duomenys iš esmės yra nestabilūs. Bet kuris kintamasis gali įgyti daugybę skirtingų verčių. Pavyzdžiui, skirtingiems investiciniams fondams yra skirtingos grąžos ir nuostolių normos. Dėl skaitinių duomenų kintamumo labai svarbu ištirti ne tik vidurkio įverčius, kurie yra kaupiamojo pobūdžio, bet ir dispersijos įverčius, apibūdinančius duomenų pasiskirstymą.

Dispersija ir standartinis nuokrypis leidžia įvertinti duomenų pasiskirstymą pagal vidurkį, kitaip tariant, nustatyti, kiek imties elementų yra mažesni už vidurkį, o kiek - daugiau. Dispersija turi keletą vertingų matematinių savybių. Tačiau jo vertė yra matavimo vieneto kvadratas - kvadratinis procentas, kvadratinis doleris, kvadratinis colis ir kt. Taigi natūralus dispersijos matas yra standartinis nuokrypis, kuris išreiškiamas bendraisiais matavimo vienetais - pajamų, dolerių ar colių procentais.

Standartinis nuokrypis leidžia įvertinti mėginio elementų svyravimo dydį aplink vidurkį. Beveik visose situacijose didžioji dalis stebimų verčių yra intervalo plius arba minus vienas standartinis nuokrypis nuo vidurkio. Todėl žinant imties elementų aritmetinį vidurkį ir standartinį imties nuokrypį, galima nustatyti intervalą, kuriam priklauso didžioji dalis duomenų.

Standartinis 15 labai didelės rizikos investicinių fondų grąžos nuokrypis yra 6,6 (9 paveikslas). Tai reiškia, kad didžiosios dalies lėšų pelningumas skiriasi nuo vidutinės vertės ne daugiau kaip 6,6% (t. Y. Svyruoja intervale nuo - Š \u003d 6,2 - 6,6 \u003d nuo -0,4 iki + S \u003d 12,8). Tiesą sakant, šis intervalas yra penkerių metų vidutinė metinė 53,3% (8 iš 15) lėšų grąža.

Paveikslas: 9. Standartinis mėginio nuokrypis

Atminkite, kad sudėjus kvadratinius skirtumus, toliau esantis mėginys įgyja daugiau svorio nei artimesnis mėginys. Ši savybė yra pagrindinė priežastis, dėl kurios paskirstymo vidurkiui įvertinti dažniausiai naudojamas aritmetinis vidurkis.

Variacijos koeficientas

Skirtingai nuo ankstesnių skirtumų, variacijos koeficientas yra santykinis įvertinimas. Jis visada matuojamas procentais, o ne pagal pirminius duomenis. Variacijos koeficientas, žymimas CV, matuoja duomenų pasiskirstymą pagal vidurkį. Variacijos koeficientas yra lygus standartiniam nuokrypiui, padalytam iš aritmetinio vidurkio ir padauginto iš 100%:

kur S - standartinis mėginio nuokrypis, - imties vidurkis.

Variacijos koeficientas leidžia palyginti du pavyzdžius, kurių elementai išreiškiami skirtingais matavimo vienetais. Pavyzdžiui, pašto pristatymo vadovas ketina atnaujinti sunkvežimių parką. Kraunant pakuotes, reikia atsižvelgti į dviejų rūšių apribojimus: kiekvienos pakuotės svoris (svarais) ir tūris (kubinėmis pėdomis). Tarkime, kad 200 maišų pavyzdžio vidutinis svoris yra 26,0 svaro, standartinis svorio nuokrypis yra 3,9 svaro, vidutinis maišo tūris yra 8,8 kubinių pėdų, o standartinis tūrio nuokrypis yra 2,2 kubinio pėdų. Kaip galite palyginti maišų svorį ir tūrį?

Kadangi svorio ir tūrio matavimo vienetai skiriasi, valdytojas turi palyginti santykinį šių verčių pasiskirstymą. Svorio variacijos koeficientas yra CV W \u003d 3,9 / 26,0 * 100% \u003d 15%, o tūrio variacijos koeficientas CV V \u003d 2,2 / 8,8 * 100% \u003d 25%. Taigi santykinis paketų tūrio skirtumas yra daug didesnis nei santykinis jų svorio skirtumas.

Paskirstymo forma

Trečioji svarbi pavyzdžio savybė yra jo pasiskirstymo forma. Šis pasiskirstymas gali būti simetriškas arba asimetriškas. Norint apibūdinti pasiskirstymo formą, reikia apskaičiuoti jo vidurkį ir mediana. Jei šie du rodikliai sutampa, kintamasis laikomas simetriškai paskirstytu. Jei kintamojo vidutinė vertė yra didesnė nei mediana, jo pasiskirstymas turi teigiamą pasvirimą (10 pav.). Jei mediana yra didesnė už vidurkį, kintamojo pasiskirstymas yra neigiamai pasviręs. Teigiamas pasvirimas atsiranda, kai vidurkis padidėja iki neįprastai aukštų verčių. Neigiamas polinkis atsiranda, kai vidurkis sumažėja iki neįprastai mažų verčių. Kintamasis pasiskirsto simetriškai, jei jis nepriima jokių kraštutinių verčių abiem kryptimis, kad aukštoji ir mažoji kintamojo reikšmės subalansuotų viena kitą.

Paveikslas: 10. Trys paskirstymo tipai

A skalės duomenys yra neigiami. Šis paveikslas parodo ilgą uodegą ir posūkį į kairę dėl neįprastai mažų verčių. Šios ypač mažos vertės vidutiniškai pasislenka į kairę, ir ji tampa mažesnė už mediana. Duomenys, rodomi B skalėje, yra pasiskirstę simetriškai. Kairioji ir dešinė paskirstymo pusės yra jų veidrodiniai vaizdai. Aukštos ir žemos vertės panaikina viena kitą, o vidurkis ir mediana yra vienodi. Duomenys, rodomi B skalėje, yra teigiami. Šis paveikslas parodo ilgą uodegą ir pasvirimą į dešinę dėl neįprastai didelių verčių. Šios per didelės vertės paverčia vidurkį dešinėn, ir jis tampa didesnis nei mediana.

„Excel“ programoje aprašomąją statistiką galima gauti naudojant priedą Analizės paketas... Eikite per meniu DuomenysDuomenų analizė, atsidariusiame lange pasirinkite eilutę Aprašomoji statistika ir spustelėkite Gerai... Lange Aprašomoji statistika būtinai nurodykite Įvesties intervalas(11 pav.). Jei norite, kad tame pačiame lape kaip ir pradiniai duomenys būtų rodoma aprašomoji statistika, pažymėkite radijo mygtuką Išėjimo intervalas ir nurodykite langelį, kuriame turėtų būti pateiktas išvesties statistikos viršutinis kairysis kampas (mūsų pavyzdyje, $ C $ 1). Jei norite išvesti duomenis į naują lapą arba į naują darbaknygę, tiesiog pasirinkite atitinkamą radijo mygtuką. Pažymėkite langelį šalia Santraukos statistika... Taip pat galite pasirinkti Sunkumo lygis,k mažiausias irk didžiausia.

Jei deponuoja Duomenys regione Analizė jums nerodoma piktograma Duomenų analizė, pirmiausia turite įdiegti priedą Analizės paketas (žr., pavyzdžiui).

Paveikslas: 11. Apibūdinama labai aukšto lygio rizikos fondų penkerių metų metinės grąžos statistika, apskaičiuota naudojant priedą Duomenų analizė„Excel“ programos

„Excel“ apskaičiuoja įvairius aukščiau aptartus statistinius duomenis: vidurkį, medianą, režimą, standartinį nuokrypį, dispersiją, diapazoną ( intervalas), mažiausias, didžiausias ir imties dydis ( rezultatas). Be to, „Excel“ apskaičiuoja tam tikrą statistiką, kuri mums yra nauja: standartinė klaida, kurtozė ir skeptiškumas. Standartinė klaida lygus standartiniam nuokrypiui, padalytam iš imties dydžio kvadratinės šaknies. Asimetrija apibūdina nuokrypį nuo pasiskirstymo simetrijos ir yra funkcija, priklausanti nuo pavyzdžių elementų ir vidurkio skirtumų kubo. Kurtozė yra santykinės duomenų koncentracijos matavimo vidurkis, palyginti su paskirstymo uodegomis, dydis ir priklauso nuo skirtumų tarp mėginio ir vidurkio, padidinto iki ketvirtosios galios.

Aprašomosios gyventojų statistikos skaičiavimas

Aukščiau aptartas pasiskirstymo vidurkis, pasiskirstymas ir forma yra charakteristikos, nustatytos iš mėginio. Tačiau jei duomenų rinkinyje yra skaitiniai visos populiacijos matmenys, galite apskaičiuoti jo parametrus. Šie parametrai apima visos populiacijos matematinius lūkesčius, dispersiją ir standartinį nuokrypį.

Tikėtina vertė yra lygus visų populiacijos verčių sumai, padalytai iš bendro gyventojų skaičiaus:

kur µ - tikėtina vertė, X i- i-as kintamojo stebėjimas X, N - gyventojų skaičius. „Excel“ naudoja tą pačią funkciją matematiniam lūkesčiui apskaičiuoti kaip ir aritmetinį vidurkį: \u003d AVERAGE ().

Populiacijos dispersija lygus skirtumų tarp bendrosios populiacijos ir mat elementų kvadratų sumai. lūkesčiai, padalyti iš gyventojų skaičiaus:

kur σ 2 - gyventojų skaičiaus kitimas. „Excel“ programoje iki 2007 m. \u003d VARP () funkcija naudojama gyventojų dispersijai apskaičiuoti, nuo 2010 m. \u003d VARP.G ().

Gyventojų standartinis nuokrypis lygus populiacijos dispersijos kvadratinei šakniai:

„Excel“ programoje iki 2007 m. \u003d STDEVP () funkcija naudojama gyventojų standartiniam nuokrypiui apskaičiuoti, nuo 2010 m. \u003d STDEV.Y (). Atkreipkite dėmesį, kad populiacijos dispersijos ir standartinio nuokrypio formulės skiriasi nuo mėginio dispersijos ir standartinio nuokrypio formulės. Skaičiuojant imties statistiką S 2 ir S trupmenos vardiklis yra n - 1, o skaičiuojant parametrus σ 2 ir σ - gyventojų skaičius N.

Nykščio taisyklė

Daugeliu atvejų didelė dalis stebėjimų sutelkta aplink medianą ir sudaro klasterį. Duomenų rinkiniuose, turinčiuose teigiamą pakrypimą, ši grupė yra išdėstyta kairėje (t. Y. Žemiau) matematinio lūkesčio atžvilgiu, o duomenų rinkiniuose, turinčiuose neigiamą skeptiškumą, šis klasteris yra dešinėje (t. Y. Aukščiau) - matematinis laukimas. Simetrinių duomenų vidurkis ir mediana yra vienodi, o stebėjimai koncentruojami aplink vidurkį, sudarant varpo formos pasiskirstymą. Jei pasiskirstymas neturi ryškaus skeptiškumo, o duomenys yra sukoncentruoti aplink tam tikrą svorio centrą, kintamumui įvertinti gali būti taikoma nykščio taisyklė, kuri sako: jei duomenys turi varpo formos pasiskirstymą, tada maždaug 68% stebėjimų yra ne daugiau kaip vienas standartinis nuokrypis nuo matematinio lūkesčio. apytiksliai 95% stebėjimų yra ne daugiau kaip du standartiniai nuokrypiai nuo matematinio lūkesčio, o 99,7% stebėjimų yra ne daugiau kaip trys standartiniai nuokrypiai nuo matematinių lūkesčių.

Taigi, standartinis nuokrypis, kuris yra vidutinio vidurkio kitimo įvertinimas, padeda suprasti, kaip pasiskirstomi stebėjimai, ir nustatyti nuokrypius. Iš nykščio taisyklės išplaukia, kad varpo formos pasiskirstymui tik viena iš dvidešimties reikšmių skiriasi nuo matematinių lūkesčių daugiau nei dviem standartiniais nuokrypiais. Todėl vertės, esančios už intervalo ribų µ ± 2σgali būti laikomi pašaliniais dalykais. Be to, tik trys iš 1000 stebėjimų skiriasi nuo matematinių lūkesčių daugiau nei trim standartiniais nuokrypiais. Taigi vertės, esančios už intervalo ribų µ ± 3σ beveik visada yra didesni. Pasiskirstymams, kurie yra labai iškreipti ar be varpo formos, gali būti taikoma Biename-Chebyshev empirinė taisyklė.

Daugiau nei prieš šimtą metų matematikai Biename ir Čebiševas savarankiškai atrado naudingą standartinio nuokrypio savybę. Jie nustatė, kad bet kokio duomenų rinkinio, neatsižvelgiant į pasiskirstymo formą, atstumų, esančių atstumu, procentinė dalis neviršija k ne mažesni kaip standartiniai nuokrypiai nuo matematinio lūkesčio (1 – 1/ k 2) * 100 proc..

Pavyzdžiui, jei k \u003d 2, Biename-Chebyshev taisyklėje teigiama, kad mažiausiai (1 - (1/2) 2) x 100% \u003d 75% stebėjimų turi būti tarp µ ± 2σ... Ši taisyklė galioja bet kam kdidesnis nei vienas. „Biename-Chebyshev“ taisyklė yra labai bendra ir galioja bet kokio pobūdžio paskirstymams. Tai rodo mažiausią stebėjimų skaičių, atstumas nuo kurio iki matematinio lūkesčio neviršija nurodytos vertės. Tačiau jei pasiskirstymas yra varpo formos, nykščio taisyklė yra tikslesnė vertinant duomenų koncentraciją aplink tikėtiną vertę.

Aprašomosios statistikos, skirtos paskirstymui pagal dažnį, skaičiavimas

Jei pirminių duomenų nėra, dažnio pasiskirstymas tampa vieninteliu informacijos šaltiniu. Tokiomis situacijomis galite apskaičiuoti apytiksles kiekybinio paskirstymo rodiklių reikšmes, tokias kaip aritmetinis vidurkis, standartinis nuokrypis, kvartiliai.

Jei imties duomenys pateikiami kaip dažnio pasiskirstymas, galima apskaičiuoti apytikslę aritmetinio vidurkio vertę, darant prielaidą, kad visos kiekvienos klasės vertės yra sukoncentruotos klasės viduryje:

kur - imties vidurkis, n - stebėjimų skaičius arba imties dydis, nuo - dažnių pasiskirstymo klasių skaičius, m j - vidurio taškas j-Gerai, f j yra dažnis, atitinkantis j-a klasė.

Norint apskaičiuoti standartinį nuokrypį nuo dažnio pasiskirstymo, taip pat daroma prielaida, kad visos kiekvienos klasės vertės yra sutelktos į klasės vidurį.

Norėdami suprasti, kaip serijų kvartilai nustatomi pagal dažnį, panagrinėkime apatinio kvartilio skaičiavimą, remiantis 2013 m. Duomenimis apie Rusijos gyventojų pasiskirstymą pagal vidutines pinigų pajamas vienam gyventojui (12 pav.).

Paveikslas: 12. Rusijos gyventojų dalis, kai vidutiniškai per mėnesį gaunamos pinigų pajamos vienam gyventojui, rubliai

Norėdami apskaičiuoti pirmąjį intervalo variacijų serijos kvartilį, galite naudoti formulę:

čia Q1 yra pirmojo kvartilio vertė, хQ1 yra apatinė intervalo, kuriame yra pirmoji kvartilis, riba (intervalas nustatomas pagal kaupiamąjį dažnį, pirmasis viršija 25%); i yra intervalo dydis; Σf yra viso mėginio dažnių suma; tikriausiai visada lygus 100%; SQ1-1 yra kumuliacinis intervalo dažnis prieš intervalą, kuriame yra apatinė kvartilė; fQ1 yra intervalo, kuriame yra apatinė kvartilis, dažnis. Trečiojo kvartilio formulė skiriasi tuo, kad visose vietose vietoj Q1 turėtų būti naudojamas Q3, o ¾ turėtų būti pakeistas ¾.

Mūsų pavyzdyje (12 pav.) Apatinis kvartilas yra 7000,1–10 000, o jo bendras dažnis yra 26,4%. Apatinė šio intervalo riba yra 7000 rublių, intervalo vertė yra 3 000 rublių, sukauptas intervalo dažnis prieš intervalą, kuriame yra apatinė kvartilė, yra 13,4%, intervalo, kuriame yra apatinis kvartilis, dažnis yra 13,0%. Taigi: Q1 \u003d 7000 + 3000 * (¼ * 100 - 13,4) / 13 \u003d 9677 rubliai.

Spąstai su aprašoma statistika

Šiame įraše mes nagrinėjome, kaip aprašyti duomenų rinkinį, naudojant įvairius statistinius duomenis, kurie įvertina jo vidurkį, sklaidą ir pasiskirstymą. Kitas žingsnis yra duomenų analizė ir aiškinimas. Iki šiol mes tyrėme objektyvias duomenų savybes, o dabar kreipiamės į subjektyvų jų aiškinimą. Tyrėjo laukia dvi klaidos: neteisingai pasirinktas analizės objektas ir neteisingas rezultatų interpretavimas.

15 labai didelės rizikos investicinių fondų veiklos analizė yra gana nešališka. Tai leido padaryti visiškai objektyvias išvadas: visų investicinių fondų grąža yra skirtinga, fondų grąža svyruoja nuo –6,1 iki 18,5, o vidutinė grąža yra 6,08. Duomenų analizės objektyvumą užtikrina teisingas visų kiekybinių paskirstymo rodiklių pasirinkimas. Buvo apsvarstyti keli duomenų vidurkio ir pasiskirstymo įvertinimo būdai, nurodyti jų pranašumai ir trūkumai. Kaip jūs pasirenkate tinkamą statistiką, kuri pateikia objektyvią ir nešališką analizę? Jei jūsų duomenų pasiskirstymas yra šiek tiek neryškus, ar turėtumėte pasirinkti aritmetinio vidurkio vidurkį? Kuris rodiklis tiksliau apibūdina duomenų sklaidą: standartinis nuokrypis ar diapazonas? Ar reikėtų atkreipti dėmesį į teigiamą paskirstymo poslinkį?

Kita vertus, duomenų aiškinimas yra subjektyvus procesas. Skirtingi žmonės, aiškindami tuos pačius rezultatus, daro skirtingas išvadas. Kiekvienas žmogus turi savo požiūrį. Kažkas mano, kad bendrieji 15 fondų vidutinės metinės grąžos rodikliai, turintys labai didelę riziką, yra geri ir yra gana patenkinti gautomis pajamomis. Kiti gali manyti, kad šių lėšų grąža yra per maža. Taigi subjektyvumą turėtų kompensuoti sąžiningumas, neutralumas ir išvadų aiškumas.

Etikos klausimai

Duomenų analizė neatsiejamai susijusi su etikos problemomis. Reikėtų kritikuoti laikraščių, radijo, televizijos ir interneto skleidžiamą informaciją. Laikui bėgant išmoksite skeptiškai vertinti ne tik rezultatus, bet ir tyrimo tikslus, dalyką ir objektyvumą. Garsus britų politikas Benjaminas Disraeli sakė tai geriausiai: „Yra trys melo rūšys: melas, akivaizdus melas ir statistika“.

Kaip pažymėta pastaboje, pasirenkant rezultatus, apie kuriuos reikia pranešti, kyla etikos problemų. Turėtų būti paskelbti ir teigiami, ir neigiami rezultatai. Be to, sudarant ataskaitą ar rašytinę ataskaitą, rezultatai turi būti pateikti sąžiningai, neutraliai ir objektyviai. Atskirkite nesėkmingą ir nesąžiningą pateikimą. Tam reikia nustatyti, kokie buvo pranešėjo ketinimai. Kartais kalbėtojas nepaiso svarbios informacijos, o kartais sąmoningai (pavyzdžiui, jei norėdamas gauti norimą rezultatą, jis naudoja aritmetinį vidurkį aiškiai asimetrinių duomenų vidurkiui įvertinti). Taip pat nesąžininga glostyti rezultatus, kurie neatitinka tyrėjo požiūrio.

Naudota knyga iš vadovų Levin ir kitos statistikos. - M .: Williams, 2004 .-- p. 178-209

Funkcija QUARTILE išlaikoma suderinamumui su ankstesnėmis „Excel“ versijomis