Cum se calculează corect valoarea medie? Cum se găsește media aritmetică în Excel Cum se calculează media dintre două numere

În matematică, media aritmetică a numerelor (sau pur și simplu media) este suma tuturor numerelor dintr-o mulțime dată împărțită la numărul lor. Acesta este conceptul cel mai generalizat și răspândit. mărime medie. După cum ați înțeles deja, pentru a găsi valoarea medie, trebuie să însumați toate numerele date și să împărțiți rezultatul la numărul de termeni.

Care este media aritmetică?

Să ne uităm la un exemplu.

Exemplul 1. Sunt date numere: 6, 7, 11. Trebuie să găsiți valoarea lor medie.

Soluţie.

Mai întâi, să găsim suma tuturor numerelor date.

Acum împărțim suma rezultată la numărul de termeni. Deoarece avem trei termeni, respectiv, vom împărți la trei.

Prin urmare, media numerelor 6, 7 și 11 este 8. De ce 8? Da, pentru că suma 6, 7 și 11 va fi aceeași cu trei opturi. Acest lucru se vede clar în ilustrație.

Valoarea medie amintește oarecum de „alinierea” unei serii de numere. După cum puteți vedea, mormanele de creioane au devenit un nivel.

Luați în considerare un alt exemplu pentru a consolida cunoștințele acumulate.

Exemplul 2 Sunt date numere: 3, 7, 5, 13, 20, 23, 39, 23, 40, 23, 14, 12, 56, 23, 29. Trebuie să găsiți media lor aritmetică.

Soluţie.

Găsim suma.

3 + 7 + 5 + 13 + 20 + 23 + 39 + 23 + 40 + 23 + 14 + 12 + 56 + 23 + 29 = 330

Împărțiți la numărul de termeni (în acest caz, 15).

Prin urmare, valoarea medie a acestei serii de numere este 22.

Acum luați în considerare numerele negative. Să ne amintim cum să le rezumam. De exemplu, aveți două numere 1 și -4. Să le găsim suma.

1 + (-4) = 1 – 4 = -3

Știind acest lucru, luați în considerare un alt exemplu.

Exemplul 3 Aflați valoarea medie a unei serii de numere: 3, -7, 5, 13, -2.

Soluţie.

Aflarea sumei numerelor.

3 + (-7) + 5 + 13 + (-2) = 12

Deoarece există 5 termeni, împărțim suma rezultată la 5.

Prin urmare, media aritmetică a numerelor 3, -7, 5, 13, -2 este 2,4.

În timpul nostru de progres tehnologic, este mult mai convenabil să folosiți pentru a găsi valoarea medie programe de calculator. Microsoft Office Excel este unul dintre ele. Găsirea mediei în Excel este rapidă și ușoară. Mai mult, acest program este inclus în pachetul software de la Microsoft Office. Considera instructiuni scurte cum să găsiți media aritmetică folosind acest program.

Pentru a calcula valoarea medie a unei serii de numere, trebuie să utilizați funcția MEDIE. Sintaxa pentru această funcție este:
=Medie(argument1, argument2, ... argument255)
unde argument1, argument2, ... argument255 sunt fie numere, fie referințe de celule (celulele înseamnă intervale și matrice).

Pentru a fi mai clar, haideți să testăm cunoștințele acumulate.

  1. Introduceți numerele 11, 12, 13, 14, 15, 16 în celulele C1 - C6.
  2. Selectați celula C7 făcând clic pe ea. În această celulă, vom afișa valoarea medie.
  3. Faceți clic pe fila „Formule”.
  4. Selectați Mai multe funcții > Statistică pentru a deschide lista derulantă.
  5. Selectați MEDIE. După aceea, ar trebui să se deschidă o casetă de dialog.
  6. Selectați și trageți celulele C1-C6 acolo pentru a seta intervalul în caseta de dialog.
  7. Confirmați acțiunile dvs. cu butonul „OK”.
  8. Dacă ați făcut totul corect, în celula C7 ar trebui să aveți răspunsul - 13.7. Când faceți clic pe celula C7, funcția (=Medie(C1:C6)) va fi afișată în bara de formule.

Este foarte util să folosiți această funcție pentru contabilitate, facturi sau atunci când trebuie doar să găsiți media unui interval foarte lung de numere. Prin urmare, este adesea folosit în birouri și companii mari. Acest lucru vă permite să păstrați evidențele în ordine și face posibilă calcularea rapidă a ceva (de exemplu, venitul mediu pe lună). De asemenea, cu folosind Excel puteți găsi valoarea medie a funcției.

In medie

Acest termen are alte semnificații, vezi sensul mediu.

In medie(în matematică și statistică) seturi de numere - suma tuturor numerelor împărțită la numărul lor. Este una dintre cele mai comune măsurători ale tendinței centrale.

A fost propusă (împreună cu media geometrică și media armonică) de către pitagoreici.

Cazurile speciale ale mediei aritmetice sunt media ( populatie) și media eșantionului (eșantioane).

Introducere

Indicați setul de date X = (X 1 , X 2 , …, X n), atunci media eșantionului este de obicei notat cu o bară orizontală peste variabila (x ¯ (\displaystyle (\bar (x))) , pronunțată " X cu o liniuță").

Litera greacă μ este folosită pentru a desemna media aritmetică a întregii populații. Pentru variabilă aleatorie, pentru care este definită valoarea medie, μ este probabilitate medie sau așteptarea matematică a unei variabile aleatoare. Dacă setul X este o colecție de numere aleatoare cu o medie a probabilității μ, apoi pentru orice probă X i din această colecție μ = E( X i) este așteptarea acestui eșantion.

În practică, diferența dintre μ și x ¯ (\displaystyle (\bar (x))) este că μ este o variabilă tipică, deoarece puteți vedea eșantionul mai degrabă decât întreaga populație. Prin urmare, dacă eșantionul este reprezentat aleatoriu (în termeni de teoria probabilității), atunci x ¯ (\displaystyle (\bar (x))) (dar nu μ) poate fi tratată ca o variabilă aleatoare având o distribuție de probabilitate pe eșantion ( distribuția de probabilitate a mediei).

Ambele cantități sunt calculate în același mod:

X ¯ = 1 n ∑ i = 1 n x i = 1 n (x 1 + ⋯ + x n) . (\displaystyle (\bar (x))=(\frac (1)(n))\sum _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\cdots +x_(n)).)

Dacă X este o variabilă aleatorie, apoi așteptarea matematică X poate fi considerată media aritmetică a valorilor în măsurători repetate ale mărimii X. Aceasta este o manifestare a legii numere mari. Prin urmare, media eșantionului este utilizată pentru a estima așteptările matematice necunoscute.

În algebra elementară, se demonstrează că media n+ 1 numere peste medie n numere dacă și numai dacă noul număr este mai mare decât vechea medie, mai puțin dacă și numai dacă noul număr este mai mic decât media și nu se modifică dacă și numai dacă noul număr este egal cu media. Cu atât mai mult n, cu atât este mai mică diferența dintre mediile noi și cele vechi.

Rețineți că există câteva alte „medii” disponibile, inclusiv media puterii, media Kolmogorov, medie armonică, medie aritmetică-geometrică și diverse medii ponderate (de exemplu, medie ponderată aritmetică, medie ponderată geometrică, medie ponderată armonică) .

Exemple

  • Pentru trei numere, trebuie să le adunați și să le împărțiți la 3:
x 1 + x 2 + x 3 3 . (\displaystyle (\frac (x_(1)+x_(2)+x_(3))(3)).) x 1 + x 2 + x 3 + x 4 4 . (\displaystyle (\frac (x_(1)+x_(2))+x_(3)+x_(4))(4)).)

Sau mai ușor 5+5=10, 10:2. Pentru că am adăugat 2 numere, ceea ce înseamnă că câte numere adunăm, împărțim la atât.

Variabilă aleatoare continuă

Pentru o valoare distribuită continuu f (x) (\displaystyle f(x)) media aritmetică pe intervalul [ a ; b ] (\displaystyle ) este definit printr-o integrală definită:

F (x) ¯ [ a ; b ] = 1 b - a ∫ a b f (x) d x (\displaystyle (\overline (f(x)))_()=(\frac (1)(b-a))\int _(a)^(b) f(x)dx)

Câteva probleme de utilizare a mediei

Lipsa robusteței

Articolul principal: Robustețe în statistică

Deși media aritmetică este adesea folosită ca medie sau tendințe centrale, acest concept nu se aplică statisticilor robuste, ceea ce înseamnă că media aritmetică este puternic influențată de „abateri mari”. Este de remarcat faptul că, pentru distribuțiile cu o asimetrie mare, media aritmetică poate să nu corespundă conceptului de „medie”, iar valorile mediei din statistici robuste (de exemplu, mediana) pot descrie mai bine tendința centrală.

Exemplul clasic este calculul venitului mediu. Media aritmetică poate fi interpretată greșit ca mediană, ceea ce poate duce la concluzia că există mai mulți oameni cu venituri mai mari decât există în realitate. Venitul „mediu” este interpretat în așa fel încât veniturile majorității oamenilor să fie apropiate de acest număr. Acest venit „mediu” (în sensul mediei aritmetice) este mai mare decât venitul majorității oamenilor, deoarece un venit mare cu o abatere mare de la medie face ca media aritmetică să fie puternic denaturată (dimpotrivă, venitul median „rezistă” o astfel de înclinare). Cu toate acestea, acest venit „mediu” nu spune nimic despre numărul de persoane aflate în apropierea venitului mediu (și nu spune nimic despre numărul de persoane din apropierea venitului modal). Cu toate acestea, dacă conceptele de „medie” și „majoritate” sunt luate cu ușurință, atunci se poate concluziona greșit că majoritatea oamenilor au venituri mai mari decât sunt în realitate. De exemplu, un raport privind venitul net „mediu” din Medina, Washington, calculat ca media aritmetică a tuturor veniturilor nete anuale ale rezidenților, va oferi o valoare surprinzător. număr mare din cauza lui Bill Gates. Luați în considerare eșantionul (1, 2, 2, 2, 3, 9). Media aritmetică este 3,17, dar cinci dintre cele șase valori sunt sub această medie.

Interes compus

Articolul principal: ROI

Dacă numerele multiplica, dar nu pliază, trebuie să utilizați media geometrică, nu media aritmetică. Cel mai adesea, acest incident se întâmplă atunci când se calculează rentabilitatea investiției în finanțe.

De exemplu, dacă stocurile au scăzut cu 10% în primul an și au crescut cu 30% în al doilea an, atunci este incorect să calculăm creșterea „medie” în acești doi ani ca medie aritmetică (−10% + 30%) / 2 = 10%; media corectă în acest caz este dată de rata de creștere anuală compusă, din care creșterea anuală este de numai aproximativ 8,16653826392% ≈ 8,2%.

Motivul pentru aceasta este că procentele au un nou punct de plecare de fiecare dată: 30% este 30% dintr-un număr mai mic decât prețul de la începutul primului an: dacă stocul a început de la 30 USD și a scăzut cu 10%, valorează 27 USD la începutul celui de-al doilea an. Dacă stocul crește cu 30%, valorează 35,1 USD la sfârșitul celui de-al doilea an. Media aritmetică a acestei creșteri este de 10%, dar din moment ce stocul a crescut cu doar 5,1 USD în 2 ani, o creștere medie de 8,2% oferă rezultat final $35.1:

[30 USD (1 - 0,1) (1 + 0,3) = 30 USD (1 + 0,082) (1 + 0,082) = 35,1 USD]. Dacă folosim media aritmetică a 10% în același mod, nu vom obține valoarea reală: [$30 (1 + 0.1) (1 + 0.1) = $36.3].

Dobânda compusă la sfârșitul anului 2: 90% * 130% = 117% , adică o creștere totală de 17%, iar dobânda compusă medie anuală este de 117% ≈ 108,2% (\displaystyle (\sqrt (117\%)) \aproximativ 108,2\%) , adică o creștere medie anuală de 8,2%.

Directii

Articolul principal: Statistici despre destinație

Când se calculează media aritmetică a unei variabile care se modifică ciclic (de exemplu, faza sau unghiul), trebuie avută o atenție deosebită. De exemplu, media 1° și 359° ar fi 1 ∘ + 359 ∘ 2 = (\displaystyle (\frac (1^(\circ )+359^(\circ ))(2))=) 180°. Acest număr este incorect din două motive.

  • În primul rând, măsurile unghiulare sunt definite doar pentru intervalul de la 0° la 360° (sau de la 0 la 2π când sunt măsurate în radiani). Astfel, aceeași pereche de numere ar putea fi scrisă ca (1° și -1°) sau ca (1° și 719°). Mediile fiecărei perechi vor fi diferite: 1 ∘ + (− 1 ∘) 2 = 0 ∘ (\displaystyle (\frac (1^(\circ )+(-1^(\circ )))(2))= 0 ^(\circ )) , 1 ∘ + 719 ∘ 2 = 360 ∘ (\displaystyle (\frac (1^(\circ )+719^(\circ ))(2))=360^(\circ )) .
  • În al doilea rând, în acest caz, o valoare de 0° (echivalent cu 360°) va fi cea mai bună medie geometrică, deoarece numerele se abat de la 0° decât de la orice altă valoare (valoarea 0° are cea mai mică variație). Comparaţie:
    • numărul 1° se abate de la 0° cu doar 1°;
    • numărul 1° se abate de la media calculată de 180° cu 179°.

Valoarea medie pentru o variabilă ciclică, calculată conform formulei de mai sus, va fi deplasată artificial în raport cu media reală la mijlocul intervalului numeric. Din această cauză, media se calculează într-un mod diferit, și anume, ca valoare medie se alege numărul cu cea mai mică varianță (punctul central). De asemenea, în loc de scădere, se folosește distanța modulo (adică distanța circumferențială). De exemplu, distanța modulară între 1° și 359° este 2°, nu 358° (pe un cerc între 359° și 360°==0° - un grad, între 0° și 1° - tot 1°, în total - 2 °).

Media ponderată - ce este și cum se calculează?

În procesul de studiere a matematicii, elevii se familiarizează cu conceptul de medie aritmetică. În viitor, în statistică și în alte științe, studenții se confruntă și cu calcularea altor medii. Ce pot fi și în ce se deosebesc unul de celălalt?

Medii: Semnificație și diferențe

Indicatorii nu întotdeauna exacti oferă o înțelegere a situației. Pentru a evalua cutare sau cutare situație, uneori este necesar să se analizeze un număr mare de cifre. Și apoi mediile vin în ajutor. Ele vă permit să evaluați situația în general.


Încă din timpul școlii, mulți adulți își amintesc existența mediei aritmetice. Este foarte ușor de calculat - suma unei secvențe de n termeni este divizibilă cu n. Adică, dacă trebuie să calculați media aritmetică în succesiunea valorilor 27, 22, 34 și 37, atunci trebuie să rezolvați expresia (27 + 22 + 34 + 37) / 4, deoarece 4 valori sunt utilizate în calcule. În acest caz, valoarea dorită va fi egală cu 30.

Adesea, în cadrul cursului școlar, se studiază și media geometrică. Calculul acestei valori se bazează pe extragerea rădăcinii gradului al n-lea din produsul n termeni. Dacă luăm aceleași numere: 27, 22, 34 și 37, atunci rezultatul calculelor va fi 29,4.

Media armonică într-o școală de învățământ general nu este de obicei subiect de studiu. Cu toate acestea, este folosit destul de des. Această valoare este reciproca mediei aritmetice și se calculează ca un coeficient de n - numărul de valori și suma 1/a 1 +1/a 2 +...+1/a n . Dacă luăm din nou aceeași serie de numere pentru calcul, atunci armonica va fi 29,6.

Medie ponderată: caracteristici

Cu toate acestea, este posibil ca toate valorile de mai sus să nu fie folosite peste tot. De exemplu, în statistică, la calcularea unor valori medii, „greutatea” fiecărui număr folosit în calcule joacă un rol important. Rezultatele sunt mai revelatoare și mai corecte pentru că țin cont de mai multe informații. Acest grup de cantități este denumirea comună "medie ponderată„. Nu sunt trecute la școală, așa că merită să ne oprim mai detaliat asupra lor.

În primul rând, merită să explicăm ce se înțelege prin „greutatea” unei anumite valori. Cel mai simplu mod de a explica acest lucru este să exemplu concret. Temperatura corporală a fiecărui pacient este măsurată de două ori pe zi în spital. Din cei 100 de pacienți din diferite secții ale spitalului, 44 vor avea o temperatură normală - 36,6 grade. Alte 30 vor avea o valoare crescută - 37,2, 14 - 38, 7 - 38,5, 3 - 39, iar restul de două - 40. Și dacă luăm media aritmetică, atunci această valoare în general pentru spital va fi peste 38 de grade. ! Dar aproape jumătate dintre pacienți au o temperatură complet normală. Și aici ar fi mai corect să folosiți media ponderată, iar „greutatea” fiecărei valori va fi numărul de persoane. În acest caz, rezultatul calculului va fi de 37,25 grade. Diferența este evidentă.

În cazul calculelor medii ponderate, „greutatea” poate fi luată ca fiind numărul de expedieri, numărul de persoane care lucrează într-o anumită zi, în general, orice poate fi măsurat și poate afecta rezultatul final.

Soiuri

Media ponderată corespunde cu media aritmetică discutată la începutul articolului. Cu toate acestea, prima valoare, așa cum sa menționat deja, ia în considerare și ponderea fiecărui număr utilizat în calcule. În plus, există și valori geometrice și armonice ponderate.

Există o altă varietate interesantă folosită în serii de numere. Aceasta este o medie mobilă ponderată. Pe baza ei se calculează tendințele. Pe lângă valorile în sine și greutatea lor, acolo se utilizează și periodicitatea. Și atunci când se calculează valoarea medie la un moment dat, se iau în considerare și valorile pentru perioadele de timp anterioare.

Calcularea tuturor acestor valori nu este atât de dificilă, dar în practică se utilizează de obicei doar media ponderată obișnuită.

Metode de calcul

În era computerizării, nu este nevoie să calculați manual media ponderată. Cu toate acestea, ar fi util să cunoașteți formula de calcul pentru a putea verifica și, dacă este cazul, corecta rezultatele obținute.

Cel mai ușor va fi să luați în considerare calculul pe un exemplu specific.

Este necesar să aflați care este salariul mediu la această întreprindere, ținând cont de numărul de lucrători care primesc un anumit salariu.

Deci, calculul mediei ponderate se efectuează folosind următoarea formulă:

x = (a 1 *w 1 +a 2 *w 2 +...+a n *w n)/(w 1 +w 2 +...+w n)

De exemplu, calculul ar fi:

x = (32*20+33*35+34*14+40*6)/(20+35+14+6) = (640+1155+476+240)/75 = 33,48

Evident, nu există nicio dificultate deosebită în calcularea manuală a mediei ponderate. Formula pentru calcularea acestei cantități într-una dintre cele mai multe aplicații populare cu formule - Excel - arata ca o functie SUMPRODUS (seria de numere; seria de greutati) / SUMA (seria de greutati).

Cum să găsiți valoarea medie în Excel?

cum să găsești media aritmetică în excel?

Vladimir09854

La fel de ușor ca o plăcintă. Pentru a găsi valoarea medie în excel, aveți nevoie doar de 3 celule. În primul scriem un număr, în al doilea - altul. Și în a treia celulă, vom nota o formulă care ne va oferi valoarea medie dintre aceste două numere din prima și a doua celulă. Dacă celula nr. 1 se numește A1, celula nr. 2 se numește B1, atunci în celula cu formula trebuie să scrieți astfel:

Această formulă calculează media aritmetică a două numere.

Pentru frumusețea calculelor noastre, putem evidenția celulele cu linii, sub formă de plăcuță.

Există și o funcție în Excel în sine pentru a determina valoarea medie, dar folosesc metoda de modă veche și introdu formula de care am nevoie. Astfel, sunt sigur că Excel va calcula exact așa cum am nevoie și nu va veni cu un fel de rotunjire proprie.

M3sergey

Acest lucru este foarte ușor dacă datele sunt deja introduse în celule. Dacă sunteți doar interesat de un număr, trebuie doar să selectați intervalul / intervalele dorite, iar valoarea sumei acestor numere, media lor aritmetică și numărul lor vor apărea în bara de stare din dreapta jos.

Puteți selecta o celulă goală, faceți clic pe triunghiul (lista derulantă) „Autosum” și selectați „Medie” acolo, după care veți fi de acord cu intervalul propus pentru calcul sau alegeți-l pe al dvs.

În cele din urmă, puteți utiliza formulele direct - faceți clic pe „Inserare funcție” lângă bara de formule și adresa celulei. Funcția AVERAGE se află în categoria „Statistică” și ia drept argumente atât numere, cât și referințe de celule etc. Acolo puteți selecta și mai multe opțiuni complexe, de exemplu, AVERAGEIF - calculul mediei în funcție de condiție.

Găsiți media în excel este o sarcină destul de simplă. Aici trebuie să înțelegeți dacă doriți să utilizați această valoare medie în unele formule sau nu.

Dacă trebuie să obțineți doar valoarea, atunci este suficient să selectați intervalul necesar de numere, după care excel va calcula automat valoarea medie - va fi afișată în bara de stare, rubrica „Medie”.

În cazul în care doriți să utilizați rezultatul în formule, puteți face acest lucru:

1) Însumați celulele folosind funcția SUM și împărțiți totul la numărul de numere.

2) O opțiune mai corectă este să folosiți o funcție specială numită MEDIE. Argumentele acestei funcții pot fi numere date secvențial sau o serie de numere.

Vladimir Tihonov

încercuiți valorile care vor fi implicate în calcul, faceți clic pe fila „Formule”, acolo veți vedea „AutoSum” în stânga și lângă ea un triunghi îndreptat în jos. faceți clic pe acest triunghi și alegeți „Medie”. Voila, gata) în partea de jos a coloanei vei vedea valoarea medie :)

Ekaterina Mutalapova

Să începem de la început și în ordine. Ce înseamnă medie?

Valoarea medie este valoarea care este media aritmetică, adică. se calculează adunând un set de numere și apoi împărțind suma totală a numerelor la numărul lor. De exemplu, pentru numerele 2, 3, 6, 7, 2 va fi 4 (suma numerelor 20 se împarte la numărul lor 5)

ÎN Foaie de calcul Excel Pentru mine personal, cel mai simplu mod a fost să folosesc formula =AVERAGE. Pentru a calcula valoarea medie, trebuie să introduceți date în tabel, să scrieți funcția =AVERAGE() sub coloana de date, iar între paranteze indicați intervalul de numere din celule, evidențiind coloana cu datele. După aceea, apăsați ENTER sau pur și simplu faceți clic stânga pe orice celulă. Rezultatul va fi afișat în celula de sub coloană. Pe față, descrierea este de neînțeles, dar de fapt este o chestiune de câteva minute.

Aventurier 2000

Programul Excel are mai multe fațete, așa că există mai multe opțiuni care vă vor permite să găsiți media:

Prima varianta. Pur și simplu însumați toate celulele și împărțiți la numărul lor;

A doua varianta. Folosiți o comandă specială, scrieți în celula necesară formula „=MEDIA (și aici specificați intervalul de celule)”;

A treia opțiune. Dacă selectați intervalul necesar, atunci rețineți că în pagina de mai jos este afișată și valoarea medie din aceste celule.

Astfel, există o mulțime de modalități de a găsi valoarea medie, trebuie doar să o alegi pe cea mai bună pentru tine și să o folosești constant.

În Excel, folosind funcția MEDIE, puteți calcula media aritmetică simplă. Pentru a face acest lucru, trebuie să introduceți un număr de valori. Apăsați egal și selectați în categoria Statistică, dintre care selectați funcția MEDIE



De asemenea, folosind formule statistice, puteți calcula media ponderată aritmetică, care este considerată mai precisă. Pentru a-l calcula, avem nevoie de valorile indicatorului și ale frecvenței.

Cum să găsiți media în Excel?

Situatia este aceasta. Există următorul tabel:

Coloanele umbrite în roșu conțin valorile numerice ale notelor la subiecte. În coloana „Medie”, trebuie să calculați valoarea medie a acestora.
Problema este aceasta: sunt 60-70 de obiecte în total și unele dintre ele sunt pe altă coală.
M-am uitat într-un alt document, media a fost deja calculată, iar în celulă există o formulă de genul
="numele foii"!|E12
dar asta a fost făcut de un programator care a fost concediat.
Spune-mi, te rog, cine înțelege asta.

Hector

În linia de funcții, introduceți „MEDIA” din funcțiile propuse și alegeți de unde trebuie calculate (B6: N6) pentru Ivanov, de exemplu. Nu știu sigur despre foile învecinate, dar cu siguranță acest lucru este conținut în ajutorul standard Windows

Spune-mi cum să calculez valoarea medie în Word

Vă rog să-mi spuneți cum să calculez valoarea medie în Word. Și anume, valoarea medie a evaluărilor, și nu numărul de persoane care au primit evaluări.


Iulia pavlova

Word poate face multe cu macrocomenzi. Apăsați ALT+F11 și scrieți un program macro..
În plus, Insert-Object... vă va permite să utilizați alte programe, chiar și Excel, pentru a crea o foaie cu un tabel în interiorul unui document Word.
Dar, în acest caz, trebuie să vă scrieți numerele în coloana tabelului și să puneți media în celula de jos a aceleiași coloane, nu?
Pentru a face acest lucru, introduceți un câmp în celula de jos.
Inserare-Câmp...-Formulă
Conținutul câmpului
[=MEDIA(SAI)]
returnează media sumei celulelor de mai sus.
Dacă câmpul este selectat și butonul din dreapta al mouse-ului este apăsat, atunci acesta poate fi Actualizat dacă numerele s-au schimbat,
vizualizați codul sau valoarea câmpului, modificați codul direct în câmp.
Dacă ceva nu merge bine, ștergeți întregul câmp din celulă și recreați-l.
MEDIE înseamnă medie, SUS - aproximativ, adică un rând de celule deasupra.
Nu știam eu însumi toate acestea, dar le-am găsit ușor în HELP, bineînțeles, gândindu-mă puțin.

Tine minte!

La găsiți media aritmetică, trebuie să adunați toate numerele și să împărțiți suma lor la numărul lor.


Aflați media aritmetică a lui 2, 3 și 4.

Să notăm media aritmetică cu litera „m”. După definiția de mai sus, găsim suma tuturor numerelor.


Împărțiți suma rezultată la numărul de numere luate. Avem trei numere.

Drept urmare, obținem formula mediei aritmetice:


Pentru ce înseamnă aritmetica?

Pe lângă faptul că se oferă în mod constant să fie găsit în sala de clasă, găsirea mediei aritmetice este foarte utilă în viață.

De exemplu, decideți să vindeți mingi de fotbal. Dar din moment ce ești nou în această afacere, este complet de neînțeles la ce preț vinzi mingi.

Atunci te hotărăști să afli la ce preț concurenții tăi vând deja mingi de fotbal în zona ta. Aflați prețurile în magazine și faceți o masă.

Prețurile pentru mingi din magazine s-au dovedit a fi destul de diferite. Ce preț ar trebui să alegem pentru a vinde mingea de fotbal?

Dacă o alegem pe cea mai mică (290 de ruble), atunci vom vinde mărfurile în pierdere. Dacă îl alegeți pe cel mai mare (360 de ruble), atunci cumpărătorii nu vor cumpăra mingi de fotbal de la noi.

Avem nevoie de un preț mediu. Aici vine în ajutor in medie.

Calculați media aritmetică a prețurilor pentru mingi de fotbal:

prețul mediu =

290 + 360 + 310
3
=
960
3
= 320 freca.

Astfel, am obținut prețul mediu (320 de ruble), la care putem vinde o minge de fotbal nu prea ieftină și nici prea scumpă.

Viteza medie de deplasare

Strâns legat de media aritmetică este conceptul viteza medie.

Observând mișcarea traficului în oraș, puteți observa că mașinile fie accelerează și circulă cu viteză mare, apoi încetinesc și circulă cu viteză mică.

Există multe astfel de secțiuni de-a lungul traseului vehiculelor. Prin urmare, pentru comoditatea calculelor, este utilizat conceptul de viteză medie.

Tine minte!

Viteza medie de mișcare este distanța totală parcursă împărțită la timpul total de mișcare.

Luați în considerare problema pentru viteza medie.

Sarcina numărul 1503 din manualul „Vilenkin Clasa 5”

Mașina a parcurs 3,2 ore pe autostradă cu viteza de 90 km/h, apoi 1,5 ore pe un drum de pământ cu viteza de 45 km/h, iar în final 0,3 ore pe un drum de țară cu viteza de 30 km/h. Găsiți viteza medie a mașinii pentru întreaga călătorie.

Pentru a calcula viteza medie de mișcare, trebuie să cunoașteți întreaga distanță parcursă de mașină și întregul timp în care mașina s-a deplasat.

S 1 \u003d V 1 t 1

S 1 \u003d 90 3,2 \u003d 288 (km)

- autostrada.

S 2 \u003d V 2 t 2

S 2 \u003d 45 1,5 \u003d 67,5 (km) - drum de pământ.

S 3 \u003d V 3 t 3

S 3 \u003d 30 0,3 \u003d 9 (km) - drum de țară.

S = S 1 + S 2 + S 3

S \u003d 288 + 67,5 + 9 \u003d 364,5 (km) - întreaga cale parcursă de mașină.

T \u003d t 1 + t 2 + t 3

T \u003d 3,2 + 1,5 + 0,3 \u003d 5 (h) - tot timpul.

V cf \u003d S: t

V cf \u003d 364,5: 5 \u003d 72,9 (km / h) - viteza medie a mașinii.

Răspuns: V av = 72,9 (km / h) - viteza medie a mașinii.

Pentru a găsi valoarea medie în Excel (fie că este o valoare numerică, textuală, procentuală sau altă valoare), există multe funcții. Și fiecare dintre ele are propriile sale caracteristici și avantaje. La urma urmei, anumite condiții pot fi stabilite în această sarcină.

De exemplu, valorile medii ale unei serii de numere în Excel sunt calculate folosind funcții statistice. De asemenea, puteți introduce manual propria formulă. Să luăm în considerare diferite opțiuni.

Cum se găsește media aritmetică a numerelor?

Pentru a găsi media aritmetică, adăugați toate numerele din mulțime și împărțiți suma la număr. De exemplu, notele unui student la informatică: 3, 4, 3, 5, 5. Ce este valabil pentru un sfert: 4. Am găsit media aritmetică folosind formula: \u003d (3 + 4 + 3 + 5 + 5) / 5.

Cum să o faci rapid cu Funcții Excel? Luați de exemplu o serie de numere aleatorii dintr-un șir:

Sau: activați celula și introduceți pur și simplu manual formula: =AVERAGE(A1:A8).

Acum să vedem ce mai poate face funcția AVERAGE.


Aflați media aritmetică a primelor două și a ultimelor trei numere. Formula: =MEDIE(A1:B1;F1:H1). Rezultat:



Medie după condiție

Condiția pentru aflarea mediei aritmetice poate fi un criteriu numeric sau unul text. Vom folosi funcția: =AVERAGEIF().

Aflați media aritmetică a numerelor care sunt mai mari sau egale cu 10.

Funcție: =AVERAGEIF(A1:A8,">=10")


Rezultatul utilizării funcției AVERAGEIF cu condiția „>=10”:

Al treilea argument - „Intervalul de mediere” - este omis. În primul rând, nu este necesar. În al doilea rând, intervalul analizat de program conține NUMAI valori numerice. În celulele specificate în primul argument, căutarea va fi efectuată conform condiției specificate în al doilea argument.

Atenţie! Criteriul de căutare poate fi specificat într-o celulă. Și în formula pentru a face o referire la ea.

Să găsim valoarea medie a numerelor după criteriul textului. De exemplu, vânzările medii ale produsului „tabele”.

Funcția va arăta astfel: =AVERAGEIF($A$2:$A$12;A7;$B$2:$B$12). Interval - o coloană cu nume de produse. Criteriul de căutare este o legătură către o celulă cu cuvântul „tabele” (puteți introduce cuvântul „tabele” în loc de linkul A7). Interval de mediere - acele celule din care vor fi luate date pentru a calcula valoarea medie.

Ca rezultat al calculului funcției, obținem următoarea valoare:

Atenţie! Pentru un criteriu text (condiție), trebuie specificat intervalul de mediere.

Cum se calculează prețul mediu ponderat în Excel?

Cum știm prețul mediu ponderat?

Formula: =SUMAPRODUS(C2:C12;B2:B12)/SUMA(C2:C12).


Folosind formula SUMPRODUCT, aflăm venitul total după vânzarea întregii cantități de mărfuri. Și funcția SUM - însumează cantitatea de mărfuri. Împărțind venitul total din vânzarea de bunuri la numărul total de unități de mărfuri, am găsit prețul mediu ponderat. Acest indicator ține cont de „greutatea” fiecărui preț. Ponderea sa în masa totală a valorilor.

Abaterea standard: formula în Excel

Distinge mediul deviație standard pentru populaţia generală şi pentru eşantion. În primul caz, aceasta este rădăcina varianței generale. În al doilea, din varianța eșantionului.

Pentru a calcula acest indicator statistic, este compilată o formulă de dispersie. Rădăcina este luată din ea. Dar în Excel există o funcție gata făcută pentru găsirea abaterii standard.


Abaterea standard este legată de amploarea datelor sursă. Acest lucru nu este suficient pentru o reprezentare figurativă a variației intervalului analizat. Pentru a obține nivelul relativ de împrăștiere în date, se calculează coeficientul de variație:

abatere standard / medie aritmetică

Formula în Excel arată astfel:

STDEV (interval de valori) / AVERAGE (interval de valori).

Coeficientul de variație se calculează procentual. Prin urmare, setăm formatul procentual în celulă.

Salariul mediu... Speranța medie de viață... Aproape în fiecare zi auzim aceste expresii folosite pentru a descrie multe cu una singular. Dar, în mod ciudat, „valoarea medie” este un concept destul de insidios, care induce adesea în eroare o persoană obișnuită care nu are experiență în statistici matematice.

Care este problema?

Valoarea medie înseamnă cel mai adesea media aritmetică, care variază foarte mult sub influența unor fapte sau evenimente individuale. Și nu vă veți face o idee reală despre cum sunt distribuite exact valorile pe care le învățați.

Să luăm un exemplu clasic de salariu mediu.

O companie abstractă are zece angajați. Nouă dintre ei primesc un salariu de aproximativ 50.000 de ruble, iar unul de 1.500.000 de ruble (într-o coincidență ciudată, el este și el CEO aceasta companie).

Valoarea medie în acest caz va fi de 195.150 de ruble, ceea ce, vedeți, este greșit.

Care sunt modalitățile de a calcula media?

Prima modalitate este de a calcula cele deja menționate medie aritmetică, care este suma tuturor valorilor împărțită la numărul lor.

  • x – medie aritmetică;
  • x n - valoare specifică;
  • n - numărul de valori.
  • Funcționează bine cu o distribuție normală a valorilor în eșantion;
  • Ușor de calculat;
  • Intuitiv.
  • Nu oferă o idee reală despre distribuția valorilor;
  • O cantitate instabilă care este ușor aruncată (ca în cazul CEO-ului).

A doua modalitate este de a calcula Modă, care este valoarea care apare cel mai frecvent.

  • M 0 - mod;
  • x0 este limita inferioară a intervalului care conține modul;
  • n este valoarea intervalului;
  • f m - frecvență (de câte ori apare o anumită valoare într-o serie);
  • f m-1 - frecvența intervalului premergător modalului;
  • f m+1 este frecvența intervalului care urmează modalului.
  • Excelent pentru a obține un simț al opiniei publice;
  • Bun pentru date non-numerice (culori ale sezonului, bestselleruri, evaluări);
  • Ușor de înțeles.
  • Moda poate pur și simplu să nu existe (fără repetări);
  • Pot exista mai multe moduri (distribuție multimodală).

A treia modalitate este de a calcula mediane, adică valoarea care împarte proba comandată în două jumătăți și se află între ele. Și dacă nu există o astfel de valoare, atunci media aritmetică dintre limitele jumătăților eșantionului este luată ca mediană.

  • M e este mediana;
  • x0 este limita inferioară a intervalului care conține mediana;
  • h este valoarea intervalului;
  • f i - frecvența (de câte ori apare o anumită valoare într-o serie);
  • S m-1 - suma frecvențelor intervalelor care preced mediana;
  • f m este numărul de valori din intervalul median (frecvența acestuia).
  • Oferă cea mai realistă și reprezentativă estimare;
  • Rezistent la emisii.
  • Este mai dificil de calculat, deoarece eșantionul trebuie comandat înainte de calcul.

Am luat în considerare metodele de bază pentru găsirea valorii medii, numite măsuri de tendinţă centrală(de fapt sunt mai multe, dar acestea sunt cele mai populare).

Acum să revenim la exemplul nostru și să calculăm toate cele trei variante ale mediei folosind funcții speciale Excel:

  • MEDIE(număr1;[număr2];…) — funcție pentru determinarea mediei aritmetice;
  • FASHION.ONE(număr1,[număr2],...) - funcție de modă (versiunile mai vechi de Excel foloseau FASHION(număr1,[număr2],...));
  • MEDIAN(număr1;[număr2];...) este o funcție pentru găsirea medianei.

Și iată care sunt valorile pe care le avem:

În acest caz, modul și mediana caracterizează mult mai bine salariul mediu în companie.

Dar ce să faci când nu există 10 valori în eșantion, ca în exemplu, ci milioane? În Excel, acest lucru nu poate fi calculat, dar în baza de date în care sunt stocate datele dvs., nicio problemă.

Calculați media aritmetică în SQL

Totul este destul de simplu aici, deoarece SQL oferă o funcție de agregare specială AVG .

Și pentru a-l folosi, este suficient să scrieți următoarea interogare:

Calcularea modului în SQL

SQL nu are o funcție separată pentru găsirea modului, dar îl puteți scrie ușor și rapid. Pentru a face acest lucru, trebuie să aflăm care dintre salarii se repetă cel mai des și să alegem pe cel mai popular.

Să scriem o interogare:

/* WITH TIES trebuie adăugat la TOP() dacă setul este multimodal, adică setul are mai multe moduri */ SELECT TOP(1) WITH TIES salariul CA „Modul salarial” FROM angajații GROUP BY salary ORDER BY COUNT(*) DESC

Calculați mediana în SQL

Ca și în cazul modei, SQL nu are o funcție încorporată pentru calcularea mediei, dar are o funcție generică pentru calcularea percentilelor PERCENTILE_CONT .

Totul arată așa:

/* În acest caz, percentila de 0,5 va fi mediana */ SELECTARE TOP(1) PERCENTILE_CONT(0.5) WITHIN GROUP (ORDER BY salary) OVER() AS "Salariu mediu" FROM angajați

Este mai bine să citiți mai multe despre funcționarea funcției PERCENTILE_CONT cu ajutorul Microsoft și Google BigQuery .

Ce mod de a folosi oricum?

Din cele de mai sus rezultă că mediana Cel mai bun mod pentru a calcula valoarea medie.

Dar nu este întotdeauna cazul. Dacă lucrați cu media, atunci aveți grijă la distribuția multimodală:

Graficul prezintă o distribuție bimodală cu două vârfuri. O astfel de situație poate apărea, de exemplu, la vot în alegeri.

În acest caz, media aritmetică și mediana sunt valori undeva la mijloc și nu vor spune nimic despre ceea ce se întâmplă cu adevărat și este mai bine să recunoașteți imediat că aveți de-a face cu o distribuție bimodală raportând două moduri.

Mai bine, împărțiți eșantionul în două grupuri și colectați date statistice pentru fiecare.

Concluzie:

Atunci când alegeți o metodă de găsire a mediei, este necesar să se țină seama de prezența valorilor aberante, precum și de distribuția normală a valorilor în eșantion.

Alegerea finală a măsurii tendinței centrale revine întotdeauna analistului.

În cele mai multe cazuri, datele sunt concentrate în jurul unui punct central. Astfel, pentru a descrie orice set de date, este suficient să indicați valoarea medie. Luați în considerare succesiv trei caracteristici numerice care sunt utilizate pentru estimarea valorii medii a distribuției: media aritmetică, mediana și modul.

In medie

Media aritmetică (denumită adesea pur și simplu medie) este cea mai comună estimare a mediei unei distribuții. Este rezultatul împărțirii sumei tuturor valorilor numerice observate la numărul lor. Pentru un eșantion de numere X 1, X 2, ..., Xn, media eșantionului (notat cu simbolul ) egal \u003d (X 1 + X 2 + ... + Xn) / n, sau

unde este media eșantionului, n- marime de mostra, Xii-lea element mostre.

Descărcați nota în sau format, exemple în format

Luați în considerare calculul mediei valoare aritmetică randamente anuale medii pe cinci ani de 15 fonduri mutuale cu foarte nivel inalt risc (fig. 1).

Orez. 1. Rentabilitatea anuală medie a 15 fonduri mutuale cu risc foarte ridicat

Media eșantionului se calculează după cum urmează:

Acesta este un randament bun, mai ales în comparație cu randamentul de 3-4% pe care l-au primit deponenții băncilor sau uniunii de credit în aceeași perioadă de timp. Dacă sortați valorile randamentului, este ușor de observat că opt fonduri au un randament peste medie și șapte sub medie. Media aritmetică acționează ca un punct de echilibru, astfel încât fondurile cu venituri mici echilibrează fondurile cu venituri mari. Toate elementele eșantionului sunt implicate în calculul mediei. Niciunul dintre ceilalți estimatori ai mediei de distribuție nu are această proprietate.

Când se calculează media aritmetică. Deoarece media aritmetică depinde de toate elementele eșantionului, prezența valorilor extreme afectează în mod semnificativ rezultatul. În astfel de situații, media aritmetică poate distorsiona sensul datelor numerice. Prin urmare, atunci când se descrie un set de date care conține valori extreme, este necesar să se indice mediana sau media aritmetică și mediana. De exemplu, dacă rentabilitatea fondului RS Emerging Growth este eliminată din eșantion, media eșantionului a randamentului celor 14 fonduri scade cu aproape 1% până la 5,19%.

Median

Mediana este valoarea mediană matrice ordonată de numere. Dacă matricea nu conține numere care se repetă, atunci jumătate din elementele sale vor fi mai mici și jumătate mai mult decât mediana. Dacă eșantionul conține valori extreme, este mai bine să folosiți mediana mai degrabă decât media aritmetică pentru a estima media. Pentru a calcula mediana unui eșantion, acesta trebuie mai întâi sortat.

Această formulă este ambiguă. Rezultatul depinde dacă numărul este par sau impar. n:

  • Dacă eșantionul conține un număr impar de articole, mediana este (n+1)/2-al-lea element.
  • Dacă eșantionul conține un număr par de elemente, mediana se află între cele două elemente din mijloc ale eșantionului și este egală cu media aritmetică calculată pentru aceste două elemente.

Pentru a calcula mediana pentru un eșantion de 15 fonduri mutuale cu risc foarte mare, trebuie mai întâi să sortăm datele brute (Figura 2). Atunci mediana va fi opusă numărului elementului mijlociu al probei; în exemplul nostru numărul 8. Excel are functie speciala=MEDIAN(), care funcționează și cu matrice neordonate.

Orez. 2. Median 15 fonduri

Astfel, mediana este 6,5. Aceasta înseamnă că jumătate din fondurile cu risc foarte mare nu depășesc 6,5, în timp ce cealaltă jumătate o fac. Rețineți că mediana de 6,5 este puțin mai mare decât mediana de 6,08.

Dacă eliminăm profitabilitatea fondului RS Emerging Growth din eșantion, atunci mediana celor 14 fonduri rămase va scădea la 6,2%, adică nu la fel de semnificativ ca media aritmetică (Fig. 3).

Orez. 3. Median 14 fonduri

Modă

Termenul a fost introdus pentru prima dată de Pearson în 1894. Moda este numărul care apare cel mai des în eșantion (cel mai la modă). Moda descrie bine, de exemplu, reacția tipică a șoferilor la un semnal de circulație pentru a opri traficul. Un exemplu clasic de utilizare a modei este alegerea mărimii lotului de pantofi produs sau a culorii tapetului. Dacă o distribuție are mai multe moduri, atunci se spune că este multimodală sau multimodală (are două sau mai multe „vârfuri”). Multimodalitatea distribuţiei dă Informații importante despre natura variabilei studiate. De exemplu, în anchetele sociologice, dacă o variabilă reprezintă o preferință sau atitudine față de ceva, atunci multimodalitatea poate însemna că există mai multe opinii diferite. Multimodalitatea este, de asemenea, un indicator că eșantionul nu este omogen și că observațiile pot fi generate de două sau mai multe distribuții „suprapuse”. Spre deosebire de media aritmetică, valorile aberante nu afectează modul. Pentru variabile aleatoare distribuite continuu, cum ar fi randamentul mediu anual al fondurilor mutuale, modul uneori nu există deloc (sau nu are sens). Deoarece acești indicatori pot lua o varietate de valori, valorile repetate sunt extrem de rare.

Quartiles

Quartilele sunt măsuri care sunt utilizate cel mai frecvent pentru a evalua distribuția datelor atunci când descriu proprietățile eșantioanelor numerice mari. În timp ce mediana împarte matricea ordonată în jumătate (50% din elementele matricei sunt mai mici decât mediana și 50% sunt mai mari), quartilele împart setul de date ordonat în patru părți. Valorile Q 1 , mediana și Q 3 sunt percentilele 25, 50 și, respectiv, 75. Prima cuartilă Q 1 este un număr care împarte eșantionul în două părți: 25% dintre elemente sunt mai mici decât și 75% sunt mai mult decât prima cuartilă.

A treia cuartilă Q 3 este un număr care împarte eșantionul în două părți: 75% dintre elemente sunt mai mici și 25% sunt mai mult de o treime quartila.

Pentru a calcula quartile în versiunile de Excel anterioare anului 2007, a fost folosită funcția =QUARTILE(array, part). Începând cu Excel 2010, se aplică două funcții:

  • =QUARTILE.ON(matrice, parte)
  • =QUARTILE.EXC(matrice, parte)

Aceste două funcții dau puțin diverse sensuri(Fig. 4). De exemplu, atunci când se calculează quartilele pentru un eșantion care conține date privind randamentul anual mediu a 15 fonduri mutuale cu risc foarte ridicat, Q 1 = 1,8 sau -0,7 pentru QUARTILE.INC și, respectiv, QUARTILE.EXC. Apropo, funcția QUARTILE folosită mai devreme corespunde funcție modernă CUARTILUL PORNIT Pentru a calcula quartile în Excel folosind formulele de mai sus, matricea de date poate fi lăsată neordonată.

Orez. 4. Calculați quartile în Excel

Să subliniem din nou. Excel poate calcula quartile pentru univariat serie discretă, care conține valorile unei variabile aleatoare. Calculul quartilelor pentru o distribuție bazată pe frecvență este prezentat în secțiunea de mai jos.

medie geometrică

Spre deosebire de media aritmetică, media geometrică măsoară cât de mult s-a schimbat o variabilă în timp. Media geometrică este rădăcina n gradul de la produs n valori (în Excel se folosește funcția = CUGEOM):

G= (X 1 * X 2 * ... * X n) 1/n

Un parametru similar - media geometrică a ratei de rentabilitate - este determinat de formula:

G \u003d [(1 + R 1) * (1 + R 2) * ... * (1 + R n)] 1 / n - 1,

Unde R i- rata de rentabilitate i-a-a perioadă de timp.

De exemplu, să presupunem că investiția inițială este de 100 000 USD. Până la sfârșitul primului an, aceasta scade la 50 000 USD și, la sfârșitul celui de-al doilea an, se recuperează la 100 000 USD inițial. Rata rentabilității acestei investiții pe o perioadă de doi- perioada anului este egală cu 0, deoarece suma inițială și finală a fondurilor sunt egale între ele. Cu toate acestea, media aritmetică a ratelor anuale de rentabilitate este = (-0,5 + 1) / 2 = 0,25 sau 25%, deoarece rata rentabilității în primul an R 1 = (50.000 - 100.000) / 100.000 = -0,5 și în al doilea R 2 = (100.000 - 50.000) / 50.000 = 1. În același timp, media geometrică a ratei rentabilității pe doi ani este: G = [(1–0,5) * (1 + 1 )] 1 /2 – 1 = ½ – 1 = 1 – 1 = 0. Astfel, media geometrică reflectă mai exact modificarea (mai precis, absența modificării) a volumului investițiilor pe parcursul bienului decât media aritmetică.

Fapte interesante.În primul rând, media geometrică va fi întotdeauna mai mică decât media aritmetică a acelorași numere. Cu excepția cazului în care toate numerele luate sunt egale între ele. În al doilea rând, luând în considerare proprietățile unui triunghi dreptunghic, se poate înțelege de ce media se numește geometrică. Înălțimea unui triunghi dreptunghic, coborât la ipotenuză, este media proporțională dintre proiecțiile catetelor pe ipotenuză, iar fiecare catete este media proporțională dintre ipotenuză și proiecția acesteia pe ipotenuză (Fig. 5). Aceasta oferă o modalitate geometrică de a construi media geometrică a două (lungimi) segmente: trebuie să construiți un cerc pe suma acestor două segmente ca diametru, apoi înălțimea, restabilită de la punctul de conectare la intersecția cu cerc, va da valoarea dorită:

Orez. 5. Natura geometrică a mediei geometrice (figura de pe Wikipedia)

A doua proprietate importantă a datelor numerice este lor variație caracterizarea gradului de dispersie a datelor. Două mostre diferite pot diferi atât în ​​ceea ce privește valorile medii, cât și în variații. Totuși, așa cum se arată în fig. 6 și 7, două eșantioane pot avea aceeași variație, dar medii diferite, sau aceeași medie și variație complet diferită. Datele corespunzătoare poligonului B din Fig. 7 se schimbă mult mai puțin decât datele din care a fost construit poligonul A.

Orez. 6. Două distribuții simetrice în formă de clopot cu aceeași răspândire și valori medii diferite

Orez. 7. Două distribuții simetrice în formă de clopot cu aceleași valori medii și dispersie diferită

Există cinci estimări ale variației datelor:

domeniul de aplicare

Intervalul este diferența dintre cele mai mari și cele mai mici elemente ale eșantionului:

Glisați = XMax-XMin

Intervalul unui eșantion care conține randamentele medii anuale a 15 fonduri mutuale cu risc foarte ridicat poate fi calculat utilizând o matrice ordonată (vezi Figura 4): interval = 18,5 - (-6,1) = 24,6. Aceasta înseamnă că diferența dintre rentabilitatea medie anuală cea mai mare și cea mai scăzută pentru fondurile cu risc foarte ridicat este de 24,6%.

Intervalul măsoară răspândirea globală a datelor. Deși intervalul de eșantion este o estimare foarte simplă a răspândirii totale a datelor, slăbiciunea sa este că nu ia în considerare exact modul în care datele sunt distribuite între elementele minime și maxime. Acest efect este bine văzut în fig. 8 care ilustrează mostre având același interval. Scala B arată că, dacă eșantionul conține cel puțin o valoare extremă, intervalul eșantionului este o estimare foarte inexactă a dispersării datelor.

Orez. 8. Comparația a trei probe cu același interval; triunghiul simbolizează suportul balanței, iar amplasarea acesteia corespunde valorii medii a probei

Intervalul intercuartil

Intervalul intercuartil, sau media, este diferența dintre a treia și prima cuartilă a eșantionului:

Interval intercuartil \u003d Q 3 - Q 1

Această valoare face posibilă estimarea răspândirii a 50% din elemente și să nu se țină cont de influența elementelor extreme. Intervalul interquartil pentru un eșantion care conține date privind randamentele anuale medii a 15 fonduri mutuale cu risc foarte ridicat poate fi calculat folosind datele din Fig. 4 (de exemplu, pentru funcția QUARTILE.EXC): Interval interquartile = 9,8 - (-0,7) = 10,5. Intervalul dintre 9,8 și -0,7 este adesea denumit jumătatea mijlocie.

Trebuie remarcat faptul că valorile Q 1 și Q 3 și, prin urmare, intervalul intercuartil, nu depind de prezența valorilor aberante, deoarece calculul lor nu ia în considerare nicio valoare care ar fi mai mică decât Q 1 sau mai mare decât Q 3 . Total caracteristici cantitative, cum ar fi mediana, primul și al treilea quartile și intervalul intercuartil, care nu sunt afectate de valori aberante, sunt numite măsuri robuste.

În timp ce intervalul și intervalul intercuartil oferă o estimare a dispersiei totale și, respectiv, medie a eșantionului, niciuna dintre aceste estimări nu ia în considerare exact modul în care sunt distribuite datele. Varianta si abaterea standard liber de acest neajuns. Acești indicatori vă permit să evaluați gradul de fluctuație a datelor în jurul mediei. Varianta eșantionului este o aproximare a mediei aritmetice calculată din diferențele pătrate dintre fiecare element eșantion și media eșantionului. Pentru un eșantion de X 1 , X 2 , ... X n varianța eșantionului (notat cu simbolul S 2 este dată de următoarea formulă:

În general, varianța eșantionului este suma diferențelor pătrate dintre elementele eșantionului și media eșantionului, împărțită la o valoare egală cu dimensiunea eșantionului minus unu:

Unde - medie aritmetică, n- marime de mostra, X i - i-al-lea element de probă X. În Excel înainte de versiunea 2007, funcția =VAR() a fost folosită pentru a calcula varianța eșantionului, începând cu versiunea 2010, este folosită funcția =VAR.V().

Cea mai practică și larg acceptată estimare a împrăștierii datelor este deviație standard. Acest indicator este notat cu simbolul S și este egal cu rădăcină pătrată din varianța eșantionului:

În Excel înainte de versiunea 2007, se folosea funcția =STDEV() pentru a calcula abaterea standard, din versiunea 2010 se folosește funcția =STDEV.B(). Pentru a calcula aceste funcții, matricea de date poate fi neordonată.

Nici varianța eșantionului și nici abaterea standard a eșantionului nu pot fi negative. Singura situație în care indicatorii S 2 și S pot fi zero este dacă toate elementele eșantionului sunt egale. În acest caz complet improbabil, intervalul și intervalul intercuartil sunt, de asemenea, zero.

Datele numerice sunt în mod inerent volatile. Orice variabilă poate prelua un set valori diferite. De exemplu, diferite fonduri mutuale au rate diferite de rentabilitate și pierdere. Datorită variabilității datelor numerice, este foarte important să se studieze nu numai estimări ale mediei, care sunt de natură sumativă, ci și estimări ale varianței, care caracterizează împrăștierea datelor.

Varianța și abaterea standard ne permit să estimăm răspândirea datelor în jurul mediei, cu alte cuvinte, să determinăm câte elemente ale eșantionului sunt mai mici decât media și câte sunt mai mari. Dispersia are unele proprietăți matematice valoroase. Cu toate acestea, valoarea sa este pătratul unei unități de măsură - un procent pătrat, un dolar pătrat, un inch pătrat etc. Prin urmare, o estimare naturală a varianței este abaterea standard, care este exprimată în unitățile obișnuite de măsură - procente din venit, dolari sau inci.

Abaterea standard vă permite să estimați cantitatea de fluctuație a elementelor eșantionului în jurul valorii medii. În aproape toate situațiile, majoritatea valorilor observate se află în plus sau minus o abatere standard de la medie. Prin urmare, cunoscând media aritmetică a elementelor eșantionului și abaterea standard a eșantionului, este posibil să se determine intervalul căruia îi aparține cea mai mare parte a datelor.

Abaterea standard a randamentelor a 15 fonduri mutuale cu risc foarte ridicat este de 6,6 (Figura 9). Aceasta înseamnă că profitabilitatea majorității fondurilor diferă de valoarea medie cu cel mult 6,6% (adică fluctuează în intervalul de la – S= 6,2 – 6,6 = –0,4 până la + S= 12,8). De fapt, acest interval conține o rentabilitate anuală medie pe cinci ani de 53,3% (8 din 15) din fonduri.

Orez. 9. Abaterea standard

Rețineți că în procesul de însumare a diferențelor pătrate, articolele care sunt mai departe de medie câștigă mai multă greutate decât articolele care sunt mai apropiate. Această proprietate este principalul motiv pentru care media aritmetică este folosită cel mai adesea pentru a estima media unei distribuții.

Coeficientul de variație

Spre deosebire de estimările anterioare de dispersie, coeficientul de variație este o estimare relativă. Este întotdeauna măsurată ca procent, nu în unitățile de date originale. Coeficientul de variație, notat cu simbolurile CV, măsoară împrăștierea datelor în jurul mediei. Coeficientul de variație este egal cu abaterea standard împărțită la media aritmetică și înmulțită cu 100%:

Unde S- abaterea standard a probei, - medie eșantionului.

Coeficientul de variație vă permite să comparați două eșantioane, ale căror elemente sunt exprimate în unități de măsură diferite. De exemplu, managerul unui serviciu de livrare poștă intenționează să modernizeze flota de camioane. La încărcarea pachetelor, există două tipuri de restricții de luat în considerare: greutatea (în lire sterline) și volumul (în picioare cubi) ale fiecărui pachet. Să presupunem că, într-un eșantion de 200 de saci, greutatea medie este de 26,0 lire sterline, abaterea standard a greutății este de 3,9 lire sterline, volumul mediu al pachetului este de 8,8 picioare cubi, iar abaterea standard a volumului este de 2,2 picioare cubi. Cum să comparăm răspândirea greutății și volumului pachetelor?

Deoarece unitățile de măsură pentru greutate și volum diferă între ele, managerul trebuie să compare răspândirea relativă a acestor valori. Coeficientul de variație a greutății este CV W = 3,9 / 26,0 * 100% = 15%, iar coeficientul de variație a volumului CV V = 2,2 / 8,8 * 100% = 25%. Astfel, împrăștierea relativă a volumelor de pachete este mult mai mare decât împrăștierea relativă a greutăților lor.

Formular de distribuire

A treia proprietate importantă a eșantionului este forma distribuției sale. Această distribuție poate fi simetrică sau asimetrică. Pentru a descrie forma unei distribuții, este necesar să se calculeze media și mediana acesteia. Dacă aceste două măsuri sunt aceleași, se spune că variabila este distribuită simetric. Dacă valoarea medie a unei variabile este mai mare decât mediana, distribuția ei are o asimetrie pozitivă (Fig. 10). Dacă mediana este mai mare decât media, distribuția variabilei este denaturată negativ. Deformarea pozitivă apare atunci când media crește la un nivel neobișnuit valori mari. Deformarea negativă apare atunci când media scade la valori neobișnuit de mici. O variabilă este distribuită simetric dacă nu ia valori extreme în nicio direcție, astfel încât valorile mari și mici ale variabilei se anulează reciproc.

Orez. 10. Trei tipuri de distribuții

Datele prezentate pe scara A au o asimetrie negativă. Această figură arată o coadă lungă și o oblică la stânga cauzate de valori neobișnuit de mici. Aceste valori extrem de mici schimbă valoarea medie spre stânga și devine mai mică decât mediana. Datele prezentate pe scara B sunt distribuite simetric. Jumătățile stânga și dreapta ale distribuției sunt imaginile lor în oglindă. Valorile mari și mici se echilibrează reciproc, iar media și mediana sunt egale. Datele prezentate pe scara B au o asimetrie pozitivă. Această figură arată o coadă lungă și înclinată spre dreapta, cauzată de prezența unor valori neobișnuit de ridicate. Aceste valori prea mari mută media spre dreapta și devine mai mare decât mediana.

În Excel, statisticile descriptive pot fi obținute folosind programul de completare Pachet de analize. Treceți prin meniu DateAnaliza datelor, în fereastra care se deschide, selectați linia Statisticile descriptiveși faceți clic Bine. La fereastră Statisticile descriptive asigurați-vă că indicați interval de intrare(Fig. 11). Dacă doriți să vedeți statistici descriptive pe aceeași foaie cu datele originale, selectați butonul radio interval de ieșireși specificați celula în care doriți să plasați colțul din stânga sus al statisticilor afișate (în exemplul nostru, $C$1). Dacă doriți să scoateți date într-o foaie nouă sau într-un registru de lucru nou, pur și simplu selectați butonul radio corespunzător. Bifați caseta de lângă Statistici finale. Opțional, puteți alege și Nivel de dificultate,k-a cel mai mic șik-a cea mai mare.

Dacă în depozit Dateîn zonă Analiză nu vezi pictograma Analiza datelor, mai întâi trebuie să instalați suplimentul Pachet de analize(vezi, de exemplu,).

Orez. 11. Statistici descriptive ale randamentelor medii anuale pe cinci ani ale fondurilor cu niveluri foarte ridicate de risc, calculate folosind add-on-ul Analiza datelor programe Excel

Excel calculează un număr de statistici discutate mai sus: medie, mediană, mod, abatere standard, varianță, interval ( interval), minim, maxim și dimensiunea eșantionului ( Verifica). În plus, Excel calculează câteva statistici noi pentru noi: eroare standard, curtoză și asimetrie. eroare standard este egal cu abaterea standard împărțită la rădăcina pătrată a dimensiunii eșantionului. Asimetrie caracterizează abaterea de la simetria distribuţiei şi este o funcţie care depinde de cubul de diferenţe dintre elementele probei şi valoarea medie. Kurtosis este o măsură a concentrației relative a datelor în jurul mediei față de cozile distribuției și depinde de diferențele dintre eșantion și media ridicată la a patra putere.

Calculul statisticilor descriptive pentru populația generală

Media, împrăștierea și forma distribuției discutate mai sus sunt caracteristici bazate pe eșantion. Cu toate acestea, dacă setul de date conține măsurători numerice ale întregii populații, atunci parametrii acestuia pot fi calculați. Acești parametri includ media, varianța și abaterea standard a populației.

Valorea estimata este egal cu suma tuturor valorilor populației generale împărțită la volumul populației generale:

Unde µ - valorea estimata, Xi- i-a-a observație variabilă X, N- volumul populaţiei generale. În Excel, pentru a calcula așteptările matematice, se folosește aceeași funcție ca și pentru media aritmetică: =AVERAGE().

Varianta populatiei egal cu suma diferenţelor pătrate dintre elementele populaţiei generale şi mat. așteptări împărțite la dimensiunea populației:

Unde σ2 este varianța populației generale. Excel înainte de versiunea 2007 folosește funcția =VAR() pentru a calcula varianța populației, începând cu versiunea 2010 =VAR.G().

abaterea standard a populației este egală cu rădăcina pătrată a varianței populației:

Excel înainte de versiunea 2007 folosește =STDEV() pentru a calcula abaterea standard a populației, începând cu versiunea 2010 =STDEV.Y(). Rețineți că formulele pentru varianța populației și abaterea standard sunt diferite de formulele pentru varianța eșantionului și abaterea standard. La calcularea statisticilor eșantionului S2Și S numitorul fracției este n - 1, iar la calcularea parametrilor σ2Și σ - volumul populaţiei generale N.

regula generală

În majoritatea situațiilor, o mare parte a observațiilor sunt concentrate în jurul mediei, formând un cluster. În seturile de date cu asimetrie pozitivă, acest cluster este situat la stânga (adică, dedesubt) așteptării matematice, iar în seturile cu asimetrie negativă, acest cluster este situat la dreapta (adică, deasupra) așteptării matematice. Datele simetrice au aceeași medie și mediană, iar observațiile se grupează în jurul mediei, formând o distribuție în formă de clopot. Dacă distribuția nu are o asimetrie pronunțată, iar datele sunt concentrate în jurul unui anumit centru de greutate, se poate folosi o regulă generală pentru a estima variabilitatea, care spune: dacă datele au o distribuție în formă de clopot, atunci aproximativ 68% dintre observații sunt mai mici de o abatere standard de la așteptările matematice, Aproximativ 95% dintre observații sunt în două abateri standard ale valorii așteptate și 99,7% dintre observații sunt în trei deviații standard ale valorii așteptate.

Astfel, abaterea standard, care este o estimare a fluctuației medii în jurul așteptărilor matematice, ajută la înțelegerea modului în care sunt distribuite observațiile și la identificarea valorii aberante. Din regula generală rezultă că, pentru distribuțiile în formă de clopot, doar o valoare din douăzeci diferă de așteptarea matematică cu mai mult de două abateri standard. Prin urmare, valori în afara intervalului µ ± 2σ, pot fi considerate valori aberante. În plus, doar trei din 1000 de observații diferă de așteptările matematice cu mai mult de trei abateri standard. Astfel, valori în afara intervalului µ ± 3σ sunt aproape întotdeauna valori aberante. Pentru distribuțiile care sunt foarte denaturate sau nu au formă de clopot, se poate aplica regula generală Biename-Chebyshev.

În urmă cu mai bine de o sută de ani, matematicienii Bienamay și Chebyshev au descoperit în mod independent o proprietate utilă a deviației standard. Ei au descoperit că pentru orice set de date, indiferent de forma distribuției, procentul de observații care se află la o distanță care nu depășește k abateri standard de la așteptările matematice, nu mai puțin (1 – 1/ 2)*100%.

De exemplu, dacă k= 2, regula Biename-Chebyshev prevede că cel puțin (1 - (1/2) 2) x 100% = 75% din observații trebuie să se situeze în interval µ ± 2σ. Această regulă este valabilă pentru orice k depășind unul. Regula Biename-Chebyshev este de natură foarte generală și este valabilă pentru distribuții de orice fel. Indică numărul minim de observații, distanța de la care până la așteptarea matematică nu depășește o valoare dată. Cu toate acestea, dacă distribuția este în formă de clopot, regula generală estimează mai precis concentrația datelor în jurul valorii medii.

Calcularea statisticilor descriptive pentru o distribuție bazată pe frecvență

Dacă datele originale nu sunt disponibile, distribuția de frecvență devine singura sursă de informații. În astfel de situații, puteți calcula valorile aproximative ale indicatorilor cantitativi ai distribuției, cum ar fi media aritmetică, abaterea standard, quartilele.

Dacă datele eșantionului sunt prezentate ca o distribuție de frecvență, se poate calcula o valoare aproximativă a mediei aritmetice, presupunând că toate valorile din fiecare clasă sunt concentrate la mijlocul clasei:

Unde - medie eșantion, n- numărul de observații sau dimensiunea eșantionului, Cu- numărul de clase din distribuția de frecvență, mj- punctul de mijloc j- clasa a-a, fj- frecventa corespunzatoare j- clasa a-a.

Pentru a calcula abaterea standard de la distribuția frecvenței, se presupune, de asemenea, că toate valorile din cadrul fiecărei clase sunt concentrate la mijlocul clasei.

Pentru a înțelege cum sunt determinate quartilele seriei pe baza frecvențelor, să luăm în considerare calculul quartilei inferioare pe baza datelor pentru anul 2013 privind distribuția populației ruse în funcție de venitul în numerar mediu pe cap de locuitor (Fig. 12).

Orez. 12. Ponderea populației Rusiei cu venit monetar pe cap de locuitor în medie pe lună, ruble

Pentru a calcula prima quartila a seriei de variații de interval, puteți utiliza formula:

unde Q1 este valoarea primului cuartil, xQ1 este limita inferioară a intervalului care conține primul cuartil (intervalul este determinat de frecvența acumulată, prima depășind 25%); i este valoarea intervalului; Σf este suma frecvențelor întregului eșantion; probabil întotdeauna egal cu 100%; SQ1–1 este frecvența cumulativă a intervalului care precede intervalul care conține quartila inferioară; fQ1 este frecvența intervalului care conține quartila inferioară. Formula pentru a treia cuartilă diferă prin aceea că în toate locurile, în loc de Q1, trebuie să utilizați Q3 și să înlocuiți ¾ în loc de ¼.

În exemplul nostru (Fig. 12), quartila inferioară se află în intervalul 7000,1 - 10.000, a cărei frecvență cumulată este de 26,4%. Limita inferioară a acestui interval este de 7000 de ruble, valoarea intervalului este de 3000 de ruble, frecvența acumulată a intervalului care precede intervalul care conține quartila inferioară este de 13,4%, frecvența intervalului care conține quartila inferioară este de 13,0%. Astfel: Q1 \u003d 7000 + 3000 * (¼ * 100 - 13,4) / 13 \u003d 9677 ruble.

Capcane asociate cu statisticile descriptive

În această notă, am analizat cum să descriem un set de date folosind diverse statistici care estimează media, dispersia și distribuția acestuia. Următorul pas este analiza și interpretarea datelor. Până acum, am studiat proprietățile obiective ale datelor, iar acum ne întoarcem la interpretarea subiectivă a acestora. Două greșeli îl așteaptă pe cercetător: un subiect de analiză ales incorect și o interpretare incorectă a rezultatelor.

O analiză a performanței a 15 fonduri mutuale cu risc foarte ridicat este destul de imparțială. El a condus la concluzii complet obiective: toate fondurile mutuale au randamente diferite, spread-ul randamentelor fondurilor variază de la -6,1 la 18,5, iar randamentul mediu este de 6,08. Obiectivitatea analizei datelor este asigurată alegerea corecta indicatori cantitativi totali de distribuţie. Au fost luate în considerare mai multe metode de estimare a mediei și dispersării datelor și au fost indicate avantajele și dezavantajele acestora. Cum să alegi statisticile potrivite care să ofere o analiză obiectivă și imparțială? Dacă distribuția datelor este ușor denaturată, ar trebui să fie aleasă mediana față de media aritmetică? Care indicator caracterizează mai exact răspândirea datelor: abaterea standard sau intervalul? Ar trebui indicată asimetria pozitivă a distribuției?

Pe de altă parte, interpretarea datelor este un proces subiectiv. Oameni diferiți ajunge la concluzii diferite, interpretând aceleași rezultate. Fiecare are punctul lui de vedere. Cineva consideră că randamentele totale medii anuale a 15 fonduri cu un nivel de risc foarte ridicat sunt bune și este destul de mulțumit de veniturile primite. Alții pot crede că aceste fonduri au randamente prea mici. Astfel, subiectivitatea ar trebui compensată de onestitate, neutralitate și claritatea concluziilor.

Probleme etice

Analiza datelor este indisolubil legată de problemele etice. Ar trebui să fim critici cu privire la informațiile difuzate de ziare, radio, televiziune și internet. De-a lungul timpului, vei învăța să fii sceptic nu numai în ceea ce privește rezultatele, ci și în ceea ce privește obiectivele, subiectul și obiectivitatea cercetării. Celebrul politician britanic Benjamin Disraeli a spus-o cel mai bine: „Există trei tipuri de minciuni: minciuni, minciună flagrantăși statistici.

După cum se menționează în notă, la alegerea rezultatelor care ar trebui prezentate în raport apar probleme etice. Ar trebui publicate atât rezultatele pozitive, cât și cele negative. În plus, la realizarea unui raport sau raport scris, rezultatele trebuie prezentate onest, neutru și obiectiv. Faceți distincția între prezentările proaste și necinstite. Pentru a face acest lucru, este necesar să se determine care au fost intențiile vorbitorului. Uneori, vorbitorul omite informații importante din ignoranță și alteori în mod deliberat (de exemplu, dacă folosește media aritmetică pentru a estima media datelor clar denaturate pentru a obține rezultatul dorit). De asemenea, este necinstit să suprimi rezultate care nu corespund punctului de vedere al cercetătorului.

Sunt folosite materiale din cartea Levin et al. Statistici pentru manageri. - M.: Williams, 2004. - p. 178–209

Funcția QUARTILE reținută pentru a se alinia cu versiunile anterioare de Excel