Standart sapmayı hesaplamak için hangi formül kullanılır? Standart sapma, hesaplama yöntemi, uygulama. Numune standart sapması

Değişimin en mükemmel özelliği, standart (veya standart sapma) olarak adlandırılan ortalama kare sapmadır. Standart sapma() özelliğin bireysel değerlerinin aritmetik ortalamadan ortalama kare sapmasının kareköküne eşittir:

Standart sapma basittir:

Gruplandırılmış verilere ağırlıklı standart sapma uygulanır:

Normal dağılım koşullarında ortalama karekök ile ortalama doğrusal sapmalar arasında şu oran ortaya çıkar: ~ 1,25.

Değişimin ana mutlak ölçüsü olan standart sapma, normal dağılım eğrisinin ordinat değerlerinin belirlenmesinde, numune gözleminin organizasyonu ile ilgili hesaplamalarda ve numune özelliklerinin doğruluğunun belirlenmesinde ve ayrıca numune özelliklerinin değerlendirilmesinde kullanılır. Homojen bir popülasyonda bir özelliğin varyasyonunun sınırları.

Dispersiyon, çeşitleri, standart sapma.

Rastgele bir değişkenin varyansı— belirli bir rastgele değişkenin yayılmasının ölçüsü, yani matematiksel beklentiden sapması. İstatistiklerde veya gösterimi sıklıkla kullanılır. Varyansın kareköküne standart sapma, standart sapma veya standart yayılma denir.

Toplam varyans (σ2) bir özelliğin varyasyonunu, bu varyasyona neden olan tüm faktörlerin etkisi altında bütünüyle ölçer. Aynı zamanda gruplama yöntemi sayesinde gruplama özelliğinden kaynaklanan varyasyonu ve hesaba katılmayan faktörlerin etkisiyle ortaya çıkan varyasyonu tespit etmek ve ölçmek mümkündür.

Gruplararası varyans (σ 2 mgr) sistematik varyasyonu, yani grubun temelini oluşturan faktör olan özelliğin etkisi altında ortaya çıkan, incelenen özelliğin değerindeki farklılıkları karakterize eder.

Standart sapma(eş anlamlılar: standart sapma, standart sapma, kare sapma; ilgili terimler: standart sapma, standart yayılma) - olasılık teorisi ve istatistikte, rastgele bir değişkenin değerlerinin matematiksel beklentisine göre dağılımının en yaygın göstergesi. Değer örneklerinin sınırlı dizileri ile matematiksel beklenti yerine örnek kümesinin aritmetik ortalaması kullanılır.

Standart sapma, rastgele değişkenin kendi birimlerinde ölçülür ve aritmetik ortalamanın standart hatasını hesaplarken, güven aralıkları oluştururken, hipotezleri istatistiksel olarak test ederken, rastgele değişkenler arasındaki doğrusal ilişkiyi ölçerken kullanılır. Bir rastgele değişkenin varyansının karekökü olarak tanımlanır.


Standart sapma:

Standart sapma(rastgele bir değişkenin standart sapmasının tahmini X varyansının tarafsız bir tahminine dayanan matematiksel beklentisine göre):

dağılım nerede; — Ben seçimin inci unsuru; - örnek boyut; — numunenin aritmetik ortalaması:

Her iki tahminin de taraflı olduğunu belirtmek gerekir. Genel durumda tarafsız bir tahmin yapmak mümkün değildir. Ancak tarafsız varyans tahminine dayalı tahmin tutarlıdır.

Mod ve medyanın belirlenmesinin özü, kapsamı ve prosedürü.

İstatistiklerdeki güç ortalamalarına ek olarak, değişen bir özelliğin değerinin ve dağılım serisinin iç yapısının göreceli karakterizasyonu için, esas olarak aşağıdakilerle temsil edilen yapısal ortalamalar kullanılır: moda ve medyan.

Moda- Bu serinin en yaygın çeşididir. Moda, örneğin alıcılar arasında en çok talep gören giysi ve ayakkabıların bedeninin belirlenmesinde kullanılır. Ayrık bir serinin modu, en yüksek frekansa sahip olandır. Bir aralık varyasyon serisi için modu hesaplarken, önce mod aralığını (maksimum frekansa göre) ve ardından aşağıdaki formülü kullanarak özelliğin modal değerinin değerini belirlemeniz gerekir:

- - moda değeri

- — modal aralığın alt sınırı

- — aralık boyutu

- — modal aralık frekansı

- — modaldan önceki aralığın frekansı

- — modalı takip eden aralığın frekansı

Medyan - bu, sıralanmış serinin temelini oluşturan ve bu seriyi iki eşit parçaya bölen özelliğin değeridir.

Frekansların varlığında ayrı bir serideki medyanı belirlemek için, önce frekansların yarı toplamını hesaplayın ve ardından hangi değişken değerinin buna uyduğunu belirleyin. (Sıralanan seri tek sayıda özellik içeriyorsa ortanca sayı şu formül kullanılarak hesaplanır:

M e = (n (toplam özellik sayısı) + 1)/2,

özelliklerin çift sayıda olması durumunda medyan, satırın ortasındaki iki özelliğin ortalamasına eşit olacaktır).

Hesaplarken medyanlar bir aralık varyasyon serisi için, önce medyanın bulunduğu medyan aralığını belirleyin ve ardından aşağıdaki formülü kullanarak medyanın değerini belirleyin:

- — gerekli medyan

- - medyanı içeren aralığın alt sınırı

- — aralık boyutu

- — frekansların toplamı veya seri terimlerinin sayısı

Medyandan önceki aralıkların birikmiş frekanslarının toplamı

- — medyan aralığın frekansı

Örnek. Modu ve medyanı bulun.

Çözüm:
Bu örnekte modal aralık 25-30 yaş grubu içerisindedir, çünkü bu aralık en yüksek frekansa sahiptir (1054).

Modun büyüklüğünü hesaplayalım:

Bu, öğrencilerin modal yaşının 27 olduğu anlamına gelir.

Ortancayı hesaplayalım. Medyan aralık 25-30 yaş aralığındadır, çünkü bu aralıkta nüfusu iki eşit parçaya bölen bir seçenek vardır (Σf i /2 = 3462/2 = 1731). Daha sonra gerekli sayısal verileri formülde yerine koyarız ve medyanın değerini elde ederiz:

Bu da öğrencilerin yarısının 27,4 yaşın altında, diğer yarısının ise 27,4 yaşın üzerinde olduğu anlamına geliyor.

Mod ve medyanın yanı sıra sıralanan seriyi 4 eşit parçaya bölen çeyrekler gibi göstergeler de kullanılabilir, ondalık dilimler- 10 parça ve yüzdelik dilimler - 100 parça başına.

Seçici gözlem kavramı ve kapsamı.

Seçici gözlem sürekli gözetim kullanıldığında geçerlidir fiziksel olarak imkansızçok miktarda veri nedeniyle veya ekonomik olarak mümkün değil. Örneğin yolcu akışlarını, piyasa fiyatlarını ve aile bütçelerini incelerken fiziksel imkansızlık ortaya çıkar. Ekonomik uygunsuzluk, örneğin tatmak, tuğlaları dayanıklılık açısından test etmek vb. gibi, imhalarıyla ilişkili malların kalitesini değerlendirirken ortaya çıkar.

Gözlem için seçilen istatistiksel birimler örnekleme çerçevesini veya örneği oluşturur ve bunların dizisinin tamamı genel popülasyonu (GS) oluşturur. Bu durumda numunedeki birim sayısı şu şekilde gösterilir: N ve tüm HS'de - N. Davranış bilinmiyor numunenin göreceli büyüklüğü veya oranı denir.

Numune gözlem sonuçlarının kalitesi numunenin temsil edilebilirliğine, yani HS'de ne kadar temsili olduğuna bağlıdır. Numunenin temsil edilebilirliğini sağlamak için aşağıdakilere uymak gerekir: birimlerin rastgele seçimi ilkesi HS biriminin numuneye dahil edilmesinin şans dışında herhangi bir faktörden etkilenemeyeceğini varsayar.

Var Rastgele seçimin 4 yoluörneklemek için:

  1. Aslında rastgele seçim veya "loto yöntemi", istatistiksel miktarlara seri numaraları atandığında, belirli nesnelere (örneğin variller) kaydedilir, bunlar daha sonra bir kapta (örneğin bir torbada) karıştırılır ve rastgele seçilir. Uygulamada bu yöntem, bir rastgele sayı üreteci veya rastgele sayıların matematiksel tabloları kullanılarak gerçekleştirilir.
  2. Mekanik her birine göre seçim ( Bilmiyorum)-th değeri genel popülasyonun. Örneğin 100.000 değer içeriyorsa ve 1.000 seçmeniz gerekiyorsa her 100.000 / 1000 = 100'üncü değer örneğe dahil edilecektir. Üstelik sıralama yapılmamışsa ilk yüz içinden rastgele birincisi seçilir, diğerlerinin sayısı yüz fazla olur. Örneğin, ilk ünite 19 numaraysa, sonraki ünite 119 numara, ardından 219 numara, ardından 319 numara vb. olmalıdır. Nüfus birimleri sıralanırsa önce 50 numara, ardından 150 numara, ardından 250 numara vb. seçilir.
  3. Heterojen bir veri dizisinden değerlerin seçimi gerçekleştirilir tabakalı(tabakalı) yöntem, popülasyonun ilk önce rastgele veya mekanik seçimin uygulandığı homojen gruplara bölünmesidir.
  4. Özel bir örnekleme yöntemi seri bireysel değerleri değil, rastgele veya mekanik olarak seçtikleri, ancak sürekli gözlemin gerçekleştirildiği serilerini (bir sayıdan arka arkaya bir sayıya kadar diziler) seçtikleri seçim.

Örnek gözlemlerin kalitesi aynı zamanda şunlara da bağlıdır: örnek tip: tekrarlandı veya tekrarlanamaz.

Şu tarihte: yeniden seçimÖrneğe dahil edilen istatistiksel değerler veya bunların serileri, kullanım sonrasında genel popülasyona geri döndürülerek yeni bir örneğe dahil edilme şansı elde edilir. Üstelik popülasyondaki tüm değerlerin örneğe dahil edilme olasılığı aynıdır.

Tekrarsız seçimörneğe dahil edilen istatistiksel değerlerin veya serilerinin kullanımdan sonra genel popülasyona geri dönmediği ve dolayısıyla kalan değerlerin bir sonraki örneğe dahil olma olasılığının arttığı anlamına gelir.

Tekrarlı olmayan örnekleme daha doğru sonuçlar verdiğinden daha sık kullanılır. Ancak uygulanamadığı durumlar vardır (yolcu akışlarının, tüketici talebinin incelenmesi vb.) ve ardından tekrarlanan bir seçim gerçekleştirilir.

Maksimum gözlem örnekleme hatası, ortalama örnekleme hatası, bunların hesaplanması için prosedür.

Yukarıda sıraladığımız örnek popülasyon oluşturma yöntemlerini ve bunu yaparken ortaya çıkan hataları detaylı olarak ele alalım. temsil edilebilirlik .
Uygun şekilde rastgeleÖrnekleme, herhangi bir sistematik unsur olmadan popülasyondan rastgele birimlerin seçilmesine dayanmaktadır. Teknik olarak, gerçek rastgele seçim kura çekilerek (örneğin piyangolar) veya rastgele sayılar tablosu kullanılarak gerçekleştirilir.

Seçici gözlem uygulamasında "saf haliyle" uygun rastgele seçim nadiren kullanılır, ancak diğer seçilim türleri arasında orijinaldir ve seçici gözlemin temel ilkelerini uygular. Basit rastgele örnekleme için örnekleme yöntemi teorisi ve hata formülü ile ilgili bazı soruları ele alalım.

Örnekleme yanlılığı parametrenin genel popülasyondaki değeri ile örnek gözlem sonuçlarından hesaplanan değeri arasındaki farktır. Ortalama niceliksel bir özellik için örnekleme hatası şu şekilde belirlenir:

Gösterge marjinal örnekleme hatası olarak adlandırılır.
Örnek ortalaması, örnekte hangi birimlerin yer aldığına bağlı olarak farklı değerler alabilen rastgele bir değişkendir. Dolayısıyla örnekleme hataları da rastgele değişkenlerdir ve farklı değerler alabilirler. Bu nedenle olası hataların ortalaması belirlenir - ortalama örnekleme hatası, şunlara bağlıdır:

Örneklem büyüklüğü: sayı ne kadar büyük olursa ortalama hata o kadar küçük olur;

İncelenen özellikteki değişimin derecesi: özelliğin varyasyonu ve dolayısıyla dağılım ne kadar küçük olursa, ortalama örnekleme hatası da o kadar küçük olur.

Şu tarihte: rastgele yeniden seçim ortalama hata hesaplanır:
.
Uygulamada genel varyans kesin olarak bilinmemekle birlikte olasılık teorisi kanıtlanmıştır
.
Yeterince büyük n'nin değeri 1'e yakın olduğundan, bunu varsayabiliriz. Daha sonra ortalama örnekleme hatası hesaplanabilir:
.
Ancak küçük bir örnek durumunda (n ile)<30) коэффициент необходимо учитывать, и среднюю ошибку малой выборки рассчитывать по формуле
.

Şu tarihte: rastgele tekrarlanmayan örnekleme Verilen formüller değere göre ayarlanır. Bu durumda ortalama tekrarlı olmayan örnekleme hatası:
Ve .
Çünkü her zaman daha azsa, çarpan () her zaman 1'den küçüktür. Bu, tekrarlanmayan seçim sırasındaki ortalama hatanın, tekrarlanan seçime göre her zaman daha az olduğu anlamına gelir.
Mekanik numune alma genel nüfusun bir şekilde sıralandığı durumlarda kullanılır (örneğin alfabetik seçmen listeleri, telefon numaraları, ev numaraları, daire numaraları). Birimlerin seçimi, örnekleme yüzdesinin tersine eşit olan belirli bir aralıkta gerçekleştirilir. Yani %2'lik bir örneklemle genel popülasyonun her 50 birimi = 1/0,02, %5'lik bir örneklemle her 1/0,05 = 20 birimi seçilir.

Referans noktası farklı şekillerde seçilir: aralığın ortasından rastgele, referans noktasında bir değişiklikle. Önemli olan sistematik hatalardan kaçınmaktır. Örneğin %5'lik bir örneklemde ilk birim 13. ise sonraki birimler 33, 53, 73 vb. olur.

Doğruluk açısından, mekanik seçim gerçek rastgele örneklemeye yakındır. Bu nedenle, mekanik örneklemenin ortalama hatasını belirlemek için uygun rastgele seçim formülleri kullanılır.

Şu tarihte: tipik seçim İncelenen nüfus öncelikle homojen, benzer gruplara ayrılır. Örneğin, işletmeleri araştırırken bunlar endüstriler, alt sektörler olabilir; nüfus incelerken bunlar bölgeler, sosyal veya yaş grupları olabilir. Daha sonra her gruptan bağımsız bir seçim mekanik olarak veya tamamen rastgele yapılır.

Tipik örnekleme diğer yöntemlere göre daha doğru sonuçlar üretir. Genel popülasyonun yazılması, her tipolojik grubun örnekte temsil edilmesini sağlar, bu da ortalama örnekleme hatası üzerindeki gruplar arası varyansın etkisini ortadan kaldırmayı mümkün kılar. Sonuç olarak, varyansları toplama kuralına () göre tipik bir numunenin hatasını bulurken, yalnızca grup varyanslarının ortalamasını hesaba katmak gerekir. Bu durumda ortalama örnekleme hatası:
yeniden seçildiğinde
,
tekrarlanmayan seçimle
,
örnekteki grup içi varyansların ortalaması nerede.

Seri (veya yuva) seçimi Örneklem araştırmasının başlangıcından önce popülasyon serilere veya gruplara ayrıldığında kullanılır. Bu seriler bitmiş ürünlerin, öğrenci gruplarının, ekiplerin paketlenmesi olabilir. İncelemeye yönelik seriler mekanik olarak veya tamamen rastgele seçilir ve seriler içerisinde birimlerin sürekli incelenmesi gerçekleştirilir. Bu nedenle, ortalama örnekleme hatası yalnızca aşağıdaki formülle hesaplanan gruplar arası (seriler arası) varyansa bağlıdır:

burada r, seçilen serilerin sayısıdır;
- i-inci serinin ortalaması.

Ortalama seri örnekleme hatası hesaplanır:

yeniden seçildiğinde:
,
tekrarlanmayan seçimle:
,
burada R, toplam bölüm sayısıdır.

Kombine seçim dikkate alınan seçim yöntemlerinin bir kombinasyonudur.

Herhangi bir örnekleme yöntemi için ortalama örnekleme hatası, esas olarak numunenin mutlak büyüklüğüne ve daha az ölçüde numunenin yüzdesine bağlıdır. İlk durumda 4.500 birimlik bir popülasyondan, ikinci durumda ise 225.000 birimlik bir popülasyondan 225 gözlem yapıldığını varsayalım. Her iki durumda da varyanslar 25'e eşittir. Bu durumda ilk durumda, %5 seçimle örnekleme hatası şöyle olacaktır:

İkinci durumda, %0,1 seçimle şuna eşit olacaktır:

BöyleceÖrnekleme yüzdesinin 50 kat azalmasıyla birlikte örneklem büyüklüğü değişmediğinden örnekleme hatası biraz arttı.
Örneklem büyüklüğünün 625 gözleme çıkarıldığını varsayalım. Bu durumda örnekleme hatası:

Aynı popülasyon büyüklüğü ile örneklemin 2,8 kat arttırılması, örnekleme hatasının boyutunu 1,6 kattan fazla azaltır.

Örnek popülasyon oluşturma yöntemleri ve yöntemleri.

İstatistikte, çalışmanın amaçlarına göre belirlenen ve çalışma nesnesinin özelliklerine bağlı olarak örnek popülasyonlar oluşturmak için çeşitli yöntemler kullanılır.

Örneklem araştırması yapmanın temel koşulu, örnekleme dahil edilecek genel nüfusun her birimi için fırsat eşitliği ilkesinin ihlalinden kaynaklanan sistematik hataların oluşmasının önlenmesidir. Sistematik hataların önlenmesi, örnek popülasyon oluşturmak için bilimsel temelli yöntemlerin kullanılmasıyla sağlanır.

Popülasyondan birimleri seçmek için aşağıdaki yöntemler vardır:

1) bireysel seçim - numune için bireysel birimler seçilir;

2) grup seçimi - örnek, niteliksel olarak homojen grupları veya incelenen birim dizilerini içerir;

3) Birleşik seçilim, bireysel ve grup seçiliminin birleşimidir.
Seçim yöntemleri, örnek popülasyon oluşturma kurallarına göre belirlenir.

Örnek şunlar olabilir:

  • aslında rastgeleÖrnek popülasyonun, genel popülasyondan bireysel birimlerin rastgele (kasıtsız) seçilmesi sonucu oluşması gerçeğinden oluşur. Bu durumda örnek popülasyonda seçilen birim sayısı genellikle kabul edilen örnek oranına göre belirlenir. Örnek oranı, örnek popülasyon n'deki birim sayısının genel popülasyon N'deki birim sayısına oranıdır, yani.
  • mekanikÖrnek popülasyondaki birimlerin seçiminin, eşit aralıklara (gruplara) bölünmüş genel popülasyondan yapılması gerçeğinden oluşur. Bu durumda popülasyondaki aralığın büyüklüğü örnek oranının tersine eşittir. Yani, %2'lik bir örnekle her 50. birim seçilir (1:0.02), %5'lik bir örnekle her 20. birim (1:0.05) vb. seçilir. Böylece, kabul edilen seçilim oranına uygun olarak genel nüfus, adeta mekanik olarak eşit büyüklükteki gruplara bölünür. Her gruptan örnek için yalnızca bir birim seçilir.
  • tipik - genel nüfusun ilk olarak homojen tipik gruplara ayrıldığı yer. Daha sonra, her bir tipik gruptan tamamen rastgele veya mekanik bir örnek, örneklem popülasyonuna birimleri ayrı ayrı seçmek için kullanılır. Tipik bir numunenin önemli bir özelliği, numune popülasyonundaki diğer birimleri seçme yöntemleriyle karşılaştırıldığında daha doğru sonuçlar vermesidir;
  • seri- genel nüfusun eşit büyüklükteki gruplara bölündüğü seriler. Örnek popülasyona seriler seçilir. Seri içerisinde seriye dahil olan birimlerin sürekli gözlemi yapılmakta;
  • kombine- örnekleme iki aşamalı olabilir. Bu durumda nüfus önce gruplara ayrılır. Daha sonra gruplar seçilir ve ikincisinin içinde bireysel birimler seçilir.

İstatistikte, örnek bir popülasyondaki birimlerin seçilmesi için aşağıdaki yöntemler ayırt edilir::

  • tek aşamalıörnekleme - seçilen her birim, belirli bir kritere göre (uygun rastgele ve seri örnekleme) derhal çalışmaya tabi tutulur;
  • çok aşamalıörnekleme - bireysel grupların genel popülasyonundan bir seçim yapılır ve bireysel birimler gruplardan seçilir (örnek popülasyona birimlerin seçilmesi için mekanik bir yöntemle tipik örnekleme).

Ayrıca şunlar da vardır:

  • yeniden seçim- geri dönen topun şemasına göre. Bu durumda örneğe dahil edilen her birim veya seri genel popülasyona geri döner ve dolayısıyla tekrar örneğe dahil olma şansına sahip olur;
  • tekrarlanmayan seçim- geri dönmeyen top şemasına göre. Aynı örneklem büyüklüğü ile daha doğru sonuçlara sahiptir.

Gerekli numune boyutunun belirlenmesi (Student's t-table kullanılarak).

Örnekleme teorisindeki bilimsel ilkelerden biri yeterli sayıda birimin seçilmesini sağlamaktır. Teorik olarak bu prensibe uyma ihtiyacı, olasılık teorisindeki limit teoremlerinin kanıtlarında sunulmakta olup, bu, yeterli olacak şekilde popülasyondan hangi hacimde birimlerin seçilmesi gerektiğini belirlemeyi mümkün kılar ve numunenin temsil edilebilirliğini sağlar.

Standart örnekleme hatasındaki bir azalma ve dolayısıyla tahminin doğruluğundaki bir artış, her zaman numune büyüklüğündeki bir artışla ilişkilidir, bu nedenle, numune gözlemini organize etme aşamasında, numune boyutunun ne olduğuna karar vermek gerekir. Örnek popülasyon, gözlem sonuçlarının gerekli doğruluğunu sağlayacak şekilde olmalıdır. Gerekli numune büyüklüğünün hesaplanması, belirli bir türe ve seçim yöntemine karşılık gelen maksimum numune alma hatalarına (A) ilişkin formüllerden türetilen formüller kullanılarak oluşturulur. Yani, rastgele tekrarlanan bir örneklem büyüklüğü (n) için elimizde:

Bu formülün özü, gerekli sayının rastgele tekrarlanan seçimiyle örneklem büyüklüğünün güven katsayısının karesiyle doğru orantılı olmasıdır. (t2) ve varyasyon karakteristiğinin varyansı (?2) ve maksimum örnekleme hatasının (?2) karesiyle ters orantılıdır. Özellikle maksimum hatanın iki kat artmasıyla gerekli numune boyutu dört kat azaltılabilir. Üç parametreden ikisi (t ve?) araştırmacı tarafından belirlenir.

Aynı zamanda araştırmacı, buna dayanarakÖrneklem araştırmasının amaç ve hedeflerinden şu sorunun çözülmesi gerekir: Optimum seçeneği sağlamak için bu parametreleri hangi niceliksel kombinasyona dahil etmek daha iyidir? Bir durumda, doğruluk ölçüsünden (?) ziyade elde edilen sonuçların güvenilirliğinden (t) daha memnun olabilir, diğer durumda ise tam tersi olabilir. Maksimum örnekleme hatasının değeri ile ilgili sorunu çözmek daha zordur, çünkü araştırmacı örnek gözlemi tasarlama aşamasında bu göstergeye sahip değildir, bu nedenle pratikte maksimum örnekleme hatasının değerini ayarlamak gelenekseldir, genellikle özelliğin beklenen ortalama seviyesinin %10'u dahilindedir. Tahmini ortalamanın belirlenmesine farklı yollarla yaklaşılabilir: daha önceki benzer araştırmalardan elde edilen veriler kullanılarak veya örnekleme çerçevesinden alınan veriler kullanılarak ve küçük bir pilot örneklem gerçekleştirilerek.

Bir örnek gözlem tasarlarken belirlenmesi en zor şey formül (5.2)'deki üçüncü parametredir - örnek popülasyonun dağılımı. Bu durumda araştırmacının elinde bulunan, daha önce yapılmış benzer ve pilot araştırmalarda elde edilen tüm bilgilerin kullanılması gerekmektedir.

Tanımla ilgili soruÖrnekleme araştırması örnekleme birimlerinin çeşitli özelliklerinin incelenmesini içeriyorsa gerekli örneklem büyüklüğü daha karmaşık hale gelir. Bu durumda, her bir özelliğin ortalama seviyeleri ve bunların varyasyonları, kural olarak farklıdır ve bu nedenle, hangi özelliklerin hangi varyansının tercih edileceğine karar vermek, ancak araştırmanın amaç ve hedefleri dikkate alınarak mümkündür. anket.

Bir örnek gözlem tasarlarken, belirli bir çalışmanın hedeflerine ve gözlem sonuçlarına dayalı sonuçların olasılığına uygun olarak izin verilen örnekleme hatasının önceden belirlenmiş bir değeri varsayılır.

Genel olarak numune ortalamasının maksimum hatasına ilişkin formül şunları belirlememize olanak tanır:

Genel nüfus göstergelerinin örnek nüfus göstergelerinden olası sapmalarının büyüklüğü;

Olası hata sınırlarının belirli bir değeri aşmayacağı, gerekli doğruluğu sağlayan gerekli numune boyutu;

Bir numunedeki hatanın belirli bir sınıra sahip olma olasılığı.

Öğrenci dağılımı olasılık teorisinde, kesinlikle sürekli dağılımların tek parametreli bir ailesidir.

Dinamik seriler (aralık, moment), kapanış dinamik serileri.

Dinamik serisi- bunlar belirli bir kronolojik sırayla sunulan istatistiksel göstergelerin değerleridir.

Her zaman serisi iki bileşen içerir:

1) zaman aralıklarının göstergeleri (yıllar, çeyrekler, aylar, günler veya tarihler);

2) seri seviyeleri olarak adlandırılan, zaman dilimleri veya karşılık gelen tarihler için incelenen nesneyi karakterize eden göstergeler.

Serinin seviyeleri ifade ediliyor hem mutlak hem de ortalama veya göreceli değerler. Göstergelerin niteliğine bağlı olarak mutlak, göreceli ve ortalama değerlerden oluşan zaman serileri oluşturulur. Göreceli ve ortalama değerlerden oluşan dinamik seriler, türetilmiş mutlak değer serileri esas alınarak oluşturulur. Dinamiklerin aralık ve moment serileri vardır.

Dinamik aralık serisi belirli zaman aralıklarına ait gösterge değerlerini içerir. Bir aralık serisinde, olgunun daha uzun bir periyottaki hacmini veya birikmiş toplamları elde etmek için seviyeler toplanabilir.

Dinamik an serisi göstergelerin değerlerini belirli bir zaman noktasında (tarih tarihi) yansıtır. Moment serilerinde araştırmacı yalnızca serinin belirli tarihler arasındaki düzeyindeki değişimi yansıtan olgulardaki farkla ilgilenebilir, çünkü buradaki düzeylerin toplamı gerçek bir içeriğe sahip değildir. Kümülatif toplamlar burada hesaplanmaz.

Zaman serilerinin doğru kurgulanmasının en önemli koşulu, serilerin farklı dönemlere ait seviyelerinin karşılaştırılabilir olmasıdır. Düzeyler homojen miktarlarda sunulmalı ve olgunun farklı bölümlerinin kapsamı eşit derecede eksiksiz olmalıdır.

İçin Gerçek dinamiklerin bozulmasını önlemek için, istatistiksel bir çalışmada zaman serisinin istatistiksel analizinden önce ön hesaplamalar yapılır (dinamik serilerin kapatılması). Dinamik serilerin kapanışı, seviyeleri farklı metodoloji kullanılarak hesaplanan veya bölgesel sınırlara vb. karşılık gelmeyen iki veya daha fazla seriden oluşan bir serinin birleşimi olarak anlaşılmaktadır. Dinamik serilerin kapatılması aynı zamanda dinamik serilerin mutlak seviyelerinin ortak bir temele getirilmesi anlamına da gelebilir, bu da dinamik serilerin seviyelerinin karşılaştırılamazlığını etkisiz hale getirir.

Dinamik serilerin, katsayıların, büyüme ve büyüme oranlarının karşılaştırılabilirliği kavramı.

Dinamik serisi- bunlar doğal ve sosyal olayların zaman içindeki gelişimini karakterize eden bir dizi istatistiksel göstergedir. Rusya Devlet İstatistik Komitesi tarafından yayınlanan istatistik koleksiyonları, tablo halinde çok sayıda dinamik seri içermektedir. Dinamik seriler, incelenen olgunun gelişim kalıplarını tanımlamayı mümkün kılar.

Dynamics serisi iki tür gösterge içerir. Zaman göstergeleri(yıllar, üç aylık dönemler, aylar vb.) veya zaman içindeki noktalar (yılın başında, her ayın başında vb.). Satır düzeyi göstergeleri. Dinamik serilerin seviyelerinin göstergeleri mutlak değerler (ton veya ruble cinsinden ürün üretimi), göreceli değerler (% olarak kentsel nüfusun payı) ve ortalama değerler (sanayi çalışanlarının yıllara göre ortalama ücretleri) olarak ifade edilebilir. , vesaire.). Tablo biçiminde bir zaman serisi iki sütun veya iki satır içerir.

Zaman serilerinin doğru şekilde oluşturulması bir dizi gereksinimin yerine getirilmesini gerektirir:

  1. bir dizi dinamiğin tüm göstergeleri bilimsel temelli ve güvenilir olmalıdır;
  2. Bir dizi dinamiğin göstergeleri zaman içinde karşılaştırılabilir olmalıdır; aynı dönemler için veya aynı tarihlerde hesaplanmalıdır;
  3. bir dizi dinamiğin göstergeleri bölge genelinde karşılaştırılabilir olmalıdır;
  4. Bir dizi dinamiğin göstergeleri içerik açısından karşılaştırılabilir olmalıdır; aynı şekilde tek bir metodolojiye göre hesaplanır;
  5. Bir dizi dinamiğin göstergeleri, dikkate alınan çiftlikler arasında karşılaştırılabilir olmalıdır. Bir dizi dinamiğin tüm göstergeleri aynı ölçüm birimlerinde verilmelidir.

İstatistiksel göstergeler belirli bir süre boyunca incelenen sürecin sonuçlarını veya incelenen olgunun belirli bir andaki durumunu karakterize edebilir; göstergeler aralıklı (periyodik) ve anlık olabilir. Buna göre başlangıçta dinamik seri aralık veya moment olabilir. Moment dinamiği serileri ise eşit veya eşit olmayan zaman aralıklarında olabilir.

Orijinal dinamik seriler, bir dizi ortalama değere ve bir dizi göreceli değere (zincir ve temel) dönüştürülebilir. Bu tür zaman serilerine türetilmiş zaman serileri denir.

Dinamik serilerdeki ortalama seviyenin hesaplanmasına yönelik metodoloji, dinamik serinin türüne bağlı olarak farklıdır. Örnekleri kullanarak, ortalama seviyeyi hesaplamak için dinamik seri türlerini ve formülleri ele alacağız.

Mutlak artışlar (Δy) serinin sonraki seviyesinin bir öncekine (gr. 3. - zincir mutlak artışları) veya başlangıç ​​seviyesine (gr. 4. - temel mutlak artışlara) göre kaç birim değiştiğini gösterir. Hesaplama formülleri aşağıdaki gibi yazılabilir:

Serinin mutlak değerleri azaldığında sırasıyla “azalma” veya “azalma” meydana gelecektir.

Mutlak büyüme göstergeleri, örneğin 1998 yılında “A” ürününün üretiminin 1997 yılına göre 4 bin ton, 1994 yılına göre ise 34 bin ton arttığını; diğer yıllar için tabloya bakınız. 11,5 gr. 3 ve 4.

Büyüme oranı serinin seviyesinin bir öncekine (gr. 5 - zincir büyüme veya düşüş katsayıları) veya başlangıç ​​​​seviyesine (gr. 6 - temel büyüme veya düşüş katsayıları) kıyasla kaç kez değiştiğini gösterir. Hesaplama formülleri aşağıdaki gibi yazılabilir:

Büyüme oranları serinin bir sonraki seviyesinin bir önceki seviyeye (gr. 7 - zincir büyüme oranları) veya başlangıç ​​seviyesine (gr. 8 - temel büyüme oranları) göre yüzde kaçını gösterir. Hesaplama formülleri aşağıdaki gibi yazılabilir:

Örneğin 1997 yılında “A” ürününün üretim hacmi 1996 yılına göre %105,5 idi (

Büyüme oranı raporlama dönemi seviyesinin bir öncekine (sütun 9 - zincirleme büyüme oranları) veya başlangıç ​​​​seviyesine (sütun 10 - temel büyüme oranları) kıyasla yüzde kaç oranında arttığını gösterin. Hesaplama formülleri aşağıdaki gibi yazılabilir:

T pr = T r - %100 veya T pr = mutlak büyüme / önceki dönemin seviyesi * %100

Örneğin, 1996 yılında, 1995 yılına kıyasla “A” ürünü %3,8 (%103,8 - %100) veya (8:210)x%100 daha fazla ve 1994 ile karşılaştırıldığında ise %9 (%109 -) daha fazla üretildi. 100%).

Serideki mutlak seviyelerin azalması durumunda oran %100'ün altına inecek ve buna bağlı olarak bir düşüş oranı (eksi işaretli artış oranı) oluşacaktır.

%1 artışın mutlak değeri(sütun 11), bir önceki dönemin seviyesinin %1 artması için belirli bir dönemde kaç adet üretilmesi gerektiğini gösterir. Örneğimizde 1995'te 2,0 bin ton, 1998'de ise 2,3 bin ton üretmek gerekiyordu. Daha büyük.

%1 büyümenin mutlak değeri iki şekilde belirlenebilir:

Bir önceki dönemin düzeyi 100'e bölünür;

Zincir mutlak artışları karşılık gelen zincir büyüme oranlarına bölünür.

%1 artışın mutlak değeri =

Dinamiklerde, özellikle uzun bir süre boyunca, büyüme oranının her yüzde artış veya azalışın içeriğiyle ortak analizi önemlidir.

Zaman serilerini analiz etmek için dikkate alınan metodolojinin, hem seviyeleri mutlak değerlerle (t, bin ruble, çalışan sayısı vb.) İfade edilen zaman serileri için hem de seviyeleri olan zaman serileri için geçerli olduğunu unutmayın. göreceli göstergeler (kusurların yüzdesi, kömürün kül içeriği yüzdesi vb.) veya ortalama değerler (c/ha cinsinden ortalama verim, ortalama ücret vb.) ile ifade edilir.

Dinamik serileri analiz ederken, her yıl için bir önceki veya başlangıç ​​seviyesine kıyasla hesaplanan dikkate alınan analitik göstergelerin yanı sıra, döneme ait ortalama analitik göstergeleri de hesaplamak gerekir: serinin ortalama seviyesi, ortalama yıllık mutlak artış (azalış) ve ortalama yıllık büyüme oranı ve büyüme oranı.

Bir dizi dinamiğin ortalama seviyesini hesaplama yöntemleri yukarıda tartışılmıştır. İncelediğimiz aralık dinamiği serisinde serinin ortalama seviyesi basit aritmetik ortalama formülü kullanılarak hesaplanır:

Ürünün 1994-1998 yılları için ortalama yıllık üretim hacmi. 218,4 bin ton olarak gerçekleşti.

Ortalama yıllık mutlak büyüme de basit aritmetik ortalama formülü kullanılarak hesaplanır:

Yıllık mutlak artışlar yıllar içinde 4 ila 12 bin ton arasında değişiyordu (bkz. sütun 3) ve 1995-1998 dönemi için üretimdeki ortalama yıllık artış. 8,5 bin ton olarak gerçekleşti.

Ortalama büyüme oranını ve ortalama büyüme oranını hesaplama yöntemleri daha ayrıntılı bir değerlendirme gerektirir. Tabloda verilen yıllık seri seviyesi göstergeleri örneğini kullanarak bunları ele alalım.

Dinamik serisinin ortalama seviyesi.

Dinamik seri (veya zaman serisi)- bunlar, belirli bir istatistiksel göstergenin ardışık anlarda veya zaman dilimlerinde (yani kronolojik sıraya göre düzenlenmiş) sayısal değerleridir.

Dinamik seriyi oluşturan bir veya başka bir istatistiksel göstergenin sayısal değerlerine denir. seri seviyeleri ve genellikle harfle gösterilir sen. Serinin ilk dönemi y 1 ilk veya denir temel Seviye, ve sonuncusu e-n - son. Seviyelerin ilgili olduğu anlar veya zaman dilimleri şu şekilde belirlenir: T.

Dinamik seriler genellikle tablo veya grafik şeklinde sunulur ve apsis ekseni boyunca bir zaman ölçeği oluşturulur. T ve ordinat ekseni boyunca - seri düzeylerinin ölçeği sen.

Dinamik serisinin ortalama göstergeleri

Her dinamik serisi belirli bir set olarak düşünülebilir N Ortalamalar olarak özetlenebilecek zamanla değişen göstergeler. Bu tür genelleştirilmiş (ortalama) göstergeler, belirli bir göstergede farklı dönemlerde, farklı ülkelerde vb. meydana gelen değişiklikleri karşılaştırırken özellikle gereklidir.

Dinamik serisinin genelleştirilmiş bir özelliği her şeyden önce şuna hizmet edebilir: orta sıra seviyesi. Ortalama seviyeyi hesaplamanın yöntemi, serinin anlık mı yoksa aralıklı (periyodik) olmasına bağlıdır.

Ne zaman aralık Bir serinin ortalama seviyesi, serinin seviyelerinin basit aritmetik ortalamasının formülü ile belirlenir, yani.

=
Mümkün ise an içeren satır N seviyeler ( y1, y2,…, yn) tarihler (saatler) arasında eşit aralıklar varsa, böyle bir seri kolaylıkla bir ortalama değerler serisine dönüştürülebilir. Bu durumda her dönemin başındaki gösterge (seviye) aynı zamanda bir önceki dönemin sonundaki göstergedir. Daha sonra göstergenin her dönem için ortalama değeri (tarihler arasındaki aralık) değerlerin toplamının yarısı kadar hesaplanabilir. en dönemin başında ve sonunda, yani Nasıl . Bu tür ortalamaların sayısı olacaktır. Daha önce de belirtildiği gibi, ortalama değer serileri için ortalama düzey, aritmetik ortalama kullanılarak hesaplanır.

Bu nedenle şunu yazabiliriz:
.
Payı dönüştürdükten sonra şunu elde ederiz:
,

Nerede Y1 Ve Yn— satırın ilk ve son seviyeleri; Yi— orta seviyeler.

Bu ortalama istatistiklerde şu şekilde bilinir: ortalama kronolojik an serisi için. Zamanla değişen göstergelerden hesaplandığı için adını “cronos” (zaman, Latince) kelimesinden almıştır.

Eşitsizlik durumunda tarihler arasındaki aralıklar, bir an serisi için kronolojik ortalama, tarihler arasındaki mesafeler (zaman aralıkları) ile ağırlıklandırılan, her bir an çifti için ortalama seviye değerlerinin aritmetik ortalaması olarak hesaplanabilir;
.
Bu durumda tarihler arasındaki aralıklarda seviyelerin farklı değerler aldığı varsayılmaktadır ve biz bilinen iki kişiden biriyiz ( evet Ve yi+1) ortalamaları belirliyoruz ve bundan sonra analiz edilen dönemin tamamı için genel ortalamayı hesaplıyoruz.
Her bir değerin olduğu varsayılırsa evet bir sonrakine kadar değişmeden kalır (i+ 1)- o an, yani Seviyelerdeki değişimin kesin tarihi biliniyorsa, ağırlıklı aritmetik ortalama formülü kullanılarak hesaplama yapılabilir:
,

seviyenin değişmeden kaldığı süre nerede.

Dinamik serilerdeki ortalama seviyeye ek olarak, diğer ortalama göstergeler de hesaplanır - seri seviyelerindeki ortalama değişim (temel ve zincir yöntemler), ortalama değişim oranı.

Taban çizgisi mutlak değişim anlamına gelir temeldeki son mutlak değişikliğin değişiklik sayısına bölümüdür. Yani

Zincir demek mutlak değişim demektir serinin seviyeleri, tüm zincir mutlak değişikliklerinin toplamının değişiklik sayısına bölünmesinin bölümüdür; yani

Ortalama mutlak değişimlerin işareti aynı zamanda bir olgudaki değişimin doğasını ortalama olarak yargılamak için de kullanılır: büyüme, gerileme veya istikrar.

Temel ve zincir mutlak değişiklikleri kontrol etme kuralından, temel ve zincir ortalama değişikliklerinin eşit olması gerektiği sonucu çıkar.

Ortalama mutlak değişimin yanı sıra, temel ve zincirleme yöntemler kullanılarak göreceli ortalama da hesaplanır.

Temel ortalama bağıl değişim formülle belirlenir:

Zincir ortalaması bağıl değişimi formülle belirlenir:

Doğal olarak, temel ve zincir ortalama göreceli değişiklikler aynı olmalıdır ve bunları kriter değeri 1 ile karşılaştırarak ortalama olarak fenomendeki değişimin doğası hakkında bir sonuca varılır: büyüme, gerileme veya istikrar.
Temel veya zincir ortalama bağıl değişiminden 1 çıkarılarak karşılık gelen ortalama değişim oranı Bu dinamik dizisi tarafından yansıtılan, incelenen olgudaki değişimin doğası da bu işaretle değerlendirilebilir.

Mevsimsel dalgalanmalar ve mevsimsellik endeksleri.

Mevsimsel dalgalanmalar yıl içi istikrarlı dalgalanmalardır.

Maksimum etkiyi elde etmek için yönetimin temel ilkesi, geliri maksimuma çıkarmak ve maliyetleri minimuma indirmektir. Mevsimsel dalgalanmalar incelenerek maksimum denklem problemi yılın her düzeyinde çözülür.

Mevsimsel dalgalanmaları incelerken birbiriyle ilişkili iki sorun çözülür:

1. Yıl içi dinamiklerde olgunun gelişiminin özelliklerinin belirlenmesi;

2. Mevsimsel dalga modeli oluşturularak mevsimsel dalgalanmaların ölçülmesi;

Mevsimsel değişimi ölçmek için genellikle mevsimlik hindiler sayılır. Genel olarak, dinamik serilerin başlangıç ​​denklemlerinin, karşılaştırmaya temel oluşturan teorik denklemlere oranıyla belirlenirler.

Rastgele sapmalar mevsimsel dalgalanmaların üzerine bindirildiğinden, bunları ortadan kaldırmak için mevsimsellik endekslerinin ortalaması alınır.

Bu durumda, yıllık döngünün her dönemi için genelleştirilmiş göstergeler ortalama mevsimsel endeksler şeklinde belirlenir:

Ortalama mevsimsel dalgalanma endeksleri ana gelişme eğilimindeki rastgele sapmaların etkisinden muaftır.

Trendin niteliğine bağlı olarak ortalama mevsimsellik endeksi formülü aşağıdaki biçimleri alabilir:

1.Açıkça ifade edilen ana gelişme eğilimine sahip bir dizi yıl içi dinamik için:

2. Artış veya azalış eğilimi olmayan veya önemsiz olan yıl içi dinamikler serisi için:

Genel ortalama nerede;

Ana eğilimi analiz etme yöntemleri.

Fenomenlerin zaman içindeki gelişimi, farklı nitelikteki faktörlerden ve etki gücünden etkilenir. Bazıları doğası gereği rastgeledir, bazıları ise neredeyse sürekli bir etkiye sahiptir ve dinamiklerde belirli bir gelişme eğilimi oluşturur.

İstatistiğin önemli bir görevi, çeşitli rastgele faktörlerin etkisinden bağımsız olarak trend dinamiklerini seriler halinde belirlemektir. Bu amaçla zaman serileri aralık genişletme, hareketli ortalama ve analitik seviyeleme vb. yöntemlerle işlenir.

Aralık genişletme yöntemi bir dizi dinamiğin seviyelerini içeren zaman periyotlarının genişletilmesine dayanmaktadır; küçük zaman dilimlerine ait verilerin daha büyük dönemlere ait verilerle değiştirilmesidir. Serinin başlangıç ​​seviyeleri kısa zaman dilimleriyle ilgili olduğunda özellikle etkilidir. Örneğin günlük olaylarla ilgili gösterge dizilerinin yerini haftalık, aylık vb. göstergelerle ilgili diziler alıyor. Bu daha net gösterecek “Olayın gelişim ekseni”. Genişletilmiş aralıklarla hesaplanan ortalama, ana gelişme eğiliminin yönünü ve doğasını (büyümenin hızlanması veya yavaşlaması) belirlememize olanak tanır.

Hareketli ortalama yöntemiöncekine benzer, ancak bu durumda gerçek seviyelerin yerini, ardışık olarak hareket eden (kaydıran) büyütülmüş aralıklar için hesaplanan ortalama seviyeler alır. M seri seviyeleri.

Örneğin eğer kabul edersek m=3, daha sonra önce serinin ilk üç seviyesinin ortalaması hesaplanır, sonra - aynı sayıda seviyeden, ancak ikinciden başlayarak, sonra - üçüncüden başlayarak vb. Böylece ortalama, dinamik seri boyunca bir dönem hareket ederek "kayar". Şu tarihten itibaren hesaplandı: Müyeler için hareketli ortalamalar her aralığın ortasını (ortasını) ifade eder.

Bu yöntem yalnızca rastgele dalgalanmaları ortadan kaldırır. Eğer seride mevsimsel bir dalga varsa, hareketli ortalama yöntemi kullanılarak yumuşatıldıktan sonra bile bu dalga devam edecektir.

Analitik hizalama. Rastgele dalgalanmaları ortadan kaldırmak ve bir trendi belirlemek için, analitik formüller (veya analitik seviyelendirme) kullanılarak seri seviyelerinin seviyelendirilmesi kullanılır. Bunun özü, ampirik (gerçek) seviyeleri, teorik seviyelerin zamanın bir fonksiyonu olarak kabul edildiği, matematiksel bir eğilim modeli olarak benimsenen belirli bir denklem kullanılarak hesaplanan teorik seviyelerle değiştirmektir: . Bu durumda her bir gerçek seviye iki bileşenin toplamı olarak kabul edilir: sistematik bir bileşen olan ve belirli bir denklemle ifade edilen ve trend etrafında dalgalanmalara neden olan rastgele bir değişkendir.

Analitik hizalamanın görevi aşağıdakilere iner:

1. İncelenen göstergenin gelişim eğilimini en uygun şekilde yansıtabilecek varsayımsal fonksiyon türünün gerçek verilere dayalı olarak belirlenmesi.

2. Belirtilen fonksiyonun (denklem) parametrelerinin ampirik verilerden bulunması

3. Teorik (hizalanmış) seviyelerin bulunan denklemini kullanarak hesaplama.

Belirli bir fonksiyonun seçimi, kural olarak ampirik verilerin grafiksel gösterimi temelinde gerçekleştirilir.

Modeller, parametreleri en küçük kareler yöntemi kullanılarak hesaplanan regresyon denklemleridir.

Aşağıda, zaman serilerini hizalamak için en sık kullanılan regresyon denklemleri yer almakta olup, bunların hangi spesifik gelişme eğilimlerini yansıtmak için en uygun olduğu belirtilmektedir.

Yukarıdaki denklemlerin parametrelerini bulmak için özel algoritmalar ve bilgisayar programları vardır. Özellikle bir düz çizgi denkleminin parametrelerini bulmak için aşağıdaki algoritma kullanılabilir:

Zamanın periyotları veya anları St = 0 olacak şekilde numaralandırılırsa, yukarıdaki algoritmalar önemli ölçüde basitleştirilecek ve

Grafikteki hizalanmış seviyeler, belirli bir dinamik serinin gerçek seviyelerinden en yakın mesafeden geçen tek bir düz çizgi üzerinde yer alacaktır. Sapmaların karelerinin toplamı rastgele faktörlerin etkisinin bir yansımasıdır.

Bunu kullanarak denklemin ortalama (standart) hatasını hesaplıyoruz:

Burada n gözlem sayısıdır ve m denklemdeki parametre sayısıdır (bunlardan iki tane var - b 1 ve b 0).

Ana eğilim (trend), sistematik faktörlerin bir dizi dinamiğin seviyelerini nasıl etkilediğini gösterir ve trend () etrafındaki seviyelerin dalgalanması, artık faktörlerin etkisinin bir ölçüsü olarak hizmet eder.

Kullanılan zaman serisi modelinin kalitesini değerlendirmek için ayrıca kullanılır. Fisher'in F testi. İki varyansın oranı, yani regresyonun neden olduğu varyansın oranı, yani. incelenen faktörden rastgele nedenlerin neden olduğu varyansa, yani. artık dağılım:

Genişletilmiş biçimde bu kriterin formülü şu şekilde sunulabilir:

burada n gözlemlerin sayısıdır, yani. satır düzeyi sayısı,

m denklemdeki parametre sayısıdır, y serinin gerçek düzeyidir,

Hizalanmış satır düzeyi - orta satır düzeyi.

Diğerlerine göre daha başarılı olan bir model her zaman yeterince tatmin edici olmayabilir. Yalnızca F kriterinin bilinen kritik sınırı aşması durumunda bu şekilde tanınabilir. Bu sınır F-dağıtım tabloları kullanılarak belirlenir.

Endekslerin özü ve sınıflandırılması.

İstatistikte bir endeks, bir olgunun büyüklüğündeki zaman, mekan veya herhangi bir standartla karşılaştırmalı değişimi karakterize eden göreceli bir gösterge olarak anlaşılmaktadır.

İndeks ilişkisinin ana unsuru indekslenen değerdir. Endekslenmiş bir değer, değişimi çalışmanın amacı olan istatistiksel bir popülasyonun bir özelliğinin değeri olarak anlaşılmaktadır.

Dizinler kullanılarak üç ana görev çözülür:

1) karmaşık bir olgudaki değişikliklerin değerlendirilmesi;

2) bireysel faktörlerin karmaşık bir olgudaki değişiklikler üzerindeki etkisinin belirlenmesi;

3) bir olgunun büyüklüğünün geçmiş dönemin büyüklüğüyle, başka bir bölgenin büyüklüğünün yanı sıra standartlar, planlar ve tahminlerle karşılaştırılması.

Endeksler 3 kritere göre sınıflandırılır:

2) nüfus unsurlarının kapsanma derecesine göre;

3) genel endeksleri hesaplama yöntemlerine göre.

İçeriğe göre endeksli miktarlar, endeksler niceliksel (hacim) göstergelerin endekslerine ve niteliksel göstergelerin endekslerine bölünmüştür. Niceliksel gösterge endeksleri - endüstriyel ürünlerin fiziksel hacmi, fiziksel satış hacmi, personel sayısı vb. endeksleri. Niteliksel gösterge endeksleri - fiyat, maliyet, işgücü verimliliği, ortalama ücret vb. endeksleri.

Nüfus birimlerinin kapsanma derecesine göre endeksler bireysel ve genel olmak üzere iki sınıfa ayrılmaktadır. Bunları karakterize etmek için indeks yöntemini kullanma pratiğinde benimsenen aşağıdaki kuralları sunuyoruz:

Q- herhangi bir ürünün fiziksel anlamda miktarı (hacmi) ; R- birim fiyat; z- birim üretim maliyeti; T- Bir birim ürün üretmek için harcanan zaman (emek yoğunluğu) ; w- birim zaman başına değer cinsinden ürünlerin üretimi; v- birim zaman başına fiziksel olarak üretim çıktısı; T— harcanan toplam süre veya çalışan sayısı.

Endekslenen büyüklüklerin hangi döneme veya nesneye ait olduğunu ayırt etmek için ilgili sembolün sağ alt kısmına alt simgeler konulması adettendir. Yani örneğin dinamik endekslerde kural olarak karşılaştırılan dönemler (cari, raporlama) ve karşılaştırmanın yapıldığı dönemler için 1 alt simgesi kullanılır,

Bireysel endeksler karmaşık bir olgunun bireysel öğelerindeki değişiklikleri karakterize etmeye hizmet eder (örneğin, bir tür ürünün çıktı hacmindeki değişiklik). Dinamiklerin göreceli değerlerini, yükümlülüklerin yerine getirilmesini, endeksli değerlerin karşılaştırılmasını temsil ederler.

Ürünlerin fiziksel hacminin bireysel endeksi belirlenir

Analitik açıdan bakıldığında, verilen bireysel dinamik endeksler büyüme katsayılarına (oranlarına) benzer ve cari dönemde endekslenen değerin baz döneme göre değişimini karakterize eder, yani kaç kez arttığını (azaldığını) gösterir. ya da büyümenin (azalmanın) yüzde kaçı olduğunu. Endeks değerleri katsayı veya yüzde olarak ifade edilir.

Genel (bileşik) endeks karmaşık bir olgunun tüm öğelerindeki değişiklikleri yansıtır.

Toplam endeks bir endeksin temel biçimidir. Toplam olarak adlandırılmasının nedeni pay ve paydanın bir dizi “toplam” olmasıdır.

Ortalama endeksler, tanımları.

İstatistiklerde toplu endekslere ek olarak bunların başka bir biçimi olan ağırlıklı ortalama endeksleri de kullanılmaktadır. Mevcut bilgiler genel toplam endeksin hesaplanmasına izin vermediğinde bunların hesaplanmasına başvurulur. Dolayısıyla fiyatlara ilişkin veri yoksa, ancak ürünlerin cari dönemdeki maliyetine ilişkin bilgi varsa ve her ürün için ayrı fiyat endeksleri biliniyorsa, genel fiyat endeksi toplu olarak belirlenemez ancak mümkündür. Bunu bireysel olanların ortalaması olarak hesaplamak için. Aynı şekilde, üretilen bireysel türdeki ürünlerin miktarları bilinmiyor ancak bireysel endeksler ve temel döneme ait üretim maliyeti biliniyorsa, fiziksel üretim hacminin genel endeksi ağırlıklı ortalama olarak belirlenebilir. değer.

Ortalama endeks - Bu Bireysel endekslerin ortalaması olarak hesaplanan bir endeks. Toplu endeks, genel endeksin temel biçimidir, dolayısıyla ortalama endeksin toplam endeksle aynı olması gerekir. Ortalama endeksleri hesaplarken iki ortalama türü kullanılır: aritmetik ve harmonik.

Aritmetik ortalama endeks, eğer bireysel endekslerin ağırlıkları, toplam endeksin paydasının koşulları ise, toplam endeksle aynıdır. Ancak bu durumda aritmetik ortalama formülü kullanılarak hesaplanan endeksin değeri toplam endekse eşit olacaktır.

Dağılım her bir nitelik değerinin genel ortalamadan sapmalarının karesinin aritmetik ortalamasıdır. Varyansa genellikle sapmaların ortalama karesi denir. Kaynak verilere bağlı olarak varyans, basit veya ağırlıklı aritmetik ortalama kullanılarak hesaplanabilir:

Gruplandırılmamış veriler için σ 2 =,

Varyasyon serisi için σ 2 =
.

Ortalama kare sapma varyansın kareköküdür:

Gruplandırılmamış veriler için σ =
,

Varyasyon serisi için σ =
.

Standart sapma, bir özelliğin toplamdaki değişiminin mutlak boyutunun genel bir özelliğidir. Özellik ile aynı ölçü birimleriyle (metre, ton, yüzde, hektar vb.) ifade edilir.

Standart sapmanın hesaplanmasından önce varyansın hesaplanması gerekir.

Bireysel değerlerden varyans ve standart sapmanın belirlenmesi

Hesaplama prosedürü:

    basit aritmetik ortalama karakteristik değerlere göre hesaplanır

;


Görev 3.İki takım örneğini kullanarak (görev 1), emek verimliliğinin dağılımını ve standart sapmasını belirleyin.

Çözüm yöntemi:

Kesikli ve aralıklı dağılım serilerinde dağılım ve standart sapmanın belirlenmesi

Hesaplama prosedürü:

Görev 4. Tipik bir problemin verilerinden varyansı ve standart sapmayı hesaplayın. Bir sonuç çıkarın.

1 işçi tarafından üretilen ürünler, adet. (x seçenek)

Çalışan sayısı

Çözüm yöntemi:

Kaynak veriler bir aralık dağılım serisi şeklinde sunuluyorsa, önce özelliğin ayrık değerini belirlemeniz, ardından yukarıda açıklanan yöntemin aynısını uygulamanız gerekir.

Görev 5.Çiftlikte ekilen alanın buğday verimine göre dağılımına dayalı olarak aralık serisinin dağılımını ve standart sapmasını hesaplayın:

Buğday verimi, c\ha

Ekilen alan, ha

Çözüm yöntemi:

Basitleştirilmiş bir şekilde varyansın hesaplanması.

Göstergenin özünü iyi yansıtmasına rağmen, varyansı hesaplamak için yukarıdaki formülü kullanmak her zaman uygun değildir. Bu nedenle, yukarıdakilerden kaynaklanan basitleştirilmiş bir hesaplama yöntemi için başka bir formülün bilinmesi gerekir:

,

Nerede - seçeneklerin karelerinin ortalama değeri;

- aritmetik ortalamanın karesi.

Hesaplama prosedürü (veriler gruplandırılmamışsa):

Görev 6.İşçilerin verimliliğine ilişkin veriler var. Varyansı basitleştirilmiş bir şekilde hesaplayın.

İşçi No.

Vardiya başına üretilen ürünler, adet.

Çözüm yöntemi:

Hesaplama prosedürü (eğer veriler gruplandırılmışsa):

Görev 7. Tarımsal işletmelerin sabit varlıkların mevcudiyetine göre dağılımına ilişkin veriler bulunmaktadır. Varyansı basitleştirilmiş bir şekilde hesaplayın.

Sabit varlıkların mevcudiyetine göre işletme grupları, milyon ruble.

İşletme sayısı

Çözüm tekniği.

Tanım

Standart sapma ( İngilizce Standart Sapma, SD), olasılık teorisinde ve matematiksel istatistiklerde, rastgele bir değişkenin matematiksel beklentisine göre dağılım derecesini değerlendirmek için kullanılan bir göstergedir. Yatırım yaparken, bir menkul kıymetin veya portföyün getirisinin standart sapması, risk ölçüsünü değerlendirmek için kullanılır. Bir menkul kıymetin getirisinin beklenen getiriye (getirinin matematiksel beklentisi) göre dağılım derecesi ne kadar yüksek olursa, yatırım riski de o kadar yüksek olur ve bunun tersi de geçerlidir.

Standart sapma genellikle Yunan harfi σ (sigma) ile gösterilir ve standart sapma Latin harfi S veya X'in rastgele bir değişken olduğu Std(X) ile gösterilir.

Formül

Gerçek standart sapma

Ayrık bir rastgele değişkenin tam dağılımı biliniyorsa, yani her sonuç için değeri biliniyorsa ve her sonucun olasılığı tahmin edilebiliyorsa, standart sapmayı hesaplama formülü şu şekilde görünecektir.

Burada Xi, i'inci sonuç için X rastgele değişkeninin değeridir; M(X) X rastgele değişkeninin matematiksel beklentisi; pi i – i'inci sonucun olasılığı; N – olası sonuçların sayısı.

Bu durumda rastgele bir değişkenin matematiksel beklentisi şu formül kullanılarak hesaplanır:

Nüfus standart sapması

Uygulamada, rastgele bir değişkenin tam dağılımı yerine, genellikle verilerin yalnızca bir örneği mevcuttur. Bu durumda, standart sapmanın tahmini değeri hesaplanır ve bu durumda standart sapma (S) olarak adlandırılır. Tahmin, veri popülasyonunun tamamına dayanıyorsa aşağıdaki formülün kullanılması gerekir.

Burada Xi, X rastgele değişkeninin i'inci değeridir; X – genel popülasyonun aritmetik ortalaması; N genel popülasyonun hacmidir.

Numune standart sapması

Veri popülasyonunun tamamı değil de ondan bir örnek kullanılıyorsa, standart sapmanın hesaplanmasına yönelik formül, varyansın tarafsız bir tahminine dayanır.

Burada Xi, X rastgele değişkeninin i'inci değeridir; X – numunenin aritmetik ortalaması; N – numune boyutu.

Hesaplama örnekleri

örnek 1

Portföy yöneticisi, A ve B adlı iki şirketin hisselerine yatırım yapma risklerini değerlendirmelidir. Aynı zamanda, olayların gelişimi için, bilgileri tabloda sunulan 5 senaryoyu dikkate alır.

Her bir hisse senedinin getiri dağılımını tam olarak bildiğimiz için, her bir hisse senedi getirisinin gerçek standart sapmasını hesaplayabiliriz.

Aşama 1. Her hisse senedi için karlılığın matematiksel beklentisini hesaplayalım.

M(A) = -%5×0,02+%6×0,25+%15×0,40+%24×0,30+%34×0,03 = %15,62

M(B) = -%18×0,02+%2×0,25+%16×0,40+%27×0,30+%36×0,03 = %22,14

Adım 2. Elde edilen verileri ilk formülde yerine koyalım.

Görebildiğimiz gibi, A Şirketinin hisseleri, getirilerin standart sapması daha düşük olduğundan, daha düşük bir risk düzeyine sahiptir. Beklenen getirilerinin B Şirketinin hisselerinden daha düşük olduğunu da belirtmek gerekir.

Örnek 2

Analist, tabloda sunulan iki menkul kıymetin son 5 yıldaki karlılığına ilişkin verilere sahiptir.

Getirilerin kesin dağılımı bilinmediğinden ve analistin elinde yalnızca veri popülasyonundan bir örnek bulunduğundan, tarafsız varyansa dayalı olarak örneğin standart sapmasını hesaplayabiliriz.

Aşama 1. Her bir menkul kıymetin beklenen getirisini örneklemin aritmetik ortalaması olarak hesaplayalım.

X A = (7 + 15 + 2 – 5 + 6) ÷ 5 = %5

X B = (3 – 2 + 12 + 4 +8) ÷ 5 = %5

Adım 2. Genel veri popülasyonundan alınan bir örneklem için formülü kullanarak her bir menkul kıymetin getirisinin standart sapmasını hesaplayalım.

Her iki menkul kıymetin de %5'lik eşit beklenen getiriye sahip olduğuna dikkat edilmelidir. Aynı zamanda, B menkul kıymetinin getirisinin standart sapması daha düşüktür; bu, diğer koşullar eşit olduğunda, daha iyi bir risk-getiri profili nedeniyle onu daha cazip bir yatırım nesnesi haline getirir.

Excel'de Standart Sapma

Excel, bir numunenin ve popülasyonun standart sapmasını hesaplamak için iki işlev sağlar.

Örnekleme için “STDEV.V” işlevini kullanın:

  1. Bir dizi hücrede B1:F1
  2. Çıkış hücresini seç B2.
  3. döviz , açılır pencerede " İşlev ekleme" Bir kategori seç " Tam alfabetik liste" ve işlevi seçin " STDSAPMA.V».
  4. Sahada " 1 numara» bir hücre aralığı seç B1:F1, alan " 2 numaraTAMAM».

Genel popülasyon için “STDEV.G” işlevi kullanılır:

  1. Bir dizi hücrede B1:F1 X rastgele değişkeninin değerleri girilir.
  2. Çıkış hücresini seç B2.
  3. Komut satırında tıklayın döviz , açılır pencerede " İşlev ekleme" Bir kategori seç " Tam alfabetik liste" ve işlevi seçin " STDEV.G».
  4. Sahada " 1 numara» bir hücre aralığı seç B1:F1, alan " 2 numara"boş bırakın ve" butonuna tıklayın TAMAM».

Tercüme

Yatırım yaparken, getirilerin standart sapması oynaklığın bir ölçüsü olarak kullanılır. Değeri ne kadar yüksek olursa, bu varlığa yatırım yapmanın riski de o kadar yüksek olur ve bunun tersi de geçerlidir. Diğer her şey eşit olduğunda, bu göstergenin minimum olduğu varlığa tercih verilmelidir.

Varyansın kareköküne ortalamadan standart sapma adı verilir ve şu şekilde hesaplanır:

Standart sapma formülünün temel cebirsel dönüşümü onu aşağıdaki forma götürür:

Bu formülün genellikle hesaplama uygulamalarında daha kullanışlı olduğu ortaya çıkar.

Standart sapma, tıpkı ortalama doğrusal sapma gibi, bir özelliğin belirli değerlerinin ortalama değerlerinden ne kadar saptığını gösterir. Standart sapma her zaman ortalama doğrusal sapmadan daha büyüktür. Aralarında şu ilişki vardır:

Bu oranı bildiğinizde, örneğin bilinmeyeni belirlemek için bilinen göstergeleri kullanabilirsiniz, ancak (BEN a'yı hesaplayın ve bunun tersini yapın. Standart sapma, bir özelliğin değişkenliğinin mutlak boyutunu ölçer ve özelliğin değerleriyle (ruble, ton, yıl vb.) aynı ölçü birimleriyle ifade edilir. Mutlak bir varyasyon ölçüsüdür.

İçin alternatif işaretler, örneğin yüksek öğrenimin olup olmaması, sigortalılık, dağılım ve standart sapma formülleri şu şekildedir:

Üniversite fakültelerinden birinde öğrencilerin yaşa göre dağılımını karakterize eden ayrı bir serinin verilerine göre standart sapmanın hesaplanmasını gösterelim (Tablo 6.2).

Tablo 6.2.

Yardımcı hesaplamaların sonuçları tablonun 2-5 sütunlarında verilmiştir. 6.2.

Bir öğrencinin ortalama yaşı (yıl), ağırlıklı aritmetik ortalama formülü (sütun 2) ile belirlenir:

Öğrencinin bireysel yaşının ortalamadan karesel sapmaları 3-4. sütunlarda, sapmaların kareleri ve karşılık gelen frekansların çarpımı ise 5. sütunda yer almaktadır.

Öğrencilerin yaşının, yıllarının varyansını formül (6.2) kullanarak buluyoruz:

O halde o = l/3.43 1.85 *oda, yani. Öğrencinin yaşının her bir özel değeri ortalamadan 1,85 yıl sapmaktadır.

Değişim katsayısı

Mutlak değerinde standart sapma, yalnızca özelliğin varyasyon derecesine değil, aynı zamanda seçeneklerin mutlak seviyelerine ve ortalamaya da bağlıdır. Bu nedenle varyasyon serilerinin standart sapmalarını farklı ortalama düzeylerle doğrudan karşılaştırmak mümkün değildir. Böyle bir karşılaştırma yapabilmek için ortalama sapmanın (doğrusal veya ikinci dereceden) aritmetik ortalama içindeki yüzde olarak ifade edilen payını bulmanız gerekir; hesaplamak göreceli değişim ölçüleri.

Doğrusal varyasyon katsayısı formülle hesaplanır

Değişim katsayısı aşağıdaki formülle belirlenir:

Değişim katsayılarında, yalnızca incelenen özelliğin farklı ölçüm birimleriyle ilişkili karşılaştırılamazlık değil, aynı zamanda aritmetik ortalamaların değerindeki farklılıklar nedeniyle ortaya çıkan karşılaştırılamazlık da ortadan kaldırılır. Ayrıca varyasyon göstergeleri popülasyonun homojenliğini karakterize eder. Varyasyon katsayısı %33'ü geçmiyorsa popülasyon homojen kabul edilir.

Tabloya göre. 6.2 ve yukarıda elde edilen hesaplama sonuçlarına göre, değişim katsayısını, %, formül (6.3)'e göre belirleriz:

Varyasyon katsayısı %33'ü aşarsa, bu, incelenen popülasyonun heterojenliğini gösterir. Bizim durumumuzda elde edilen değer, öğrenci popülasyonunun yaşa göre kompozisyon bakımından homojen olduğunu göstermektedir. Bu nedenle, değişim göstergelerini genelleştirmenin önemli bir işlevi ortalamaların güvenilirliğini değerlendirmektir. Daha az c1, a2 ve V, Sonuçta ortaya çıkan olgu kümesi ne kadar homojense ve sonuçta ortaya çıkan ortalama da o kadar güvenilir olur. Matematiksel istatistiklerin dikkate aldığı “üç sigma kuralına” göre normal dağılım gösteren veya bunlara yakın serilerde aritmetik ortalamadan ±3'ü geçmeyen sapmalar 1000 vakanın 997'sinde meydana gelir. X ve a, varyasyon serisi hakkında genel bir başlangıç ​​fikri edinebilirsiniz. Örneğin, bir şirketteki bir çalışanın ortalama maaşı 25.000 ruble ise ve a 100 rubleye eşitse, o zaman kesinliğe yakın bir olasılıkla şirket çalışanlarının ücretlerinin (25.000) aralığında dalgalandığını söyleyebiliriz. ± ± 3 x 100 ) yani. 24.700 ila 25.300 ruble.

Rastgele bir değişkenin matematiksel beklentisine ek olarak. olasılık dağılımının merkezinin konumunu belirler; rastgele bir değişkenin dağılımının niceliksel bir özelliği, rastgele değişkenin dağılımıdır;

Dağılımı D [x] veya ile göstereceğiz.

Dispersiyon kelimesi dispersiyon anlamına gelir. Dağılım, dağılımın sayısal bir özelliğidir, rastgele bir değişkenin değerlerinin matematiksel beklentisine göre yayılmasıdır.

Tanım 1. Bir rastgele değişkenin varyansı, bir rastgele değişken ile onun matematiksel beklentisi arasındaki farkın karesinin matematiksel beklentisidir (yani, karşılık gelen merkezli rastgele değişkenin karesinin matematiksel beklentisi):

Varyans, rastgele değişkenin karesi boyutundadır. Bazen dağılımı karakterize etmek için, boyutu bir rastgele değişkenin boyutuyla örtüşen bir miktarın kullanılması daha uygundur. Bu değer standart sapmadır.

Tanım 2. Bir rastgele değişkenin ortalama kare sapması, varyansının kareköküdür:

veya genişletilmiş biçimde

Standart sapma da gösterilir

Açıklama 1. Varyans hesaplanırken formül (1) uygun şekilde aşağıdaki şekilde dönüştürülebilir:

yani varyans, rastgele değişkenin matematiksel beklentisinin karesi ile rastgele değişkenin matematiksel beklentisinin karesi arasındaki farka eşittir.

Örnek 1. Bir nesneye bir atış yapılıyor. Vurulma olasılığı. Matematiksel beklentiyi, dağılımı ve standart sapmayı belirleyin.

Çözüm. İsabet sayısı değerleri tablosu oluşturma

Buradan,

Rastgele bir değişkenin dağılımının özellikleri olarak dağılım ve standart sapma kavramının anlamını sunmak için örnekleri göz önünde bulundurun.

Örnek 2. Rastgele bir değişken aşağıdaki dağıtım yasasıyla verilmektedir (bkz. tablo ve Şekil 413):

Örnek 3. Rastgele bir değişken aşağıdaki dağıtım yasasıyla verilmektedir (bkz. tablo ve Şekil 414):

Belirleyin: 1) matematiksel beklenti, 2) dağılım, 3) standart sapma.

İlk örnekteki rastgele değişkenin dağılımı, dağılımı ikinci örnekteki rastgele değişkenin dağılımından daha azdır (bkz. Şekil 414 ve 415). Bu değerlerin varyansları sırasıyla 0,6 ve 2,4’tür.

Örnek 4; Rastgele değişken aşağıdaki dağıtım yasasıyla verilir (bkz. tablo ve Şekil 415):

Belirleyin: 1) matematiksel beklenti, 2) dağılım, 3) standart sapma.