Fórmula para calcular la varianza total. Varianza y desviación estándar en MS EXCEL

Solución.

Como medida de la dispersión de valores variable aleatoria usado dispersión

Dispersión (la palabra dispersión significa "dispersión") es medida de dispersión de valores de variables aleatorias con respecto a ella expectativa matemática. La dispersión es la expectativa matemática de la desviación al cuadrado de una variable aleatoria de su expectativa matemática.

Si la variable aleatoria es discreta con un conjunto de valores infinito pero contable, entonces

si la serie del lado derecho de la igualdad converge.

Propiedades de dispersión.

  • 1. La varianza de un valor constante es cero.
  • 2. La varianza de la suma de variables aleatorias es igual a la suma de las varianzas.
  • 3. El factor constante se puede sacar del signo de la dispersión al cuadrado.

La varianza de la diferencia de variables aleatorias es igual a la suma de las varianzas.

Esta propiedad es consecuencia de la segunda y tercera propiedades. Las variaciones sólo pueden sumar.

Es conveniente calcular la dispersión mediante una fórmula que se puede obtener fácilmente utilizando las propiedades de la dispersión.

La varianza siempre es positiva..

La varianza tiene dimensión dimensión cuadrada de la propia variable aleatoria, lo cual no siempre es conveniente. Por lo tanto, la cantidad

Promedio desviación cuadrada (desviación estándar o estándar) de una variable aleatoria se llama valor aritmético la raíz cuadrada de su varianza

Lanza dos monedas de 2 y 5 rublos. Si la moneda sale como un escudo de armas, entonces se otorgan cero puntos, y si sale como un número, entonces el número de puntos es igual a la denominación de la moneda. Encuentre la expectativa matemática y la varianza del número de puntos.

Solución. Primero encontremos la distribución de la variable aleatoria X: el número de puntos. Todas las combinaciones - (2;5),(2;0),(0;5),(0;0) - son igualmente probables y la ley de distribución es:

Valor esperado:

Encontramos la varianza usando la fórmula.

¿Por qué calculamos?

Ejemplo 2.

Encuentra probabilidad desconocida R, expectativa matemática y varianza de una variable aleatoria discreta especificada por una tabla de distribución de probabilidad

Encontramos la expectativa matemática y la varianza:

METRO(X) = 00,0081 + 10,0756 + 20,2646 + 3 0,4116 + +40,2401=2,8

Para calcular la dispersión utilizamos la fórmula (19.4)

D(X) = 020 ,0081 + 120,0756 + 220,2646 + 320,4116 + 420,2401 - 2,82 = 8,68 -

Ejemplo 3. Dos atletas igualmente fuertes celebran un torneo que dura hasta la primera victoria de uno de ellos o hasta que se hayan jugado cinco partidos. La probabilidad de ganar un juego para cada uno de los atletas es 0,3 y la probabilidad de empate es 0,4. Encuentre la ley de distribución, expectativa matemática y dispersión del número de juegos jugados.

Solución. Valor aleatorio X- el número de partidos jugados, toma valores del 1 al 5, es decir

Determinemos las probabilidades de terminar el partido. El partido terminará en el primer set si uno de sus atletas gana. La probabilidad de ganar es

R(1) = 0,3+0,3 =0,6.

Si hubo empate (la probabilidad de empate es 1 - 0,6 = 0,4), el partido continúa. El partido terminará en el segundo juego si el primero fue empate y alguien ganó el segundo. Probabilidad

R(2) = 0,4 0,6=0,24.

Asimismo, el partido finalizará en el tercer juego si hubo dos empates seguidos y nuevamente alguien ganó.

R(3) = 0,4 0,4 0,6 = 0,096. R(4)= 0,4 0,4 0,4 0,6=0,0384.

El quinto juego es el último en cualquier versión.

R(5)= 1 - (R(1)+R(2)+R(3)+R(4)) = 0,0256.

Pongamos todo en una mesa. La ley de distribución de la variable aleatoria “número de juegos ganados” tiene la forma

Valor esperado

Calculamos la varianza usando la fórmula (19.4)

Distribuciones discretas estándar.

Distribución binomial. Dejemos que se implemente el esquema experimental de Bernoulli: norte experimentos independientes idénticos, en cada uno de los cuales el evento A puede aparecer con probabilidad constante pag y no aparecerá con probabilidad

(ver conferencia 18).

Número de ocurrencias del evento A en estos norte experimentos hay una variable aleatoria discreta X, valores posibles cual:

0; 1; 2; ... ;metro; ... ; norte.

Probabilidad de ocurrencia metro eventos A en una serie específica de norte Los experimentos y la ley de distribución de dicha variable aleatoria vienen dados por la fórmula de Bernoulli (ver lección 18).

Características numéricas de una variable aleatoria. X distribuido según la ley del binomio:

Si norte es genial (), entonces, cuando la fórmula (19.6) entra en la fórmula

y la función gaussiana tabulada (la tabla de valores de la función gaussiana se proporciona al final de la conferencia 18).

En la práctica, lo que suele ser importante no es la probabilidad de que ocurra en sí. metro eventos A en una serie específica de norte experimentos y la probabilidad de que el evento A no aparecerá menos

veces y no más de veces, es decir, la probabilidad de que X tome los valores

Para hacer esto, necesitamos sumar las probabilidades.

Si norte es genial (), entonces, cuando la fórmula (19.9) se convierte en una fórmula aproximada

función tabulada. Las tablas se encuentran al final de la Conferencia 18.

Al utilizar tablas, es necesario tener en cuenta que

Ejemplo 1. Un automóvil que se acerca a una intersección puede continuar circulando por cualquiera de tres vías: A, B o C con igual probabilidad. Cinco coches se acercan al cruce. Encuentre el número promedio de automóviles que viajarán por la carretera A y la probabilidad de que tres automóviles viajen por la carretera B.

Solución. El número de automóviles que circulan por cada vía es una variable aleatoria. Si suponemos que todos los automóviles que se acercan a la intersección viajan independientemente unos de otros, entonces esta variable aleatoria se distribuye según la ley binomial con

norte= 5 y pag = .

Por tanto, el número medio de coches que seguirán la carretera A es según la fórmula (19.7)

y la probabilidad deseada en

Ejemplo 2. La probabilidad de falla del dispositivo durante cada prueba es 0,1. Se realizan 60 pruebas del dispositivo. ¿Cuál es la probabilidad de que ocurra una falla del dispositivo: a) 15 veces; b) no más de 15 veces?

A. Como el número de pruebas es 60, usamos la fórmula (19.8)

Según la tabla 1 del apéndice de la lección 18 encontramos

b. Usamos la fórmula (19.10).

Según la tabla 2 del apéndice de la lección 18.

  • - 0,495
  • 0,49995

Distribución de Poisson) ley de eventos raros). Si norte grande y R poco (), y el producto etc. conserva un valor constante, que denotamos por l,

entonces la fórmula (19.6) se convierte en la fórmula de Poisson

La ley de distribución de Poisson tiene la forma:

Obviamente, la definición de la ley de Poisson es correcta, porque propiedad principal de una serie de distribución

hecho, porque suma de series

El desarrollo en serie de la función en

Teorema. La expectativa matemática y la varianza de una variable aleatoria distribuida según la ley de Poisson coinciden y son iguales al parámetro de esta ley, es decir

Prueba.

Ejemplo. Para promocionar sus productos en el mercado, la empresa establece buzones volantes. La experiencia demuestra que aproximadamente en uno de cada 2.000 casos se sigue una orden. Encuentre la probabilidad de que al colocar 10,000 anuncios llegue al menos un pedido, el promedio de pedidos recibidos y la varianza del número de pedidos recibidos.

Solución. Aquí

La probabilidad de que llegue al menos un pedido se encontrará mediante la probabilidad evento opuesto, es decir.

Flujo aleatorio de eventos. Una secuencia de eventos es una secuencia de eventos que ocurren en momentos aleatorios. Ejemplos típicos de flujos son fallas en las redes informáticas, llamadas a centrales telefónicas, un flujo de solicitudes de reparación de equipos, etc.

Fluir eventos se llama estacionario, si la probabilidad de que un número particular de eventos caigan en un intervalo de tiempo de longitud depende solo de la duración del intervalo y no depende de la ubicación del intervalo de tiempo en el eje de tiempo.

La condición de estacionariedad se cumple mediante el flujo de solicitudes cuyas características probabilísticas no dependen del tiempo. En particular, un flujo estacionario se caracteriza por una densidad constante (el número promedio de solicitudes por unidad de tiempo). En la práctica, a menudo hay flujos de solicitudes que (al menos durante un período de tiempo limitado) pueden considerarse estacionarios. Por ejemplo, se puede considerar teléfono fijo el flujo de llamadas en una central telefónica de la ciudad en el período de 12 a 13 horas. El mismo flujo durante todo el día ya no puede considerarse estacionario (por la noche la densidad de llamadas es significativamente menor que durante el día).

Fluir eventos se llama flujo sin secuelas, si para períodos de tiempo que no se superponen, el número de eventos que ocurren en uno de ellos no depende del número de eventos que ocurren en los demás.

La condición de ausencia de efectos secundarios, la más esencial para el flujo más simple, significa que las aplicaciones ingresan al sistema de forma independiente unas de otras. Por ejemplo, un flujo de pasajeros que ingresa a una estación de metro puede considerarse un flujo sin secuelas porque los motivos que determinaron la llegada de un pasajero individual en un momento determinado y no en otro, por regla general, no están relacionados con motivos similares de otros pasajeros. . Sin embargo, la condición de ausencia de efectos secundarios puede violarse fácilmente debido a la aparición de dicha dependencia. Por ejemplo, el flujo de pasajeros que sale de una estación de metro ya no puede considerarse un flujo sin efectos secundarios, ya que los momentos de salida de los pasajeros que llegan en el mismo tren dependen unos de otros.

Fluir eventos se llama común, si la probabilidad de que ocurran dos o más eventos dentro de un corto intervalo de tiempo t es insignificante en comparación con la probabilidad de que ocurra un evento (en este sentido, la ley de Poisson se llama ley de eventos raros).

La condición de normalidad significa que los pedidos llegan solos y no en pares, trillizos, etc. Desviación de la varianza Distribución de Bernoulli

Por ejemplo, el flujo de clientes que entran en una peluquería puede considerarse casi normal. Si en un flujo extraordinario las solicitudes llegan sólo en pares, sólo en tripletes, etc., entonces el flujo extraordinario puede reducirse fácilmente a uno ordinario; Para hacer esto, en lugar de un flujo de solicitudes individuales, es suficiente considerar un flujo de pares, tripletes, etc., será más difícil si cada solicitud puede resultar aleatoriamente doble, triple, etc. lidiar con una corriente de eventos no homogéneos, sino heterogéneos.

Si una corriente de eventos tiene las tres propiedades (es decir, estacionaria, ordinaria y no tiene efectos secundarios), entonces se llama corriente de Poisson simple (o estacionaria). El nombre "Poisson" se debe al hecho de que si se cumplen las condiciones enumeradas, el número de eventos que caen en cualquier intervalo de tiempo fijo se distribuirá entre ley de poisson

Aquí está el número promedio de eventos. A, que aparece por unidad de tiempo.

Esta ley es uniparamétrica, es decir para configurarlo, sólo necesita conocer un parámetro. Se puede demostrar que la esperanza y la varianza en la ley de Poisson son numéricamente iguales:

Ejemplo. Digamos que a mitad de la jornada laboral la media de solicitudes es de 2 por segundo. ¿Cuál es la probabilidad de que 1) no se reciban solicitudes en un segundo, 2) lleguen 10 solicitudes en dos segundos?

Solución. Dado que la validez de la aplicación de la ley de Poisson está fuera de toda duda y su parámetro está dado (= 2), la solución del problema se reduce a la aplicación de la fórmula de Poisson (19.11)

1) t = 1, metro = 0:

2) t = 2, metro = 10:

Ley números grandes. La base matemática del hecho de que los valores de una variable aleatoria se agrupan alrededor de algunos valores constantes es la ley de los grandes números.

Históricamente, la primera formulación de la ley de los grandes números fue el teorema de Bernoulli:

“Con un aumento ilimitado en el número de experimentos n idénticos e independientes, la frecuencia de ocurrencia del evento A converge en probabilidad a su probabilidad”, es decir,

donde es la frecuencia de ocurrencia del evento A en n experimentos,

En esencia, la expresión (19.10) significa que cuando gran número experimentos frecuencia de ocurrencia de un evento A Puede reemplazar la probabilidad desconocida de este evento, y cuanto mayor sea el número de experimentos realizados, más cerca p* de p. Interesante hecho histórico. K. Pearson lanzó una moneda 12.000 veces y su escudo de armas apareció 6.019 veces (frecuencia 0,5016). Al lanzar la misma moneda 24.000 veces, obtuvo 12.012 escudos de armas, es decir. frecuencia 0,5005.

La forma más importante de la ley de los grandes números es el teorema de Chebyshev: con un aumento ilimitado en el número de experimentos independientes con varianza finita y realizados en condiciones idénticas, la media aritmética de los valores observados de la variable aleatoria converge en probabilidad a su expectativa matemática. En forma analítica, este teorema se puede escribir de la siguiente manera:

El teorema de Chebyshev, además de su significado teórico fundamental, también tiene una importante uso práctico, por ejemplo, en la teoría de la medición. Después de tomar n medidas de una cierta cantidad X, obtiene diferentes valores que no coinciden X 1, X 2, ..., xn. Para el valor aproximado de la cantidad medida X tomar la media aritmética de los valores observados

Donde, Cuantos más experimentos se realicen, más preciso será el resultado. El hecho es que la dispersión de la cantidad disminuye con un aumento en el número de experimentos realizados, porque

D(X 1) = D(X 2)=…= D(xn) D(X) , Eso

La relación (19.13) muestra que incluso con una alta inexactitud de los instrumentos de medición (valor grande), al aumentar el número de mediciones, es posible obtener un resultado con una precisión arbitrariamente alta.

Usando la fórmula (19.10) puede encontrar la probabilidad de que la frecuencia estadística se desvíe de la probabilidad en no más de

Ejemplo. La probabilidad de que ocurra un evento en cada ensayo es 0,4. ¿Cuántas pruebas hay que realizar para esperar, con una probabilidad no inferior a 0,8, que la frecuencia relativa de un evento se desvíe de la probabilidad en valor absoluto en menos de 0,01?

Solución. Según la fórmula (19.14)

por lo tanto, según la tabla hay dos aplicaciones

por eso, norte 3932.

La dispersión en estadística se define como la desviación estándar de los valores individuales de una característica al cuadrado de la media aritmética. Un método común para calcular las desviaciones al cuadrado de las opciones del promedio y luego promediarlas.

En el análisis estadístico económico, se acostumbra evaluar la variación de una característica utilizando con mayor frecuencia la desviación estándar; es la raíz cuadrada de la varianza.

(3)

Caracteriza la fluctuación absoluta de los valores de una característica variable y se expresa en las mismas unidades de medida que las opciones. En estadística, a menudo existe la necesidad de comparar la variación de diferentes características. Para tales comparaciones, se utiliza una medida relativa de variación, el coeficiente de variación.

Propiedades de dispersión:

1) si restas cualquier número de todas las opciones, la variación no cambiará;

2) si todos los valores de la opción se dividen por cualquier número b, entonces la varianza disminuirá b^2 veces, es decir

3) si calcula el cuadrado promedio de las desviaciones de cualquier número con una media aritmética desigual, entonces será mayor que la varianza. Al mismo tiempo, por un valor bien definido por cuadrado de la diferencia entre el valor medio c.

La dispersión se puede definir como la diferencia entre la media al cuadrado y la media al cuadrado.

17. Variaciones grupales e intergrupales. Regla de suma de varianza

Si una población estadística se divide en grupos o partes según la característica que se está estudiando, entonces se pueden calcular los siguientes tipos de dispersión para dicha población: grupo (privado), promedio grupal (privado) e intergrupal.

varianza total– refleja la variación de una característica debido a todas las condiciones y causas que operan en una población estadística determinada.

variación del grupo- igual al cuadrado medio de las desviaciones de los valores individuales de una característica dentro de un grupo de la media aritmética de este grupo, denominada media de grupo. Sin embargo, la media del grupo no coincide con la media general de toda la población.

La variación grupal refleja la variación de un rasgo sólo debido a condiciones y causas que operan dentro del grupo.

Promedio de variaciones del grupo- se define como la media aritmética ponderada de las varianzas del grupo, siendo los pesos los volúmenes del grupo.

Varianza intergrupal- igual al cuadrado medio de las desviaciones de los promedios grupales del promedio general.

La dispersión intergrupal caracteriza la variación de la característica resultante debido a la característica de agrupación.

Existe una cierta relación entre los tipos de dispersiones considerados: la dispersión total es igual a la suma de la dispersión promedio grupal e intergrupal.

Esta relación se llama regla de suma de varianzas.

18. Series dinámicas y sus componentes. Tipos de series temporales.

Fila en estadísticas- se trata de datos digitales que muestran cambios en un fenómeno en el tiempo o el espacio y que permiten realizar una comparación estadística de los fenómenos tanto en el proceso de su desarrollo en el tiempo como en diversas formas y tipos de procesos. Gracias a esto, es posible detectar la dependencia mutua de los fenómenos.

En estadística, el proceso de desarrollo del movimiento de los fenómenos sociales a lo largo del tiempo se suele denominar dinámica. Para mostrar la dinámica se construyen series dinámicas (cronológicas, temporales), que son series de valores que varían en el tiempo de un indicador estadístico (por ejemplo, el número de condenados durante 10 años), ubicados en orden cronológico. Sus elementos constitutivos son los valores digitales de un indicador determinado y los períodos o momentos en el tiempo a los que se refieren.

La característica más importante de las series dinámicas.- su tamaño (volumen, magnitud) de un fenómeno particular logrado en un período determinado o en un momento determinado. En consecuencia, la magnitud de los términos de la serie dinámica es su nivel. Distinguir niveles inicial, medio y final de la serie dinámica. Primer nivel muestra el valor del primero, el final, el valor del último término de la serie. Nivel promedio representa el rango de variación cronológica promedio y se calcula dependiendo de si la serie dinámica es interválica o momentánea.

Otra característica importante de la serie dinámica.- el tiempo transcurrido desde la observación inicial hasta la final, o el número de dichas observaciones.

Existen diferentes tipos de series temporales, se pueden clasificar según los siguientes criterios.

1) Dependiendo del método de expresión de los niveles, las series dinámicas se dividen en series de indicadores absolutos y derivados (valores relativos y medios).

2) Dependiendo de cómo los niveles de la serie expresen el estado del fenómeno en determinados momentos (al inicio de mes, trimestre, año, etc.) o su valor en determinados intervalos de tiempo (por ejemplo, por día, mes, año, etc.) etc.), distinguen entre series de dinámica de momento y de intervalo, respectivamente. Las series de momentos se utilizan relativamente raramente en el trabajo analítico de los organismos encargados de hacer cumplir la ley.

En teoría estadística, la dinámica se distingue según una serie de otros criterios de clasificación: según la distancia entre niveles, con niveles iguales y niveles desiguales en el tiempo; dependiendo de la presencia de la tendencia principal del proceso en estudio: estacionaria y no estacionaria. Al analizar series de tiempo, se parte de lo siguiente, los niveles de la serie se presentan en forma de componentes:

Y t = TP + E (t)

donde TP es un componente determinista que determina la tendencia general de cambio en el tiempo o tendencia.

E (t) es un componente aleatorio que provoca fluctuaciones en los niveles.

Dispersión I Dispersión (del latín dispersio - dispersión)

en estadística matemática y teoría de la probabilidad, la medida de dispersión más utilizada, es decir, desviación del promedio. En el sentido estadístico D.

es la media aritmética de las desviaciones al cuadrado de los valores xyo de su media aritmética

En teoría de la probabilidad, la D. de una variable aleatoria X llamada expectativa matemática E ( X - mx) 2 desviaciones cuadradas X de su expectativa matemática mx= mi ( X). D. variable aleatoria X denotado por D ( X) o mediante σ 2X. La raíz cuadrada de D. (es decir, σ, si D. es σ 2) se llama desviación estándar (ver Desviación cuadrada).

Para una variable aleatoria X Con distribución continua probabilidades caracterizadas por densidad de probabilidad (Ver Densidad de probabilidad) R(X), D. se calcula mediante la fórmula

En la teoría de la probabilidad gran importancia tiene un teorema: D. la suma de términos independientes es igual a la suma de sus D. No menos significativa es la desigualdad de Chebyshev, que permite estimar la probabilidad de grandes desviaciones de una variable aleatoria X de su expectativa matemática.

II Dispersión

La presencia de ondas D provoca una distorsión de la forma de las señales a medida que se propagan en el medio. Esto se explica por el hecho de que las ondas armónicas diferentes frecuencias, en el que se puede descomponer la señal, se propagan a diferentes velocidades (para más detalles, consulte Ondas, Velocidad de grupo). La dispersión de la luz cuando se propaga en un prisma transparente conduce a la descomposición de la luz blanca en un espectro (ver Dispersión de la luz).


Grande enciclopedia soviética. - M.: Enciclopedia soviética. 1969-1978 .

Sinónimos:

Vea qué es “Varianza” en otros diccionarios:

    dispersión- Esparciendo algo. En matemáticas, la dispersión define la desviación de cantidades del valor medio. La dispersión de la luz blanca provoca su descomposición en componentes. La dispersión del sonido hace que se extienda. Dispersión de los datos almacenados en... ... Guía del traductor técnico

    enciclopedia moderna

    - (varianza) Una medida de dispersión de datos. La varianza de un conjunto de N miembros se encuentra sumando los cuadrados de sus desviaciones de la media y dividiendo por N. Por lo tanto, si los miembros son xi para i = 1, 2,..., N, y su media es m , la variación... ... Diccionario económico

    Dispersión- (del latín dispersión dispersio) de ondas, la dependencia de la velocidad de propagación de las ondas en una sustancia de la longitud de onda (frecuencia). Se determina la varianza propiedades físicas el medio en el que se propagan las ondas. Por ejemplo, en el vacío... ... Ilustrado diccionario enciclopédico

    - (del latín dispersión dispersio) en estadística matemática y teoría de la probabilidad, una medida de dispersión (desviación del promedio). En estadística, la dispersión es la media aritmética de las desviaciones al cuadrado de los valores observados (x1, x2,...,xn) de un azar... ... Gran diccionario enciclopédico

    En teoría de la probabilidad, la medida de desviación de la media más utilizada es la medida de dispersión. En inglés: Dispersión Sinónimos: Dispersión estadística Sinónimos en inglés: Dispersión estadística Ver también: Poblaciones de muestra Financiero... ... Diccionario financiero

    - [lat. dispersus disperso, disperso] 1) dispersión; 2) química, física. descomponer una sustancia en partículas muy pequeñas. D. descomposición luminosa de la luz blanca en un espectro mediante un prisma; 3) estera. desviación del promedio. Diccionario palabras extranjeras. Komlev N.G.,... ... Diccionario de palabras extranjeras de la lengua rusa.

    dispersión- (varianza) indicador de dispersión de datos, correspondiente a la desviación cuadrática media de estos datos de la media aritmética. igual al cuadrado Desviación Estándar. Diccionario psicólogo práctico. M.: AST, Cosecha. S. Yu. Golovin. 1998... Gran enciclopedia psicológica.

    Dispersión, dispersión Diccionario de sinónimos rusos. sustantivo dispersión, número de sinónimos: 6 nanodispersión (1) ... Diccionario de sinónimos

    Dispersión- característica de la dispersión de los valores de una variable aleatoria, medida por el cuadrado de sus desviaciones del valor medio (denotado por d2). D. difiere entre teórico (continuo o discreto) y empírico (también continuo y... ... Diccionario económico-matemático

    Dispersión- * dispersión * dispersión 1. Dispersión; dispersión; variación (ver). 2. Un concepto de probabilidad teórica que caracteriza la medida de desviación de una variable aleatoria de su expectativa matemática. En la práctica biométrica se utiliza. varianza muestral s2... Genética. diccionario enciclopédico

Libros

  • Dispersión anómala en bandas anchas de absorción, D.S. Navidad. Reproducido con la ortografía original del autor de la edición de 1934 (editorial 'Izvestia de la Academia de Ciencias de la URSS'). EN…

La teoría de la probabilidad es una rama especial de las matemáticas que estudian únicamente estudiantes de instituciones de educación superior. ¿Te gustan los cálculos y las fórmulas? ¿No le asusta la perspectiva de familiarizarse con la distribución normal, la entropía de conjunto, la expectativa matemática y la dispersión de una variable aleatoria discreta? Entonces este tema te resultará muy interesante. Conozcamos varios de los conceptos básicos más importantes de esta rama de la ciencia.

Recordemos lo básico.

Incluso si recuerdas más conceptos simples Teoría de la probabilidad, no descuides los primeros párrafos del artículo. El caso es que sin comprensión clara conceptos básicos, no podrá trabajar con las fórmulas que se analizan a continuación.

Así que algo está pasando evento al azar, una especie de experimento. Como resultado de las acciones que realizamos, podemos obtener varios resultados: algunos de ellos ocurren con más frecuencia, otros con menos frecuencia. La probabilidad de un evento es la relación entre el número de resultados realmente obtenidos de un tipo y numero total posible. Sólo conociendo la definición clásica de este concepto se puede empezar a estudiar la expectativa matemática y la dispersión de variables aleatorias continuas.

Promedio

En la escuela, durante las lecciones de matemáticas, empezaste a trabajar con la media aritmética. Este concepto se utiliza ampliamente en la teoría de la probabilidad y, por lo tanto, no puede ignorarse. Lo principal para nosotros es este momento es que lo encontraremos en las fórmulas para la expectativa matemática y la dispersión de una variable aleatoria.

Tenemos una secuencia de números y queremos encontrar la media aritmética. Todo lo que se requiere de nosotros es sumar todo lo disponible y dividirlo por el número de elementos de la secuencia. Tengamos números del 1 al 9. La suma de los elementos será igual a 45, y dividiremos este valor entre 9. Respuesta: - 5.

Dispersión

En términos científicos, la dispersión es el cuadrado promedio de las desviaciones de los valores obtenidos de una característica de la media aritmética. Se denota con una letra latina mayúscula D. ¿Qué se necesita para calcularlo? Para cada elemento de la secuencia, calculamos la diferencia entre el número existente y la media aritmética y lo elevamos al cuadrado. Habrá exactamente tantos valores como resultados pueda haber para el evento que estamos considerando. A continuación, sumamos todo lo recibido y lo dividimos por la cantidad de elementos de la secuencia. Si tenemos cinco resultados posibles, entonces dividimos entre cinco.

La dispersión también tiene propiedades que deben recordarse para poder utilizarla al resolver problemas. Por ejemplo, cuando se aumenta una variable aleatoria X veces, la varianza aumenta X al cuadrado (es decir, X*X). Nunca es menor que cero y no depende de cambiar los valores hacia arriba o hacia abajo en cantidades iguales. Además, para ensayos independientes, la varianza de la suma es igual a la suma de las varianzas.

Ahora definitivamente necesitamos considerar ejemplos de la varianza de una variable aleatoria discreta y la expectativa matemática.

Digamos que realizamos 21 experimentos y obtuvimos 7 resultados diferentes. Observamos cada uno de ellos 1, 2, 2, 3, 4, 4 y 5 veces, respectivamente. ¿A qué será igual la varianza?

Primero, calculemos la media aritmética: la suma de los elementos, por supuesto, es 21. Divídalo por 7, obteniendo 3. Ahora reste 3 de cada número en la secuencia original, eleve cada valor al cuadrado y sume los resultados. El resultado es 12. Ahora todo lo que tenemos que hacer es dividir el número por el número de elementos y, al parecer, eso es todo. ¡Pero hay una trampa! Discutamoslo.

Dependencia del número de experimentos.

Resulta que al calcular la varianza, el denominador puede contener uno de dos números: N o N-1. Aquí N es el número de experimentos realizados o el número de elementos en la secuencia (que es esencialmente lo mismo). ¿De qué depende esto?

Si el número de pruebas se mide en centenas, entonces debemos poner N en el denominador. Si está en unidades, entonces N-1. Los científicos decidieron dibujar la frontera de manera bastante simbólica: hoy pasa por el número 30. Si realizamos menos de 30 experimentos, dividimos la cantidad entre N-1, y si son más, entre N.

Tarea

Volvamos a nuestro ejemplo de resolución del problema de varianza y expectativa matemática. Obtuvimos un número intermedio 12, que debía dividirse por N o N-1. Como realizamos 21 experimentos, que son menos de 30, elegiremos la segunda opción. Entonces la respuesta es: la varianza es 12/2 = 2.

Valor esperado

Pasemos al segundo concepto, que debemos considerar en este artículo. La expectativa matemática es el resultado de sumar todos los resultados posibles multiplicados por las probabilidades correspondientes. Es importante entender que el valor obtenido, así como el resultado del cálculo de la varianza, se obtiene una sola vez para todo el problema, sin importar cuántos resultados se consideren en él.

La fórmula para la expectativa matemática es bastante simple: tomamos el resultado, lo multiplicamos por su probabilidad, sumamos lo mismo para el segundo, tercer resultado, etc. Todo lo relacionado con este concepto no es difícil de calcular. Por ejemplo, la suma de los valores esperados es igual al valor esperado de la suma. Lo mismo ocurre con el trabajo. Semejante operaciones simples No todas las cantidades de la teoría de la probabilidad permiten hacer esto. Tomemos el problema y calculemos el significado de dos conceptos que hemos estudiado a la vez. Además, estábamos distraídos por la teoría: es hora de practicar.

Un ejemplo más

Realizamos 50 ensayos y obtuvimos 10 tipos de resultados (números del 0 al 9) que aparecen en diferentes porcentajes. Estos son, respectivamente: 2%, 10%, 4%, 14%, 2%, 18%, 6%, 16%, 10%, 18%. Recuerde que para obtener probabilidades es necesario dividir los valores porcentuales entre 100. Así, obtenemos 0,02; 0,1, etc. Presentemos un ejemplo de resolución del problema de la varianza de una variable aleatoria y la expectativa matemática.

Calculamos la media aritmética usando la fórmula que recordamos de escuela secundaria: 50/10 = 5.

Ahora conviertamos las probabilidades en el número de resultados "en partes" para que sea más fácil de contar. Obtenemos 1, 5, 2, 7, 1, 9, 3, 8, 5 y 9. De cada valor obtenido restamos la media aritmética, tras lo cual elevamos al cuadrado cada uno de los resultados obtenidos. Vea cómo hacer esto usando el primer elemento como ejemplo: 1 - 5 = (-4). Siguiente: (-4) * (-4) = 16. Para otros valores, realice estas operaciones usted mismo. Si hiciste todo correctamente, luego de sumarlos todos obtendrás 90.

Sigamos calculando la varianza y el valor esperado dividiendo 90 entre N. ¿Por qué elegimos N en lugar de N-1? Correcto, porque el número de experimentos realizados supera los 30. Entonces: 90/10 = 9. Obtuvimos la varianza. Si obtiene un número diferente, no se desespere. Lo más probable es que haya cometido un simple error en los cálculos. Vuelva a verificar lo que escribió y probablemente todo encajará.

Finalmente, recuerde la fórmula de la expectativa matemática. No daremos todos los cálculos, solo escribiremos una respuesta que podrá consultar después de completar todos los procedimientos requeridos. El valor esperado será 5,48. Recordemos únicamente cómo realizar las operaciones, tomando como ejemplo los primeros elementos: 0*0.02 + 1*0.1... y así sucesivamente. Como puede ver, simplemente multiplicamos el valor del resultado por su probabilidad.

Desviación

Otro concepto muy relacionado con la dispersión y la expectativa matemática es la desviación estándar. Se designa ya sea con letras latinas sd, o "sigma" minúscula griega. Este concepto muestra cuánto se desvían en promedio los valores de característica central. Para encontrar su valor, necesitas calcular. Raíz cuadrada de la dispersión.

si tramas distribución normal y quiero verlo directamente desviación cuadrada, esto se puede hacer en varias etapas. Tome la mitad de la imagen a la izquierda o derecha de la moda ( importancia central), traza una perpendicular al eje horizontal para que las áreas de las figuras resultantes sean iguales. El tamaño del segmento entre el centro de la distribución y la proyección resultante sobre el eje horizontal representará la desviación estándar.

Software

Como puede verse en las descripciones de las fórmulas y los ejemplos presentados, calcular la varianza y la expectativa matemática no es el procedimiento más simple desde un punto de vista aritmético. Para no perder el tiempo, tiene sentido utilizar el programa utilizado en la educación superior. Instituciones educacionales- se llama "R". Tiene funciones que te permiten calcular valores para muchos conceptos de estadística y teoría de probabilidad.

Por ejemplo, especifica un vector de valores. Esto se hace de la siguiente manera: vector<-c(1,5,2…). Теперь, когда вам потребуется посчитать какие-либо значения для этого вектора, вы пишете функцию и задаете его в качестве аргумента. Для нахождения дисперсии вам нужно будет использовать функцию var. Пример её использования: var(vector). Далее вы просто нажимаете «ввод» и получаете результат.

Finalmente

La dispersión y la expectativa matemática son las condiciones sin las cuales es difícil calcular algo en el futuro. En el curso principal de conferencias en las universidades, se discuten ya en los primeros meses de estudio de la materia. Precisamente por la falta de comprensión de estos conceptos simples y la imposibilidad de calcularlos, muchos estudiantes inmediatamente comienzan a retrasarse en el programa y luego obtienen malas calificaciones al final de la sesión, lo que los priva de becas.

Practica durante al menos una semana, media hora diaria, resolviendo tareas similares a las que se presentan en este artículo. Luego, en cualquier prueba de teoría de la probabilidad, podrá afrontar los ejemplos sin consejos superfluos ni hojas de trucos.

Dispersiónvariable aleatoria- medida de la propagación de un determinado variable aleatoria, esa es ella desviaciones de la expectativa matemática. En estadística, la notación (sigma cuadrado) se utiliza a menudo para indicar dispersión. La raíz cuadrada de la varianza igual a se llama Desviación Estándar o diferencial estándar. La desviación estándar se mide en las mismas unidades que la propia variable aleatoria y la varianza se mide en los cuadrados de esa unidad.

Aunque es muy conveniente utilizar un solo valor (como la media o la moda y la mediana) para estimar toda la muestra, este enfoque puede llevar fácilmente a conclusiones incorrectas. La razón de esta situación no reside en el valor en sí, sino en el hecho de que un valor no refleja de ninguna manera la dispersión de los valores de los datos.

Por ejemplo, en la muestra:

el valor promedio es 5.

Sin embargo, en la muestra misma no hay un solo elemento con un valor de 5. Es posible que necesite saber el grado de cercanía de cada elemento de la muestra a su valor medio. O en otras palabras, necesitarás conocer la varianza de los valores. Conociendo el grado de cambio en los datos, se puede interpretar mejor valor promedio, mediana Y moda. El grado en que cambian los valores de la muestra se determina calculando su varianza y desviación estándar.



La varianza y la raíz cuadrada de la varianza, denominada desviación estándar, caracterizan la desviación promedio de la media muestral. Entre estas dos cantidades, la más importante es Desviación Estándar. Este valor puede considerarse como la distancia promedio a la que se encuentran los elementos desde el elemento central de la muestra.

La variación es difícil de interpretar de manera significativa. Sin embargo, la raíz cuadrada de este valor es la desviación estándar y puede interpretarse fácilmente.

La desviación estándar se calcula determinando primero la varianza y luego sacando la raíz cuadrada de la varianza.

Por ejemplo, para la matriz de datos que se muestra en la figura, se obtendrán los siguientes valores:

Foto 1

Aquí el valor medio de las diferencias al cuadrado es 717,43. Para obtener la desviación estándar, solo queda sacar la raíz cuadrada de este número.

El resultado será aproximadamente 26,78.

Recuerde que la desviación estándar se interpreta como la distancia promedio entre los elementos y la media muestral.

La desviación estándar mide qué tan bien la media describe toda la muestra.

Supongamos que es el jefe de un departamento de producción de ensamblaje de PC. El informe trimestral afirma que la producción del último trimestre fue de 2.500 PC. ¿Esto es bueno o malo? Usted solicitó (o ya existe esta columna en el informe) mostrar la desviación estándar de estos datos en el informe. La desviación estándar, por ejemplo, es 2000. Usted, como jefe de departamento, se da cuenta de que la línea de producción requiere una mejor gestión (desviaciones demasiado grandes en el número de PC ensambladas).

Recuerde que cuando la desviación estándar es grande, los datos están muy dispersos alrededor de la media, y cuando la desviación estándar es pequeña, se agrupan cerca de la media.

Las cuatro funciones estadísticas VAR(), VAR(), STDEV() y STDEV() están diseñadas para calcular la varianza y la desviación estándar de números en un rango de celdas. Antes de poder calcular la varianza y la desviación estándar de un conjunto de datos, es necesario determinar si los datos representan una población o una muestra de una población. En el caso de una muestra de una población general, se deben utilizar las funciones VAR() y STDEV(), y en el caso de una población general, las funciones VAR() y STDEV():

Población Función

DESPR()

STANDOTLONP()
Muestra

DISP()

DESVEST()

La dispersión (así como la desviación estándar), como señalamos, indica hasta qué punto los valores incluidos en el conjunto de datos están dispersos alrededor de la media aritmética.

Un valor pequeño de varianza o desviación estándar indica que todos los datos están concentrados alrededor de la media aritmética, y un valor grande de estos valores indica que los datos están dispersos en una amplia gama de valores.

La dispersión es bastante difícil de interpretar de manera significativa (¿qué significa un valor pequeño y un valor grande?). Actuación Tareas 3 le permitirá mostrar visualmente, en un gráfico, el significado de la varianza de un conjunto de datos.

Tareas

· Ejercicio 1.

· 2.1. Dé los conceptos: dispersión y desviación estándar; su designación simbólica para el procesamiento de datos estadísticos.

· 2.2. Complete la hoja de trabajo de acuerdo con la Figura 1 y realice los cálculos necesarios.

· 2.3. Dar las fórmulas básicas utilizadas en los cálculos.

· 2.4. Explique todas las designaciones ( , , )

· 2.5. Explicar el significado práctico de los conceptos de dispersión y desviación estándar.

Tarea 2.

1.1. Dé los conceptos: población general y muestra; expectativa matemática y su media aritmética designación simbólica para el procesamiento de datos estadísticos.

1.2. De acuerdo con la Figura 2, prepare una hoja de trabajo y realice cálculos.

1.3. Proporcione las fórmulas básicas utilizadas en los cálculos (para la población general y la muestra).

Figura 2

1.4. Explique por qué es posible obtener valores medios aritméticos en muestras como 46,43 y 48,78 (consulte el Apéndice del archivo). Sacar conclusiones.

Tarea 3.

Hay dos muestras con diferentes conjuntos de datos, pero el promedio de ellas será el mismo:

figura 3

3.1. Complete la hoja de trabajo de acuerdo con la Figura 3 y realice los cálculos necesarios.

3.2. Dar las fórmulas de cálculo básicas.

3.3. Construya gráficos de acuerdo con las Figuras 4, 5.

3.4. Explique las dependencias obtenidas.

3.5. Realice cálculos similares para los datos de dos muestras.

Muestra original 11119999

Seleccione los valores de la segunda muestra para que la media aritmética de la segunda muestra sea la misma, por ejemplo:

Seleccione usted mismo los valores para la segunda muestra. Organice cálculos y gráficos similares a las Figuras 3, 4, 5. Muestre las fórmulas básicas utilizadas en los cálculos.

Sacar conclusiones apropiadas.

Prepare todas las tareas en forma de informe con todas las imágenes, gráficos, fórmulas y breves explicaciones necesarias.

Nota: la construcción de gráficos debe explicarse con dibujos y breves explicaciones.