Cómo calcular la desviación estándar. Desviación lineal y estándar promedio

En este artículo hablaré de cómo encontrar el promedio Desviación Estándar . Este material es extremadamente importante para una comprensión completa de las matemáticas, por lo que un tutor de matemáticas debe dedicar una lección separada o incluso varias a estudiarlo. En este artículo encontrará un enlace a un vídeo tutorial detallado y comprensible que explica qué es la desviación estándar y cómo encontrarla.

Desviación Estándar permite evaluar la dispersión de los valores obtenidos como resultado de la medición de un determinado parámetro. Indicado por el símbolo (letra griega "sigma").

La fórmula de cálculo es bastante sencilla. Para encontrar la desviación estándar, debes sacar la raíz cuadrada de la varianza. Entonces ahora hay que preguntarse: “¿Qué es la varianza?”

¿Qué es la variación?

La definición de varianza es la siguiente. La dispersión es la media aritmética de las desviaciones al cuadrado de los valores de la media.

Para encontrar la varianza, realice los siguientes cálculos secuencialmente:

  • Determinar el promedio (promedio aritmético simple de una serie de valores).
  • Luego resta el promedio de cada valor y eleva al cuadrado la diferencia resultante (obtienes diferencia al cuadrado).
  • El siguiente paso es calcular la media aritmética de las diferencias al cuadrado resultantes (puedes descubrir por qué exactamente en los cuadrados a continuación).

Veamos un ejemplo. Digamos que tú y tus amigos deciden medir la altura de sus perros (en milímetros). Como resultado de las mediciones, obtuvo las siguientes medidas de altura (a la cruz): 600 mm, 470 mm, 170 mm, 430 mm y 300 mm.

Calculemos la media, la varianza y la desviación estándar.

Primero encontremos el valor promedio.. Como ya sabes, para hacer esto necesitas sumar todos los valores medidos y dividirlos por el número de mediciones. Progreso del cálculo:

Promedio mm.

Entonces, el promedio (media aritmética) es 394 mm.

Ahora necesitamos determinar desviación de la altura de cada perro de la media:

Finalmente, para calcular la varianza, elevamos al cuadrado cada una de las diferencias resultantes, y luego encontramos la media aritmética de los resultados obtenidos:

Dispersión mm2.

Por tanto, la dispersión es de 21704 mm 2.

Cómo encontrar la desviación estándar

Entonces, ¿cómo podemos calcular ahora la desviación estándar conociendo la varianza? Como recordamos, sácale la raíz cuadrada. Es decir, la desviación estándar es igual a:

Mm (redondeado al número entero más cercano en mm).

Usando este método, descubrimos que algunos perros (por ejemplo, Rottweilers) son muy perros grandes. Pero también hay perros muy pequeños (por ejemplo, los perros salchicha, pero no debes decirles eso).

Lo más interesante es que la desviación estándar lleva consigo información útil. Ahora podemos mostrar cuáles de los resultados de medición de altura obtenidos están dentro del intervalo que obtenemos si trazamos la desviación estándar del promedio (a ambos lados).

Es decir, utilizando la desviación estándar obtenemos un método “estándar” que nos permite saber cuál de los valores es normal (promedio estadístico) y cuál es extraordinariamente grande o, por el contrario, pequeño.

¿Qué es la desviación estándar?

Pero... todo será un poco diferente si analizamos muestra datos. En nuestro ejemplo consideramos población general. Es decir, nuestros 5 perros eran los únicos perros del mundo que nos interesaban.

Pero si los datos son una muestra (valores seleccionados de un gran población), entonces los cálculos deben realizarse de manera diferente.

Si hay valores, entonces:

Todos los demás cálculos se realizan de manera similar, incluida la determinación del promedio.

Por ejemplo, si nuestros cinco perros son sólo una muestra de la población de perros (todos los perros del planeta), debemos dividir por 4, no 5, a saber:

Varianza muestral = mm2.

Donde Desviación Estándar según la muestra es igual mm (redondeado al número entero más cercano).

Podemos decir que hemos hecho alguna “corrección” en el caso de que nuestros valores sean solo una pequeña muestra.

Nota. ¿Por qué diferencias exactamente al cuadrado?

Pero, ¿por qué tomamos exactamente las diferencias al cuadrado al calcular la varianza? Digamos que al medir algún parámetro, recibió el siguiente conjunto de valores: 4; 4; -4; -4. Si simplemente sumamos las desviaciones absolutas de la media (diferencias) entre sí... valores negativos se cancelarán mutuamente con los positivos:

.

Resulta que esta opción es inútil. Entonces, ¿quizás valga la pena probar los valores absolutos de las desviaciones (es decir, los módulos de estos valores)?

A primera vista, resulta bien (el valor resultante, por cierto, se llama desviación media absoluta), pero no en todos los casos. Probemos con otro ejemplo. Deje que la medición dé como resultado el siguiente conjunto de valores: 7; 1; -6; -2. Entonces la desviación absoluta promedio es:

¡Guau! De nuevo obtuvimos un resultado de 4, aunque las diferencias tienen una extensión mucho mayor.

Ahora veamos qué sucede si elevamos al cuadrado las diferencias (y luego sacamos la raíz cuadrada de su suma).

Para el primer ejemplo será:

.

Para el segundo ejemplo será:

¡Ahora es un asunto completamente diferente! Cuanto mayor es la dispersión de las diferencias, mayor es la desviación estándar... que es lo que buscábamos.

De hecho, en este método Se utiliza la misma idea que para calcular la distancia entre puntos, sólo que se aplica de forma diferente.

Y desde un punto de vista matemático, usar cuadrados y raíces cuadradas proporciona más beneficios de los que podríamos obtener de los valores de desviación absoluta, lo que hace que la desviación estándar sea aplicable a otros problemas matemáticos.

Sergey Valerievich te dijo cómo encontrar la desviación estándar

Desviación Estándar(sinónimos: Desviación Estándar, Desviación Estándar, desviación cuadrada; términos relacionados: Desviación Estándar, extensión estándar) - en teoría de la probabilidad y estadística, el indicador más común de la dispersión de los valores de una variable aleatoria en relación con su expectativa matemática. Para matrices limitadas de muestras de valores, en lugar de expectativa matemática Se utiliza la media aritmética de la población muestral.

YouTube enciclopédico

  • 1 / 5

    La desviación estándar se mide en unidades de medida en sí. variable aleatoria y se utiliza al calcular el error estándar de la media aritmética, al construir intervalos de confianza, al probar hipótesis estadísticamente y al medir la relación lineal entre variables aleatorias. Definida como la raíz cuadrada de la varianza de una variable aleatoria.

    Desviación Estándar:

    s = norte norte − 1 σ 2 = 1 norte − 1 ∑ yo = 1 norte (x yo − x ¯) 2 ; (\displaystyle s=(\sqrt ((\frac (n)(n-1))\sigma ^(2)))=(\sqrt ((\frac (1)(n-1))\sum _( i=1)^(n)\left(x_(i)-(\bar (x))\right)^(2)));)
    • Nota: Muy a menudo hay discrepancias en los nombres de MSD (desviación cuadrática media) y STD (desviación estándar) con sus fórmulas. Por ejemplo, en el módulo numPy del lenguaje de programación Python, la función std() se describe como "desviación estándar", mientras que la fórmula refleja la desviación estándar (división por la raíz de la muestra). En Excel, la función ESTANDARDEVAL() es diferente (división por la raíz de n-1).

    Desviación Estándar(estimación de la desviación estándar de una variable aleatoria X en relación con su expectativa matemática basada en una estimación insesgada de su varianza) s (\displaystyle s):

    σ = 1 norte ∑ yo = 1 norte (x yo − x ¯) 2 . (\displaystyle \sigma =(\sqrt ((\frac (1)(n))\sum _(i=1)^(n)\left(x_(i)-(\bar (x))\right) ^(2))).)

    Dónde σ 2 (\displaystyle \sigma ^(2))- dispersión; x yo (\displaystyle x_(i)) - iº elemento de la selección; norte (\ Displaystyle n)- tamaño de la muestra; - media aritmética de la muestra:

    x ¯ = 1 norte ∑ yo = 1 norte x yo = 1 norte (x 1 + … + x norte) . (\displaystyle (\bar (x))=(\frac (1)(n))\sum _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\ldots +x_(n)).)

    Cabe señalar que ambas estimaciones están sesgadas. En el caso general, es imposible elaborar una estimación insesgada. Sin embargo, la estimación basada en la estimación de la varianza insesgada es consistente.

    De acuerdo con GOST R 8.736-2011, la desviación estándar se calcula utilizando la segunda fórmula de esta sección. Por favor verifique los resultados.

    regla tres sigma

    regla tres sigma (3 σ (\displaystyle 3\sigma)) - casi todos los valores de una variable aleatoria distribuida normalmente se encuentran en el intervalo (x ¯ − 3 σ ; x ¯ + 3 σ) (\displaystyle \left((\bar (x))-3\sigma ;(\bar (x))+3\sigma \right)). Más estrictamente, con una probabilidad de aproximadamente 0,9973, el valor de una variable aleatoria distribuida normalmente se encuentra en el intervalo especificado (siempre que el valor x ¯ (\displaystyle (\bar (x))) verdadero y no obtenido como resultado del procesamiento de la muestra).

    Si el valor verdadero x ¯ (\displaystyle (\bar (x))) es desconocido, entonces no deberías usar σ (\displaystyle \sigma), A s. Así, la regla de tres sigma se transforma en regla de tres. s .

    Interpretación del valor de la desviación estándar.

    Un valor de desviación estándar mayor muestra una mayor dispersión de valores en el conjunto presentado con el valor promedio del conjunto; Por lo tanto, un valor más pequeño muestra que los valores del conjunto están agrupados alrededor del valor promedio.

    Por ejemplo, tenemos tres conjuntos numéricos: (0, 0, 14, 14), (0, 6, 8, 14) y (6, 6, 8, 8). Los tres conjuntos tienen valores medios iguales a 7 y desviaciones estándar, respectivamente, iguales a 7, 5 y 1. El último conjunto tiene una desviación estándar pequeña, ya que los valores del conjunto se agrupan alrededor del valor medio; el primer conjunto tiene más gran importancia desviación estándar: los valores dentro del conjunto difieren mucho del valor promedio.

    En sentido general, la desviación estándar puede considerarse una medida de incertidumbre. Por ejemplo, en física, la desviación estándar se utiliza para determinar el error de una serie de mediciones sucesivas de alguna cantidad. Este valor es muy importante para determinar la plausibilidad del fenómeno en estudio en comparación con el valor predicho por la teoría: si el valor promedio de las mediciones difiere mucho de los valores predichos por la teoría (gran desviación estándar), luego se deben volver a verificar los valores obtenidos o el método para obtenerlos. identificados con riesgo de cartera.

    Clima

    Supongamos que hay dos ciudades con la misma temperatura máxima diaria promedio, pero una está ubicada en la costa y la otra en la llanura. Se sabe que las ciudades ubicadas en la costa tienen muchas temperaturas máximas diurnas diferentes que son más bajas que las ciudades ubicadas en el interior. Por lo tanto, la desviación estándar de las temperaturas máximas diarias para una ciudad costera será menor que para la segunda ciudad, a pesar de que el valor promedio de este valor es el mismo, lo que en la práctica significa que la probabilidad de que la temperatura máxima del aire en cualquier día del año será mayor que el valor medio, mayor para una ciudad situada en el interior.

    Deporte

    Supongamos que hay varios equipos de fútbol que se clasifican según algún conjunto de parámetros, por ejemplo, el número de goles marcados y concedidos, oportunidades de gol, etc. Lo más probable es que el mejor equipo de este grupo tenga mejores valores. en más parámetros. Cuanto menor sea la desviación estándar del equipo para cada uno de los parámetros presentados, más predecible será el resultado del equipo; dichos equipos están equilibrados. Por otro lado, el equipo con gran valor La desviación estándar dificulta predecir el resultado, lo que a su vez se explica por un desequilibrio, por ejemplo, una defensa fuerte pero un ataque débil.

    El uso de la desviación estándar de los parámetros del equipo permite, en un grado u otro, predecir el resultado de un partido entre dos equipos, evaluando las fortalezas y lados débilesórdenes y, por tanto, los métodos de lucha elegidos.

    Para calcular la media geométrica simple se utiliza la fórmula:

    Ponderado geométrico

    Para determinar la media geométrica ponderada se utiliza la fórmula:

    Los diámetros medios de ruedas, tuberías y los lados medios de los cuadrados se determinan utilizando el cuadrado medio.

    Los valores cuadráticos medios se utilizan para calcular algunos indicadores, por ejemplo, el coeficiente de variación, que caracteriza el ritmo de producción. Aquí la desviación estándar de la producción planificada para un período determinado se determina mediante la siguiente fórmula:

    Estos valores caracterizan con precisión el cambio en los indicadores económicos en comparación con su valor base, tomado en su valor promedio.

    cuadrático simple

    La raíz cuadrática media se calcula mediante la fórmula:

    ponderado cuadrático

    El cuadrado medio ponderado es igual a:

    22. Los indicadores absolutos de variación incluyen:

    rango de variación

    desviación lineal promedio

    dispersión

    Desviación Estándar

    Rango de variación (r)

    Rango de variación- es la diferencia entre los valores máximo y mínimo del atributo

    Muestra los límites dentro de los cuales cambia el valor de una característica en la población que se estudia.

    La experiencia laboral de los cinco aspirantes en trabajos anteriores es: 2,3,4,7 y 9 años. Solución: rango de variación = 9 - 2 = 7 años.

    Para una descripción generalizada de las diferencias en los valores de los atributos, los indicadores de variación promedio se calculan teniendo en cuenta las desviaciones de la media aritmética. La diferencia se toma como una desviación del promedio.

    En este caso, para evitar que la suma de las desviaciones de las variantes de una característica del promedio llegue a cero (propiedad cero del promedio), es necesario ignorar los signos de la desviación, es decir, tomar esta suma módulo, o elevar al cuadrado los valores de desviación

    Desviación lineal y cuadrada promedio

    Promedio desviación lineal es el promedio aritmético de las desviaciones absolutas de los valores individuales de una característica del promedio.

    La desviación lineal promedio es simple:

    La experiencia laboral de los cinco aspirantes en trabajos anteriores es: 2,3,4,7 y 9 años.

    En nuestro ejemplo: años;

    Respuesta: 2,4 años.

    Desviación lineal media ponderada se aplica a datos agrupados:

    Debido a su convención, la desviación lineal promedio se utiliza en la práctica relativamente raramente (en particular, para caracterizar el cumplimiento de obligaciones contractuales en materia de uniformidad de entrega; en el análisis de la calidad del producto, teniendo en cuenta las características tecnológicas de la producción).

    Desviación Estándar

    La característica de variación más perfecta es la desviación cuadrática media, que se llama estándar (o desviación estándar). Desviación Estándar() es igual raíz cuadrada del cuadrado medio de las desviaciones de los valores individuales de la característica a la media aritmética:

    La desviación estándar es simple:

    La desviación estándar ponderada se aplica a los datos agrupados:

    Entre la raíz cuadrática media y las desviaciones lineales medias en condiciones de distribución normal se produce la siguiente relación: ~ 1,25.

    La desviación estándar, al ser la principal medida absoluta de variación, se utiliza para determinar los valores de ordenadas de una curva de distribución normal, en cálculos relacionados con la organización de la observación de la muestra y el establecimiento de la precisión de las características de la muestra, así como para evaluar la límites de variación de una característica en una población homogénea.

    A sabios matemáticos y estadísticos se les ocurrió un indicador más confiable, aunque con un propósito ligeramente diferente: desviación lineal promedio. Este indicador caracteriza la medida de dispersión de los valores de un conjunto de datos en torno a su valor medio.

    Para mostrar la medida de la dispersión de los datos, primero debe decidir con qué se calculará esta dispersión; normalmente este es el valor promedio. A continuación, debe calcular qué tan lejos están los valores del conjunto de datos analizado del promedio. Está claro que a cada valor le corresponde un determinado valor de desviación, pero nos interesa la valoración global, que abarque a toda la población. Por lo tanto, la desviación promedio se calcula utilizando la fórmula habitual de media aritmética. ¡Pero! Pero para calcular el promedio de las desviaciones, primero hay que sumarlas. Y si sumamos números positivos y negativos, se anularán entre sí y su suma tenderá a cero. Para evitar esto, todas las desviaciones se toman en módulo, es decir, todos los números negativos se vuelven positivos. Ahora la desviación media mostrará una medida generalizada de la dispersión de valores. Como resultado, la desviación lineal promedio se calculará mediante la fórmula:

    a– desviación lineal media,

    X– el indicador analizado, con un guión arriba – el valor medio del indicador,

    norte– número de valores en el conjunto de datos analizados,

    Espero que el operador de suma no asuste a nadie.

    La desviación lineal promedio calculada utilizando la fórmula especificada refleja la desviación absoluta promedio de tamaño promedio para este agregado.

    En la imagen, la línea roja es el valor medio. Las desviaciones de cada observación de la media se indican con flechas pequeñas. Se toman módulo y se resumen. Luego todo se divide por el número de valores.

    Para completar el cuadro, necesitamos dar un ejemplo. Digamos que hay una empresa que produce esquejes para palas. Cada corte debe tener una longitud de 1,5 metros, pero lo más importante es que todos sean iguales o al menos más o menos 5 cm, pero los trabajadores descuidados cortarán 1,2 mo 1,8 m. Los veraneantes están descontentos. El director de la empresa decidió realizar un análisis estadístico de la longitud de los esquejes. Seleccioné 10 piezas y medí su longitud, encontré el promedio y calculé la desviación lineal promedio. El promedio resultó ser exactamente lo que se necesitaba: 1,5 m. Pero la desviación lineal promedio fue de 0,16 m. Por lo tanto, resulta que cada corte es en promedio 16 cm más largo o más corto que lo necesario. Hay algo de qué hablar con el trabajadores. De hecho, no he visto ningún uso real de este indicador, así que se me ocurrió un ejemplo. Sin embargo, existe tal indicador en las estadísticas.

    Dispersión

    Al igual que la desviación lineal promedio, la varianza también refleja el grado de dispersión de los datos alrededor del valor medio.

    La fórmula para calcular la varianza se ve así:

    (para series de variación (varianza ponderada))

    (para datos no agrupados (varianza simple))

    Donde: σ 2 – dispersión, Xi– analizamos el indicador sq (valor de signo), – el valor promedio del indicador, f i – el número de valores en el conjunto de datos analizados.

    La dispersión es el cuadrado promedio de las desviaciones.

    Primero, se calcula el valor promedio, luego se toma la diferencia entre cada valor original y promedio, se eleva al cuadrado, se multiplica por la frecuencia del valor del atributo correspondiente, se suma y luego se divide por el número de valores en la población.

    Sin embargo, en forma pura, como la media aritmética o índice, no se utiliza la varianza. Este es más bien un indicador auxiliar e intermedio que se utiliza para otros tipos. análisis estadístico.

    Una forma simplificada de calcular la varianza

    Desviación Estándar

    Para utilizar la varianza para el análisis de datos, se toma la raíz cuadrada de la varianza. Resulta el llamado Desviación Estándar.

    Por cierto, la desviación estándar también se llama sigma, de la letra griega que la denota.

    La desviación estándar, obviamente, también caracteriza la medida de la dispersión de los datos, pero ahora (a diferencia de la varianza) se puede comparar con los datos originales. Como regla general, las medidas cuadráticas medias en estadística dan resultados más precisos que las lineales. Por lo tanto, la desviación estándar es una medida más precisa de la dispersión de los datos que la desviación media lineal.

    Una de las principales herramientas del análisis estadístico es el cálculo de la desviación estándar. Este indicador le permite estimar la desviación estándar de una muestra o de una población. Aprendamos a usar la fórmula de desviación estándar en Excel.

    Determinemos inmediatamente cuál es la desviación estándar y cómo se ve su fórmula. Este valor es la raíz cuadrada del promedio. número aritmético cuadrados de la diferencia entre todos los valores de la serie y su media aritmética. Este indicador tiene el mismo nombre: desviación estándar. Ambos nombres son completamente equivalentes.

    Pero, por supuesto, en Excel el usuario no tiene que calcular esto, ya que el programa hace todo por él. Aprendamos a calcular la desviación estándar en Excel.

    Cálculo en Excel

    Puede calcular el valor especificado en Excel usando dos funciones especiales DESVEST.V(basado en la población de muestra) y DESVEST.G(basado en la población general). El principio de su funcionamiento es absolutamente el mismo, pero se pueden denominar de tres formas, que analizaremos a continuación.

    Método 1: Asistente de funciones


    Método 2: pestaña Fórmulas


    Método 3: ingresar la fórmula manualmente

    También hay una manera en la que no necesitarás llamar a la ventana de argumentos en absoluto. Para hacer esto, debe ingresar la fórmula manualmente.


    Como puedes ver, el mecanismo para calcular la desviación estándar en Excel es muy sencillo. El usuario sólo necesita ingresar números de la población o referencias a las celdas que los contienen. Todos los cálculos los realiza el propio programa. Es mucho más difícil entender cuál es el indicador calculado y cómo se pueden aplicar los resultados del cálculo en la práctica. Pero comprender esto ya se relaciona más con el campo de la estadística que con aprender a trabajar con software.