¿Cómo calcular correctamente el valor medio? Cómo encontrar la media aritmética en Excel Cómo calcular el promedio entre dos números

En matemáticas, la media aritmética de los números (o simplemente el promedio) es la suma de todos los números de un conjunto dado dividida por su número. Este es el concepto más generalizado y difundido. talla mediana. Como ya entendió, para encontrar el valor promedio, debe sumar todos los números que se le dieron y dividir el resultado por la cantidad de términos.

¿Qué es la media aritmética?

Veamos un ejemplo.

Ejemplo 1. Se dan números: 6, 7, 11. Necesita encontrar su valor promedio.

Solución.

Primero, encontremos la suma de todos los números dados.

Ahora dividimos la suma resultante por el número de términos. Como tenemos tres términos, respectivamente, dividiremos por tres.

Por tanto, la media de los números 6, 7 y 11 es 8. ¿Por qué 8? Sí, porque la suma de 6, 7 y 11 será lo mismo que tres ochos. Esto se ve claramente en la ilustración.

El valor promedio recuerda un poco a la "alineación" de una serie de números. Como puede ver, las pilas de lápices se han convertido en un nivel.

Considere otro ejemplo para consolidar el conocimiento adquirido.

Ejemplo 2 Se dan los números: 3, 7, 5, 13, 20, 23, 39, 23, 40, 23, 14, 12, 56, 23, 29. Necesitas encontrar su media aritmética.

Solución.

Encontramos la suma.

3 + 7 + 5 + 13 + 20 + 23 + 39 + 23 + 40 + 23 + 14 + 12 + 56 + 23 + 29 = 330

Divida por el número de términos (en este caso, 15).

Por tanto, el valor medio de esta serie de números es 22.

Ahora considere los números negativos. Recordemos cómo resumirlos. Por ejemplo, tienes dos números 1 y -4. Encontremos su suma.

1 + (-4) = 1 – 4 = -3

Sabiendo esto, considere otro ejemplo.

Ejemplo 3 Encuentra el valor promedio de una serie de números: 3, -7, 5, 13, -2.

Solución.

Encontrar la suma de números.

3 + (-7) + 5 + 13 + (-2) = 12

Como hay 5 términos, dividimos la suma resultante por 5.

Por tanto, la media aritmética de los números 3, -7, 5, 13, -2 es 2,4.

En nuestro tiempo de progreso tecnológico, es mucho más conveniente usar para encontrar el valor promedio programas de computador. Microsoft Office Excel es uno de ellos. Encontrar el promedio en Excel es rápido y fácil. Además, este programa está incluido en el paquete de software de Microsoft Office. Considerar breves instrucciones cómo encontrar la media aritmética usando este programa.

Para calcular el valor promedio de una serie de números, debe usar la función PROMEDIO. La sintaxis de esta función es:
=Promedio(argumento1, argumento2, ... argumento255)
donde argumento1, argumento2, ... argumento255 son números o referencias de celdas (las celdas significan rangos y matrices).

Para que quede más claro, probemos los conocimientos adquiridos.

  1. Ingrese los números 11, 12, 13, 14, 15, 16 en las celdas C1 - C6.
  2. Seleccione la celda C7 haciendo clic en ella. En esta celda, mostraremos el valor promedio.
  3. Haga clic en la pestaña "Fórmulas".
  4. Seleccione Más funciones > Estadísticas para abrir la lista desplegable.
  5. Seleccione PROMEDIO. Después de eso, debería abrirse un cuadro de diálogo.
  6. Seleccione y arrastre las celdas C1-C6 allí para establecer el rango en el cuadro de diálogo.
  7. Confirme sus acciones con el botón "Aceptar".
  8. Si hiciste todo correctamente, en la celda C7 deberías tener la respuesta: 13.7. Al hacer clic en la celda C7, la función (=Promedio(C1:C6)) se mostrará en la barra de fórmulas.

Es muy útil usar esta función para contabilidad, facturas o cuando solo necesita encontrar el promedio de un rango muy largo de números. Por lo tanto, a menudo se utiliza en oficinas y grandes compañias. Esto le permite mantener los registros en orden y hace posible calcular algo rápidamente (por ejemplo, el ingreso promedio por mes). También con usando Excel puede encontrar el valor medio de la función.

Promedio

Este término tiene otros significados, vea el significado promedio.

Promedio(en matemáticas y estadística) conjuntos de números: la suma de todos los números dividida por su número. Es una de las medidas de tendencia central más comunes.

Fue propuesto (junto con la media geométrica y la media armónica) por los pitagóricos.

Los casos especiales de la media aritmética son la media ( población) y media muestral (muestras).

Introducción

Denota el conjunto de datos. X = (X 1 , X 2 , …, X norte), entonces la media de la muestra generalmente se denota con una barra horizontal sobre la variable (x ¯ (\displaystyle (\bar (x))) , pronunciada " X con un guión").

La letra griega μ se usa para indicar la media aritmética de toda la población. Para variable aleatoria, para el cual se define el valor medio, μ es media de probabilidad o la expectativa matemática de una variable aleatoria. si el conjunto X es una colección de números aleatorios con una probabilidad media μ, entonces para cualquier muestra X i de esta colección μ = E( X i) es la expectativa de esta muestra.

En la práctica, la diferencia entre μ y x ¯ (\displaystyle (\bar (x))) es que μ es una variable típica porque se puede ver la muestra en lugar de toda la población. Por lo tanto, si la muestra se representa aleatoriamente (en términos de la teoría de la probabilidad), entonces x ¯ (\displaystyle (\bar (x))) (pero no μ) puede tratarse como una variable aleatoria que tiene una distribución de probabilidad en la muestra ( distribución de probabilidad de la media).

Ambas cantidades se calculan de la misma manera:

X ¯ = 1 norte ∑ yo = 1 norte X yo = 1 norte (X 1 + ⋯ + X norte) . (\displaystyle (\bar (x))=(\frac (1)(n))\sum _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\cdots +x_(n)).)

Si X es una variable aleatoria, entonces la expectativa matemática X puede considerarse como la media aritmética de los valores en mediciones repetidas de la cantidad X. Esta es una manifestación de la ley. números grandes. Por lo tanto, la media de la muestra se usa para estimar la expectativa matemática desconocida.

En álgebra elemental se demuestra que la media norte+ 1 números por encima del promedio norte números si y solo si el nuevo número es mayor que el promedio anterior, menos si y solo si el nuevo número es menor que el promedio, y no cambia si y solo si el nuevo número es igual al promedio. Cuanto más norte, menor será la diferencia entre los promedios nuevos y antiguos.

Tenga en cuenta que hay varios otros "promedios" disponibles, incluida la media de la ley de potencia, la media de Kolmogorov, la media armónica, la media aritmético-geométrica y varias medias ponderadas (p. ej., media ponderada aritmética, media ponderada geométrica, media ponderada armónica) .

Ejemplos

  • Para tres números, debes sumarlos y dividirlos por 3:
X 1 + X 2 + X 3 3 . (\displaystyle (\frac (x_(1)+x_(2)+x_(3))(3)).) X 1 + X 2 + X 3 + X 4 4 . (\displaystyle (\frac (x_(1)+x_(2)+x_(3)+x_(4))(4)).)

O más fácil 5+5=10, 10:2. Porque sumamos 2 números, lo que significa que cuántos números sumamos, dividimos por esa cantidad.

Variable aleatoria continua

Para un valor continuamente distribuido f (x) (\displaystyle f(x)) la media aritmética en el intervalo [ a ; b ] (\displaystyle ) se define a través de una integral definida:

F (x) ¯ [ un ; segundo ] = 1 segundo − un ∫ un segundo F (x) re X (\displaystyle (\overline (f(x))))_()=(\frac (1)(b-a))\int _(a)^(b) f(x)dx)

Algunos problemas de usar el promedio

Falta de robustez

Articulo principal: Robustez en las estadísticas

Aunque la media aritmética se utiliza a menudo como media o tendencia central, este concepto no se aplica a las estadísticas robustas, lo que significa que la media aritmética está fuertemente influenciada por "grandes desviaciones". Cabe señalar que para distribuciones con una gran asimetría, la media aritmética puede no corresponder al concepto de "promedio", y los valores de la media de estadísticas robustas (por ejemplo, la mediana) pueden describir mejor la tendencia central.

El ejemplo clásico es el cálculo de la renta media. La media aritmética puede malinterpretarse como una mediana, lo que puede llevar a la conclusión de que hay más personas con más ingresos de los que realmente hay. El ingreso "medio" se interpreta de tal manera que los ingresos de la mayoría de las personas están cerca de este número. Este ingreso "promedio" (en el sentido de media aritmética) es más alto que el ingreso de la mayoría de las personas, ya que un ingreso alto con una gran desviación del promedio hace que la media aritmética sea fuertemente sesgada (en contraste, el ingreso mediano "resiste" tal sesgo). Sin embargo, este ingreso "promedio" no dice nada sobre el número de personas cerca del ingreso medio (y no dice nada sobre el número de personas cerca del ingreso modal). Sin embargo, si los conceptos de "promedio" y "mayoría" se toman a la ligera, se puede concluir incorrectamente que la mayoría de las personas tienen ingresos más altos de lo que realmente son. Por ejemplo, un informe sobre el ingreso neto "promedio" en Medina, Washington, calculado como el promedio aritmético de todos los ingresos netos anuales de los residentes, dará una sorprendente Número grande debido a Bill Gates. Considere la muestra (1, 2, 2, 2, 3, 9). La media aritmética es 3,17, pero cinco de los seis valores están por debajo de esta media.

Interés compuesto

Articulo principal: ROI

si los números multiplicar, pero no doblar, necesitas usar la media geométrica, no la media aritmética. Muy a menudo, este incidente ocurre al calcular el retorno de la inversión en finanzas.

Por ejemplo, si las acciones cayeron un 10 % en el primer año y aumentaron un 30 % en el segundo año, entonces es incorrecto calcular el aumento "promedio" durante estos dos años como la media aritmética (−10 % + 30 %) / 2 = 10%; el promedio correcto en este caso viene dado por la tasa de crecimiento anual compuesta, de la cual el crecimiento anual es solo de aproximadamente 8.16653826392% ≈ 8.2%.

La razón de esto es que los porcentajes tienen un nuevo punto de partida cada vez: 30% es 30% de un número menor que el precio al comienzo del primer año: si la acción comenzó en $30 y cayó un 10%, vale $27 al comienzo del segundo año. Si la acción sube un 30%, vale $35,1 al final del segundo año. El promedio aritmético de este crecimiento es del 10%, pero dado que las acciones han crecido solo $5.1 en 2 años, un aumento promedio del 8.2% da resultado final $35.1:

[$30 (1 - 0,1) (1 + 0,3) = $30 (1 + 0,082) (1 + 0,082) = $35,1]. Si usamos la media aritmética del 10% de la misma manera, no obtendremos el valor real: [$30 (1 + 0,1) (1 + 0,1) = $36,3].

Interés compuesto al final del año 2: 90 % * 130 % = 117 %, es decir, un aumento total del 17 %, y el interés compuesto anual promedio es 117 % ≈ 108,2 % (\displaystyle (\sqrt (117\%)) \approx 108,2\%) , es decir, un incremento medio anual del 8,2%.

Direcciones

Articulo principal: Estadísticas de destino

Al calcular la media aritmética de alguna variable que cambia cíclicamente (por ejemplo, fase o ángulo), se debe tener especial cuidado. Por ejemplo, el promedio de 1° y 359° sería 1 ∘ + 359 ∘ 2 = (\displaystyle (\frac (1^(\circ )+359^(\circ ))(2))=) 180°. Este número es incorrecto por dos razones.

  • Primero, las medidas angulares solo se definen para el rango de 0° a 360° (o de 0 a 2π cuando se mide en radianes). Por lo tanto, el mismo par de números podría escribirse como (1° y −1°) o como (1° y 719°). Los promedios de cada par serán diferentes: 1 ∘ + (− 1 ∘) 2 = 0 ∘ (\displaystyle (\frac (1^(\circ )+(-1^(\circ )))(2))= 0 ^(\circ )) , 1 ∘ + 719 ∘ 2 = 360 ∘ (\displaystyle (\frac (1^(\circ )+719^(\circ ))(2))=360^(\circ )) .
  • En segundo lugar, en este caso, un valor de 0° (equivalente a 360°) será la mejor media geométrica, ya que los números se desvían menos de 0° que de cualquier otro valor (el valor 0° tiene la varianza más pequeña). Comparar:
    • el número 1° se desvía de 0° en solo 1°;
    • el número 1° se desvía del promedio calculado de 180° en 179°.

El valor promedio de una variable cíclica, calculado de acuerdo con la fórmula anterior, se desplazará artificialmente en relación con el promedio real a la mitad del rango numérico. Debido a esto, el promedio se calcula de una manera diferente, es decir, el número con la varianza más pequeña (punto central) se elige como valor promedio. Además, en lugar de restar, se utiliza la distancia de módulo (es decir, la distancia circunferencial). Por ejemplo, la distancia modular entre 1° y 359° es 2°, no 358° (en un círculo entre 359° y 360°==0° - un grado, entre 0° y 1° - también 1°, en total - 2°).

Promedio ponderado: ¿qué es y cómo calcularlo?

En el proceso de estudiar matemáticas, los estudiantes se familiarizan con el concepto de la media aritmética. En el futuro, en estadística y algunas otras ciencias, los estudiantes también se enfrentarán al cálculo de otros promedios. ¿Qué pueden ser y en qué se diferencian entre sí?

Promedios: significado y diferencias

No siempre los indicadores precisos dan una idea de la situación. Para evaluar tal o cual situación, a veces es necesario analizar una gran cantidad de cifras. Y luego los promedios vienen al rescate. Le permiten evaluar la situación en general.


Desde la época escolar, muchos adultos recuerdan la existencia de la media aritmética. Es muy fácil de calcular: la suma de una secuencia de n términos es divisible por n. Es decir, si necesita calcular la media aritmética en la secuencia de valores 27, 22, 34 y 37, entonces necesita resolver la expresión (27 + 22 + 34 + 37) / 4, ya que 4 valores \u200b\u200a se utilizan en los cálculos. En este caso, el valor deseado será igual a 30.

A menudo, como parte del curso escolar, también se estudia la media geométrica. El cálculo de este valor se basa en extraer la raíz de grado n del producto de n términos. Si tomamos los mismos números: 27, 22, 34 y 37, el resultado de los cálculos será 29.4.

La media armónica en una escuela de educación general no suele ser objeto de estudio. Sin embargo, se usa con bastante frecuencia. Este valor es el recíproco de la media aritmética y se calcula como cociente de n - el número de valores y la suma 1/a 1 +1/a 2 +...+1/a n . Si nuevamente tomamos la misma serie de números para el cálculo, entonces el armónico será 29.6.

Promedio ponderado: Características

Sin embargo, es posible que todos los valores anteriores no se utilicen en todas partes. Por ejemplo, en estadística, al calcular algunos valores promedio, el "peso" de cada número utilizado en los cálculos juega un papel importante. Los resultados son más reveladores y correctos porque tienen en cuenta más información. Este grupo de cantidades es nombre común "peso promedio". No se aprueban en la escuela, por lo que vale la pena detenerse en ellos con más detalle.

En primer lugar, vale la pena explicar qué se entiende por "peso" de un valor particular. La forma más fácil de explicar esto es ejemplo específico. La temperatura corporal de cada paciente se mide dos veces al día en el hospital. De los 100 pacientes en diferentes departamentos del hospital, 44 tendrán una temperatura normal - 36,6 grados. Otros 30 tendrán un valor aumentado: 37.2, 14 - 38, 7 - 38.5, 3 - 39, y los dos restantes - 40. Y si tomamos la media aritmética, entonces este valor en general para el hospital será superior a 38 grados. ! Pero casi la mitad de los pacientes tienen una temperatura completamente normal. Y aquí sería más correcto usar el promedio ponderado, y el "peso" de cada valor será el número de personas. En este caso, el resultado del cálculo será de 37,25 grados. La diferencia es obvia.

En el caso de cálculos de promedio ponderado, el "peso" puede tomarse como el número de envíos, el número de personas que trabajan en un día determinado, en general, cualquier cosa que pueda medirse y afectar el resultado final.

Variedades

El promedio ponderado corresponde al promedio aritmético discutido al comienzo del artículo. Sin embargo, el primer valor, como ya se mencionó, también tiene en cuenta el peso de cada número utilizado en los cálculos. Además, también hay valores geométricos y armónicos ponderados.

Hay otra variedad interesante utilizada en series de números. Este es un promedio móvil ponderado. Es sobre esta base que se calculan las tendencias. Además de los valores en sí mismos y su peso, también se utiliza allí la periodicidad. Y al calcular el valor promedio en algún momento, también se tienen en cuenta los valores de períodos de tiempo anteriores.

Calcular todos estos valores no es tan difícil, pero en la práctica solo se suele utilizar la media ponderada habitual.

Métodos de cálculo

En la era de la informatización, no hay necesidad de calcular manualmente el promedio ponderado. No obstante, sería útil conocer la fórmula de cálculo para poder comprobar y, en su caso, corregir los resultados obtenidos.

Será más fácil considerar el cálculo en un ejemplo específico.

Es necesario averiguar cuál es el salario promedio en esta empresa, teniendo en cuenta la cantidad de trabajadores que reciben un salario en particular.

Entonces, el cálculo del promedio ponderado se realiza mediante la siguiente fórmula:

x = (a 1 *w 1 +a 2 *w 2 +...+a n *w n)/(w 1 +w 2 +...+w n)

Por ejemplo, el cálculo sería:

x = (32*20+33*35+34*14+40*6)/(20+35+14+6) = (640+1155+476+240)/75 = 33,48

Obviamente, no hay ninguna dificultad particular en calcular manualmente el promedio ponderado. La fórmula para calcular esta cantidad en uno de los más aplicaciones populares con fórmulas - Excel - parece una función SUMAPRODUCTO (serie de números; serie de pesos) / SUMA (serie de pesos).

¿Cómo encontrar el valor promedio en Excel?

¿Cómo encontrar la media aritmética en Excel?

vladimir09854

Tan fácil como un pastel. Para encontrar el valor promedio en Excel, solo necesita 3 celdas. En el primero escribimos un número, en el segundo, otro. Y en la tercera celda, anotaremos una fórmula que nos dará el valor promedio entre estos dos números de la primera y segunda celda. Si la celda No. 1 se llama A1, la celda No. 2 se llama B1, entonces en la celda con la fórmula debe escribir así:

Esta fórmula calcula la media aritmética de dos números.

Por la belleza de nuestros cálculos, podemos resaltar las celdas con líneas, en forma de placa.

También hay una función en Excel para determinar el valor promedio, pero uso el método antiguo e ingreso la fórmula que necesito. Por lo tanto, estoy seguro de que Excel calculará exactamente como lo necesito y no generará ningún tipo de redondeo propio.

sergeym3

Esto es muy fácil si los datos ya están ingresados ​​en las celdas. Si solo está interesado en un número, simplemente seleccione el rango/los rangos deseados, y el valor de la suma de estos números, su media aritmética y su número aparecerán en la barra de estado en la parte inferior derecha.

Puede seleccionar una celda vacía, hacer clic en el triángulo (lista desplegable) "Autosuma" y seleccionar "Promedio" allí, después de lo cual estará de acuerdo con el rango propuesto para el cálculo, o elegirá el suyo propio.

Finalmente, puede usar las fórmulas directamente: haga clic en "Insertar función" junto a la barra de fórmulas y la dirección de la celda. La función PROMEDIO está en la categoría "Estadística", y toma como argumentos tanto números como referencias de celda, etc. Allí también puede seleccionar más opciones complejas, por ejemplo, AVERAGEIF - cálculo del promedio según la condición.

encontrar promedio en excel es una tarea bastante sencilla. Aquí debe comprender si desea utilizar este valor promedio en algunas fórmulas o no.

Si necesita obtener solo el valor, basta con seleccionar el rango de números requerido, después de lo cual Excel calculará automáticamente el valor promedio; se mostrará en la barra de estado, el encabezado "Promedio".

En el caso de que quiera usar el resultado en fórmulas, puede hacer esto:

1) Sume las celdas usando la función SUMA y divídalo todo por la cantidad de números.

2) Una opción más correcta es usar una función especial llamada PROMEDIO. Los argumentos de esta función pueden ser números dados secuencialmente o un rango de números.

Vladimir Tijonov

encierre en un círculo los valores que estarán involucrados en el cálculo, haga clic en la pestaña "Fórmulas", allí verá "AutoSuma" a la izquierda y al lado un triángulo que apunta hacia abajo. haga clic en este triángulo y elija "Promedio". Listo, listo) en la parte inferior de la columna verá el valor promedio :)

Ekaterina Mutalapova

Comencemos por el principio y en orden. ¿Qué significa promedio?

El valor medio es el valor que es la media aritmética, es decir se calcula sumando un conjunto de números y luego dividiendo la suma total de números por su número. Por ejemplo, para los números 2, 3, 6, 7, 2 será 4 (la suma de los números 20 se divide por su número 5)

EN hoja de cálculo de Excel Personalmente, para mí, la forma más sencilla fue utilizar la fórmula =PROMEDIO. Para calcular el valor promedio, debe ingresar datos en la tabla, escribir la función =PROMEDIO() debajo de la columna de datos y entre paréntesis indicar el rango de números en las celdas, resaltando la columna con los datos. Después de eso, presione ENTER, o simplemente haga clic izquierdo en cualquier celda. El resultado se mostrará en la celda debajo de la columna. A primera vista, la descripción es incomprensible, pero en realidad es cuestión de minutos.

Aventurero 2000

El programa Excel tiene múltiples facetas, por lo que hay varias opciones que le permitirán encontrar el promedio:

Primera opción. Simplemente suma todas las celdas y divide por su número;

Segunda opción. Use un comando especial, escriba en la celda requerida la fórmula "=PROMEDIO (y aquí especifique el rango de celdas)";

Tercera opción. Si selecciona el rango requerido, tenga en cuenta que en la página a continuación, también se muestra el valor promedio en estas celdas.

Por lo tanto, hay muchas formas de encontrar el valor promedio, solo necesita elegir la mejor para usted y usarla constantemente.

En Excel, usando la función PROMEDIO, puede calcular la media aritmética simple. Para hacer esto, debe ingresar una cantidad de valores. Presione igual y seleccione en la categoría Estadística, entre las cuales seleccione la función PROMEDIO



Además, utilizando fórmulas estadísticas, puede calcular el promedio ponderado aritmético, que se considera más preciso. Para calcularlo, necesitamos los valores del indicador y la frecuencia.

¿Cómo encontrar el promedio en Excel?

La situación es esta. Existe la siguiente tabla:

Las columnas sombreadas en rojo contienen los valores numéricos de las calificaciones de las materias. En la columna "Promedio", debe calcular su valor promedio.
El problema es este: hay 60-70 objetos en total y algunos de ellos están en otra hoja.
Miré en otro documento, ya se calculó el promedio, y en la celda hay una fórmula como
="nombre de la hoja"!|E12
pero esto fue hecho por un programador que fue despedido.
Dime, por favor, quién entiende esto.

Héctor

En la línea de funciones, inserte "PROMEDIO" de las funciones propuestas y elija desde dónde deben calcularse (B6: N6) para Ivanov, por ejemplo. No estoy seguro acerca de las hojas vecinas, pero seguro que esto está contenido en la ayuda estándar de Windows

Dime cómo calcular el valor promedio en Word

Por favor, dígame cómo calcular el valor promedio en Word. Es decir, el valor promedio de las calificaciones, y no la cantidad de personas que recibieron calificaciones.


yulia pavlova

Word puede hacer mucho con las macros. Presione ALT+F11 y escriba un programa macro.
Además, Insertar-Objeto... te permitirá utilizar otros programas, incluso Excel, para crear una hoja con una tabla dentro de un documento de Word.
Pero en este caso, debe escribir sus números en la columna de la tabla y poner el promedio en la celda inferior de la misma columna, ¿verdad?
Para hacer esto, inserte un campo en la celda inferior.
Insertar-Campo...-Fórmula
Contenido del campo
[=PROMEDIO(ARRIBA)]
devuelve el promedio de la suma de las celdas anteriores.
Si se selecciona el campo y se presiona el botón derecho del mouse, entonces se puede actualizar si los números han cambiado,
ver el código o el valor del campo, cambiar el código directamente en el campo.
Si algo sale mal, elimine todo el campo de la celda y vuelva a crearlo.
PROMEDIO significa promedio, ARRIBA, aproximadamente, es decir, una fila de celdas arriba.
Yo mismo no sabía todo esto, pero lo encontré fácilmente en AYUDA, por supuesto, pensando un poco.

¡Recordar!

A encontrar la media aritmética, necesitas sumar todos los números y dividir su suma por su número.


Encuentra la media aritmética de 2, 3 y 4.

Denotemos la media aritmética con la letra "m". Por la definición anterior, encontramos la suma de todos los números.


Divide la cantidad resultante por el número de números tomados. Tenemos tres números.

Como resultado, obtenemos fórmula de la media aritmética:


¿Para qué sirve la media aritmética?

Además del hecho de que se ofrece constantemente para encontrarlo en el aula, encontrar la media aritmética es muy útil en la vida.

Por ejemplo, decide vender balones de fútbol. Pero como eres nuevo en este negocio, es completamente incomprensible a qué precio vendes pelotas.

Entonces decide averiguar a qué precio sus competidores ya están vendiendo balones de fútbol en su área. Averigüe los precios en las tiendas y haga una tabla.

Los precios de las pelotas en las tiendas resultaron ser bastante diferentes. ¿Qué precio debemos elegir para vender el balón de fútbol?

Si elegimos el más bajo (290 rublos), venderemos los productos con pérdidas. Si elige el más alto (360 rublos), los compradores no nos comprarán balones de fútbol.

Necesitamos un precio medio. Aquí viene al rescate promedio.

Calcula la media aritmética de los precios de los balones de fútbol:

precio promedio =

290 + 360 + 310
3
=
960
3
= 320 frotar.

Por lo tanto, obtuvimos el precio promedio (320 rublos), al que podemos vender un balón de fútbol ni demasiado barato ni demasiado caro.

Velocidad de movimiento promedio

Estrechamente relacionado con la media aritmética está el concepto velocidad media.

Al observar el movimiento del tráfico en la ciudad, puede ver que los automóviles aceleran y viajan a alta velocidad, luego reducen la velocidad y viajan a baja velocidad.

Hay muchas secciones de este tipo a lo largo de la ruta de los vehículos. Por lo tanto, por conveniencia de los cálculos, se utiliza el concepto de velocidad promedio.

¡Recordar!

La velocidad promedio de movimiento es la distancia total recorrida dividida por el tiempo total de movimiento.

Considere el problema de la velocidad promedio.

Tarea número 1503 del libro de texto "Vilenkin Grade 5"

El automóvil viajó 3.2 horas en una carretera a una velocidad de 90 km/h, luego 1.5 horas en un camino de terracería a una velocidad de 45 km/h y finalmente 0.3 horas en un camino rural a una velocidad de 30 km/h. Encuentre la velocidad promedio del automóvil durante todo el viaje.

Para calcular la velocidad promedio de movimiento, necesita saber la distancia total recorrida por el automóvil y el tiempo total que estuvo en movimiento.

S 1 \u003d V 1 t 1

S 1 \u003d 90 3.2 \u003d 288 (km)

- carretera.

S 2 \u003d V 2 t 2

S 2 \u003d 45 1.5 \u003d 67.5 (km) - camino de tierra.

S 3 \u003d V 3 t 3

S 3 \u003d 30 0.3 \u003d 9 (km) - camino rural.

S = S 1 + S 2 + S 3

S \u003d 288 + 67.5 + 9 \u003d 364.5 (km): todo el camino recorrido por el automóvil.

T \u003d t 1 + t 2 + t 3

T \u003d 3.2 + 1.5 + 0.3 \u003d 5 (h) - todo el tiempo.

V cf \u003d S: t

V cf \u003d 364.5: 5 \u003d 72.9 (km / h) - la velocidad promedio del automóvil.

Respuesta: V av = 72.9 (km / h) - la velocidad promedio del automóvil.

Para encontrar el valor promedio en Excel (ya sea un valor numérico, textual, porcentual u otro), hay muchas funciones. Y cada uno de ellos tiene sus propias características y ventajas. Después de todo, se pueden establecer ciertas condiciones en esta tarea.

Por ejemplo, los valores medios de una serie de números en Excel se calculan mediante funciones estadísticas. También puede ingresar manualmente su propia fórmula. Consideremos varias opciones.

¿Cómo encontrar la media aritmética de los números?

Para encontrar la media aritmética, sumas todos los números del conjunto y divides la suma por el número. Por ejemplo, las calificaciones de un estudiante en informática: 3, 4, 3, 5, 5. Lo que vale para un trimestre: 4. Encontramos la media aritmética usando la fórmula: \u003d (3 + 4 + 3 + 5 + 5) / 5.

Cómo hacerlo rápido con funciones de excel? Tomemos, por ejemplo, una serie de números aleatorios en una cadena:

O: active la celda y simplemente ingrese manualmente la fórmula: =PROMEDIO(A1:A8).

Ahora veamos qué más puede hacer la función PROMEDIO.


Halla la media aritmética de los dos primeros y los tres últimos números. Fórmula: =PROMEDIO(A1:B1;F1:H1). Resultado:



Promedio por condición

La condición para encontrar la media aritmética puede ser un criterio numérico o de texto. Usaremos la función: =PROMEDIO.SI().

Encuentra la media aritmética de números que son mayores o iguales a 10.

Función: =PROMEDIO.SI(A1:A8,">=10")


El resultado de usar la función PROMEDIO.SI en la condición ">=10":

El tercer argumento - "Rango promedio" - se omite. Primero, no es obligatorio. En segundo lugar, el rango analizado por el programa contiene SÓLO valores numéricos. En las celdas especificadas en el primer argumento, la búsqueda se realizará de acuerdo con la condición especificada en el segundo argumento.

¡Atención! El criterio de búsqueda se puede especificar en una celda. Y en la fórmula para hacer referencia a ella.

Encontremos el valor promedio de los números por el criterio del texto. Por ejemplo, las ventas promedio del producto "mesas".

La función se verá así: =PROMEDIOSI($A$2:$A$12;A7;$B$2:$B$12). Rango: una columna con nombres de productos. El criterio de búsqueda es un enlace a una celda con la palabra "tablas" (puede insertar la palabra "tablas" en lugar del enlace A7). Rango promedio: aquellas celdas de las que se tomarán datos para calcular el valor promedio.

Como resultado del cálculo de la función, obtenemos el siguiente valor:

¡Atención! Para un criterio de texto (condición), se debe especificar el rango promedio.

¿Cómo calcular el precio promedio ponderado en Excel?

¿Cómo sabemos el precio medio ponderado?

Fórmula: =SUMAPRODUCTO(C2:C12,B2:B12)/SUMA(C2:C12).


Usando la fórmula SUMPRODUCT, encontramos el ingreso total después de la venta de la cantidad total de bienes. Y la función SUM - resume la cantidad de bienes. Al dividir el ingreso total de la venta de bienes por el número total de unidades de bienes, encontramos el precio promedio ponderado. Este indicador tiene en cuenta el "peso" de cada precio. Su participación en la masa total de valores.

Desviación estándar: fórmula en Excel

distinguir medio Desviación Estándar para la población general y para la muestra. En el primer caso, esta es la raíz de la varianza general. En el segundo, de varianza muestral.

Para calcular este indicador estadístico, se compila una fórmula de dispersión. La raíz se toma de ella. Pero en Excel hay una función preparada para encontrar la desviación estándar.


La desviación estándar está vinculada a la escala de los datos de origen. Esto no es suficiente para una representación figurativa de la variación del rango analizado. Para obtener el nivel relativo de dispersión en los datos, se calcula el coeficiente de variación:

desviación estándar / media aritmética

La fórmula en Excel se ve así:

STDEV (rango de valores) / PROMEDIO (rango de valores).

El coeficiente de variación se calcula como un porcentaje. Por lo tanto, establecemos el formato de porcentaje en la celda.

Salario promedio... Esperanza de vida promedio... Casi todos los días escuchamos estas frases para describir muchos con uno singular. Pero curiosamente, el "valor promedio" es un concepto bastante insidioso, que a menudo engaña a una persona común que no tiene experiencia en estadísticas matemáticas.

¿Cuál es el problema?

El valor promedio generalmente significa la media aritmética, que varía mucho bajo la influencia de hechos o eventos individuales. Y no te harás una idea real de cómo se distribuyen exactamente los valores que estás aprendiendo.

Tomemos un ejemplo clásico del salario promedio.

Una empresa abstracta tiene diez empleados. Nueve de ellos reciben un salario de unos 50.000 rublos, y uno 1.500.000 rublos (por una extraña coincidencia, también es CEO esta compañía).

El valor promedio en este caso será de 195 150 rublos, lo cual, como ves, es incorrecto.

¿Cuáles son las formas de calcular el promedio?

La primera forma es calcular el ya mencionado significado aritmetico, que es la suma de todos los valores dividida por su número.

  • x – media aritmética;
  • x norte - valor específico;
  • n - número de valores.
  • Funciona bien con una distribución normal de valores en la muestra;
  • Fácil de calcular;
  • Intuitivo.
  • No da una idea real de la distribución de valores;
  • Una cantidad inestable que se tira fácilmente (como en el caso del CEO).

La segunda forma es calcular moda, que es el valor más frecuente.

  • M 0 - modo;
  • x0 es el límite inferior del intervalo que contiene la moda;
  • n es el valor del intervalo;
  • f m - frecuencia (cuántas veces ocurre un valor particular en una serie);
  • f m-1 - la frecuencia del intervalo que precede al modal;
  • f m+1 es la frecuencia del intervalo que sigue al modal.
  • Genial para tener una idea de la opinión pública;
  • Bueno para datos no numéricos (colores de la temporada, éxitos de ventas, valoraciones);
  • Fácil de comprender.
  • La moda puede simplemente no existir (sin repeticiones);
  • Puede haber varios modos (distribución multimodal).

La tercera forma es calcular medianas, es decir, el valor que divide la muestra ordenada en dos mitades y se encuentra entre ellas. Y si no existe tal valor, entonces la media aritmética entre los límites de las mitades de la muestra se toma como la mediana.

  • M e es la mediana;
  • x0 es el límite inferior del intervalo que contiene la mediana;
  • h es el valor del intervalo;
  • fi - frecuencia (cuántas veces ocurre un valor particular en una serie);
  • S m-1 - la suma de las frecuencias de los intervalos que preceden a la mediana;
  • f m es el número de valores en el intervalo mediano (su frecuencia).
  • Proporciona la estimación más realista y representativa;
  • Resistente a las emisiones.
  • Es más difícil de calcular, ya que se debe pedir la muestra antes del cálculo.

Hemos considerado los métodos básicos para encontrar el valor promedio, llamados medidas de tendencia central(en realidad hay más, pero estos son los más populares).

Ahora volvamos a nuestro ejemplo y calculemos las tres variantes del promedio usando funciones especiales de Excel:

  • PROMEDIO(número1;[número2];…) — función para determinar la media aritmética;
  • FASHION.ONE(number1,[number2],...) - función de moda (las versiones anteriores de Excel usaban FASHION(number1,[number2],...));
  • MEDIAN(number1;[number2];...) es una función para encontrar la mediana.

Y aquí están los valores que obtuvimos:

En este caso, la moda y la mediana caracterizan mucho mejor el salario medio de la empresa.

Pero, ¿qué hacer cuando no hay 10 valores en la muestra, como en el ejemplo, sino millones? En Excel, esto no se puede calcular, pero en la base de datos donde se almacenan sus datos, no hay problema.

Calcular la media aritmética en SQL

Aquí todo es bastante simple, ya que SQL proporciona una función agregada especial AVG.

Y para usarlo, basta con escribir la siguiente consulta:

Cálculo del modo en SQL

SQL no tiene una función separada para encontrar el modo, pero puede escribirlo usted mismo fácil y rápidamente. Para hacer esto, necesitamos averiguar cuál de los salarios se repite con más frecuencia y elegir el más popular.

Escribamos una consulta:

/* CON LAZOS debe agregarse a TOP() si el conjunto es multimodal, lo que significa que el conjunto tiene múltiples modos */ SELECT TOP(1) CON LAZOS salario AS "Modo de salario" FROM empleados GROUP BY salario ORDER BY COUNT(*) DESC

Calcular la mediana en SQL

Como ocurre con la moda, SQL no tiene una función integrada para calcular la mediana, pero sí tiene una función genérica para calcular percentiles PERCENTILE_CONT.

Todo se ve así:

/* En este caso, el percentil 0.5 será la mediana */ SELECT TOP(1) PERCENTILE_CONT(0.5) DENTRO DEL GRUPO (ORDENAR POR salario) OVER() AS "Salario medio" FROM empleados

Es mejor leer más sobre el trabajo de la función PERCENTILE_CONT en la ayuda de Microsoft y Google BigQuery.

¿Qué manera de usar de todos modos?

De lo anterior se deduce que la mediana La mejor manera para calcular el valor medio.

Pero no siempre es así. Si está trabajando con la media, tenga cuidado con la distribución multimodal:

El gráfico muestra una distribución bimodal con dos picos. Tal situación puede surgir, por ejemplo, al votar en las elecciones.

En este caso, la media aritmética y la mediana son valores intermedios y no dirán nada sobre lo que realmente está sucediendo y es mejor reconocer de inmediato que se trata de una distribución bimodal al informar dos modas.

Mejor aún, divida la muestra en dos grupos y recopile datos estadísticos para cada uno.

Conclusión:

Al elegir un método para encontrar la media, es necesario tener en cuenta la presencia de valores atípicos, así como la distribución normal de valores en la muestra.

La elección final de la medida de la tendencia central siempre recae en el analista.

En la mayoría de los casos, los datos se concentran alrededor de algún punto central. Así, para describir cualquier conjunto de datos, basta con indicar el valor medio. Considere sucesivamente tres características numéricas que se utilizan para estimar el valor medio de la distribución: media aritmética, mediana y moda.

Promedio

La media aritmética (a menudo denominada simplemente media) es la estimación más común de la media de una distribución. Es el resultado de dividir la suma de todos los valores numéricos observados por su número. Para una muestra de números X 1, X 2, ..., Xnorte, la media de la muestra (indicada por el símbolo ) es igual \u003d (X 1 + X 2 + ... + Xnorte) / norte, o

donde es la media muestral, norte- tamaño de la muestra, Xii-ésimo elemento muestras

Descargar nota en o formato, ejemplos en formato

Considere el cálculo del promedio valor aritmético retornos anuales promedio de cinco años de 15 fondos mutuos con muy nivel alto riesgo (fig. 1).

Arroz. 1. Rentabilidad anual promedio de 15 fondos mutuos de muy alto riesgo

La media muestral se calcula de la siguiente manera:

Este es un buen rendimiento, especialmente en comparación con el rendimiento del 3-4% que recibieron los depositantes de bancos o cooperativas de crédito durante el mismo período de tiempo. Si ordena los valores de retorno, es fácil ver que ocho fondos tienen un retorno por encima y siete por debajo del promedio. La media aritmética actúa como un punto de equilibrio, de modo que los fondos de bajos ingresos equilibren los fondos de altos ingresos. Todos los elementos de la muestra están involucrados en el cálculo del promedio. Ninguno de los otros estimadores de la media de distribución tiene esta propiedad.

Cuándo calcular la media aritmética. Dado que la media aritmética depende de todos los elementos de la muestra, la presencia de valores extremos afecta significativamente el resultado. En tales situaciones, la media aritmética puede distorsionar el significado de los datos numéricos. Por lo tanto, al describir un conjunto de datos que contiene valores extremos, es necesario indicar la mediana o la media aritmética y la mediana. Por ejemplo, si se elimina de la muestra la rentabilidad del fondo RS Emerging Growth, la media muestral de la rentabilidad de los 14 fondos disminuye casi un 1 % hasta el 5,19 %.

Mediana

la mediana es valor madiano matriz ordenada de números. Si la matriz no contiene números repetidos, la mitad de sus elementos serán menores y la otra mitad mayores que la mediana. Si la muestra contiene valores extremos, es mejor usar la mediana en lugar de la media aritmética para estimar la media. Para calcular la mediana de una muestra, primero se debe ordenar.

Esta fórmula es ambigua. Su resultado depende de si el número es par o impar. norte:

  • Si la muestra contiene un número impar de artículos, la mediana es (n+1)/2-ésimo elemento.
  • Si la muestra contiene un número par de elementos, la mediana se encuentra entre los dos elementos centrales de la muestra y es igual a la media aritmética calculada sobre estos dos elementos.

Para calcular la mediana de una muestra de 15 fondos mutuos de muy alto riesgo, primero debemos clasificar los datos sin procesar (Figura 2). Entonces la mediana será opuesta al número del elemento medio de la muestra; en nuestro ejemplo número 8. excel tiene funcion especial=MEDIAN(), que también funciona con arreglos desordenados.

Arroz. 2. Mediana de 15 fondos

Así, la mediana es 6,5. Esto quiere decir que la mitad de los fondos de muy alto riesgo no superan el 6,5, mientras que la otra mitad sí lo hace. Tenga en cuenta que la mediana de 6,5 es ligeramente mayor que la mediana de 6,08.

Si eliminamos la rentabilidad del fondo RS Emerging Growth de la muestra, entonces la mediana de los 14 fondos restantes disminuirá a 6.2%, es decir, no tan significativamente como la media aritmética (Fig. 3).

Arroz. 3. Mediana de 14 fondos

Moda

El término fue introducido por primera vez por Pearson en 1894. La moda es el número que aparece con mayor frecuencia en la muestra (el más de moda). La moda describe bien, por ejemplo, la típica reacción de los conductores ante un semáforo para detener el tráfico. Un ejemplo clásico del uso de la moda es la elección del tamaño del lote de zapatos producido o el color del papel tapiz. Si una distribución tiene múltiples modos, entonces se dice que es multimodal o multimodal (tiene dos o más "picos"). La multimodalidad de la distribución da información importante sobre la naturaleza de la variable en estudio. Por ejemplo, en las encuestas sociológicas, si una variable representa una preferencia o actitud hacia algo, entonces la multimodalidad puede significar que hay varios valores definidos. opiniones diferentes. La multimodalidad también es un indicador de que la muestra no es homogénea y que las observaciones pueden ser generadas por dos o más distribuciones "superpuestas". A diferencia de la media aritmética, los valores atípicos no afectan a la moda. Para las variables aleatorias distribuidas continuamente, como los rendimientos anuales promedio de los fondos mutuos, la moda a veces no existe en absoluto (o no tiene sentido). Dado que estos indicadores pueden tomar una variedad de valores, los valores repetidos son extremadamente raros.

Cuartiles

Los cuartiles son medidas que se usan más comúnmente para evaluar la distribución de datos al describir las propiedades de muestras numéricas grandes. Mientras que la mediana divide la matriz ordenada por la mitad (el 50 % de los elementos de la matriz son menores que la mediana y el 50 % son mayores), los cuartiles dividen el conjunto de datos ordenado en cuatro partes. Los valores de Q 1 , mediana y Q 3 son los percentiles 25, 50 y 75, respectivamente. El primer cuartil Q 1 es un número que divide la muestra en dos partes: el 25% de los elementos son menores y el 75% son mayores que el primer cuartil.

El tercer cuartil Q 3 es un número que también divide la muestra en dos partes: el 75% de los elementos son más pequeños y el 25% son más de un tercio cuartilla.

Para el cálculo de cuartiles en versiones de Excel anteriores a 2007 se utilizaba la función =CUARTIL(matriz, parte). A partir de Excel 2010, se aplican dos funciones:

  • =CUARTIL.ON(matriz, parte)
  • =CUARTIL.EXC(matriz, parte)

Estas dos funciones dan un poco varios significados(Figura 4). Por ejemplo, al calcular los cuartiles de una muestra que contiene datos sobre el rendimiento anual promedio de 15 fondos mutuos de muy alto riesgo, Q 1 = 1.8 o -0.7 para QUARTILE.INC y QUARTILE.EXC, respectivamente. Por cierto, la función CUARTIL utilizada anteriormente corresponde a función moderna CUARTIL EN Para calcular cuartiles en Excel usando las fórmulas anteriores, la matriz de datos se puede dejar sin ordenar.

Arroz. 4. Calcula cuartiles en Excel

Hagamos hincapié de nuevo. Excel puede calcular cuartiles para univariado serie discreta, que contiene los valores de una variable aleatoria. El cálculo de los cuartiles para una distribución basada en frecuencias se proporciona en la sección a continuación.

significado geometrico

A diferencia de la media aritmética, la media geométrica mide cuánto ha cambiado una variable con el tiempo. La media geométrica es la raíz. norte grado del producto norte valores (en Excel, se usa la función = CUGEOM):

GRAMO= (X 1 * X 2 * ... * X n) 1/n

Un parámetro similar, la media geométrica de la tasa de rendimiento, está determinado por la fórmula:

G \u003d [(1 + R 1) * (1 + R 2) * ... * (1 + R n)] 1 / n - 1,

Dónde yo- tasa de retorno i-ésimo periodo de tiempo.

Por ejemplo, suponga que la inversión inicial es de $100 000. Al final del primer año, se reduce a $50 000 y al final del segundo año se recupera a los $100 000 originales. La tasa de rendimiento de esta inversión en un período de dos años año es igual a 0, ya que la cantidad inicial y final de fondos son iguales entre sí. Sin embargo, la media aritmética de las tasas de rendimiento anuales es = (-0,5 + 1) / 2 = 0,25 o 25 %, ya que la tasa de rendimiento en el primer año R 1 = (50 000 - 100 000) / 100 000 = -0,5 , y en el segundo R 2 = (100 000 - 50 000) / 50 000 = 1. Al mismo tiempo, la media geométrica de la tasa de rendimiento para dos años es: G = [(1–0,5) * (1 + 1 )] 1 /2 – 1 = ½ – 1 = 1 – 1 = 0. Por lo tanto, la media geométrica refleja con mayor precisión el cambio (más precisamente, la ausencia de cambio) en el volumen de inversiones durante el bienio que la media aritmética.

Datos interesantes. Primero, la media geométrica siempre será menor que la media aritmética de los mismos números. Excepto en el caso en que todos los números tomados sean iguales entre sí. En segundo lugar, habiendo considerado las propiedades de un triángulo rectángulo, uno puede entender por qué la media se llama geométrica. La altura de un triángulo rectángulo, bajado a la hipotenusa, es la media proporcional entre las proyecciones de los catetos sobre la hipotenusa, y cada cateto es la media proporcional entre la hipotenusa y su proyección sobre la hipotenusa (Fig. 5). Esto brinda una forma geométrica de construir la media geométrica de dos segmentos (longitudes): debe construir un círculo sobre la suma de estos dos segmentos como un diámetro, luego la altura, restaurada desde el punto de su conexión hasta la intersección con el círculo, le dará el valor deseado:

Arroz. 5. La naturaleza geométrica de la media geométrica (figura de Wikipedia)

La segunda propiedad importante de los datos numéricos es su variación caracterizando el grado de dispersión de los datos. Dos muestras diferentes pueden diferir tanto en valores medios como en variaciones. Sin embargo, como se muestra en la fig. 6 y 7, dos muestras pueden tener la misma variación pero medias diferentes, o la misma media y variación completamente diferente. Los datos correspondientes al polígono B de la Fig. 7 cambian mucho menos que los datos a partir de los cuales se construyó el polígono A.

Arroz. 6. Dos distribuciones simétricas en forma de campana con la misma dispersión y diferentes valores medios

Arroz. 7. Dos distribuciones simétricas en forma de campana con los mismos valores medios y diferente dispersión

Hay cinco estimaciones de variación de datos:

alcance

El rango es la diferencia entre los elementos más grandes y más pequeños de la muestra:

Deslizar = XMax-Xmínimo

El rango de una muestra que contiene datos sobre los rendimientos anuales promedio de 15 fondos mutuos de muy alto riesgo se puede calcular utilizando una matriz ordenada (consulte la Figura 4): Rango = 18,5 - (-6,1) = 24,6. Esto significa que la diferencia entre la rentabilidad media anual máxima y mínima de los fondos de muy alto riesgo es del 24,6 %.

El rango mide la dispersión general de los datos. Aunque el rango de la muestra es una estimación muy simple de la dispersión total de los datos, su debilidad es que no tiene en cuenta exactamente cómo se distribuyen los datos entre los elementos mínimo y máximo. Este efecto se ve bien en la Fig. 8 que ilustra muestras que tienen el mismo rango. La escala B muestra que si la muestra contiene al menos un valor extremo, el rango de la muestra es una estimación muy imprecisa de la dispersión de los datos.

Arroz. 8. Comparación de tres muestras con el mismo rango; el triángulo simboliza el apoyo de la balanza, y su ubicación corresponde al valor medio de la muestra

Rango intercuartil

El rango intercuartílico o medio es la diferencia entre el tercer y el primer cuartil de la muestra:

Rango intercuartil \u003d Q 3 - Q 1

Este valor permite estimar la dispersión del 50% de los elementos y no tener en cuenta la influencia de elementos extremos. El rango intercuartílico para una muestra que contiene datos sobre los rendimientos anuales promedio de 15 fondos mutuos de muy alto riesgo se puede calcular utilizando los datos de la figura. 4 (por ejemplo, para la función CUARTIL.EXC): Rango intercuartílico = 9,8 - (-0,7) = 10,5. El intervalo entre 9,8 y -0,7 suele denominarse la mitad del medio.

Cabe señalar que los valores de Q 1 y Q 3, y por tanto el rango intercuartílico, no dependen de la presencia de outliers, ya que en su cálculo no se tiene en cuenta ningún valor que sea inferior a Q 1 o superior a Q 3 . Total caracteristicas cuantitativas, como la mediana, el primer y tercer cuartil y el rango intercuartílico, que no se ven afectados por los valores atípicos, se denominan medidas robustas.

Si bien el rango y el rango intercuartílico proporcionan una estimación de la dispersión total y media de la muestra, respectivamente, ninguna de estas estimaciones tiene en cuenta exactamente cómo se distribuyen los datos. Varianza y desviación estándar libre de este defecto. Estos indicadores le permiten evaluar el grado de fluctuación de los datos alrededor de la media. Varianza de la muestra es una aproximación de la media aritmética calculada a partir de las diferencias al cuadrado entre cada elemento de la muestra y la media de la muestra. Para una muestra de X 1 , X 2 , ... X n la varianza de la muestra (denotada por el símbolo S 2 está dada por la siguiente fórmula:

En general, la varianza de la muestra es la suma de las diferencias al cuadrado entre los elementos de la muestra y la media de la muestra, dividida por un valor igual al tamaño de la muestra menos uno:

Dónde - significado aritmetico, norte- tamaño de la muestra, X yo - i-ésimo elemento de muestra X. En Excel antes de la versión 2007 se usaba la función =VAR() para calcular la varianza muestral, desde la versión 2010 se usa la función =VAR.V().

La estimación más práctica y ampliamente aceptada de la dispersión de datos es Desviación Estándar. Este indicador se denota con el símbolo S y es igual a raíz cuadrada de la varianza muestral:

En Excel antes de la versión 2007, se usaba la función =STDEV() para calcular la desviación estándar, desde la versión 2010 se usa la función =STDEV.B(). Para calcular estas funciones, la matriz de datos se puede desordenar.

Ni la varianza de la muestra ni la desviación estándar de la muestra pueden ser negativas. La única situación en la que los indicadores S 2 y S pueden ser cero es si todos los elementos de la muestra son iguales. En este caso completamente improbable, el rango y el rango intercuartílico también son cero.

Los datos numéricos son inherentemente volátiles. Cualquier variable puede tomar un conjunto valores diferentes. Por ejemplo, diferentes fondos mutuos tienen diferentes tasas de rendimiento y pérdida. Debido a la variabilidad de los datos numéricos, es muy importante estudiar no solo las estimaciones de la media, que son de naturaleza sumativa, sino también las estimaciones de la varianza, que caracterizan la dispersión de los datos.

La varianza y la desviación estándar nos permiten estimar la dispersión de los datos alrededor de la media, en otras palabras, determinar cuántos elementos de la muestra son menores que la media y cuántos son mayores. La dispersión tiene algunas propiedades matemáticas valiosas. Sin embargo, su valor es el cuadrado de una unidad de medida: un porcentaje cuadrado, un dólar cuadrado, una pulgada cuadrada, etc. Por lo tanto, una estimación natural de la varianza es la desviación estándar, que se expresa en las unidades de medida habituales: porcentaje de ingresos, dólares o pulgadas.

La desviación estándar le permite estimar la cantidad de fluctuación de los elementos de la muestra alrededor del valor medio. En casi todas las situaciones, la mayoría de los valores observados se encuentran dentro de más o menos una desviación estándar de la media. Por lo tanto, conociendo la media aritmética de los elementos de la muestra y la desviación estándar de la muestra, es posible determinar el intervalo al que pertenece la mayor parte de los datos.

La desviación estándar de los rendimientos de 15 fondos mutuos de muy alto riesgo es 6.6 (Figura 9). Esto significa que la rentabilidad de la mayor parte de los fondos difiere del valor promedio en no más del 6,6% (es decir, fluctúa en el rango de - S= 6,2 – 6,6 = –0,4 a +S= 12,8). De hecho, este intervalo contiene un rendimiento anual promedio de cinco años del 53,3% (8 de 15) de los fondos.

Arroz. 9. Desviación estándar

Tenga en cuenta que en el proceso de sumar las diferencias al cuadrado, los elementos que están más alejados de la media ganan más peso que los elementos que están más cerca. Esta propiedad es la razón principal por la cual la media aritmética se usa con mayor frecuencia para estimar la media de una distribución.

El coeficiente de variación

A diferencia de las estimaciones de dispersión anteriores, el coeficiente de variación es una estimación relativa. Siempre se mide como un porcentaje, no en las unidades de datos originales. El coeficiente de variación, indicado por los símbolos CV, mide la dispersión de los datos alrededor de la media. El coeficiente de variación es igual a la desviación estándar dividida por la media aritmética y multiplicada por 100%:

Dónde S- desviación estándar de la muestra, - muestra promedio.

El coeficiente de variación le permite comparar dos muestras, cuyos elementos se expresan en diferentes unidades de medida. Por ejemplo, el gerente de un servicio de entrega de correo tiene la intención de actualizar la flota de camiones. Al cargar paquetes, hay dos tipos de restricciones a considerar: el peso (en libras) y el volumen (en pies cúbicos) de cada paquete. Suponga que en una muestra de 200 bolsas, el peso promedio es de 26,0 libras, la desviación estándar del peso es de 3,9 libras, el volumen promedio del paquete es de 8,8 pies cúbicos y la desviación estándar del volumen es de 2,2 pies cúbicos. ¿Cómo comparar la distribución de peso y volumen de los paquetes?

Dado que las unidades de medida de peso y volumen difieren entre sí, el gerente debe comparar la dispersión relativa de estos valores. El coeficiente de variación de peso es CV W = 3,9 / 26,0 * 100% = 15%, y el coeficiente de variación de volumen CV V = 2,2 / 8,8 * 100% = 25%. Por lo tanto, la dispersión relativa de los volúmenes de los paquetes es mucho mayor que la dispersión relativa de sus pesos.

Formulario de distribución

La tercera propiedad importante de la muestra es la forma de su distribución. Esta distribución puede ser simétrica o asimétrica. Para describir la forma de una distribución, es necesario calcular su media y mediana. Si estas dos medidas son iguales, se dice que la variable está distribuida simétricamente. Si el valor medio de una variable es mayor que la mediana, su distribución tiene una asimetría positiva (Fig. 10). Si la mediana es mayor que la media, la distribución de la variable tiene un sesgo negativo. La asimetría positiva ocurre cuando la media aumenta a un nivel inusualmente valores altos. La asimetría negativa ocurre cuando la media disminuye a valores inusualmente pequeños. Una variable se distribuye simétricamente si no toma ningún valor extremo en ninguna dirección, de modo que los valores grandes y pequeños de la variable se cancelen entre sí.

Arroz. 10. Tres tipos de distribuciones

Los datos representados en la escala A tienen un sesgo negativo. Esta figura muestra una cola larga y un sesgo a la izquierda causado por valores inusualmente pequeños. Estos valores extremadamente pequeños desplazan el valor medio hacia la izquierda y se vuelve menor que la mediana. Los datos que se muestran en la escala B se distribuyen simétricamente. Las mitades izquierda y derecha de la distribución son sus imágenes especulares. Los valores grandes y pequeños se equilibran entre sí, y la media y la mediana son iguales. Los datos que se muestran en la escala B tienen un sesgo positivo. Esta figura muestra una cola larga y sesgada a la derecha, causada por la presencia de valores inusualmente altos. Estos valores demasiado grandes desplazan la media hacia la derecha y se vuelve más grande que la mediana.

En Excel, las estadísticas descriptivas se pueden obtener usando el complemento Paquete de análisis. Ir a través del menú DatosAnálisis de los datos, en la ventana que se abre, seleccione la línea Estadísticas descriptivas y haga clic De acuerdo. En la ventana Estadísticas descriptivas asegúrese de indicar intervalo de entrada(Figura 11). Si desea ver estadísticas descriptivas en la misma hoja que los datos originales, seleccione el botón de radio intervalo de salida y especifique la celda donde desea colocar la esquina superior izquierda de las estadísticas mostradas (en nuestro ejemplo, $C$1). Si desea generar datos en una nueva hoja o en un nuevo libro de trabajo, simplemente seleccione el botón de opción apropiado. Marque la casilla junto a Estadísticas finales. Opcionalmente, también puede elegir Nivel de dificultad,k-ésimo más pequeño yk-ésimo mayor.

Si en deposito Datos en la zona Análisis no ves el icono Análisis de los datos, primero debe instalar el complemento Paquete de análisis(ver, por ejemplo,).

Arroz. 11. Estadísticas descriptivas de la rentabilidad anual media de cinco años de fondos con niveles de riesgo muy altos, calculada mediante el complemento Análisis de los datos programas de excel

Excel calcula una serie de estadísticas discutidas anteriormente: media, mediana, moda, desviación estándar, varianza, rango ( intervalo), mínimo, máximo y tamaño de la muestra ( controlar). Además, Excel calcula algunas estadísticas nuevas para nosotros: error estándar, curtosis y asimetría. Error estándar es igual a la desviación estándar dividida por la raíz cuadrada del tamaño de la muestra. Asimetría caracteriza la desviación de la simetría de la distribución y es una función que depende del cubo de las diferencias entre los elementos de la muestra y el valor medio. La curtosis es una medida de la concentración relativa de datos alrededor de la media frente a las colas de la distribución, y depende de las diferencias entre la muestra y la media elevada a la cuarta potencia.

Cálculo de estadísticas descriptivas para la población general

La media, la dispersión y la forma de la distribución discutida anteriormente son características basadas en muestras. Sin embargo, si el conjunto de datos contiene medidas numéricas de toda la población, entonces se pueden calcular sus parámetros. Estos parámetros incluyen la media, la varianza y la desviación estándar de la población.

Valor esperado es igual a la suma de todos los valores de la población general dividida por el volumen de la población general:

Dónde µ - valor esperado, Xi- i-ésima observación variable X, norte- el volumen de la población general. En Excel, para calcular la esperanza matemática se utiliza la misma función que para la media aritmética: =PROMEDIO().

Varianza de la población igual a la suma de las diferencias al cuadrado entre los elementos de la población general y mat. expectativa dividida por el tamaño de la población:

Dónde σ2 es la varianza de la población general. Excel antes de la versión 2007 usa la función =VAR() para calcular la varianza de la población, a partir de la versión 2010 =VAR.G().

desviación estándar de población es igual a la raíz cuadrada de la varianza de la población:

Excel antes de la versión 2007 usa =STDEV() para calcular la desviación estándar de la población, a partir de la versión 2010 =STDEV.Y(). Tenga en cuenta que las fórmulas para la varianza de la población y la desviación estándar son diferentes de las fórmulas para la varianza de la muestra y la desviación estándar. Al calcular estadísticas de muestra S2 Y S el denominador de la fraccion es n - 1, y al calcular los parámetros σ2 Y σ - el volumen de la población general norte.

regla de oro

En la mayoría de las situaciones, una gran proporción de observaciones se concentran alrededor de la mediana, formando un conglomerado. En conjuntos de datos con asimetría positiva, este grupo se ubica a la izquierda (es decir, debajo) de la expectativa matemática, y en conjuntos con asimetría negativa, este grupo se ubica a la derecha (es decir, arriba) de la expectativa matemática. Los datos simétricos tienen la misma media y mediana, y las observaciones se agrupan alrededor de la media, formando una distribución en forma de campana. Si la distribución no tiene un sesgo pronunciado y los datos se concentran alrededor de un cierto centro de gravedad, se puede usar una regla general para estimar la variabilidad, que dice: si los datos tienen una distribución en forma de campana, entonces aproximadamente el 68 % de las observaciones están a menos de una desviación estándar de la expectativa matemática, aproximadamente el 95 % de las observaciones están dentro de dos desviaciones estándar del valor esperado y el 99,7 % de las observaciones están dentro de tres desviaciones estándar del valor esperado.

Por lo tanto, la desviación estándar, que es una estimación de la fluctuación promedio en torno a la expectativa matemática, ayuda a comprender cómo se distribuyen las observaciones e identificar valores atípicos. De la regla empírica se deduce que, para las distribuciones en forma de campana, solo un valor entre veinte difiere de la expectativa matemática en más de dos desviaciones estándar. Por lo tanto, valores fuera del intervalo µ ± 2σ, pueden considerarse valores atípicos. Además, solo tres de 1000 observaciones difieren de la expectativa matemática en más de tres desviaciones estándar. Así, valores fuera del intervalo µ ± 3σ son casi siempre valores atípicos. Para distribuciones muy sesgadas o sin forma de campana, se puede aplicar la regla general de Biename-Chebyshev.

Hace más de cien años, los matemáticos Bienamay y Chebyshev descubrieron de forma independiente una propiedad útil de la desviación estándar. Descubrieron que para cualquier conjunto de datos, independientemente de la forma de la distribución, el porcentaje de observaciones que se encuentran a una distancia que no exceda k desviaciones estándar de la expectativa matemática, no menos (1 – 1/ 2)*100%.

Por ejemplo, si k= 2, la regla de Biename-Chebyshev establece que al menos (1 - (1/2) 2) x 100% = 75% de las observaciones deben estar en el intervalo µ ± 2σ. Esta regla es válida para cualquier k superior a uno. La regla de Biename-Chebyshev es de carácter muy general y es válida para distribuciones de cualquier tipo. Indica el número mínimo de observaciones, la distancia a partir de la cual la esperanza matemática no supera un valor dado. Sin embargo, si la distribución tiene forma de campana, la regla general estima con mayor precisión la concentración de datos alrededor de la media.

Cálculo de estadísticas descriptivas para una distribución basada en frecuencias

Si los datos originales no están disponibles, la distribución de frecuencias se convierte en la única fuente de información. En tales situaciones, puede calcular los valores aproximados de los indicadores cuantitativos de la distribución, como la media aritmética, la desviación estándar, los cuartiles.

Si los datos de la muestra se presentan como una distribución de frecuencias, se puede calcular un valor aproximado de la media aritmética, suponiendo que todos los valores dentro de cada clase se concentran en el punto medio de la clase:

Dónde - muestra promedio, norte- número de observaciones, o tamaño de la muestra, Con- el número de clases en la distribución de frecuencias, mj- Punto Medio j-ésima clase, Fj- frecuencia correspondiente a j-ésima clase.

Para calcular la desviación estándar de la distribución de frecuencias, también se supone que todos los valores dentro de cada clase se concentran en el punto medio de la clase.

Para comprender cómo se determinan los cuartiles de la serie en función de las frecuencias, consideremos el cálculo del cuartil inferior a partir de los datos de 2013 sobre la distribución de la población rusa por ingreso medio per cápita en efectivo (Fig. 12).

Arroz. 12. La proporción de la población de Rusia con ingresos monetarios per cápita en promedio por mes, rublos

Para calcular el primer cuartil de la serie de variación del intervalo, puede usar la fórmula:

donde Q1 es el valor del primer cuartil, xQ1 es el límite inferior del intervalo que contiene el primer cuartil (el intervalo está determinado por la frecuencia acumulada, la primera superior al 25%); i es el valor del intervalo; Σf es la suma de las frecuencias de toda la muestra; probablemente siempre igual al 100%; SQ1–1 es la frecuencia acumulada del intervalo que precede al intervalo que contiene el cuartil inferior; fQ1 es la frecuencia del intervalo que contiene el cuartil inferior. La fórmula para el tercer cuartil difiere en que en todos los lugares, en lugar de Q1, debe usar Q3 y sustituir ¾ en lugar de ¼.

En nuestro ejemplo (Fig. 12), el cuartil inferior está en el rango 7000.1 - 10,000, cuya frecuencia acumulada es 26.4%. El límite inferior de este intervalo es 7000 rublos, el valor del intervalo es 3000 rublos, la frecuencia acumulada del intervalo que precede al intervalo que contiene el cuartil inferior es 13,4%, la frecuencia del intervalo que contiene el cuartil inferior es 13,0%. Por lo tanto: Q1 \u003d 7000 + 3000 * (¼ * 100 - 13.4) / 13 \u003d 9677 rublos.

Peligros asociados con las estadísticas descriptivas

En esta nota, analizamos cómo describir un conjunto de datos usando varias estadísticas que estiman su media, dispersión y distribución. El siguiente paso es analizar e interpretar los datos. Hasta ahora, hemos estudiado las propiedades objetivas de los datos y ahora pasamos a su interpretación subjetiva. Dos errores acechan al investigador: un tema de análisis elegido incorrectamente y una interpretación incorrecta de los resultados.

Un análisis del desempeño de 15 fondos mutuos de muy alto riesgo es bastante imparcial. Llevó a conclusiones completamente objetivas: todos los fondos mutuos tienen rendimientos diferentes, el diferencial de rendimiento de los fondos varía de -6.1 a 18.5 y el rendimiento promedio es de 6.08. Se garantiza la objetividad del análisis de datos. la elección correcta indicadores cuantitativos totales de distribución. Se consideraron varios métodos para estimar la media y la dispersión de datos, y se indicaron sus ventajas y desventajas. ¿Cómo elegir las estadísticas adecuadas que proporcionen un análisis objetivo e imparcial? Si la distribución de datos está ligeramente sesgada, ¿debería elegirse la mediana sobre la media aritmética? ¿Qué indicador caracteriza con mayor precisión la dispersión de los datos: la desviación estándar o el rango? ¿Debe indicarse la asimetría positiva de la distribución?

Por otro lado, la interpretación de datos es un proceso subjetivo. Gente diferente llegar a conclusiones diferentes, interpretando los mismos resultados. Todo el mundo tiene su propio punto de vista. Alguien considera que la rentabilidad media anual total de 15 fondos con un nivel de riesgo muy alto es buena y está bastante satisfecho con los ingresos recibidos. Otros pueden pensar que estos fondos tienen rendimientos demasiado bajos. Así, la subjetividad debe ser compensada por la honestidad, la neutralidad y la claridad de las conclusiones.

Cuestiones éticas

El análisis de datos está indisolublemente ligado a cuestiones éticas. Se debe ser crítico con la información que difunden los periódicos, la radio, la televisión e Internet. Con el tiempo, aprenderá a ser escéptico no solo sobre los resultados, sino también sobre los objetivos, el tema y la objetividad de la investigación. El famoso político británico Benjamin Disraeli lo dijo mejor: “Hay tres tipos de mentiras: mentiras, mentira descarada y estadísticas.

Como se señala en la nota, surgen cuestiones éticas al elegir los resultados que deben presentarse en el informe. Tanto los resultados positivos como los negativos deben ser publicados. Además, al realizar un informe o informe escrito, los resultados deben presentarse de manera honesta, neutral y objetiva. Distinguir entre presentaciones malas y deshonestas. Para ello, es necesario determinar cuáles fueron las intenciones del hablante. A veces, el hablante omite información importante por ignorancia y, a veces, deliberadamente (por ejemplo, si usa la media aritmética para estimar la media de datos claramente sesgados para obtener el resultado deseado). También es deshonesto suprimir resultados que no corresponden al punto de vista del investigador.

Se utilizan materiales del libro Levin et al., Estadísticas para gerentes. - M.: Williams, 2004. - p. 178–209

Función CUARTIL retenida para alinearse con versiones anteriores de Excel