График плотности вероятностей для нормального распределения. Нормальный закон распределения случайных величин. Графики плотности двумерного нормального распределения

Рассмотрим Нормальное распределение. С помощью функции MS EXCEL НОРМ.РАСП() построим графики функции распределения и плотности вероятности. Сгенерируем массив случайных чисел, распределенных по нормальному закону, произведем оценку параметров распределения, среднего значения и стандартного отклонения .

Нормальное распределение (также называется распределением Гаусса) является самым важным как в теории, так в приложениях системы контроля качества. Важность значения Нормального распределения (англ. Normal distribution ) во многих областях науки вытекает из теории вероятностей.

Определение : Случайная величина x распределена по нормальному закону , если она имеет :

Нормальное распределение зависит от двух параметров: μ (мю) - является , и σ (сигма) - является (среднеквадратичным отклонением). Параметр μ определяет положение центра плотности вероятности нормального распределения , а σ - разброс относительно центра (среднего).

Примечание : О влиянии параметров μ и σ на форму распределения изложено в статье про , а в файле примера на листе Влияние параметров можно с помощью понаблюдать за изменением формы кривой.

Нормальное распределение в MS EXCEL

В MS EXCEL, начиная с версии 2010, для Нормального распределения имеется функция НОРМ.РАСП() , английское название - NORM.DIST(), которая позволяет вычислить плотность вероятности (см. формулу выше) и интегральную функцию распределения (вероятность, что случайная величина X, распределенная по нормальному закону , примет значение меньше или равное x). Вычисления в последнем случае производятся по следующей формуле:

Вышеуказанное распределение имеет обозначение N (μ; σ). Так же часто используют обозначение через N (μ; σ 2).

Примечание : До MS EXCEL 2010 в EXCEL была только функция НОРМРАСП() , которая также позволяет вычислить функцию распределения и плотность вероятности. НОРМРАСП() оставлена в MS EXCEL 2010 для совместимости.

Стандартное нормальное распределение

Стандартным нормальным распределением называется нормальное распределение с μ=0 и σ=1. Вышеуказанное распределение имеет обозначение N (0;1).

Примечание : В литературе для случайной величины, распределенной по стандартному нормальному закону, закреплено специальное обозначение z.

Любое нормальное распределение можно преобразовать в стандартное через замену переменной z =(x -μ)/σ . Этот процесс преобразования называется стандартизацией .

Примечание : В MS EXCEL имеется функция НОРМАЛИЗАЦИЯ() , которая выполняет вышеуказанное преобразование. Хотя в MS EXCEL это преобразование называется почему-то нормализацией . Формулы =(x-μ)/σ и =НОРМАЛИЗАЦИЯ(х;μ;σ) вернут одинаковый результат.

В MS EXCEL 2010 для имеется специальная функция НОРМ.СТ.РАСП() и ее устаревший вариант НОРМСТРАСП() , выполняющий аналогичные вычисления.

Продемонстрируем, как в MS EXCEL осуществляется процесс стандартизации нормального распределения N (1,5; 2).

Для этого вычислим вероятность, что случайная величина, распределенная по нормальному закону N(1,5; 2) , меньше или равна 2,5. Формула выглядит так: =НОРМ.РАСП(2,5; 1,5; 2; ИСТИНА) =0,691462. Сделав замену переменной z =(2,5-1,5)/2=0,5 , запишем формулу для вычисления Стандартного нормального распределения: =НОРМ.СТ.РАСП(0,5; ИСТИНА) =0,691462.

Естественно, обе формулы дают одинаковые результаты (см. файл примера лист Пример ).

Обратите внимание, что стандартизация относится только к (аргумент интегральная равен ИСТИНА), а не к плотности вероятности .

Примечание : В литературе для функции, вычисляющей вероятности случайной величины, распределенной по стандартному нормальному закону, закреплено специальное обозначение Ф(z). В MS EXCEL эта функция вычисляется по формуле
=НОРМ.СТ.РАСП(z;ИСТИНА) . Вычисления производятся по формуле

В силу четности функции распределения f(x), а именно f(x)=f(-х), функция стандартного нормального распределения обладает свойством Ф(-x)=1-Ф(x).

Обратные функции

Функция НОРМ.СТ.РАСП(x;ИСТИНА) вычисляет вероятность P, что случайная величина Х примет значение меньше или равное х. Но часто требуется провести обратное вычисление: зная вероятность P, требуется вычислить значение х. Вычисленное значение х называется стандартного нормального распределения .

В MS EXCEL для вычисления квантилей используют функцию НОРМ.СТ.ОБР() и НОРМ.ОБР() .

Графики функций

В файле примера приведены графики плотности распределения вероятности и интегральной функции распределения .

Как известно, около 68% значений, выбранных из совокупности, имеющей нормальное распределение , находятся в пределах 1 стандартного отклонения (σ) от μ(среднего или математического ожидания); около 95% - в пределах 2-х σ, а в пределах 3-х σ находятся уже 99% значений. Убедиться в этом для стандартного нормального распределения можно записав формулу:

=НОРМ.СТ.РАСП(1;ИСТИНА)-НОРМ.СТ.РАСП(-1;ИСТИНА)

которая вернет значение 68,2689% - именно такой процент значений находятся в пределах +/-1 стандартного отклонения от среднего (см. лист График в файле примера ).

В силу четности функции плотности стандартного нормального распределения: f (x )= f (-х) , функция стандартного нормального распределения обладает свойством F(-x)=1-F(x). Поэтому, вышеуказанную формулу можно упростить:

=2*НОРМ.СТ.РАСП(1;ИСТИНА)-1

Для произвольной функции нормального распределения N(μ; σ) аналогичные вычисления нужно производить по формуле:

2* НОРМ.РАСП(μ+1*σ;μ;σ;ИСТИНА)-1

Вышеуказанные расчеты вероятности требуются для .

Примечание : Для удобства написания формул в файле примера созданы для параметров распределения: μ и σ.

Генерация случайных чисел

Сгенерируем 3 массива по 100 чисел с различными μ и σ. Для этого в окне Генерация случайных чисел установим следующие значения для каждой пары параметров:

Примечание : Если установить опцию Случайное рассеивание (Random Seed ), то можно выбрать определенный случайный набор сгенерированных чисел. Например, установив эту опцию равной 25, можно сгенерировать на разных компьютерах одни и те же наборы случайных чисел (если, конечно, другие параметры распределения совпадают). Значение опции может принимать целые значения от 1 до 32 767. Название опции Случайное рассеивание может запутать. Лучше было бы ее перевести как Номер набора со случайными числами .

В итоге будем иметь 3 столбца чисел, на основании которых можно, оценить параметры распределения, из которого была произведена выборка: μ и σ. Оценку для μ можно сделать с использованием функции СРЗНАЧ() , а для σ – с использованием функции СТАНДОТКЛОН.В() , см. файл примера лист Генерация .

Примечание : Для генерирования массива чисел, распределенных по нормальному закону , можно использовать формулу =НОРМ.ОБР(СЛЧИС();μ;σ) . Функция СЛЧИС() генерирует от 0 до 1, что как раз соответствует диапазону изменения вероятности (см. файл примера лист Генерация ).

Задачи

Задача1 . Компания изготавливает нейлоновые нити со средней прочностью 41 МПа и стандартным отклонением 2 МПа. Потребитель хочет приобрести нити с прочностью не менее 36 МПа. Рассчитайте вероятность, что партии нити, изготовленные компанией для потребителя, будут соответствовать требованиям или превышать их.
Решение1 : =1-НОРМ.РАСП(36;41;2;ИСТИНА)

Задача2 . Предприятие изготавливает трубы, средний внешний диаметр которых равен 20,20 мм, а стандартное отклонение равно 0,25мм. Согласно техническим условиям, трубы признаются годными, если диаметр находится в пределах 20,00+/- 0,40 мм. Какая доля изготовленных труб соответствует ТУ?
Решение2 : = НОРМ.РАСП(20,00+0,40;20,20;0,25;ИСТИНА)- НОРМ.РАСП(20,00-0,40;20,20;0,25)
На рисунке ниже, выделена область значений диаметров, которая удовлетворяет требованиям спецификации.

Решение приведено в файле примера лист Задачи .

Задача3 . Предприятие изготавливает трубы, средний внешний диаметр которых равен 20,20 мм, а стандартное отклонение равно 0,25мм. Внешний диаметр не должен превышать определенное значение (предполагается, что нижняя граница не важна). Какую верхнюю границу в технических условиях необходимо установить, чтобы ей соответствовало 97,5% всех изготавливаемых изделий?
Решение3 : =НОРМ.ОБР(0,975; 20,20; 0,25) =20,6899 или
=НОРМ.СТ.ОБР(0,975)*0,25+20,2 (произведена «дестандартизация», см. выше)

Задача 4 . Нахождение параметров нормального распределения по значениям 2-х (или ).
Предположим, известно, что случайная величина имеет нормальное распределение, но не известны его параметры, а только 2-я процентиля (например, 0,5-процентиль , т.е. медиана и 0,95-я процентиль ). Т.к. известна , то мы знаем , т.е. μ. Чтобы найти нужно использовать .
Решение приведено в файле примера лист Задачи .

Примечание : До MS EXCEL 2010 в EXCEL были функции НОРМОБР() и НОРМСТОБР() , которые эквивалентны НОРМ.ОБР() и НОРМ.СТ.ОБР() . НОРМОБР() и НОРМСТОБР() оставлены в MS EXCEL 2010 и выше только для совместимости.

Линейные комбинации нормально распределенных случайных величин

Известно, что линейная комбинация нормально распределённых случайных величин x (i ) с параметрами μ(i ) и σ(i ) также распределена нормально. Например, если случайная величина Y=x(1)+x(2), то Y будет иметь распределение с параметрами μ(1)+ μ(2) и КОРЕНЬ(σ(1)^2+ σ(2)^2). Убедимся в этом с помощью MS EXCEL.

Краткая теория

Нормальным называют распределение вероятностей непрерывной случайной величины , плотность которого имеет вид:

где – математическое ожидание , – среднее квадратическое отклонение .

Вероятность того, что примет значение, принадлежащее интервалу :

где – функция Лапласа :

Вероятность того, что абсолютная величина отклонения меньше положительного числа :

В частности, при справедливо равенство:

При решении задач, которые выдвигает практика, приходится сталкиваться с различными распределениями непрерывных случайных величин .

Кроме нормального распределения, основные законы распределения непрерывных случайных величин:

Пример решения задачи

На станке изготавливается деталь. Ее длина - случайная величина, распределенная по нормальному закону с параметрами , . Найти вероятность того, что длина детали будет заключена между 22 и 24,2 см. Какое отклонение длины детали от можно гарантировать с вероятностью 0,92; 0,98? В каких пределах, симметричных относительно , будут лежать практически все размеры деталей?

Решение:

Вероятность того, что случайная величина, распределенная по нормальному закону, будет находиться в интервале :

Получаем:

Вероятность того, что случайная величина, распределенная по нормальному закону, отклонится от среднего не более чем на величину .

Закон нормального распределения вероятностей непрерывной случайной величины занимает особое место среди различных теоретических законов, т. к. является основным во многих практических исследованиях. Им описывается большинство случайных явлений, связанных с производственными процессами.

К случайным явлениям, подчиняющимся нормальному закону распределения, относятся ошибки измерений производственных параметров, распределение технологических погрешностей изготовления, рост и вес большинства биологических объектов и др.

Нормальным называют закон распределения вероятностей непрерывной случайной величины, который описывается дифференциальной функцией

a - математическое ожидание случайной величины;

Среднее квадратичное отклонение нормального распределения.

График дифференциальной функции нормального распределения называют нормальной кривой (кривой Гаусса) (рис.7).

Рис. 7 Кривая Гаусса

Свойства нормальной кривой (кривой Гаусса):

1. кривая симметрична относительно прямой x = a;

2. нормальная кривая расположена над осью X, т. е. при всех значениях X функция f(x) всегда положительна;

3. ось ox является горизонтальной асимптотой графика, т. к.

4. при x = a функция f(x) имеет максимум равный

,

в точках A и B при и кривая имеет точки перегиба, ординаты которых равны.

При этом, вероятность того, что абсолютная величина отклонения случайной величины, распределенной нормально, от ее математического ожидания не превысит среднего квадратичного отклонения , равна 0,6826.

в точках E и G, при и , значение функции f(x) равно

а вероятность того, что абсолютная величина отклонения случайной величины, распределенной нормально, от ее математического ожидания не превысит удвоенного среднего квадратичного отклонения, равна 0,9544.

Асимптотически приближаясь к оси абсцисс, кривая Гаусса в точках C и D, при и , очень близко подходит к оси абсцисс. В этих точках значение функции f(x) очень мало

а вероятность того, что абсолютная величина отклонения случайной величины, распределенной нормально, от ее математического ожидания не превысит утроенного среднего квадратичного отклонения, равна 0,9973. Это свойство кривой Гаусса называется "правило трех сигм ".



Если случайная величина распределена нормально, то абсолютная величина ее отклонения от математического ожидания не превосходит утроенного среднего квадратического отклонения.

Изменение величины параметра a (математического ожидания случайной величины) не изменяет форму нормальной кривой, а приводит лишь к ее смещению вдоль оси X: вправо, если a возрастает, и влево, если a убывает.

При a=0 нормальная кривая симметрична относительно оси ординат.

Изменение величины параметра (среднего квадратичного отклонения) изменяет форму нормальной кривой: с возрастанием ординаты нормальной кривой убывают, кривая растягивается вдоль оси X и прижимается к ней. При убывании ординаты нормальной кривой увеличиваются, кривая сжимается вдоль оси X и становится более "островершинной".

При этом, при любых значениях и площадь ограниченная нормальной кривой и осью X, остается равной единице (т. е. вероятность того, что случайная величина, распределенная нормально, примет значение ограниченное на оси X нормальной кривой, равна 1).

Нормальное распределение с произвольными параметрами и , т. е. описываемое дифференциальной функцией

называется общим нормальным распределением .

Нормальное распределение с параметрами и называется нормированным распределением (рис. 8). В нормированном распределении дифференциальная функция распределения равна:

Рис. 8 Нормированная кривая

Интегральная функция общего нормального распределения имеет вид:

Пусть случайная величина X распределена по нормальному закону в интервале (c, d). Тогда вероятность того, что X примет значение, принадлежащее интервалу (c, d) равна

Пример. Случайная величина X распределена по нормальному закону. Математическое ожидание и среднее квадратичное отклонение этой случайной величины равны a=30 и . Найти вероятность того, что X примет значение в интервале (10, 50).

По условию: . Тогда

Пользуясь готовыми таблицами Лапласа (см. приложение 3), имеем.

(вещественный, строго положительный)

Норма́льное распределе́ние , также называемое распределением Гаусса или Гаусса - Лапласа - распределение вероятностей , которое в одномерном случае задаётся функцией плотности вероятности , совпадающей с функцией Гаусса :

f (x) = 1 σ 2 π e − (x − μ) 2 2 σ 2 , {\displaystyle f(x)={\frac {1}{\sigma {\sqrt {2\pi }}}}\;e^{-{\frac {(x-\mu)^{2}}{2\sigma ^{2}}}},}

где параметр μ - математическое ожидание (среднее значение), медиана и мода распределения, а параметр σ - среднеквадратическое отклонение ( σ  ² - дисперсия) распределения.

Таким образом, одномерное нормальное распределение является двухпараметрическим семейством распределений. Многомерный случай описан в статье «Многомерное нормальное распределение ».

Стандартным нормальным распределением называется нормальное распределение с математическим ожиданием μ = 0 и стандартным отклонением σ = 1 .

Энциклопедичный YouTube

  • 1 / 5

    Важное значение нормального распределения во многих областях науки (например, в математической статистике и статистической физике) вытекает из центральной предельной теоремы теории вероятностей . Если результат наблюдения является суммой многих случайных слабо взаимозависимых величин, каждая из которых вносит малый вклад относительно общей суммы, то при увеличении числа слагаемых распределение центрированного и нормированного результата стремится к нормальному. Этот закон теории вероятностей имеет следствием широкое распространение нормального распределения, что и стало одной из причин его наименования.

    Свойства

    Моменты

    Если случайные величины X 1 {\displaystyle X_{1}} и X 2 {\displaystyle X_{2}} независимы и имеют нормальное распределение с математическими ожиданиями μ 1 {\displaystyle \mu _{1}} и μ 2 {\displaystyle \mu _{2}} и дисперсиями σ 1 2 {\displaystyle \sigma _{1}^{2}} и σ 2 2 {\displaystyle \sigma _{2}^{2}} соответственно, то X 1 + X 2 {\displaystyle X_{1}+X_{2}} также имеет нормальное распределение с математическим ожиданием μ 1 + μ 2 {\displaystyle \mu _{1}+\mu _{2}} и дисперсией σ 1 2 + σ 2 2 . {\displaystyle \sigma _{1}^{2}+\sigma _{2}^{2}.} Отсюда вытекает, что нормальная случайная величина представима как сумма произвольного числа независимых нормальных случайных величин.

    Максимальная энтропия

    Нормальное распределение имеет максимальную дифференциальную энтропию среди всех непрерывных распределений, дисперсия которых не превышает заданную величину .

    Моделирование нормальных псевдослучайных величин

    Простейшие приближённые методы моделирования основываются на центральной предельной теореме . Именно, если сложить несколько независимых одинаково распределённых величин с конечной дисперсией , то сумма будет распределена приблизительно нормально. Например, если сложить 100 независимых стандартно равномерно  распределённых случайных величин, то распределение суммы будет приближённо нормальным .

    Для программного генерирования нормально распределённых псевдослучайных величин предпочтительнее использовать преобразование Бокса - Мюллера . Оно позволяет генерировать одну нормально распределённую величину на базе одной равномерно распределённой.

    Нормальное распределение в природе и приложениях

    Нормальное распределение часто встречается в природе. Например, следующие случайные величины хорошо моделируются нормальным распределением:

    • отклонение при стрельбе.
    • погрешности измерений (однако погрешности некоторых измерительных приборов имеют не нормальные распределения).
    • некоторые характеристики живых организмов в популяции.

    Такое широкое распространение этого распределения связано с тем, что оно является бесконечно делимым непрерывным распределением с конечной дисперсией. Поэтому к нему в пределе приближаются некоторые другие, например, биномиальное и пуассоновское . Этим распределением моделируются многие не детерминированные физические процессы.

    Связь с другими распределениями

    • Нормальное распределение является распределением Пирсона типа XI .
    • Отношение пары независимых стандартных нормально распределенных случайных величин имеет распределение Коши . То есть, если случайная величина X {\displaystyle X} представляет собой отношение X = Y / Z {\displaystyle X=Y/Z} (где Y {\displaystyle Y} и Z {\displaystyle Z} - независимые стандартные нормальные случайные величины), то она будет обладать распределением Коши.
    • Если z 1 , … , z k {\displaystyle z_{1},\ldots ,z_{k}} - совместно независимые стандартные нормальные случайные величины, то есть z i ∼ N (0 , 1) {\displaystyle z_{i}\sim N\left(0,1\right)} , то случайная величина x = z 1 2 + … + z k 2 {\displaystyle x=z_{1}^{2}+\ldots +z_{k}^{2}} имеет распределение хи-квадрат с k степенями свободы.
    • Если случайная величина X {\displaystyle X} подчинена логнормальному распределению , то её натуральный логарифм имеет нормальное распределение. То есть, если X ∼ L o g N (μ , σ 2) {\displaystyle X\sim \mathrm {LogN} \left(\mu ,\sigma ^{2}\right)} , то Y = ln ⁡ (X) ∼ N (μ , σ 2) {\displaystyle Y=\ln \left(X\right)\sim \mathrm {N} \left(\mu ,\sigma ^{2}\right)} . И наоборот, если Y ∼ N (μ , σ 2) {\displaystyle Y\sim \mathrm {N} \left(\mu ,\sigma ^{2}\right)} , то X = exp ⁡ (Y) ∼ L o g N (μ , σ 2) {\displaystyle X=\exp \left(Y\right)\sim \mathrm {LogN} \left(\mu ,\sigma ^{2}\right)} .
    • Отношение квадратов двух стандартных нормальных случайных величин имеет имеет

    Случайной, если в результате опыта она может принимать действительные значения с определёнными вероятностями. Наиболее полной, исчерпывающей характеристикой случайной величины является закон распределения. Закон распределения – функция (таблица, график, формула), позволяющая определять вероятность того, что случайная величина Х принимает определеное значение хi или попадает в некоторый интервал. Если случайная величина имеет данный закон распределения, то говорят, что она распределена по этому закону или подчиняется этому закону распределения.

    Каждый закон распределения – это некоторая функция, полностью описывающая случайную величину с вероятностной точки зрения. На практике о распределении вероятностей случайной величины Х часто приходится судить только по результатам испытаний.

    Нормальное распределение

    Нормальное распределение , также называемое распределением Гаусса, - распределение вероятностей, которое играет важнейшую роль во многих областях знаний, особенно в физике. Физическая величина подчиняется нормальному распределению, когда она подвержена влиянию огромного числа случайных помех. Ясно, что такая ситуация крайне распространена, поэтому можно сказать, что из всех распределений, в природе чаще всего встречается именно нормальное распределение - отсюда и произошло одно из его названий.

    Нормальное распределение зависит от двух параметров - смещения и масштаба, то есть, является, с математической точки зрения, не одним распределением, а целым их семейством. Значения параметров соответствуют значениям среднего (математического ожидания) и разброса (стандартного отклонения).

    Стандартным нормальным распределением называется нормальное распределение с математическим ожиданием 0 и стандартным отклонением 1.

    Коэффициент асимметрии

    Коэффициент асимметрии положителен, если правый хвост распределения длиннее левого, и отрицателен в противном случае.

    Если распределение симметрично относительно математического ожидания, то его коэффициент асимметрии равен нулю.

    Выборочный коэффициент асимметрии используется для проверки распределения на симметричность, а также для грубой предварительной проверки на нормальность. Он позволяет отвергнуть, но не позволяет принять гипотезу нормальности.

    Коэффициент эксцесса

    Коэффициент эксцесса (коэффициент островершинности) - мера остроты пика распределения случайной величины.

    «Минус три» в конце формулы введено для того, чтобы коэффициент эксцесса нормального распределения был равен нулю. Он положителен, если пик распределения около математического ожидания острый, и отрицателен, если вершина гладкая.

    Моменты случайной величины

    Момент случайной величины - числовая характеристика распределения данной случайной величины.