Каким образом происходит восприятие звуков кратко. Слуховой анализатор. Механизм восприятия звуков разной частоты. Органы восприятия звука

Представляет собой сложный специализированный орган, состоящий из трех отделов: наружного, среднего и внутреннего уха.

Наружное ухо является звукоулавливающим аппаратом. Звуковые колебания улавливаются ушными раковинами и передаются по наружному слуховому проходу к барабанной перепонке, которая отделяет наружное ухо от среднего. Улавливание звука и весь процесс слушания двумя ушами, так называемый биниуральный слух, имеют значение для определения направления звука. Звуковые колебания, идущие сбоку, доходят до ближайшего уха на несколько десятичных долей секунды (0,0006 с) раньше, чем до другого. Этой предельно малой разницы во времени прихода звука к обоим ушам достаточно, чтобы определить его направление.

Среднее ухо представляет собой воздушную полость, которая через евстахиеву трубу соединяется с полостью носоглотки. Колебания от барабанной перепонки через среднее ухо передают 3 слуховые косточки, соединенные друг с другом, - молоточек, наковальня и стремечко, а последнее через перепонку овального окна передает эти колебания жидкости, находящейся во внутреннем ухе - перилимфе. Благодаря слуховым косточкам амплитуда колебаний уменьшается, а сила их увеличивается, что позволяет приводить в движение столб жидкости во внутреннем ухе. В среднем ухе имеется особый механизм адаптации к изменениям интенсивности звука. При сильных звуках специальные мышцы увеличивают натяжение барабанной перепонки и уменьшают подвижность стремечка. Тем самым снижается амплитуда колебаний, и внутреннее ухо предохраняется от повреждений.

Внутреннее ухо с расположенной в нем улиткой находится в пирамидке височной кости. Улитка у человека образует 2,5 спиральных витка. Улитковый канал разделен двумя перегородками (основной мембраной и вестибулярной мембраной) на 3 узких хода: верхний (вестибулярная лестница), средний (перепончатый канал) и нижний (барабанная лестница). На вершине улитки имеется отверстие, соединяющее верхний и нижний каналы в единый, идущий от овального окна к вершине улитки и далее к круглому окну. Полость их заполнена жидкостью - перилимфой, а полость среднего перепончатого канала заполнена жидкостью иного состава - эндолимфой. В среднем канале расположен звуковоспринимающий аппарат - кортиев орган, в котором находятся рецепторы звуковых колебаний - волосковые клетки.

Механизм восприятия звука. Физиологический механизм восприятия звука основан на двух процессах, происходящих в улитке: 1) разделение звуков различной частоты по месту их наибольшего воздействия на основную мембрану улитки и 2) преобразование рецепторными клетками механических колебаний в нервное возбуждение. Звуковые колебания, поступающие во внутреннее ухо через овальное окно, передаются перилимфе, а колебания этой жидкости приводят к смещениям основной мембраны. От высоты звука зависит высота столба колеблющейся жидкости и, соответственно, место наибольшего смещения основной мембраны. Таким образом, при различных по высоте звуках возбуждаются разные волосковые клетки и разные нервные волокна. Увеличение силы звука приводит к увеличению числа возбужденных волосковых клеток и нервных волокон, что позволяет различать интенсивность звуковых колебаний.
Преобразование колебаний в процесс возбуждения осуществляется специальными рецепторами - волосковыми клетками. Волоски этих клеток погружены в покровную мембрану. Механические колебания при действии звука приводят к смещению покровной мембраны относительно рецепторных клеток и изгибанию волосков. В рецепторных клетках механическое смещение волосков вызывает процесс возбуждений.

Проводимость звука. Различают воздушную и костную проводимость. В обычных условиях у человека преобладает воздушная проводимость: звуковые волны улавливаются наружным ухом, и воздушные колебания передаются через наружный слуховой проход в среднее и внутреннее ухо. В случае костной проводимости звуковые колебания передаются через кости черепа непосредственно улитке. Этот механизм передачи звуковых колебаний имеет значение при погружениях человека под воду.
Человек обычно воспринимает звуки с частотой от 15 до 20 000 Гц (в диапазоне 10-11 октав). У детей верхний предел достигает 22 000 Гц, с возрастом он понижается. Наиболее высокая чувствительность обнаружена в области частот от 1000 до 3000 Гц. Эта область соответствует наиболее часто встречающимся частотам человеческой речи и музыки.

Процесс восприятия нами звуков зависит от качества поступающей звуковой информации и от состояния нашей психики.

О звуках и том, что мы слышим.

Звук можно представить как волновое уплотнение среды, перемещающееся прямолинейно от источника колебаний с определенной скоростью. С расстоянием волна теряет свою «уплотненность», постепенно угасая. Угасание звука обратно пропорционально квадрату расстояния от источника звука. Скорость распространения звука в газах зависит от природы газа, плотности среды, температуры и статического атмосферного давления. Для жидких и газообразных сред – в основном от природы среды. Так, в воздухе эта величина составляет от 330 до 345 м/с при изменении температуры от 0 до 200С, в воде – около 1500 м/с, в стали – 6000 м/с.

В статье о строении слухового анализатора описан основной механизм восприятия звуков органами слуха через наружное и среднее ухо и преобразования звуковых волн в электрические импульсы во внутреннем ухе. Кроме воздушного пути проведения звука к рецепторным клеткам внутреннего уха, существует ещё и костный путь восприятия звука, так как звуковые волны не только попадают в наружный слуховой проход, но и приводят в колебание кости черепа. Этот механизм важен для понимания, почему мы слышим звук собственного голоса искажённым. При костном проведении звука лишь высокие звуки с малой амплитудой колебаний достигают рецепторных клеток, поэтому мы слышим свой голос более высоким, чем его слышат окружающие.

Существует также микроволновый слуховой эффект, заключающийся в слуховом восприятии микроволнового излучения. При воздействии импульсного или модулированного микроволнового излучения восприятие звуков возникает непосредственно внутри черепа человека. В ходе этого процесса возникают ударные волны, воспринимаемые человеком как звуковая информация, которая больше никому не слышна. Также было обнаружено, что при соответствующем выборе модулирующего сигнала существует возможность через микроволновое излучение передавать человеку звуковую информацию в виде отдельных слов или фраз.

Избирательность слуховых ощущений звуковой информации.

Звуки, которые мы слышим, – это раскодированная мозгом звуковая информация, преобразованная в субъективные звуковые представления или образы. Звуки, которые доносятся до нас, можно измерить и объективно описать, но восприятие звука – индивидуально и избирательно.Оно зависит не только от качества работы нашего слухового анализатора, но и психологического состояния, настроения, текущих потребностей.

Обычно мы не слышим, как тикают часы или шумит вентилятор, мы можем не слышать разговор людей, находящихся рядом, если заняты интересующим нас делом. Но, прислушавшись, расслышим и собственное дыхание. Не раздражающие нас громкие звуки проходят «мимо наших ушей», а интересные и важные, даже очень тихие, могут вызвать серьёзный эмоциональный отклик. Наш слуховой аппарат чрезвычайно избирателен для звуковой информации. Такое субъективное восприятие звуков происходит благодаря своеобразному входному фильтру головного мозга, тормозящему восприятие звуков, ненужных нам. Фильтрация звуков, отсеивающая бесполезный «спам», позволяет нам выделять действительно важную в данный момент информацию.

Однако фильтрация звуковой информации без участия сознания имеет и оборотную сторону. Некоторые звуковые структуры с низкими частотами и медленными ритмами обладают воздействием глубокой мышечной или умственной релаксации. Восприятие звуков такой музыки и ритмов способно также создавать условия для мобилизации тела без обычного воздействия на него сознательного контроля. Например, известно с древности, что ритм барабана помогает солдатам тупо ходить даже при большой усталости. Подобная звуковая информация используется для усиления эффекта внушения шаманами, гипнотизёрами или психотерапевтами.

Преобразование поступающих к нам звуковых волн в звуковую информацию производится в слуховом анализаторе, причём конечная обработка поступающих сигналов может делаться в нескольких слуховых центрах головного мозга, обменивающихся информацией с другими важными центрами, прежде всего, двигательным центром и центром зрения. Возможно также использование при слуховом восприятии звуковой информации, хранящейся в памяти, для сравнения и идентификации нового звукового представления.

Определение направления звукового раздражителя.

Чтобы понять, откуда поступает звуковая информация, крокодил должен повернуть тело, кошке достаточно развернуть уши, а человеку вообще не нужно делать никаких движений.

Человек обладает стереофоническим восприятием звука, определяя горизонтальное направление звука двумя основными способами: по задержке во времени между входом звука в одно ухо и его входом во второе и по разнице между интенсивностью звуков в обоих ушах. Первый механизм восприятия звука лучше всего функционирует при частотах ниже 3000 герц (Гц), а второй механизм- при более высоких частотах, поскольку голова при этих частотах является более существенным барьером для звуковой информации.

Если человек смотрит прямо на источник звука, звуковая информация достигает обоих ушей одновременно, но если одно ухо ближе к раздражителю, чем другое, звуковые сигналы от первого уха входят в мозг на несколько микросекунд раньше звуковой информации от второго.

Различение находится ли источник звука впереди или позади человека, а также сверху или снизу достигается главным образом с помощью изощрённой формы ушных раковин, которая изменяет интенсивность звука, входящего в ухо, в зависимости от направления, откуда он идет.

Психоакустика - область науки, которая изучает слуховые ощущения человека при воздействии звука на уши.

Люди, обладающие абсолютным (аналитическим) музыкальным слухом, с высокой точностью определяют высоту, громкость и тембр звука, способны запоминать звучание инструментов и распознавать их через некоторое время. Они могут правильно проанализировать прослушанное, правильно выделить отдельные инструменты.

Люди, не обладающие абсолютным слухом, могут определить ритм, тембр, тональность, но правильно произвести анализ прослушанного материала для них затруднительно.

При прослушивании высококачественной аудиоаппаратуры, как правило, мнения экспертов расходятся. Одни предпочитают высокую прозрачность и верность передачи каждого обертона, их раздражает отсутствие детализованности звучания. Другие предпочитают звучание размытого, нечеткого характера, быстро устают от изобилия подробностей в музыкальном образе. Кто-то заостряет внимание на гармонии в звучании, кто-то на спектральном балансе, а кто-то - на динамическом диапазоне. Оказывается, все зависит от типохарактера индивида Типохарактеры людей подразделяются на следующие дихотомии (парные классы): сенсорную и интуитивную, думающую и чувствующую, экстравертную и интровертную, решающую и воспринимающую .

Люди с сенсорной доминантой обладают четкой дикцией, великолепно воспринимают все нюансы речевого или музыкального образа. Для них чрезвычайно важна прозрачность звучания, когда четко выделяются все звучащие инструменты

Слушатели с интуитивной доминантой предпочитают размытый музыкальный образ, придают исключительно важное значение сбалансированности звучания всех музыкальных инструментов.

Слушатели с думающей доминантой предпочитают музыкальные произведения с высоким динамическим диапазоном, с четко обозначенной мажорной и минорной доминантой, с выраженным смыслом и структурой произведения

Люди с чувствующей доминантой придают большое значение гармоничности в музыкальных произведениях, предпочитают произведения с небольшими отклонениями мажорности и минорности от нейтрального значения, т.е. «музыку для души».

Слушатель с экстравертной доминантой успешно выделяет сигнал из шума, предпочитает слушать музыку с высоким уровнем громкости, мажорность или минорность музыкального произведения определяет по частотному положению музыкального образа в данный момент.

Люди с интровертной доминантой значительное внимание уделяют внутренней структуре музыкального образа, мажорность-минорность оценивают, в том числе, и по смещению частоты одной из гармоник в возникающих резонансах, посторонние шумы затрудняют восприятие аудиоинформации.

Люди с решающей доминантой предпочитают в музыке закономерность, наличие внутренней периодичности.

Слушатели с воспринимающей доминантой предпочитают в музыке импровизацию.

Каждый по себе знает, что одна и та же музыка на одной и той же аппаратуре и в одном и том же помещении не всегда воспринимается одинаково. Вероятно, в зависимости от психоэмоционального состояния наши чувства то притупляются, то обостряются.

С другой стороны, излишняя детализованность и натуральность звучания может раздражать усталого и обремененного заботами слушателя с сенсорной доминантой, что в таком состоянии он предпочтет музыку размытую и мягкую, грубо говоря, предпочтет слушать живые инструменты в шапке-ушанке.

В какой-то степени на качество звука оказывает влияние «качество» напряжения сети, которое в свою очередь зависит как от дня недели, так и от времени суток (в часы пиковой нагрузки напряжение сети наиболее «загрязнено»). От времени суток зависит и уровень шума в помещении, а значит и реальный динамический диапазон.

О влиянии окружающего шума хорошо запомнился случай 20-летней давности. Поздно вечером после деревенской свадьбы молодежь осталась помочь убрать со столов и перемыть посуду. Музыка была организована во дворе: электробаян с двухканальным усилителем и двумя колонками, четырехканальный усилитель мощности по схеме Шушурина, на вход которого был подключен электробаян, а на выходы - две 3-полосные и две 2-полосные акустические системы. Магнитофон с записями, выполненными на 19 скорости со встречно-параллельным подмагничиванием. Около 2-х часов ночи, когда все освободились, молодежь собралась во дворе и попросила включить что-нибудь для души. Каково же было удивление музыкантов и присутствующих меломанов, когда зазвучало попурри на темы Битлс в исполнении группы STARS on 45. Для слуха, адаптированного к восприятию музыки в атмосфере повышенной зашумленности, звучание в ночной тишине стало удивительно чистым и нюансированным.

Восприятие по частоте

Человеческое ухо воспринимает колебательный процесс как звук только в том случае, если частота его колебаний находится в пределах от 16...20 Гц до 16...20 кГц. При частоте ниже 20 Гц колебания называют инфразвуковыми, выше 20 кГц - ультразвуковыми. Звуки с частотой ниже 40 Гц в музыке встречаются редко, а в разговорной речи и вовсе отсутствуют. Восприятие высоких звуковых частот сильно зависит как от индивидуальных особенностей органов слуха, так и от возраста слушателя. Так, например, в возрасте до 18 лет звуки частотой 14 кГц слышат около 100%, в то время как в возрасте 50...60 лет - только 20% слушателей. Звуки частотой 18 кГц к 18 годам слышит около 60%, а к 40...50 годам - всего 10% слушателей. Но это вовсе не означает, что для людей пожилого возраста снижаются требования к качеству тракта звуковоспроизведения. Экспериментально установлено, что люди, едва воспринимающие сигналы частотой 12 кГц, очень легко распознают недостаток верхних частот в фонограмме.

Разрешающая способность слуха к изменению частоты около 0,3%. Например два тона 1000 и 1003 Гц, следующих один за другим, можно различить без приборов. А по биениям частот двух тонов человек может обнаружить разность частот до десятых долей герца. В то же время трудно различить на слух отклонение скорости воспроизведения музыкальной фонограммы в пределах ±2%.

Субъективный масштаб восприятия звука по частоте близок к логарифмическому закону. Исходя из этого, все частотные характеристики устройств передачи звука строят в логарифмическом масштабе. Степень точности, с которой человек определяет высоту звука на слух, зависит от остроты, музыкальности и тренированности его слуха, а также от интенсивности звука. При больших уровнях громкости звуки большей интенсивности кажутся ниже, чем слабые.

При длительном воздействии интенсивного звука чувствительность слуха постепенно снижается и тем больше, чем выше громкость звука, что связано с реакцией слуха на перегрузку, т.е. с естественной его адаптацией. По истечении определенного времени чувствительность восстанавливается. Систематическое и длительное прослушивание музыки с высоким уровнем громкости вызывает необратимые изменения в органах слуха, особенно страдает молодежь, пользующаяся наушниками (головными телефонами).

Важной характеристикой звука является тембр. Способность слуха различать его оттенки позволяет различать многообразие музыкальных инструментов и голосов. Благодаря тембральной окраске их звучание становится многокрасочным и легко узнаваемым. Условием правильной передачи тембра является неискаженная передача спектра сигнала - совокупности синусоидальных составляющих сложного сигнала (обертонов). Обертоны кратны частоте основного тона и меньше его по амплитуде. От состава обертонов и их интенсивности зависит тембр звука.

Тембр звука живых инструментов в значительной степени зависит от интенсивности звукоизвлечения. Например, одна и та же нота, сыгранная на фортепьяно легким нажатием пальца, и резким, имеет разные атаки и спектры сигнала. Даже не тренированный человек легко улавливает эмоциональное различие двух таких звуков по их атаке, даже если они переданы слушателю с помощью микрофона и уравновешены по громкости. Атака звука - это начальная стадия, специфический переходной процесс, в течение которого устанавливаются стабильные характеристики: громкость, тембр, высота звука. Длительность атаки звука разных инструментов колеблется в пределах 0...60 мс. Например, у ударных инструментов она находится в пределах 0...20 мс, у фагота - 20...60 мс. Характеристики атаки инструмента сильно зависят от манеры и техники игры музыканта. Именно эти особенности инструментов позволяют передать эмоциональное содержание музыкального произведения.

Тембр звука источника сигнала, находящегося на расстоянии от слушателя менее 3 м, воспринимается более «тяжелым». Удаление источника сигнала от 3 до 10 м сопровождается пропорциональным уменьшением громкости, при этом тембр становится более ярким. С дальнейшим удалением источника сигнала потери энергии в воздухе растут пропорционально квадрату частоты и имеют сложную зависимость от относительной влажности воздуха. Потери энергии ВЧ-составляющих максимальны при относительной влажности в пределах от 8 до 30...40% и минимальны при 80% (рис. 1.1) . Увеличение потерь обертонов приводит к снижению тембральной яркости.

Восприятие по амплитуде

Кривые равной громкости от порога слышимости до порога болевого ощущения для бинаурального и моноурального слушания приведены на рис. 1.2.а,б, соответственно . Восприятие по амплитуде зависит от частоты и имеет значительный разброс, связанный с возрастными изменениями.

Чувствительность слуха к интенсивности звука носит дискретный характер. Порог ощущения изменения интенсивности звука зависит как от частоты, так и от громкости звука (на высоких и средних уровнях составляет 0,2...0,6 дБ, на низких уровнях доходит до нескольких децибел) и в среднем меньше 1 дБ.

Эффект Хааса (Haas)

Слуховому аппарату, как и любой другой колебательной системе, свойственна инерционность. Благодаря этому свойству короткие звуки длительностью до 20 мс воспринимаются более тихими, чем звуки длительностью более 150 мс. Одно из проявлений инерционности -

неспособность человека выявлять искажения в импульсах длительностью менее 20 мс. В случае прихода к ушам 2-х одинаковых сигналов, с временным интервалом между ними 5...40 мс, слух воспринимает их как один сигнал, при интервале более 40...50 мс - раздельно.

Эффект маскировки

Ночью, в условиях тишины, слышны писк комара, тиканье часов и другие тихие звуки, а в условиях шума трудно разобрать громкую речь собеседника. В реальных условиях акустический сигнал не существует в абсолютной тишине. Посторонние шумы, неизбежно присутствующие в месте прослушивания, маскируют в определенной мере основной сигнал и затрудняют его восприятие. Повышение порога слышимости одного тона (или сигнала) при одновременном воздействии другого тона (шума или сигнала) называют маскировкой.

Экспериментально установлено, что тон любой частоты маскируется более низкими тонами значительно эффективнее, чем более высокими, иными словами, низкочастотные тоны сильнее маскируют высокочастотные, чем наоборот. Например, при одновременном воспроизведении звуков 440 и 1200 Гц с одинаковой интенсивностью, мы будем слышать только тон частотой 440 Гц и только выключив его, услышим тон частотой 1200 Гц. Степень маскировки зависит от соотношения частот и носит сложный характер, связанный с кривыми равной громкости (рис. 1.3.α и 1.3.6) .

Чем больше соотношение частот, тем меньше эффект маскировки. Это в значительной степени объясняет феномен «транзисторного» звучания. Спектр нелинейных искажений транзисторных усилителей простирается вплоть до 11 гармоники, в то время как спектр ламповых усилителей ограничивается 3...5 гармоникой. Кривые маскировки узкополосным шумом для тонов разных частот и уровней их интенсивности имеют разный характер. Четкое восприятие звука возможно в том случае, если его интенсивность превышает определенный порог слышимости. На частотах 500 Гц и ниже превышение интенсивности сигнала должно быть около 20 дБ, на частоте 5 кГц - около 30 дБ, а

на частоте 10 кГц - 35 дБ. Эту особенность слухового восприятия учитывают при записи на носители звука. Так, если отношение сигнал/шум аналоговой грампластинки около 60...65 дБ, то динамический диапазон записанной программы может быть не более 45...48 дБ.

Эффект маскировки оказывает влияние на субъективно воспринимаемую громкость звука. Если составляющие сложного звука расположены по частоте близко друг к другу и наблюдается их взаимная маскировка, то громкость такого сложного звука будет меньше громкостей его составляющих.

Если несколько тонов расположены по частоте настолько далеко, что их взаимной маскировкой можно пренебречь, то их суммарная, громкость будет равна сумме громкостей каждой из составляющих.

Достижение «прозрачности» звучания всех инструментов оркестра или эстрадного ансамбля является сложной задачей, которая решается звукорежиссером - умышленным выделением наиболее важных в данном месте произведения инструментов и другими специальными приемами.

Бинауральный эффект

Способность человека определять направление источника звука (благодаря наличию двух ушей) называется бинауральным эффектом . К уху, расположенному ближе к источнику звука, звук приходит раньше, чем ко второму уху, а значит, различается по фазе и амплитуде. При слушании реального источника сигнала бинауральные сигналы (т.е. сигналы, приходящие к правому и левому уху) статистически связаны между собой (коррелированны). Точность локализации источника звука зависит как от частоты, так и от его местонахождения (спереди или сзади слушателя). Дополнительную информацию о расположении источника звука (спереди, сзади, сверху) орган слуха получает, анализируя особенности спектра бинауральных сигналов.

До 150...300 Гц человеческий слух обладает очень малой направленностью. На частотах 300...2000 Гц, для которых длина полуволны сигнала соизмерима с «межушным» расстоянием, равным 20...25 см, существенны фазовые различия. Начиная с частоты 2 кГц направленность слуха резко убывает. На высших частотах большее значение приобретает разность амплитуд сигналов. Когда разница в амплитудах превышает пороговое значение, равное 1 дБ, то кажется, что источник звука находится на той стороне, где амплитуда больше.

При асимметричном расположении слушателя относительно громкоговорителей возникают дополнительные интенсивностные и временные разносы, которые приводят к пространственным искажениям. Причем, чем дальше КИЗ (кажущийся источник звука) от центра базы (ΔL > 7 дБ или Δτ > 0,8 мс), тем меньше они подвержены искажениям. При ΔL > 20 дБ, Δτ > 3...5 мс КИЗ превращаются в действительные (громкоговорители) и не подвержены пространственным искажениям.

Экспериментально установлено, что пространственные искажения отсутствуют (незаметны), если полоса частот каждого канала сверху ограничена частотой не менее 10 кГц, а высокочастотная (выше 10 кГц) и низкочастотная (ниже 300 Гц) часть спектра этих сигналов воспроизводится монофонически.

Погрешность оценки азимута источника звука в горизонтальной плоскости спереди составляет 3...4°, сзади и в вертикальной плоскости - примерно 10... 15°, что объясняется экранирующим действием ушных раковин.

Рассмотрев теорию распространения и механизмы возникновения звуковых волн, целесообразно понять, каким образом звук "интерпретируется" или воспринимается человеком. За восприятие звуковых волн в человеческом организме отвечает парный орган - ухо. Человеческое ухо - весьма сложный орган, который отвечает за две функции: 1) воспринимает звуковые импульсы 2) выполняет роль вестибулярного аппарата всего человеческого организма, определяет положение тела в пространстве и даёт жизненно важную способность удерживать равновесие. Среднестатистическое человеческое ухо способно улавливать колебания 20 - 20000 Гц, однако бывают отклонения в большую или меньшую сторону. В идеале, слышимый частотный диапазон составляет 16 - 20000 Гц, что так же соответствует 16 м - 20 см длины волны. Ухо делится на три составляющие: внешнее, среднее и внутреннее ухо. Каждое из этих "отделов" выполняет свою собственную функцию, однако все три отдела тесно связаны друг с другом и фактически осуществляют передачу волны звуковых колебаний друг другу.

Внешнее (наружнее) ухо

Внешнее ухо состоит из ушной раковины и наружного слухового прохода. Ушная раковина - упругий хрящ сложной формы, покрытый кожей. В нижней части ушной раковины располагается мочка, которая состоит из жировой ткани и также покрыта кожей. Ушная раковина выполняет роль приёмника звуковых волн из окружающего пространства. Особая форма строения ушной раковины позволяет лучше улавливать звуки, в особенности звуки среднечастотного диапазона, отвечающего за передачу речевой информации. Этот факт во многом обусловлен эволюционной необходимостью, поскольку человек большую часть жизни проводит в устном общении с представителями своего вида. Ушная раковина человека практически неподвижна, в отличии от большого числа представителей животного вида, которые используют движения ушами для более точной настройки на источник звука.

Складки человеческой ушной раковины устроены таким образом, что вносят поправки (незначительные искажения) относительно вертикальной и горизонтальной локации источника звука в пространстве. Именно за счёт этой уникальной особенности человек способен достаточно чётко определять местоположение объекта в пространстве относительно него самого, ориентируясь только по звуку. Эта особенность так же хорошо известна под термином "локализация звука". Основная функция ушной раковины - уловить как можно больше звуков в слышимом диапазоне частот. Дальнейшая судьба "пойманых" звуковых волн решается в слуховом проходе, длина которого 25-30 мм. В нём хрящевая часть внешней ушной раковины переходит в костную, а кожная поверхность слухового прохода наделена сальными и серными железами. В конце слухового прохода располагается эластичная барабанная перепонка, до которой доходят колебания звуковых волн, вызывая тем самым её ответные колебания. Барабанная перепонка в свою очередь передаёт эти полученные вибрации в область среднего уха.

Среднее ухо

Колебания, переданные барабанной перепонкой, попадают в область среднего уха, называемой "барабанная область". Это область объёмом около одного кубического сантиметра, в которой расположены три слуховые косточки: молоточек, наковальня и стремечко. Именно эти "промежуточные" элементы выполняют важнейшую функцию: передача звуковых волн во внутреннее ухо и одновременное усиление. Слуховые косточки представляют собой чрезвычайно сложную цепочку передачи звучания. Все три косточки тесно соединены друг с другом, а так же с барабанной перепонкой, за счёт чего и происходит передача колебаний "по цепочке". На подходе к области внутреннего уха имеется окно преддверия, которое перекрывается основанием стремечка. Для выравнивания давления с двух сторон барабанной перепонки (например, в случае изменений внешнего давления), область среднего уха соединяется с носоглоткой посредством евстахиевой трубы. Всем нам хорошо знаком эффект закладывания ушей, который возникает именно по причине такой тонкой настройки. Из среднего уха звуковые колебания, уже усиленные, попадают в область внутреннего уха, наиболее сложную и чувствительную.

Внутреннее ухо

Наиболее сложную форму представляет внутреннее ухо, названное по этой причине лабиринтом. Костный лабиринт включает в себя: преддверие, улитку и полукружные каналы, а также вестибулярный аппарат , отвечающий за равновесие. Непосредственно к слуху в этой связке относится именно улитка. Улитка представляет собой спиралевидный перепончатый канал, заполненый лимфатической жидкостью. Внутри канал делится на две части ещё одной перепончатой перегородкой под названием "основная мембрана". Данная мембрана представляют собой волокна различной длины (общим количеством более 24000), натянутые как струны, каждая струна резонирует на свой определённый звук. Деление канала мембраной осуществляется на верхнюю и нижнюю лестницу, сообщающиеся у верхушки улитки. С противоположного конца канал соединяется с рецепторным аппаратом слухового анализатора, который покрыт мельчайшими волосковыми клетками. Этот аппарат слухового анализатора так же носит название "Кортиев орган". Когда колебания из среднего уха попадают в улитку, лимфатическая жидкость, заполняющая канал, также начинает вибрировать, передавая колебания основной мембране. В этот момент в действие вступает аппарат слухового анализатора, волосковые клетки которого, расположенные в несколько рядов, осуществляют превращение звуковых колебаний в электрические "нервные" импульсы, которые по слуховому нерву передаются в височную зону коры головного мозга. Таким сложным и витиеватым образом человек в конечном случае услышит искомый звук.

Особенности восприятия и формирования речи

Механизм речеобразования формировался у человека на протяжении всего эволюционного этапа. Смысл этой способности заключается в передачи вербальной и невербальной информации. Первая несёт в себе словесную и смысловую нагрузку, вторая отвечает за передачу эмоциональной составляющей. Процесс создания и восприятия речи включает в себя: формулировка сообщения; кодирование в элементы по правилам существующего языка; переходные нейромускульные действия; движения голосовых связок; излучение акустического сигнала; Далее в действие вступает слушатель, осуществляя: спектральный анализ полученного акустического сигнала и выделение акустических признаков в периферической слуховой системе, передача выделенных признаков по нейронным сетям, распознавание языкового кода (лингвистический анализ), понимание смысла сообщения.
Аппарат формирования речевых сигналов можно сравнить со сложным духовым инструментом, однако многогранность и гибкость настройки и возможности воспроизведения малейших тонкостей и деталей не имеет аналогов в природе. Голосообразующий механизм состоит из трёх неразрывных составляющих:

Генератор - лёгкие в качестве резервуара воздушного объёма. В лёгких запасается энергия избыточного давления, далее через выводящий канал при помощи мускульной системы осуществляется вывод этой энергии через трахею, соединённой с гортанью. На этом этапе воздушная струя прерывается и видоизменяется;
Вибратор - состоит из голосовых связок. Так же на поток воздействуют воздушные турбулентные струи (создают краевые тоны) и импульсные источники (взрывы);
Резонатор - включает резонансные полости сложной геометрической формы (глотка, ротовая и носовая полости).

В совокупности индивидуального устройства данных элементов формируется неповторимый и индивидуальный тембр голоса каждого человека в отдельности.

Генерация энергии воздушного столба осуществляется в легких, которые создают определённый поток воздуха при вдохе и выдохе за счет разницы атмосферного и внутрилегочного давления. Процесс накопления энергии осуществляется посредством вдоха, процесс освобождения характеизуется выдохом. Происходит это за счет сжатия и расширения грудной клетки, которые осуществляются с помощью двух групп мышц: межреберных и диафрагмы, при глубоком усиленном дыхании и пении сокращаются также мышцы брюшного пресса, груди и шеи. При вдохе диафрагма сжимается и опускается вниз, сокращение наружных межреберных мышц поднимает ребра и отводит их в стороны, а грудину вперед. Увеличение грудной клетки приводит к падению давления внутри лёгких (по отношению к атмосферному), и это пространство стремительно заполняется воздухом. При выдохе соответственно происходит расслабление мускул и всё возвращается в прежнее состояние (грудная клетка возвращается в исходное состояние за счёт своей собственной тяжести, диафрагма поднимается, уменьшается объём ранее расширившихся легких, давление внутрилёгочное растет). Вдох можно описать как процесс, требующий затраты энергии (активный); выдох – процесс накопления энергии (пассивный). Управление процессом дыхания и формирования речи происходит бессознательно, но при пении постановка дыхания требует осознанного подхода и длительного дополнительного обучения.

Количество энергии, которое впоследствии расходуется на формирование речи и голоса, зависит от объема запасенного воздуха и от величины дополнительного давления в легких. Максимально развиваемое давление у тренированного оперного певца может достигать 100-112 дБ. Модуляция воздушного потока вибрацией голосовых связок и создание подглоточного избыточного давления, эти процессы совершаются в гортани, которая представляет собой своеобразный клапан, расположенный на конце трахеи. Клапан выполняет двойственную функцию: предохраняет лёгкие от попадания посторонних предметов и поддерживает высокое давление. Именно гортань выступает в качестве источника речи и пения. Гортань представляет собой совокупность хрящей, соединённых мышцами. Гортань имеет достаточно сложное строение, главным элементом которой являются пара голосовых связок. Именно голосовые связки - основной (но не единственный) источник голосообразования или "вибратор". Во время этого процесса голосовые связки приходят в движение, сопровождаемое трением. Для защиты от этого выделяется особая слизистая секреция, выполняющая роль смазки. Образование речевых звуков определяется колебаниями связок, что приводит к формированию потока воздуха, выдыхаемого из легких, к определённому виду амплитудной характеристики. Между голосовыми складками располагаются небольшие полости, выполняющие роль акустических фильтров и резонаторов тогда, когда это требуется.

Особенности слухового восприятия, безопасность прослушивания, слуховые пороги, адаптация, правильный уровень громкости

Как видно из описания строения человеческого уха, орган этот весьма нежный и достаточно сложный по строению. Принимая этот факт во внимание, нетрудно определить, что этот чрезвычайно тонкий и чувствительный аппарат имеет набор ограничений, порогов и т.д. Человеческая слуховая система приспособлена к восприятию тихих звуков, а так же звуков средней интенсивности. Длительное воздействие громких звуков влечёт за собой необратимые сдвиги слуховых порогов, а так же прочие проблемы со слухом, вплоть до полной глухоты. Степень повреждения прямопропорциональна времени воздействия в громкой среде. В этот момент так же вступает в силу механизм адаптации - т.е. под действием длительных громких звуков чувствительность постепенно снижается, ощущаемая громкость уменьшается, слух адаптируется.

Адаптация изначально стремится защитить органы слуха от слишком громких звуков, однако, именно влияние этого процесса чаще всего заставляет человека неконтролируемо прибавлять уровень громкости аудиосистемы. Защита реализуется благодаря работы механизма среднего и внутреннего уха: стремечко отводится от овального окна, тем самым предохраняя от излишне громких звуков. Но механизм защиты не идеален и имеет задержку по времени, срабатывая только через 30-40 мс после начала поступления звука, притом полная защита не достигается ещё при длительности 150 мс. Механизм защиты активизуруется, когда уровень громкости переходит уровень 85 Дб, притом сама защита до 20 Дб.
Наиболее опасным, в данном случае, можно считать явление "сдвига слухового порога", что обычно происходит на практике в результате длительного воздействия громких звуков выше 90 Дб. Процесс восстановления слуховой системы после такого вредного воздействия может длиться до 16 часов. Сдвиг порогов начинается уже с уровня интенсивности 75 Дб, и увеличивается пропорционально с повышением уровня сигнала.

При рассмотрении проблемы правильного уровня звуковой интенсивности хуже всего осознавать тот факт, что проблемы (приобретённые или врождённые), связанные со слухом, практически не поддаются лечению в наш век достаточно развитой медицины. Всё это должно наводить любого здравомыслящего человека на мысли о бережном отношении к своему слуху, если конечно планируется сохранить его первозданную целостность и способность слышать весь частотный диапазон как можно дольше. К счастью, всё не так страшно, как может показаться на первый взгляд, и соблюдая ряд мер предосторожности можно легко сохранить слух даже в старости. Прежде чем рассматривать эти меры, необходимо вспомнить про одну важную особенность слухового восприятия человека. Слуховой аппарат воспринимает звуки нелинейно. Заключается подобное явление в следующем: если представить какую-то одну частоту чистого тона, например 300 Гц, то нелинейность проявляется при возникновении в ушной раковине обертонов этой основной частоты по логарифмическому принципу (если основную частоту принять за f, то обертоны частоты будут 2f, 3f и т.д. по возрастающей). Эта нелинейность так же проще для восприятия и знакома многим под названием "нелинейные искажения" . Поскольку в первоначальном чистом тоне таких гармоник (обертонов) не возникает, получается, что ухо само по себе вносит свои поправки и призвуки в первоначальное звучание, но определить их можно только в качестве субъективных искажений. При уровне интенсивности ниже 40 дБ субъективные искажения не возникают. При увеличении интенсивности с 40 дБ уровень субъективных гармоник начинает нарастать, однако ещё на уровне 80-90 дБ их негативный вклад в звучание относительно невелик (поэтому данный уровень интенсивности условно можно считать своеобразной "золотой серединой" в музыкальной сфере).

Основываясь на этой информации, можно без труда вывести безопасный и приемлимый уровень громкости, который не навредит слуховым органам и при этом даст возможность услышать абсолютно все особенности и детали звучания, например в случае работы с "hi-fi" системой. Этот уровень "золотой середины" составляет примерно 85-90 дБ. Именно при такой интенсивности звука реально услышать всё то, что заложено в аудиотракте, при этом риск преждевременного повреждения и снижения слуха сводится к минимуму. Практически полностью безопасным можно считать уровень громкости 85 дБ. Чтобы разобраться, в чём заключается опасность громкого прослушивания и почему слишком низкий уровень громкости не позволяет услышать всех нюансов звучания, рассмотрим этот вопрос подробнее. Что касается низких уровней громкости, то отсутствие целесообразности (но чаще субъективного желания) прослушивания музыки на низких уровнях обуславливается следующими причинами:

Нелинейность слухового восприятия человека;
Особенности психоакустического восприятия, которые будут рассмотрены отдельно.

Нелинейность слухового восприятия, рассмотренная выше, оказывает существенное влияние на любой громкости ниже 80 дБ. На практике это выглядит следующим образом: если включить музыку на тихом уровне, например 40 дБ, то отчётливее всего будет слышно среднечастотный диапазон музыкальной композиции, будь то вокал исполнителя/исполнительницы или инструменты, играющие в этом диапазоне. В это же время будет ощущаться явная нехватка низких и высоких частот, обусловленная как раз нелинейностью восприятия а так же тем, что различные частоты звучат с разной громкостью. Таким образом очевидно, что для полноценного восприятия всей полноты картины, частотный уровень интенсивности необходимо максимально выровнять к единому значению. Несмотря на то, что даже на уровне громкости 85-90 дБ идеализированного выравнивания громкости разных частот не происходит, уровень становится приемлимым для нормального повседневного прослушивания. Чем ниже громкость в тоже время, тем отчётливей будет восприниматься на слух характерная нелинейность, а именно ощущение отсутствия должного количества высоких и низких частот. Вместе с этим получается, что при такой нелинейности нельзя говорить серьёзно о воспроизведении звучания "hi-fi" качества высокой точности, ибо точность передачи оригинальной звуковой картины будет крайне низкой в данной конкретной ситуации.

Если вникнуть в эти выводы, то становится понятно, почему на низком уровне громкости прослушивание музыки хоть и максимально безопасное с точки зрения здоровья, но крайне отрицательно ощущается на слух по причине создания явно неправдоподобных образов музыкальных инструментов и голоса, отсутствия масштабности звуковой сцены. В целом, тихое воспроизведение музыки можно использовать в качестве фонового сопровождения, но совершенно противопоказано проводить прослушивание высокого "hi-fi" качества на низкой громкости, по вышеуказанным причинам невозможности создания натуралистичных образов звуковой сцены, которая была сформирована звукорежиссёром в студии, на этапе звукозаписи. Но не только низкая громкость вводит определённые ограничения на восприятие конечного звучания, гораздо хуже ситуация обстоит с повышенной громкостью. Повредить слух и достаточно сильно понизить чувствительность можно и достаточно просто, если продолжительное время слушать музыку на уровнях выше 90 дБ. Эти данные основаны на большом количестве медицинских исследований, заключающие, что звук громкостью выше 90 дБ оказывает реальный и практически непоправимый вред здоровью. Механизм этого явления кроется в слуховом восприятии и особенностях строения уха. Когда звуковая волна интенсивностью выше 90 дБ попадает в слуховой канал, в дело вступают органы среднего уха, вызывая явление, называемое слуховой адаптацией.

Принцип происходящего в этом случае такой: стремечко отводится от овального окна и предохраняет внутреннее ухо от слишком громких звуков. Этот процесс носит название акустического рефлекса . На слух подобное воспринимается как кратковременное снижение чувствительности, что может быть знакомо каждому, кто хоть раз посещал рок-концерты в клубах, например. После такого концерта возникает кратковременное снижение чувствительности, которая по истечению некоторого периода времени восстанавливается на прежний уровень. Однако восстановление чувствительности будет далеко не всегда и напрямую зависит от возраста. За всем этим и кроется большая опасность громких прослушиваний музыки и других звуков, интенсивность которых превышает 90 дБ. Возникновение акустического рефлекса не единственная "видимая" опасность потери слуховой чувствительности. При длительном воздействии слишком громких звуков, волоски, расположенные в области внутреннего уха (которые реагируют на колебания), отклоняются очень сильно. В этом случае происходит эффект, что волосок, отвечающий за восприятие определённой частоты отклоняется под воздействием звуковых вибраций большой амплитуды. В определённый момент такой волосок может отклониться слишком сильно и обратно уже не вернуться. Это вызовет соответствующий эффект потери чувствительности на конкретной определённой частоте!

Самым страшным во всей этой ситуации является то, что болезни уха практически не поддаются лечению, даже самыми современными методами, известными медицине. Всё это наводит на определённые серьёзные выводы: звук выше 90 дБ опасен для здоровья и практически гарантированно вызовет преждевременную потерю слуха или существенное снижение чувствительности. Ещё неприятнее и то, что в игру со временем вступает ранее упомянутое свойство адаптации. Этот процесс у человеческих слуховых органов происходит практически незаметно, т.е. человек, медленно теряющий чувствительность, близко к 100% вероятности не заметит этого до момента, пока окружающие люди сами не обратят внимание на постоянные переспрашивания, вроде: "Что Вы только что сказали?". Вывод в итоге предельно простой: при прослушивании музыки жизненно важно не допускать уровней интенсивности звука выше 80-85 дБ! В этом же моменте кроется и положительная сторона: уровень громкости 80-85 дБ примерно соответствует уровню звукозаписи музыки в студийных условиях. Вот и возникает понятие "Золотой середины", выше которой лучше не подниматься, если вопросы здоровья имеют хоть какое-то значение.

Даже достаточно кратковременное прослушивание музыки на уровне 110-120 дБ может вызвать проблемы со слухом, например во время живого концерта. Очевидно, что избежать этого временами нельзя или очень трудно, но крайне важно стараться это делать для сохранения целостности слухового восприятия. Теоретически, кратковременное воздействие громких звуков (не превышающих 120 дБ), ещё до момента возникновения "слуховой утомляемости", не приводит к серьёзным негативным последствиям. Но на практике обычно встречаются случаи длительного воздействия звуком такой интенсивности. Люди оглушают сами себя, не осознавая всей степени опасности в автомобиле при прослушивании аудиосистемы, дома в аналогичных условиях, или в наушниках портативного плеера. Почему так происходит, и что вынуждает делать звук всё громче и громче? Ответов на этот вопрос два: 1) Влияние психоакустики, о которой будет рассказано отдельно; 2) Постоянная необходимость "перекричать" громкостью музыки какие-то внешние звуки. Первый аспект проблемы достаточно интересен, и будет детально рассмотрен далее, а вот вторая сторона проблемы больше наводит на негативные мысли и выводы об ошибочном понимании истинных основ правильного прослушивания звучания "hi-fi" класса.

Не вдаваясь в особенности, общий вывод о прослушивании музыки и правильной громкости звучит следующим образом: прослушивание музыки должно происходить при уровнях звуковой интенсивности не выше 90 дб, не ниже 80 дБ в помещении, в котором сильно заглушены или полностью отсутствуют посторонние звуки внешних источников (такие как: разговоры соседей и прочий шум, за стеной квартиры; шумы улицы и технические шумы в случае, если вы находитесь в салоне автомобиля, и т.д.). Хочется выделить раз и навсегда, что именно в случае соблюдения таких, вероятно жёстких требований, можно достичь долгожданного баланса громкости, которая не вызовет преждевременных нежелательных повреждений слуховых органов, а так же доставит истинное удовольствие от прослушивания любимых музыкальных произведений с мельчайшими деталями звучания на высоких и низких частотах и точностью, которую преследует само понятие "hi-fi" звучания.

Психоакустика и особенности восприятия

Чтобы наиболее полно ответить на некоторые важные вопросы, касающиеся конечного восприятия человеком звуковой информации, существует целый раздел науки, изучающий огромное многообразие подобных аспектов. Этот раздел именуется "психоакустикой". Дело в том, что слуховое восприятие не заканчивается только на работе слуховых органов. После непосредственного восприятия звука органом слуха (ухо), далее в действие вступает самый сложный и малоизученный механизм анализа полученной информации, за это всецело отвечает головной мозг человека, который устроен таким образом, что при работе генерирует волны определённой частоты, и они так же обозначаются в Герцах (Гц). Различные частоты мозговых волн соответствуют определённым состояниям человека. Таким образом получается, что прослушивание музыки способствует изменению настройки частоты мозга, и это важно учитывать при прослушивании музыкальных композиций. На основании этой теории существует так же метод звукотерапии путём прямого влияния на психическое состояние человека. Мозговые волны бывают пяти типов:

Дельта-волны (волны ниже 4 Гц). Соответствует состоянию глубокого сна без сновидений, при этом полностью отсутствуют ощущения тела.
Тета-волны (волны 4-7 Гц). Состояние сна или глубокой медитации.
Альфа-волны (волны 7-13 Гц). Состояния расслабления и релаксации во время бодрствования, сонливость.
Бета-волны (волны 13-40 Гц). Состояние активность, повседневного мышления и мыслительной деятельности, возбуждение и познание.
Гамма-волны (волны выше 40 Гц). Состояние сильной умственной активности, страха, возбуждения и осознания.

Психоакустика, как раздел науки, ищет ответы на самые интересные вопросы, касающиеся конечного восприятия человеком звуковой информации. В процессе изучения этого процесса вскрывается огромное количество факторов, влияние которых неизменно происходит как в процессе прослушивания музыки, так и в любом другом случае обработки и анализа любой звуковой информации. Психоакуситка изучает практически всё многообразие возможных влияний, начиная с эмоционального и психического состояния человека в момент прослушивания, заканчивая особенностями строения голосовых связок (в случае, если речь идёт об особенностях восприятия всех тонкостей вокального исполнения) и механизма преобразования звука в электрические импульсы мозга. Наиболее интересные, а главное важные факторы (которые жизненно необходимо учитывать каждый раз при прослушивании любимых музыкальных композиций, а так же при построении профессиональной аудиосистемы) будут рассмотрены далее.

Понятие созвучности, музыкальной созвучности

Устройство человеческой слуховой системы уникально в первую очередь механизмом восприятия звука, нелинейностью слуховой системы, способностью группировать звуки по высоте с достаточно высокой степенью точности. Наиболее интересной особенностью восприятия можно отметить нелинейность слуховой системы, которая проявляется в виде возникновения дополнительных несуществующих (в основном тоне) гармоник, особенно часто проявляется у людей с музыкальным или абсолютным слухом. Если же подробнее остановится и проанализировать все тонкости восприятия музыкального звучания, то легко выделяется понятие "консонансности" и "диссонансности" различных аккордов и интервалов звучания. Понятие "консонанс" определяется как согласное (от французского слова "согласие") звучание, и соответственно наоборот, "диссонанс" - несогласное, нестройное звучание. Несмотря на многообразие различных трактовок этих понятий характеристики музыкальных интервалов, наиболее удобно использовать "музыкально-психологическую" расшифровку терминов: консонанс определяется и ощущается человеком как приятное и комфортное, мягкое звучание; диссонанс же можно охарактеризовать с другой стороны как звучание, вызывающее раздражение, беспокойство и напряжение. Подобная терминология носит слегка субьективный характер, а так же, за историю развития музыки совершенно различные интервалы принимались за "созвучные" и наоборот.

В наше время данные понятия так же сложно воспринимать однозначно, поскольку наблюдаются различия у людей с отличными музыкальными предпочтениями и вкусами, а также нет общепризнанного и согласованного понятия гармонии. Психоакустическая основа восприятия различных музыкальных интервалов в качестве консонансных или диссонансных напрямую зависит от понятия "критической полосы". Кртическая полоса - это определённая ширина полосы, внутри которой слуховые ощущения резко изменяются. Ширина критических полос с повышением частоты пропорционально расширяется. Поэтому, ощущение консонансов и диссонансов напрямую связано с наличием критических полос. Слуховой орган человека (ухо), как уже было сказано ранее, выполняет роль полосового фильтра на определённом этапе анализа звуковых волн. Эта роль отводится базилярной мембране, на которой располагается 24 критических полосы с частотнозависимой шириной.

Таким образом, созвучность и несогласованность (консонансность и диссонансность) напрямую зависит от разрешающей способности слуховой системы. Получается, что если два разных тона звучат в унисон или разница частот равна нулю, то это совершенный консонанс. Такой же консонанс возникает в случае, если разница частот будет больше, чем критическая полоса. Диссонанс же возникает лишь тогда, когда разница частот составляет от 5% до 50% от критической полосы. Наивысшая степень диссонанса в данном отрезке прослушивается, если разница составляет одну четверть от ширины критической полосы. На основании этого легко проанализировать любую сведённую музыкальную запись и сочетание инструментов на предмет созвучности или диссонансности звучания. Нетрудно догадаться, какую большую роль в этом случае играет звукорежиссёр, студия звукозаписи и прочие составляющие конечного цифрового или аналогового оригинала звуковой дорожки, и всё это ещё даже до попытки воспроизведения на звуковоспроизводящем оборудовании.

Локализация звука

Воспринимать всю полноту пространственной звуковой картины человеку помогает система бинаурального слуха и пространственной локализации. Этот механизм восприятия реализуется за счёт двух приёмников слуха и двух слуховых каналов. Звуковая информация, которая поступает по этим каналам, в последствии обрабатывается в переферической части слуховой системы и подвергается спектрально временному анализу. Далее, эта информация передаётся в высшие отделы головного мозга, где сравнивается разница левого и правого звукового сигнала, а так же формируется единый звуковой образ. Этот описанный механизм именуется бинауральным слухом . Благодаря этому, у человека имеются такие уникальные возможности:

1) локализация звуковых сигналов от одного или нескольких источников, при этом формируется пространственная картина восприятия звукового поля
2) разделение сигналов, приходящих от различных источников
3) выделение одних сигналов, на фоне других (например, выделение речи и голоса из шума или звучания инструментов)

Пространственную локализацию легко наблюдать на простом примере. На концерте, со сценой и некоторым количеством музыкантов на ней в определённом отдалении друг от друга, можно легко (при желании даже закрыв глаза) определить направление прихода звукового сигнала каждого инструмента, оценить глубину и пространственность звукового поля. Таким же образом ценится хорошая hi-fi система, способная достоверно "воспроизвести" подобные эффекты пространственности и локализации, тем самым фактически "обманув" мозг, заставив почувствовать полноценное присутствие на живом выступлении любимого исполнителя. Локализацию звукового источника обычно обуславливают три основных фактора: временной, интенсивностный и спектральный. Независимо от этих факторов, имеется ряд закономерностей, с помощью которых можно понять основы, касающиеся локализации звука.

Наибольший эффект локализации, воспринимаемый человеческими органами слуха, находится в области средних частот. В то же время, практически невозможно определить направление звуков частот выше 8000 Гц и ниже 150 Гц. Последний факт особенно широко используется в системах hi-fi и домашнего театра при выборе местоположения сабвуфера (низкочастотного звена), расположение которого в помещении ввиду отсутствия локализации частот ниже 150 Гц практически не имеет значения, и у слушателя в любом случае возникает целостный образ звуковой сцены. Точность локализации зависит от расположения источника излучения звуковых волн в пространстве. Таким образом, наибольшая точность локализации звуков отмечается в горизонтальной плоскости, достигая значения 3°. В вертикальной плоскости человеческая слуховая система гораздо хуже определяет направление источника, точность в этом случае составляет 10-15° (из-за специфического строения ушных раковин и сложной геометрии). Точность локализации слегка варьируется в зависимости от угла расположения излучающих звук объектов в пространстве углами относительно слушателя, а так же, на конечный эффект оказывает влияние степень дифракции звуковых волн головы слушателя. Следует так же заметить, что широкополосные сигналы локализуются лучше, чем узкополосный шум.

Гораздо интереснее обстоит дело с определением глубины направленного звука. Например, человек по звуку может определить расстояние до объекта, однако, происходит это в большей степени за счёт изменения звукового давления в пространстве. Обычно, чем дальше объект от слушателя, тем больше происходит ослабление звуковых волн в свободном пространстве (в помещении добавляется влияние отражённых звуковых волн). Таким образом можно заключить, что точность локализации выше в закрытом помещении именно за счёт возникновения ревербации. Отражённые волны, возникающие в закрытых помещениях, дают возможность появлению таких интересных эффектов, как расширение звуковой сцены, обволакивание и пр. Данные явления возможны именно за счёт восприимчивости трёхмерной локализации звуков. Основные зависимости, которые и определяют горизонтальную локализацию звука: 1) разница по времени прихода звуковой волны в левое и правое ухо; 2) разница в интенсивности, возникающая из-за дифракции на голове слушателя. Для определения глубины звука важна разница уровня звукового давления и разница спектрального состава. Локализация в вертикальной плоскости так же сильно зависима от дифракции в ушной раковине.

Сложнее обстоит дело с современными системами пространственного звучания на основе технологии dolby surround и аналогов. Казалось бы, принцип построения систем домашнего кинотеатра чётко регламентируют способ воссоздания достаточно натуралистичной пространственной картины 3D звучания с присущим объёмом и локализацией виртуальных источников в пространстве. Однако, не всё так тривиально, поскольку обычно не принимаются во внимание сами механизмы восприятия и локализации большого количества источников звука. Преобразование звука органами слуха предполагает процесс сложения сигналов разных источников, пришедших в разные уши. Притом, если фазовая структура разных звуков более менее синхронна, такой процесс на слух воспринимается как звук, исходящий от одного источника. Имеется ещё и целый ряд трудностей, включая особенности механизма локализации, затрудняющий точность определения направления источника в пространстве.

Ввиду вышесказанного, наиболее трудной задачей становится разделение звуков от разных источников, особенно, если эти разные источники проигрывают схожий амплитудно-частотный сигнал. А именно это и происходит на практике в любой современной системе пространственного звучания, и даже в обычной стереосистеме. Когда человек прослушивает большое количество звуков, исходящих от разных источников, сначала происходит определение принадлежности каждого конкретного звука тому источнику, который его создаёт (группировка по частоте, высоте, тембру). И только вторым этапом слух пытается локализовать источник. После этого приходящие звуки разделяются по потокам, основываясь на пространственных признаках (разница во времени поступления сигналов, разница по амплитуде). На основе полученной информации формируется более менее статичный и фиксированный слуховой образ, из которого которого возможно определить, откуда идёт каждый конкретный звук.

Очень удобно отследить данные процессы на примере обычной сцены, с фиксированно расположенными на ней музыкантами. При этом, очень интересно то, что если вокалист/исполнитель, занимая изначально определённую позицию на сцене начнёт плавно перемещаться по сцене в любом направлении, ранее сформированный слуховой образ не изменится! Определение направления звука, исходящего от вокалиста, останется субъективно прежним, как-буд-то он стоит на том же месте, на котором стоял до перемещения. Только в случае резкого изменения местоположения исполнителя на сцене произойдёт расщипление сформированного звукового образа. Помимо рассмотренных проблем и сложности процессов локализации звуков в пространстве, в случае с многоканальными системами пространственного звучания достаточно большую роль оказывает процесс ревербации в конечном помещении для прослушивания. Наиболее ярко эта зависимость наблюдается, когда большое число отражённых звуков приходит со всех сторон - точность локализации существенно ухудшается. Если же энергетическая насыщенность отражённых волн больше (преобладает) чем прямых звуков, критерий локализации в таком помещении становится крайне размытым, говорить о точности определения таких источников крайне затруднительно (если вообще возможно).

Однако, в сильно ревербирующем помещении локализация теоретически происходит, в случае широкополосных сигналов слух ориентируется по параметру разницы интенсивности. В этом случае определение направления осуществляется по высокочастотной составляющей спектра. В любом помещении точность локализации будет зависеть от времени прихода отражённых звуков после прямых звуков. При слишком малом интервале разрыва между этими звуковыми сигналами в помощь слуховой системе начинает работать "закон прямой волны". Суть этого явления: если звуки с коротким интервалом задержки по времени приходят с разных направлений, то локализация всего звука происходит по первому пришедшему звуку, т.е. слух игнорирует в какой-то степени отраженный звук, если он приходит через слишком короткий отрезок времени после прямого. Подобный эффект проявляется и тогда, когда происходит определение направления прихода звука в вертикальной плоскости, но в этом случае гораздо слабее (по причине того, что восприимчивость слуховой системы к локализации в вертикальной плоскости заметно хуже).

Суть эффекта предшествования гораздо глубже и имеет психологическую, нежели физиологическую природу. Было проведено большое количество экспериментов, на основании которых установлена зависимость. Возникает этот эффект преимущественно тогда, когда время появления эха, его амплитуда и направление совпадают с некоторым "ожиданием" слушателя от того, как акустика данного конкретного помещения формирует звуковой образ. Возможно, человек уже имел опыт прослушивания в данном помещении или аналогичных, что и формирует предрасположенность слуховой системы к возникновению "ожидаемого" эффекта предшествования. Чтобы обойти данные ограничения, присущие человеческому слуху, в случае с несколькими источниками звука используются различные уловки и хитрости, с помощью которых и формируется в конечном счёте более менее правдоподобная локализация музыкальных инструментов/других источников звука в пространстве. По большому счёту, воспроизведение стерео и многоканальных звуковых образов строится на большом обмане и создании слуховой иллюзии.

Когда две или большее число акустических систем (например, 5.1 или 7.1, или даже 9.1) воспроизводят звук из разных точек помещения, слушатель при этом слышит звуки, исходящие из несуществующих или мнимых источников, воспринимая определенную звуковую панораму. Возможность этого обмана заключается в биологических особенностях устройства организма человека. Скорее всего, человек не успел адаптироваться к распознаванию подобного обмана по причине того, что принципы "искусственного" звуковоспроизведения появились сравнительно недавно. Но, хоть и процесс создания мнимой локализации оказался возможным, реализация по сей день далека от совершенства. Дело в том, что слух действительно воспринимает источник звука там, где его на самом деле нет, но правильность и точность передачи звуковой информации (в частности тембра) оказывается под большим вопросом. Методом многочисленных опытов в реальных ревербационных помещениях и в заглушенных камерах было установлено, что тембр звуковых волн от реальных и мнимых источников отличается. В основном это сказывается на субъективном восприятии спектральной громкости, тембр в этом случае видоизменяется существенным и заметным образом (при сравнении с аналогичным звуком, воспроизведённом реальным источником).

В случае с многоканальными системами домашнего кинотеатра уровень искажений заметно выше, по нескольким причинам: 1) Много схожих по амплитудно-частотной и фазофой характеристике звуковых сигналов одновременно приходит с разных источников и направлений (включая переотражённые волны) на каждый ушной канал. Это приводит к увеличению искажений и появлению гребенчатой фильтрации. 2) Сильное разнесение громкоговорителей в пространстве (относительно друг друга, в многоканальных системах это расстояние может быть несколько метров и более) способствует росту тембровых искажений и окраске звука в области мнимого источника. В качестве итога можно сказать, что окрашивание тембра в системах многоканального и объёмного звучания на практике происходят по двум причинам: явление гребенчатой фильтрации и влияние ревербационных процессов конкретного помещения. В случае, если за воспроизведение звуковой информации отвечает более одного источника (это касается и стереосистемы с 2-умя источниками), неизбежно появление эффекта "гребенчатой фильтрации", вызванной разным временем прибытия звуковых волн на каждый слуховой канал. Особая неравномерность наблюдается в области верхней середины 1-4 кГц.

Слуховой анализатор человека представляет собой специализированную систему для восприятия звуковых колебаний, формирования слуховых ощущений и опознавания звуковых образов. Вспомогательный аппарат периферической части анализатора — это ухо (рисунок 15).

Различают наружное ухо, в состав которого входят ушная раковина, наружный слуховой проход и барабанная перепонка; среднее ухо, состоящее из системы соединенных между собой слуховых косточек — молоточка, наковальни и стремени, и внутреннее ухо, которое включает улитку, где расположены рецепторы, воспринимающие звуковые колебания, а также преддверие и полукружные каналы. Полукружные каналы представляют собой периферическую рецепторную часть вестибулярного анализатора, о котором пойдет отдельный разговор.

Наружное ухо устроено таким образом, что обеспечивает подведение звуковой энергии к барабанной перепонке. При помощи ушных раковин происходит относительно небольшое концентрирование этой энергии, а наружный слуховой проход обеспечивает поддержание постоянной температуры и влажности как факторов, обусловливающих стабильность работы звукопередающего аппарата.

Барабанная перепонка представляет собой тонкую перегородку толщиной около 0,1 миллиметра, состоящую из волокон, идущих в различных направлениях. Функция барабанной перепонки хорошо отражена в ее названии — она начинает колебаться, когда на нее падают звуковые колебания воздуха со стороны наружного слухового прохода. При этом ее строение позволяет ей передавать практически без искажения все частоты звукового диапазона. Система слуховых косточек обеспечивает передачу колебаний от барабанной перепонки к улитке.

Рецепторы, которые обеспечивают восприятие звуковых колебаний, расположены во внутреннем ухе — в улитке (рисунок 16). Это название связано со спиралеобразной формой данного образования, состоящего из 2,5 витков.

В среднем канале улитки на основной мембране расположен кортиев орган (по имени итальянского анатома Корти, 1822-1888 годы). В этом органе и находится рецепторный аппарат слухового анализатора (рисунок 17).

Как же происходит формирование ощущений звука? Вопрос, который и в настоящее время привлекает пристальное внимание исследователей. Впервые (1863 год) весьма убедительное толкование процессов во внутреннем ухе представил немецкий физиолог Герман Людвиг Фердинанд Гельмгольц, разработавший так называемую резонансную теорию. Он обратил внимание, что основную мембрану улитки образуют волокна, идущие в поперечном направлении. Длина таких волокон увеличивается к вершине улитки. Отсюда понятна аналогия работы этого органа с арфой, у которой различная тональность достигается разной длиной струн. По представлению Гельмгольца, при воздействии звуковых колебаний вступает в резонанс какое-то определенное волокно, ответственное за восприятие данной частоты. Очень подкупающая своей простотой и завершенностью теория, но которую, увы, пришлось оставить, поскольку оказалось, что струн — волокон — в основной мембране слишком мало, чтобы воспроизводить все слышимые человеком частоты, натянуты эти струны слишком слабо, да и кроме того, их изолированные колебания невозможны. Эти трудности для резонансной теории оказались непреодолимы, но они послужили импульсом для последующих исследований.

По современным представлениям, передача и воспроизведение звуковых колебаний обусловлены частотно-резонансными свойствами всех сред улитки. При помощи весьма остроумных экспериментов было обнаружено, что при низких частотах колебаний (100-150 герц, может быть несколько выше, но не более 1000 герц) волновой процесс охватывает всю основную мембрану, возбуждаются все рецепторы кортиева органа, расположенного на этой мембране. При возрастании частоты звуковых волн в колебательный процесс вовлекается только часть основной мембраны, и тем меньше, чем выше звук. При этом максимум резонанса сдвигается по направлению к основанию улитки.

Однако мы пока еще не рассмотрели вопрос, каким же образом происходит трансформация энергии механических колебаний в процесс нервного возбуждения. Рецепторный аппарат слухового анализатора представлен своеобразными волосковыми клетками, которые являются типичными механорецепторами, то есть для которых адекватным раздражителем служит механическая энергия, в данном случае колебательные движения. Специфической особенностью волосковых клеток является наличие на их вершине волосков, которые находятся в непосредственном соприкосновении с покровной мембраной. В кортиевом органе различают один ряд (3,5 тысячи) внутренних и 3 ряда (12 тысяч) наружных волосковых клеток, которые различаются по уровню чувствительности. Для возбуждения внутренних клеток требуется больше энергии, и это является одним из механизмов органа слуха воспринимать звуковые раздражители в широком диапазоне интенсивностей.

При возникновении колебательного процесса в улитке в результате движений основной мембраны, а вместе с ней и кортиева органа происходит деформация волосков, упирающихся в покровную мембрану. Эта деформация и служит пусковым моментом в цепи явлений, приводящих к возбуждению рецепторных клеток. В специальном эксперименте было обнаружено, что если во время подачи звукового сигнала от поверхности волосковых клеток отводить биотоки и затем, усилив их, подвести к громкоговорителю, то мы обнаружим достаточно точное воспроизведение звукового сигнала. Это воспроизведение распространяется на все частоты, в том числе и на человеческий голос. Не правда ли, достаточно близкая аналогия с микрофоном? Вот отсюда и название — микрофонный потенциал. Доказано, что этот биоэлектрический феномен и представляет собой рецепторный потенциал. Отсюда следует, что волосковая рецепторная клетка достаточно точно (до определенного предела по интенсивности) через параметры рецепторного потенциала отражает параметры звукового воздействия — частоту, амплитуду и форму.

При электрофизиологическом исследовании волокон слухового нерва, которые подходят непосредственно к структурам кортиева органа, регистрируются нервные импульсы. Примечательно то, что частота такой импульсации зависит от частоты воздействующих звуковых колебаний. При этом до 1000 герц отмечается практически их совпадение. Хотя более высокие частоты в нерве не регистрируются, но сохраняется определенная количественная зависимость между частотами звукового раздражителя и афферентной импульсации.

Итак, мы ознакомились со свойствами человеческого уха и механизмами функционирования рецепторов слухового анализатора при воздействии звуковых колебаний воздуха. Но возможна передача и не только через воздух, а посредством так называемой костной проводимости. В последнем случае колебания (например, камертона) передаются костями черепа и затем, минуя среднее ухо, попадают непосредственно в улитку. Хотя в данном случае способ подведения акустической энергии иной, но механизм взаимодействия ее с рецепторными клетками остается тот же самый. Правда, при этом несколько различны и количественные отношения. Но в том и в другом случае возбуждение, первично возникшее в рецепторе и несущее определенную информацию, передается по нервным структурам до высших слуховых центров.

Каким же образом кодируется информация о таких параметрах звуковых колебаний, как частота и амплитуда? Сначала о частоте. Вы, очевидно, обратили внимание на своеобразный биоэлектрический феномен — микрофонный потенциал улитки. Он ведь по существу свидетельствует о том, что в значительном диапазоне колебания рецепторного потенциала (а они отражают работу рецептора и по восприятию, и последующей передаче) практически точно соответствуют по частоте звуковым колебаниям. Однако, как уже тоже отмечалось, в волокнах слухового нерва, то есть в тех волокнах, которые воспринимают информацию от рецепторов, частота нервных импульсов не превышает 1000 колебаний в секунду. А это значительно меньше, чем частоты воспринимаемых звуков в реальных условиях. Как же эта задача решается в слуховой системе? Ранее мы с вами, когда рассматривали работу кортиева органа, отмечали, что при низких частотах звукового воздействия колеблется вся основная мембрана. Следовательно, возбуждаются все рецепторы, и частота колебаний без изменения передается волокнам слухового нерва. При больших же частотах в колебательный процесс вовлекается только часть основной мембраны и, следовательно, только часть рецепторов. Они передают возбуждение соответствующей части нервных волокон, но уже с трансформацией ритма. В этом случае определенной частоте соответствует определенная часть волокон. Такой принцип обозначают как пространственный способ кодирования. Таким образом, информация о частоте обеспечивается частотно-пространственным кодированием.

Однако хорошо известно, что подавляющее большинство реальных звуков, воспринимаемых нами, в том числе и речевые сигналы, представляют собой не правильные синусоидальные колебания, а процессы, имеющие гораздо более сложную форму. Как же в этом случае обеспечивается передача информации? Еще в начале 19-го века выдающийся французский математик Жан Батист Фурье разработал оригинальный математический метод, позволяющий любую периодическую функцию представить в виде суммы ряда синусоидальных составляющих (ряда Фурье). Строгими математическими методами доказывается, что эти составляющие имеют периоды, равные Т, Т/2, Т/3 и так далее, или, иначе говоря, имеют частоты, кратные основной частоте. И немецкий физик Георг Симон Ом (которого все очень хорошо знают по его закону в электротехнике) в 1847 году выдвинул идею, что в кортиевом органе происходит именно такое разложение. Так появился еще один закон Ома, который отражает очень важный механизм звуковосприятия. Благодаря своим резонансным свойствам основная мембрана разлагает сложный звук на его составляющие, каждая из которых воспринимается соответствующим нервно-рецепторным аппаратом. Таким образом, пространственный рисунок возбуждения несет информацию о частотном спектре сложного звукового колебания.

Для передачи информации об интенсивности звука, то есть амплитуде колебаний, в слуховом анализаторе имеется механизм, также отличный от способа работы других афферентных систем. Чаще всего информация об интенсивности передается частотой нервной импульсации. Однако в слуховой системе, как это следует из только что рассмотренных процессов, такой способ невозможен. Оказывается, что и в данном случае используется принцип пространственного кодирования. Как уже отмечалось, внутренние волосковые клетки имеют чувствительность ниже, чем наружные. Таким образом, различной интенсивности звука соответствует разное сочетание возбужденных рецепторов двух этих видов, то есть специфическая форма пространственного рисунка возбуждения.

В слуховом анализаторе вопрос о специфических детекторах (как это хорошо выражено в зрительной системе) остается все еще открытым, тем не менее и здесь имеются механизмы, которые позволяют выделять все более и более сложные признаки, что в конечном итоге завершается формированием такого рисунка возбуждения, который соответствует определенному субъективному образу, опознаваемому по соответствующему «эталону».