THE MODERN SYSTEM OF SPATIAL SOUND TRANSMISSION – BINAURAL STEREOPHONY

Эволюция технических средств звукопередачи, развитие визуальных искусств, появление трехмерного видео в кино, всё это обусловило существенные изменения в технике и технологии звукорежиссуры. С развитием новых технологий звукозаписи стремительно развиваются и средства художественной выразительности. Периодизация этапов звукорежиссуры, приведенная в работе [1], развитие проектов направленных на разработку систем пространственной звукозаписи и звукопередачи, возросшее количество исследований в этих областях и активно расширяющаяся практика использования их результатов говорят о том, что эволюция звукорежиссуры вступает в этап актуализации технологий трехмерного звука [2]. Бинауральная стереофония принадлежит к группе технологий для записи, воспроизведения и синтеза пространственного звука. Идея бинауральной звукозаписи не нова, первые записи были выполнены по этой технологии в 30е года прошлого века, однако в настоящее время можно говорить о новом этапе развития и актуализации бинауральной стереофонии. Об этом свидетельствует интерес научного сообщества и обширные области применения бинауральных технологий. Бинауральная стереофония используется для музыкальных записей, как в концертной, так и в студийной практиках, для записи радиопостановок. Бинауральные технологии находят практическое применение в акустических экспериментах и слушательских тестах, применяются в архитектурной акустике для создания аурализационных моделей. Крупнейшая радиовещательная компания BBC с 2011 года регулярно передает бинауральные записи на канале Radio1 (Англия). Французская компания RadioFrance также имеет несколько программ, в том числе и записи концертов, в бинауральном формате. Всё это свидетельствует об актуальности данного исследования.

Цель исследования

Целью исследования является анализ структуры бинауральной стереофонии в системе современных технологий пространственной звукопередачи, выявление преимуществ и недостатков системы, определение возможных направлений ее применения.

Бинауральная пространственная локализация

Бинауральная пространственная локализация реализуется за счет наличия двух приемников слуха, что обеспечивает способность локализовать сигналы, как от одиночных, так и от множественных источников. При этом в слуховой системе определяется азимутальное направление на источник звука в горизонтальной плоскости, его вертикальное возвышение над горизонтальной плоскостью и расстояние до источника (глубина), формируя, таким образом, пространственный звуковой образ.

Механизмы локализации в горизонтальной, вертикальной плоскостях и по глубине имеют существенные отличия. Горизонтальная (азимутальная) локализация обусловлена тремя физическими факторами: ITD (interaural time difference) разницей по времени моментов прихода одинаковых фаз звуковой волны; ILD (interaural level difference) разницей по интенсивности; спектральными различиями. Локализация в вертикальной плоскости связана с дифракцией на ушных раковинах и торсе. Локализация по глубине зависит от изменения уровня звукового давления и соотношения прямого и отраженного звука в помещении. Подробнее механизмы пространственного слуха описаны в работе Блауэрта [7]. Принципы бинауральной пространственной локализации являются основополагающими для создания систем пространственной звукозаписи и звуковоспроизведения, к которым относится система бинауральной звукозаписи.

Краткая история бинауральной звукозаписи

История бинауральной звукозаписи началась задолго до появления теоретических знаний о механизмах работы слуховой системы. Идея заключалась в том, чтобы на вход слуховой системы поступали два звуковых сигнала, записывалось значение их звуковых давлений в слуховом канале, затем эти данные передавались по двум каналам и воспроизводились через стереотелефоны, при этом у слушателя должно было возникать ощущение первичного пространственного звукового поля.
Первым шагом к реализации бинауральной стереофонии была запись французского изобретателя Клемента Адера. В 1881 году он установил несколько микрофонов на сцене Парижской оперы, а записываемые сигналы подавал на головные телефоны. Слушатели впервые могли услышать пространственный звук. Дальнейшие исследования проводились в лабораториях Белла (Bell laboratories), где в период с 1931г по 1932г были выполнены экспериментальные записи симфонического оркестра. Тогда впервые была продемонстрирована первая микрофонная система «искусственная голова», которая получила название «Oscar». Система представляла собой модель человеческой головы с двумя микрофонами, размещенными в полостях, соответствующих положениям ушных раковин.
Следующий важнейший этап развития бинауральной звукозаписи приходится на 70е годы XX века, в это время фирмы Neumann и Sennheiser выпускают бинауральные микрофонные системы «искусственная голова» для коммерческого использования. На сегодняшний день в научно-практических целях используются системы таких фирм как Neumann (KU-100), Brüel & Kjær (HATS 4128/5930), Knowles Electronics (Kemar X). Все они представляют собой достаточно точные модели головы с ушными раковинами и миниатюрными микрофонами в слуховых каналах. Их использование позволяет записывать и анализировать первичные сигналы.
Варианты воспроизведения бинауральных записей

Воспроизведение бинауральных сигналов производится, прежде всего, через стереотелефоны, т.к. они обеспечивают разделение каналов воспроизведения, акустическую изоляцию от вторичного поля и располагаются наиболее близко к барабанным перепонкам.

Воспроизведение через головные телефоны имеет целый ряд преимуществ:

-обеспечивает слушателя вынесенным за пределы головы пространственным звуковым образом (это явление называется экстернализацией) с четкой локализацией виртуальных звуковых источников в пределах всей горизонтальной плоскости, в то время как, при прослушивании обычных стереофонических сигналов через головные телефоны возникает явление латерализации, т.е. локализации виртуальных источников внутри головы слушателя.

-обеспечивает значительно более реалистичную передачу акустических свойств первичного помещения за счет более точного восстановления структуры первичного реверберационного процесса и передачи реалистичных тембральных характеристик звукового сигнала.

Однако при прослушивании бинауральных сигналов были выявлены определенные проблемы: недостаточно точная локализация расстояния до источника; ошибки типа «фронт-тыл», погрешности, возникающие из-за индивидуальных особенностей морфологического строения ушных раковин.

Причиной их возникновения являются искажения, вносимые акустическим трактом, состоящим из микрофонов, линий связи и излучателей головных телефонов. Потерями полезного сигнала на линиях связи можно пренебречь; современные микрофоны имеют почти ровную амплитудно-частотную характеристику, следовательно, погрешности возникают в основном в преобразователях внутри телефонов, в связи с чем необходима предварительная обработка бинауральных сигналов и калибровка головных телефонов.
Исследования, выполненные в работе H. Moller, D. Hammershoi [16] показали, что большинство головных телефонов не обладают ровной частотной характеристикой необходимой для точного воспроизведения бинауральных сигналов, а некоторые модели имеют сложную структуру АЧХ, особенно в области высоких частот (на частотах выше 7kHz). Калибровка применяется для компенсации искажений, вносимых неравномерностью частотной характеристики телефонов, с учетом их передаточных функций HpTFs (headphone transfer functions), которые описывают процесс распространения звуковой волны от излучателей телефонов до барабанных перепонок слушателя.

При выборе головных телефонов важным аспектом является соотношение давлений PDR (pressure division ratio), характеризующее отношение импеданса на входе в слуховой канал при прослушивании в свободном поле, к импедансу при нагрузке его на головные телефоны. Если это отношение стремится к единице, то головные телефоны определяются как «открытые» (Free-air coupling equivalent) и дополнительной компенсации не требуют. Если это условие не выполняется, то калибровка телефонов должна быть выполнена с учетом PDR.

Сложность калибровки телефонов обусловлена тем, что передаточные функции телефонов (hptfs) зависят не только от индивидуальной морфологии, но и от расположения телефонов на голове слушателя. Для решения этой проблемы в настоящее время используют компьютерное моделирование передаточных функций головы и головных телефонов. Однако для точного воспроизведения бинауральных сигналов рекомендуется применять индивидуальную калибровку, т.е. с измерениями с учетом индивидуальных HpTFs, как было показано в работе H. Moller [17].

В связи с развитием мобильных устройств активное распространение получили «вкладные» головные телефоны (earphones, insert heapdhones). Они полностью блокируют слуховой канал, отличаются качественной передачей низкочастотных составляющих и позволяют производить воспроизведение на сравнительно низких уровнях вследствие значительного ослабления уровня фоновых шумов. В работе [11] представлены возможности воспроизведения бинауральных сигналов на таких телефонах.

В настоящее время разработаны специальные цифровые процессоры для стереотелефонов, производящие частотную фильтрацию сигналов и обработку с учетом передаточных функций головы, ушных раковин и их индивидуальных морфологических особенностей[9]. Их использование позволяет обеспечить более точную локализацию пространственного образа, избежать ошибок «фронт-тыл», и существенно увеличить естественность звучания. Так же разработаны и продолжают развиваться технологии отслеживания движения головы (head-tracking), позволяющие производить оценку локализации бинаурального источника при изменении положения головы, примером может служить система Headzone Beyerdynamic [6]

Воспроизведение через громкоговорители. Со времени первых экспериментов по звукозаписи бинауральных сигналов предпринимались попытки их воспроизведения через громкоговорители, поскольку при этом восприятие звука происходит более естественно, что приводит к меньшей утомляемости слушателя. Однако, при подаче сигналов, записанных в ушах слушателя или на искусственной голове, на два громкоговорителя возникают перекрестные связи, которые приводят к сжатию виртуального источника во фронтальной плоскости с потерей пространственного образа. Правильная передача пространственной информации через громкоговорители возможна практически для одной точки (sweet spot), при условии подавления перекрестных связей. При этом даже незначительное (7-10см) смещение центра головы слушателя приводит к значительному ухудшению восприятия пространственного образа. Кроме того, влияние реверберации во вторичном поле затрудняет оценку азимутальной локализации источника, особенно в тыловой области. Данные ошибки проявляются, когда время стандартной реверберации в помещении прослушивания превышает 0.3 секунды.

Первые системы, реализующие подавление перекрестных связей при бинауральном воспроизведении назывались TRADIS (true reproduction of all direction stereophony). Они основаны на технологии, разработанной в лабораториях Белла B.Atal и M.Schroeder [3]. Идея заключается в добавке задержанного по времени и инвертированного по фазе сигнала одного громкоговорителя в канал второго и наоборот. Подробный анализ проблемы возникновения перекрестных связей и технологии их компенсации приведен в работе [8].

Для подавления перекрестных связей в настоящее время разработаны бифонические процессоры, которые за счет корректирующей частотной и фазовой фильтрации, а также временной задержки, обеспечивают компенсацию перекрестных сигналов при заданном положении громкоговорителей и фиксированных координатах слушателей.

Особое внимание в современных исследованиях уделяется влиянию структуры помещения прослушивания на воспроизведение бинауральных сигналов через громкоговорители. В результаты ряда исследований показали, что добавление искусственной реверберации, а именно ранних отражений, значительно повышает качество экстернализации виртуальных источников [4].

При воспроизведении бинауральных записей через стереофонические системы возникают проблемы, связанные с неравномерностью АЧХ на высоких частотах, что приводит к искажению тембральных характеристик источников. Причина возникновения пиков и провалов АЧХ заключается в том, что при записи на искусственной голове сигналы проходят обработку на ушных раковинах, выполняющих роль дифракционных фильтров. Для точной звукопередачи тембров и совместимости со стереофонией применяется эквализация (по свободному или по диффузному полю). Эквализация по диффузному полю менее зависима от индивидуальных особенностей, чем эквализация по свободному полю, т.к. использует пространственное усреднение. [18].

Одним из перспективных направлений современных исследований является разработка алгоритмов кодирования форматов многоканального аудио в бинауральный формат и наоборот, что позволит значительно расширить возможности воспроизведения бинауральных записей. Такие исследования на протяжении последних лет проводятся в университете Аалто, в Финляндии (Aalto University). Теоретические основы кодирования пространственной звуковой информации изложены в работе Ville Pulkki [19].

Возможности применения бинауральной стереофонии

- Бинауральная стереофония реализует одну из современных концепций звукозаписи, позволяя слушателю, где бы он ни находился, ощутить себя в первичном поле (концертном зале), т.е. реализует «эффект присутствия». Таким образом, бинауральная звукозапись является одной из перспективных технологии звукозаписи концертов.

- Современные технологии звукорежиссуры позволяют микшировать бинауральные сигналы с сигналами, записанными другими микрофонными системами, создавая реалистичные трехмерные звуковые образы с четкой передачей акустических характеристик звуковых источников и помещения, в котором производилась запись.

- Широкое применение бинауральные технологии получили в связи с развитием бинаурального синтеза. Как известно, бинауральные сигналы должны быть записаны в ушных каналах слушателя или на искусственной голове. Однако с развитием компьютерных технологий появился ещё один вариант получения бинауральных сигналов, они могут быть синтезированы на компьютере путем «свертки» монофонического сигнала источника с парой бинауральных фильтров, которые содержат информацию о передаточных характеристиках и описывают пути распространения звуковой волны от источника до барабанных перепонок слушателя. Бинауральный синтез используется для построения аурализационных моделей в системах моделирования помещений [13]. Данные системы используются в архитектурной акустике для расчета физических параметров проектируемых концертных и зрительных залов, театров, сцен и т.д. Благодаря бинауральному синтезу и технологиям аурализации стало возможным прослушивать музыкальные записи в различных помещениях в процессе их проектирования [15].

- Одним из самых перспективных направлений в использовании бинауральных технологий является создание систем «виртуальной реальности». В системах виртуальной реальности [5,14] целью является моделирование несуществующей окружающей среды. Для этого необходимым условием является использование бинауральных передаточных функций, записанных или рассчитанных в помещениях, которые подлежат моделированию, с последующей сверткой их с музыкальным сигналом.

- С помощью бинауральной технологии, как было предложено финскими учеными из исследовательского центра компании Nokia [12], возможно создание трехмерного звукового пространства, состоящего из натуральных и синтезированных звуков. Практическая реализация данной модели позволяет расширить горизонты естественного восприятия слушателя, поместить его в совмещенную реальную и виртуальную звуковую среду.

Заключение

Анализ основных аспектов бинауральной технологии свидетельствует о ряде преимуществ по сравнению с другими системами пространственного звука. Одним из главных достоинств является способность создавать трехмерные звуковые образы с максимально реалистичной локализацией виртуальных источников звука, опираясь на естественные особенности восприятия. Также стоит отметить компактность системы, что особенно актуально в связи с активным развитием мобильных портативных устройств звуковоспроизведения. Результаты данного исследования подтверждают перспективу использования бинауральной стереофонии как современной системы звукопередачи пространственного звука в искусстве звукорежиссуры.

Рецензенты:

Алдошина И.А., д.т.н., профессор кафедры режиссуры мультимедиа Негосударственного образовательного учреждения высшего профессионального образования «Санкт-Петербургский гуманитарный университет профсоюзов», г. Санкт-Петербург;

Денисов А.В., доктор искусствоведения, член Союза композиторов, профессор кафедры теории и истории культуры Российского государственного педагогического университета им. Герцена, г. Санкт-Петербург.

Scientific journal
Modern problems of science and education

ISSN 2070-7428

"Перечень" ВАК

ИФ РИНЦ = 1,039

THE MODERN SYSTEM OF SPATIAL SOUND TRANSMISSION – BINAURAL STEREOPHONY

Modern problems of science and education
Scientific journal | ISSN 2070-7428 | CertJournal