Scientific journal
Modern problems of science and education
ISSN 2070-7428
"Перечень" ВАК
ИФ РИНЦ = 1,006

WAVE FIELD SYNTHESIS IN CONTEXT OF CREATIVE AUDIO ENGINEERING

Chabushkin V.A. 1
1 Saint-Petersburg University of Humanities and Social Science
Sound reproduction techniques have great impact on forming of creative palette available for audio-engineer. Development of new spatial audio reproduction systems promotes the development of “creative language” within framework of audio art, improves the ability of mixing engineer to create accurate auditory composition, which translates the creative concept of author. Innovative sound reproduction system – the Wave Field Synthesis format, is discussed in this paper. Paper contains the historical overview of development of the spatial audio reproduction system based WFS-format. Creative tools that become available for mixing engineer are discussed through the explanation of the basic operation principles of the WFS-format system. The object of current study is WFS-format as the most effectual technology to improve the reproduction of spatial audio for a large number of listeners.
audio reproduction system.
WFS
Wave Field Synthesis
spatial audio

Введение

Основной художественной задачей звукорежиссера является создание звукового образа, важнейшим элементом которого является пространственное впечатление. Пространственная звуковая картина включает в себя: представление о размерах акустического пространства, о расположении и протяженности источников звука, о звуковых планах и др. – все эти компоненты влияют на музыкальный баланс, тембровую окраску, эмоциональный фон [1]. Эволюция в создании звукового образа определяется постоянным совершенствованием технических средств звукозаписи и звуковоспроизведения, с помощью которых он создаётся. Это подтверждает опыт развития систем звуковоспроизведения – переход от монофонии к стереозвуку, а затем к системам матричной стереофонии, представленных такими форматами, как DolbyDigital, DTS, SDDS и другие. Благодаря техническому развитию систем звуковоспроизведения звукорежиссер получает улучшенные инструменты для создания пространственного впечатления, для управления расположением звуковых объектов в пространстве, для работы со звуковыми планами, что в свою очередь влияет на совершенствование средств художественной выразительности искусства звукорежиссуры. Стереофонические системы и системы матричной стереофонии, наиболее распространенные в настоящее время, несмотря на значительный прогресс в технике звукозаписи, связанный с их внедрением, имеют ряд недостатков при передаче пространственной картины, что является одной из причин дальнейшего развития имеющихся систем и появления принципиально новых технологий. Стереоэффект, позволяющий воспринимать протяженную звуковую картину, возникающую между отдельными громкоговорителями, стабилен для восприятия только в ограниченной зоне, называемой зоной стереоэффекта (sweet spot). Поэтому положение слушателя в пространстве влияет на воспринимаемую индивидуально стереокартину – смещение в сторону одного из громкоговорителей искажает пространственный образ. Таким образом, традиционные пространственные системы не могут обеспечить воспроизведение стабильной пространственной звуковой картины в рамках больших помещений, что особенно негативно сказывается при звуковоспроизведении в кинотеатрах, театрах, выставочных и лекционных залах, а также концертных залах. Кроме того, стремление воспроизвести во вторичном пространстве звуковую картину, которая наиболее точно соответствовала бы исходному, оригинальному звучанию или замыслу звукорежиссера, также является важным фактором развития пространственных систем звуковоспроизведения.

Цель исследования

Развитие цифровых технологий на рубеже XX и XXI века вызвало новый интерес в области систем пространственного звука, результатом исследований стало появление систем Binaural, Ambisonics, Ambiophonia, VBAP и Wave Field Synthesis. Разработанные новые форматы звуковоспроизведения обеспечили дальнейшее развитие искусства звукорежиссуры, расширив творческую палитру, доступную звукорежиссеру.

Технология Wave Field Synthesis (WFS) представляется одной из наиболее перспективных систем пространственного звуковоспроизведения, интеграция которой позволит сильно расширить инструментарий современной звукорежиссуры при решении творческих задач. Целью исследования стало определение влияния использования систем пространственного звуковоспроизведения на основе WFS-формата на субъективное восприятие пространственной звуковой картины.

Материал и методы исследования

В основе исследования лежит анализ зарубежной литературы по вопросам волнового поля, технологии WFS, аурализации[*] и прикладной акустики. Кроме того, проведен анализ и обобщение результатов экспериментальной работы со звуковоспроизводящими системами WFS, проведенной в европейских исследовательских центрах, с целью определения эстетических качеств новой пространственной системы.

Теория Wave Field Synthesis

Теоретические основы технологии WFS впервые были описаны в статье профессора А. Беркхаута в 1992 году [2]. В своем труде профессор А. Беркхаут описал систему звуковоспроизведения, существенной особенностью которой являлась возможность синтезировать комплексное звуковое поле, что позволяло во вторичном помещении прослушивания воспроизводить звук в соответствии с первичной звуковой картиной. В отличие от предшествующих стереофонических систем, создававших пространственное впечатление за счет стереоэффекта в ограниченной зоне, система звуковоспроизведения на основе WFS представляла собой массив громкоговорителей, расположенный вдоль стен помещения, и позволяла в пределах заключаемого ими пространства создавать стабильный пространственный звуковой образ.

В основе синтеза фронта звуковых волн лежит принцип Гюйгенса [7], из которого следует, что каждая точка волнового фронта может быть рассмотрена как вторичный источник. Г. Кирхгоф придал принципу Гюйгенса строгий математический вид и доказал, что в каждой точке пространства, не содержащего источник, звуковое давление может быть определено при условии, что звуковое давление и нормаль к скорости движения частиц известна на поверхности S, заключающей объем V. Применив интеграл Релея, звуковое поле может быть задано источниками звука (акустическими системами, громкоговорителями), расположенными на плоскости S1, окружающей объем V1 – помещение для прослушивания.

Предложенная профессором Беркхаутом система звукоусиления обладала рядом преимуществ:

  • панорамирование звукового образа в любую точку пространства, в том числе перед массивом громкоговорителей, непосредственно в пределах помещения для прослушивания;
  • пространственный звуковой образ, стабильный во всех точках аудитории, не искажаемый при перемещении слушателя в пространстве;
  • возможность во вторичном помещении создавать реверберационные процессы первичного помещения, в том числе: ранние и поздние отражения с учетом их пространственных характеристик;
  • синтез виртуального пространства средствами аурализации.

Возможность создавать стабильный пространственный образ в рамках всего пространства зала сделали новые системы звуковоспроизведения оптимальными при передаче пространственного образа большому числу слушателей. Вышеописанные преимущества наиболее важны при использовании систем на основе WFS в концертных залах, кинотеатрах, театрах, системах виртуальной реальности.

Заявленные преимущества вызвали широкий научный интерес к концепции волнового синтеза звукового поля, основной задачей дальнейших исследований было приведение теоретических принципов WFS к этапу практической реализации. Прежде всего, была поставлена задача разработать проект экспериментальной системы, методы записи, кодирования и воспроизведения пространственного сигнала в формате WFS.

Практическая реализация

В 1992 году группа ученных из Дельфтского технического университета приступила к созданию первого опытного образца системы на основе WFS, представлявшего собой массив громкоговорителей, организованный в виде прямоугольника со сторонами шесть на четыре метра. Каждый из двухметровых модулей в составе массива содержал восемь идентичных излучателей. Расчет необходимых сигналов для громкоговорителей осуществлялся специально изготовленной платой цифровой обработки сигнала (DSP), способной создавать до 160 индивидуальных каналов. Использование линейного массива вместо трехмерного массива позволило существенно сократить число громкоговорителей, что упростило необходимые вычисления и улучшило эргономику системы с визуальной точки зрения. Благодаря исследованиям доктора П. Вогеля [10] трехмерное звуковое поле удалось трансформировать в двухмерную проекцию, которая может быть воспроизведена через линейный массив громкоговорителей.

Важным пунктом является выбор громкоговорителей для пространственной системы – теория WFS подразумевает использование двунаправленных или ненаправленных излучателей, что на практике невозможно. Характеристика направленности громкоговорителя зависит от воспроизводимой частоты и не может быть одинаковой во всем диапазоне частот. Исследования Д. де Вриса [4] показали, что характеристика направленности громкоговорителей может быть учтена в виде дополнительного аргумента в вычислениях, что фактически позволяет использовать в массиве обычные громкоговорители при условии, что они будут обладать идентичной характеристикой направленности. Другие акустические параметры: амплитудно-частотная характеристика (АЧХ), фазо-частотная характеристика (ФЧХ) и прочие - не влияют на процесс синтеза звукового поля, но влияют на качество воспроизводимого сигнала.

Другим важным параметром при выборе громкоговорителей является физический размер акустической системы, а именно ширина её фронтальной части. В идеальных условиях для синтеза непрерывного звукового поля излучатели должны быть бесконечно малыми точечными объектами. Невозможность удовлетворить это требование приводит к дискретизации фронтов воспроизводимых волн, разбиению комплексного звукового поля на фрагменты. При этом в высокочастотной области спектра воспроизводимого сигнала возникают нежелательные слышимые артефакты. Из теоремы Шеннона-Найквиста следует, что искажения возникают в области тех частот, длина волны которых меньше удвоенного расстояния между акустическими центрами громкоговорителей в массиве. Диапазон слышимого звука находится в пределах от 16 Гц до 20 кГц [6], наибольшее влияние для восприятия пространственной составляющей звуковой картины имеют частоты до 1500 Гц [3]. Эти особенности слуховой системы позволяют воспринимать пространственную картину, создаваемую системами на основе формата WFS, как целостную, несмотря на имеющиеся искажения, при условии, что расстояние между акустическими центрами громкоговорителей не превышает 11,43 сантиметра. Дискретизация волнового поля, воспроизводимого в формате WFS, остаётся предметом дальнейшего изучения, основными направлениями которого являются субъективная реакция слуховой системы человека на возникающие артефакты и разработка методов повышения пороговой частоты, выше которой возникают искажения. Повышение пороговой частоты уменьшает влияние возникающих артефактов на восприятие и сужает частотный диапазон, в котором возможны искажения, основным способом достижения этой задачи является увеличение плотности расположения громкоговорителей.

Создание пространственной звуковой картины в формате WFS

При создании пространственной звуковой картины необходимо соблюсти определенные условия как при оснащении помещения для звуковоспроизведения, так и на стадии звукозаписи. Пространственные эффекты возможны только при условии, что реверберация вторичного помещения не будет иметь значительного влияния на воспроизводимый сигнал. Помещение, где должна быть установлена система пространственного звука на основе WFS-формата, необходимо хорошо заглушить. Такая акустическая подготовка помещения, необходимая для синтеза звукового поля, позволяет избежать отражения звука от окружающих поверхностей. Средствами WFS в помещении для прослушивания звукорежиссер может воссоздать виртуальное акустическое пространство фактически любого помещения, создавая тем самым у слушателя ощущение присутствия в концертном зале или костеле, комнате или пещере и т.д. Акустическое пространство складывается из расположения звуковых источников в пространстве, резонансов (тембральной окраски) сигналов и процессов реверберации. Реверберация представляет собой процесс затухания сигнала в помещении, связанный с многократными отражениями прямого сигнала от поверхностей, формирующих пространство. Каждое отражение имеет свою индивидуальную интенсивность, амплитудно-частотную, временную и пространственную характеристики, множество отражений складывается в единое звучание –­ реверберационного затухания. В рамках формата WFS есть возможность синтезировать каждое отражение в виде отдельного дополнительного «зеркального» звукового объекта, что недостижимо при использовании предшествующих систем. Однако сложность необходимых вычислений существенно возрастает, что не позволяет использовать такой прямолинейный подход для синтеза отражений сколько-нибудь сложного помещения. Изучив особенности восприятия реверберационных процессов, исследователя пришли к заключению, что человеческая слуховая система способна качественно анализировать пространственную и временную характеристику отдельного отражения лишь в первые 100 миллисекунд реверберационного процесса, когда общее число воспринимаемых отражений сравнительно невелико. Эта особенность восприятия позволила разработчикам разделить процесс реверберации в формате WFS на две составляющие: ранние отражения (0-100 мсек) и диффузное затухание (после 100 мсек). Благодаря ранним отражениям слушатель получает наиболее точное представление о собственном положении внутри виртуального помещения, о положении источников в пространстве относительно границ помещения, о размерах помещения и пр. Тот факт, что таких отражений сравнительно немного, позволяет синтезировать каждое из них в формате WFS с сохранением пространственной, временной и амплитудно-частотной характеристики [8]. Диффузное затухание в формате WFS синтезируется в виде нескольких плоских волн, каждая с индивидуальной амплитудно-частотной характеристикой и направлением, что даёт представление об отражающих поверхностях помещения, резонансах и времени реверберации. Исследования Я. Сонке [9] позволили определить, что от четырех до восьми плоских волн достаточно, чтобы воспринимать акустическое пространство как однородное и изотропное. Современный уровень вычислительной техники позволяет синтезировать такое количество сигналов в режиме реального времени.

Пространственная картина в формате WFS может быть создана как на основе «живой» одновременной записи звуковых источников в акустическом пространстве, так и синтезирована на основе отдельных записей и метаданных, создающих виртуальное пространство в соответствии с замыслом звукорежиссера.

В первом случае воспринимаемая звуковая картина будет наиболее полно соответствовать первичной звуковой картине, таким образом, звукорежиссер может «перенести» слушателя из помещения для прослушивания в помещение, где производилась запись. Особенности звуковоспроизведения в формате WFS позволяют слушателю свободно перемещаться в пространстве, что не искажает воспринимаемую пространственную звуковую картину. Таким образом, каждый слушатель может занять в помещении для прослушивания любое место в соответствии с субъективным представлением об оптимальном акустическом балансе, что будет соответствовать выбору соответствующего места в первичном акустическом пространстве. Большое количество ранних записей в формате WFS были выполнены в технике одновременной записи, что позволило выработать определенный алгоритм их создания. Запись небольших коллективов и камерных оркестров наиболее популярна для демонстрации преимуществ формата WFS, так как в этом случае положение каждого инструмента в первичном помещении имеет большое значение при формировании пространственной звуковой картины. Микрофоны при записи можно разделить на две группы:

  • точечные микрофоны для записи «прямого» сигнала от каждого инструмента или группы инструментов в отдельности;
  • общие микрофоны для записи пространственных эффектов.

Точечные микрофоны располагаются близко к инструменту, чтобы избежать взаимопроникновения и записать инструмент максимально «сухо», то есть минимизировать влияние акустики помещения на сигнал. Количество точечных микрофонов связано с числом музыкальных инструментов, групп музыкальных инструментов или независимых звуковых объектов в общем смысле.

Общие микрофоны располагаются в пространстве так, чтобы наилучшим образом записать реверберационные процессы. Расстояние микрофонов от «сцены» определяется акустическими характеристиками помещения. Сигнал каждого микрофона используется для создания отдельной плоской волны для имитации акустики помещения, в соответствии с алгоритмами, описанными выше.

Звукозапись по технологии WFS, кодированная в формат MPEG4, представляет собой совокупность медиаобъектов [5]. Запись с каждого точечного микрофона кодируется в отдельный медиаобъект, в метаданные заносится информации об исходном положении источника в пространстве. Запись с общих микрофонов хранится также в виде объектов с указанием нормали к поверхности, синтезируемой плоской волны, в качестве метаданных.

Последовательная запись в формате WFS немногим отличается от технологии, описанной выше. В отличие от единовременного исполнения и записи звуковых объектов в акустическом пространстве, каждый объект записывается в отдельном заглушенном помещении. «Акустика» помещения в этом случае синтезируется на основе импульсной характеристики с помощью техники аурализации. Импульсная характеристика помещения является своего рода акустическим слепком пространства, описывающим распространение сигнала в нем и возникающие отражения от всех поверхностей помещения. Записанная реакция помещения на короткий акустический импульс позволяет моделировать реакцию данного помещения на любой произвольный звуковой сигнал. Благодаря математической операции свертки звукорежиссер может смоделировать отражения, возникающие в помещении для любого звукового источника, записанного в заглушенной студии, и получить его звучание в желаемом помещении.

Как было сказано ранее, для операции свертки необходима импульсная характеристика помещения – многоканальный аудиофайл, описывающий затухания в помещении. Запись импульсной характеристики производится на группу микрофонов или массив микрофонов, расположенных на существенном расстоянии от «сцены». Использование специального SoundField-микрофона позволяет получить информацию о скорости и направлении движения частиц, а также значении давления в той точке пространства, где он установлен. Процесс создания реверберации на основе операции свертки импульсной характеристики с музыкальным сигналом получил большое развитие благодаря усовершенствованию цифровых систем обработки сигнала и на сегодняшний день является одним из наиболее качественных алгоритмов в создании пространственных эффектов. В рамках технологии WFS синтезированные таким образом отражения воспроизводятся в форме плоских волн в соответствии с алгоритмом, описанным выше.

Последовательная запись открывает перед звукорежиссером возможность создания виртуальных звуковых пространств высокой достоверности. Варьируя импульсные характеристики разных помещений, звукорежиссер создаёт эффекты многопространственности, что позволяет ему создавать пространственные звуковые картины любой сложности.

Заключение

Развитие технологии WFS предполагает дальнейшую интеграцию с существующими стандартами аудиоиндустрии, а также снижение стоимости WFS-систем и разработку программного обеспечения для удобного, наглядного контроля звуковой картины в формате WFS. Для звукорежиссера переход на формат WFS открывает принципиально новые возможности для создания звуковой картины. Использование WFS-формата позволяет погрузить слушателя в виртуальное звуковое поле, позволив ему свободно перемещаться в пространстве, тем самым взаимодействовать с созданной звуковой картиной. Технология WFS в кинотеатрах позволит усилить эффект присутствия, добавит рельеф звуковой картине, даст возможность помещать звуковые образы перед экраном. В концертном зале основным достоинством систем на основе WFS-формата является возможность создавать стабильную объемную звуковую картину во всем пространстве концертного зала, синтезировать виртуальное поле, создавать различные пространственные эффекты.

Рецензенты:

Денисов А.В., доктор искусствоведения, профессор кафедры звукорежиссуры Негосударственного образовательного учреждения высшего профессионального образования «Санкт-Петербургский гуманитарный университет профсоюзов», г. Санкт-Петербург.

Алдошина И.А., д.т.н., профессор кафедры режиссуры мультимедиа Негосударственного образовательного учреждения высшего профессионального образования «Санкт-Петербургский гуманитарный университет профсоюзов», г. Санкт-Петербург.


[*] Аурализация – процесс превращения физической модели звукового источника в пространстве в слышимый звук, в основе которого лежат принципы физического или математического моделирования.