Scientific journal
Modern problems of science and education
ISSN 2070-7428
"Перечень" ВАК
ИФ РИНЦ = 1,006

PSYCHOACOUSTIC BASIS OF PERCEPTION OF MULTICHANNEL SOUND WHILE USING THE SIMULATOR "VIRTUAL ORCHESTRA"

Novikov O.A. 1
1 Moscow State Humanitarian University n.a. M.A.Sholokhov
The article presents a theoretical analysis of the problem psychoacoustic perception features multi-channel surround sound when using the simulator "Virtual Orchestra". The ways of empowering surround to enhance the process of training of professional musicians; technological and psychoacoustic technology features Surround Sound to create acoustic learning environment, which allows you to recreate the feeling of the acoustic conditions of the future professional activity of a musician. Describes the acoustic environment of a concert hall, needed to understand how to create a natural sound to play through the multi-channel system. Particular attention is paid to the differences of perception of sound from the speakers and from the natural source. The basic methods of minimizing distortion when playing audio through a multi-channel system for creating effective teaching simulator.
acoustic training environment
psychoacoustics
multi-channel system
simulator for musicians
virtual orchestra
При обучении профессионального музыканта важна не только передача опыта мастера из рук в руки, но и наличие возможностей ставить ученика в различные ситуации, в которых он должен принимать самостоятельные решения. Эти ситуации могут быть смоделированы как самим педагогом, так и созданы с использованием технических средств обучения, в частности, с помощью акустической обучающей среды.

Акустическая обучающая среда служит основой виртуальной акустической среды и позволяет:

  • моделировать различные акустические ситуации, недоступные для создания вербальной системой человека;
  • менять параметры и свойства контекста, в соответствии с необходимыми динамически меняющимися условиями образования этого контекста;
  • моделировать отклик системы на действия музыканта, что представляется важным при анализе качества исполнения и оценке реакции музыканта;
  • воспринимать музыкальные произведения в целостном виде, с подробной пространственной детализацией.

Создание виртуальной акустической среды, а вместе с тем и тренажера «виртуальный оркестр» возможно при наличии многоканальной системы воспроизведения звука, которая представляет собой некоторое количество громкоговорителей установленных вокруг слушателя по определенным правилам.

Однако следует принять во внимание тот факт, что человеческое восприятие звука воспроизведенного громкоговорителями отличается от восприятия звука естественного происхождения, т.к. формирование его в природе и громкоговорителями различно.

Естественный источник звука не разделен на составляющие, он исходит из единого места, но, преодолевая расстояния и препятствия на пути распространения, становится объемным. В двух-канальном стерео источников становится два, в Surround Sound источников становится 6 и более, и поэтому формирование единого звукового образа от нескольких громкоговорителей происходит благодаря психоакустическому свойству слуховой системы человека воспринимать фантомный образ между двумя когерентными звуковыми сигналами, приходящими с различных сторон.

Одновременно с увеличением количества громкоговорителей увеличиваются возможности аудио системы для воспроизведения пространственных составляющих звукового образа, в том числе расширяются возможности панорамирования инструментов до полного круга.

Однако частотные изменения в фантомных образах по сравнению с исходным тембром увеличиваются с приходит сигналов от громкоговорителей отличных от фронтальных. Хотя незначительные тембральные изменения отмечаются даже в фантомом образе между фронтальными громкоговорителями, между задними же - изменения тембра значительны на слух.

Таким образом, попытка воссоздать природный звуковой источник с помощью увеличивающегося количества громкоговорителей неизбежно приводит к некоторым изменениям естественного исходного звучания, но позволяет с все большей детализацией воссоздать в восприятии человека иллюзию практически любого пространства.

При разработке обучающих систем, в которых многоканальный звук является основной составляющей, необходимо компенсировать изменения в звучании, связанные с психоакустическими особенностями восприятия человека.

Содержательная направленность тренажера «Виртуальный оркестр» - это игра в виртуальном оркестровом пространстве. Использование тренажера способствует интенсификации приобретения и накоплению практического опыта оркестровой игры обучаемыми; формирует навыки слаженной игры в оркестре; развивает слуховую активность во время исполнения, направленную как на свое исполнение, так и на партнеров по оркестровому музицированию; формирует навыки преодоления трудностей под наблюдением педагога.

Создание тренажера «Виртуальный оркестр» связано с распределением звучания инструментов по пространственной панораме. Учащийся оказывается в центре воссозданного оркестрового звучания, и в зависимости от исполняемой им партии различные группы оркестра располагаются с разных сторон.

Изменение локализации при прослушивании естественного звука связано, в том числе, и с изменениями в его частотных составляющих. И эти частотные изменения звука частично вычитаются на этапе обработки пришедших сигналов в мозг. В итоге человек выделяет и воспринимает некий "источник тембра", который остается неизменным при смене угла прихода звука. Меняется только ощущение локализации инструмента. Примером может служить звучание музыкального инструмента при перемещении музыканта. Хотя частотная характеристика при его перемещении кардинально изменяется за счет изменения акустического баланса и изменения угла восприятия, но инструмент по-прежнему звучит как тот же для нас, и мы легко определим, если музыкант возьмет подобный, но другой музыкальный инструмент.

Эта замечательная способность, позволяющая слуху вычленить из звука изменения связанные с акустикой помещения и изменения вносимыми самой слуховой системой для определения локализации, помогает найти истинный исходный тембр. Но работает она только с естественными источниками, а звук, созданный с помощью громкоговорителей, подчиняется другим законам. Если не принимать это во внимание, то можно прийти к выводу, что коррекция не является необходимой для звука, поступающего с направлений отличных от передних, и что подобранная пара громкоговорителей с необходимой поправкой на особенности акустики конкретного помещения - это все что нужно для воссоздания полноценного звучания [1]. Другими словами предположение, что простое панорамирование между громкоговорителями должно привести к тем же тембрам при распределении их вокруг, не подтверждается фактами.

Мы слышим другие эффекты:

  • Звук, панорамированный на фронтально расположенные громкоговорители субъективно отличается от панорамированного на тыловые и воспринимается более ярким, даже при использовании идеально подобранных громкоговорителей.
  • Звук, панорамированный между задним и передних громкоговорителями, мы воспринимаем не как единый когерентный звук между двумя громкоговорителями (фантомных образ), а как две частотные составляющие, часть частот звука мы воспринимаем спереди, а остальные сзади.
  • При динамическом панорамировании из переднего громкоговорителя в задний, звук из единого распадается на две половины спектра, затем, когда перемещение закончено, звук опять становится единым.

Одна из предполагаемых причин проявления таких особенностей в звучании многоканальных систем заключаются в следующем: создание иллюзии перемещения источника звука в пространстве с помощью перемещения звукового сигнала между несколькими электроакустическими источниками не является физическим аналогом данного процесса, происходящего в природе. Другой взгляд на эту проблему заключается в том, что в системе 5.1 мы имеем пространство вокруг, квантованное пятью громкоговорителями. Это слишком крупно для 360 градусов, поэтому шаги квантования заметны [3].

Различие в восприятии звука приходящего с громкоговорителей, расположенных с различных сторон, возможно частично скорректировать, внеся высокочастотную коррекцию инструментов панорамированных на тыловые громкоговорители таким образом, чтобы они звучали по яркости как и все остальные.

Процесс корректировки усложняется тем, что в звуке, приходящем от громкоговорителей, содержится не только прямой звук от инструментов, но и составляющие звука, используемые для иллюзии создаваемого пространства: ранние отражения и реверберационный хвост и т.п. Следовательно, предлагаемая выше, высокочастотная эквализация повлияет на все эти составляющие звучания, что может привести к нарушению баланса между ними.

Важным свойством тренажера является передача звукового пространства сформированного вокруг. Поэтому при создании тренажера важно правильное понимать, как формируется пространственное звучание. Есть два параметра, которые описывают пространственный звук: spaciousness (размерность, просторность) и envelopment (заполненность, пространственность, окруженность). Эти параметры имеют схожесть, но у них есть разница.

Spaciousness применяется к изображению части звукового пространства, его можно услышать как через двух канальную систему, так и через 5.1. На него влияют главным образом акустический баланс и реверберация. На двухканальной системе звуковое поле обычно располагается между громкоговорителями, и spaciousness относится к ощущению физического пространства между ними. В это понятие включена и глубина пространства, но опять же ограниченная двумя громкоговорителями.

Envelopment относится к ощущению окружения звуком, которое вносится в звучание или формируется при записи, и это требует многоканальной системы для воспроизведения.

Двухканальная система может производить впечатление наличия пространства за громкоговорителями - spaciousness, а многоканальная система производит ощущение пребывания там - envelopment.

Специалистами был выявлен ряд особенностей распространения звука в акустике концертного зала, которые помогут сформировать естественный звук при воспроизведении через многоканальную систему:

  • Количество реверберации и ее параметры, такие как время реверберации, время задержки перед ранними отражениями, количество и качество диффузии, очень важны для восприятия окружающего звука. Они олицетворяют свойства звукового поля.
  • Ранние отражения, приходящие спереди и сосредоточенные, главным образом, на 55° в сторону от центра (с небольшим допуском), добавляют в слуховые ощущения ширину и оставляют приятное впечатление от звука.
  • Все направления полезны в получении ощущения окружения звуком, поэтому реверберация должна применяется ко всем каналам. В литературе отмечается, что наиболее важными для реверберации являются каналы Ls и Rs, а каналы L, C, R не имеют большого значения.
  • Исследования показали, что пять каналов - это минимум для получения чувства окружения в диффузном звуковом поле, однако углы для получения такого ощущения не соответствуют стандартной установке 5.1. Необходимые углы составляют +-36, +-108, +180 градусов. Из них +-36° соответствуют громкоговорителям, расположенным на +-30°, +-108°-+-110°, но нет тылового канала в стандартной конфигурации. Таким образом, ощущение полного диффузного окружения при стандартной установке 5.1 проблематично.
  • Симметрично расположенные тыловые каналы в системе 5.1 необходимы для получения ощущения звукового окружения и особенно подходят для воспроизведения специально записанного отраженного звука помещения.
  • Действие звуковых эффектов, таких как уровень громкости, задержка между прямым звуком и первым отражением, время реверберации и подача двух отличающихся по звучанию сигнала в уши, воздействуют на разных людей, находящихся в звуковом поле по-разному.

Необходимо отметить, что важными предпосылками создания тренажера являются проводимые эксперименты подтверждающие эффективность многоканальных систем для формирования более детального ощущения звукового пространства при увеличении количества каналов. Также немаловажный фактор - широкая распространенность на сегодняшний день таких систем, их применяют в театральных постановках, телевидении и радиовещании. Стремительное развитие медийной индустрии в этом направлении приводит к повсеместным домашним инсталляциям звуковых систем с шестью и более каналами.

Сейчас ни для кого не является открытием, что звук в стерео формате звучит намного привлекательнее, нежели в моно. Слушатель с любой подготовкой способен на слух отличить моно от стерео, при этом подавляющее большинство предпочитает к прослушиванию именно стерео звук. Поэтому можно с уверенностью констатировать, что звук стерео значительно отличается на слух от звука моно.

Слушатели находят большие различия и между стерео и 5.1. Аналогично чувствуется разница между 5.1 и 10.2, выражающаяся в большей прозрачности звучания, но и это не предел возможностей восприятия. Поэтому многоканальные системы находятся на пути к совершенствованию.

Обратим внимание на следующее: для определения путей развития многоканального звуковоспроизведения при создании акустической обучающей среды, необходимо учесть, что в системе 5.1 звучит хорошо, а что необходимо улучшить.

  • В звучании стандартной системы 5.1 воспринимается неоднородность звука (образуются так называемые "ямы в панораме"), приходящего между тыловым и фронтальным громкоговорителями. Устранить это можно добавлением широко располагающихся фронтальных громкоговорителей для плавного прохождения звука от переднего громкоговорителя к громкоговорителю, расположенному сзади, что также улучшит восприятие фантомного образа сбоку.
  • Для заполнения пространства между задними громкоговорителями предлагается ввести центральный тыловой громкоговоритель.
  • Для увеличения воспринимаемого пространства системы 5.1 по вертикали можно добавить два передних громкоговорителя выше основных.
  • Ровность супер низкой части спектра по всему объему помещения обеспечат несколько сабвуферов вместо одного.

Указанные добавления ведут систему 5.1 к системе 10.2 с соответствующим увеличением пространственного эффекта. 10.2 - это логическое продолжение системы 5.1, как 5.1 - продолжение 2.0.

Разворачиваются большие споры относительно технических характеристик сигнала для нового медиа формата воспроизводимого многоканальными системами. Однако многие разработанные спецификации позволяют оперировать этими параметрами весьма гибко. Возможно использование любой частоты дискретизации от 44100 до 192000 Гц с квантованием 24 бита. Это позволяет воспроизводить частотный диапазон, превышающий возможности восприятия слуховой системы человека, и достаточно для передачи динамического диапазона от порога слышимости до болевого порога.

Развитие систем многоканального воспроизведения привело к попыткам создания виртуальной звуковой реальности, которая позволяет создать иллюзию изменения акустического поля при перемещении в виртуальной пространстве. Для этого ведутся разработки в сфере аурализации.

Аурализация - это воссоздание нужного звучания в комнате с помощью акустической системы. Компьютерная модель источника звука взаимодействует с компьютерной моделью комнаты, в результате создается необходимое звучание, которое воспроизводится обычно через 2 канальную систему с исключением взаимопроникновений между каналами. Одной из дополнительных возможностей такой системы является выяснение акустических проблем дорогой архитектуры до ее строительства. В будущем аурализация может включать 5.1 канальную систему воспроизведения и, тем самым, уменьшить ресурсы, затрачиваемые вычислительной системой на расчеты, так как многоканальная система раскрывает пространственный потенциал звука более полно по сравнению с двух канальной системой.

Виртуальная аудио реальность разрабатывается как часть виртуальной реальности, в которой пользователь может перемещаться, хоть и с ограничениями, в пространстве, как в реальном мире, при этом ощущая звук вокруг как реальный.

Методы аурализации применяются наряду с отслеживанием положения головы пользователя для получения полного слухового ощущения присутствия. Такие системы основаны на зрительном впечатлении и требуют наличия проекторов вокруг. Таким образом, практически не остается места для расположения громкоговорителей, чтобы они не прерывали визуального впечатления. В этих случаях многоканальную систему располагают по углам куба, хотя этот метод не является акустически корректным.

В теории возможно без исправления взаимопроникновения между каналами и синтеза HRTF настроить для человека систему так, чтобы получить ощущение присутствия и при перемещении в виртуальном пространстве иметь звук идентичный реальному, но, по подсчетам специалистов, потребуется около миллиона каналов [3].

Создание виртуальной акустической среды для музыканта не нуждается в такой проработке визуальных деталей, и необходимость перемещения фактически отсутствует, эта специфика несколько облегчает задачу по созданию тренажера. Однако описанные исследования восприятия человеком звучания от многоканальных систем и наработки в области создания виртуальной реальности необходимо учитывать при создании эффективного инструмента для профессионального обучения музыканта.

Рецензенты:

Немыкина И.Н., д.п.н., профессор, профессор кафедры музыкознания и музыкального образования ФГБОУ ВПО «Московский государственный гуманитарный университет им. М.А. Шолохова» Минобрнауки России, г. Москва;

Рапацкая Л.А., д.п.н., профессор, декан факультета культуры и музыкального искусства ФГБОУ ВПО «Московский государственный гуманитарный университет им. М.А. Шолохова» Минобрнауки России, г. Москва.