Le changement climatique est la principale priorité de recherche de la NSF Engineering Alliance

Le changement climatique est la principale priorité de recherche de la NSF Engineering Alliance

Et pourtant, même maintenant, après 150 ans de développement, le son que nous entendons, même d’un système audio haut de gamme, est bien en deçà de ce que nous entendons lorsque nous assistons physiquement à une performance musicale en direct. Lors d’un tel événement, nous sommes dans un champ sonore naturel et pouvons facilement percevoir que les sons de différents instruments proviennent de différents endroits, même lorsque le champ sonore est entrecroisé avec le son mixé de plusieurs instruments. Il y a une raison pour laquelle les gens paient des sommes considérables pour écouter de la musique en direct : c’est plus agréable, excitant et peut générer un plus grand impact émotionnel.

Aujourd’hui, les chercheurs, les entreprises et les entrepreneurs, y compris nous-mêmes, se rapprochent enfin de l’audio enregistré qui recrée véritablement un champ sonore naturel. Le groupe comprend de grandes entreprises, telles qu’Apple et Sony, ainsi que des entreprises plus petites, telles que Creative. Netflix a récemment dévoilé un partenariat avec Sennheiser en vertu duquel le réseau a commencé à utiliser un nouveau système, Ambeo 2-Channel Spatial Audio, pour accroître le réalisme sonore d’émissions télévisées telles que “Stranger Things” et “The Witcher”.

Il existe maintenant au moins une demi-douzaine d’approches différentes pour produire un son hautement réaliste. Nous utilisons le terme « scène sonore » pour distinguer notre travail des autres formats audio, tels que ceux appelés audio spatial ou audio immersif. Ceux-ci peuvent représenter le son avec plus d’effet spatial que la stéréo ordinaire, mais ils n’incluent généralement pas les repères de localisation détaillés de la source sonore qui sont nécessaires pour reproduire un champ sonore vraiment convaincant.

Nous pensons que la scène sonore est l’avenir de l’enregistrement et de la reproduction de la musique. Mais avant qu’une révolution aussi radicale ne puisse se produire, il faudra franchir un énorme obstacle : celui de convertir facilement et à peu de frais les innombrables heures d’enregistrements existants, qu’ils soient mono, stéréo ou surround multicanal (5.1, 7.1 , etc). Personne ne sait exactement combien de chansons ont été enregistrées, mais selon l’entreprise de métadonnées de divertissement Gracenote, plus de 200 millions de chansons enregistrées sont maintenant disponibles sur la planète Terre. Étant donné que la durée moyenne d’une chanson est d’environ 3 minutes, cela équivaut à environ 1 100 ans de musique.

Lire aussi  L’Allemagne est honnête sur ce que coûtera le zéro net

Après avoir séparé un enregistrement dans ses pistes composantes, l’étape suivante consiste à les remixer dans un enregistrement de scène sonore. Ceci est accompli par un processeur de signal sonore. Ce processeur de scène sonore exécute une fonction de calcul complexe pour générer les signaux de sortie qui pilotent les haut-parleurs et produisent le son de la scène sonore. Les entrées du générateur comprennent les pistes isolées, les emplacements physiques des haut-parleurs et les emplacements souhaités de l’auditeur et des sources sonores dans le champ sonore recréé. Les sorties du processeur de scène sonore sont des signaux multipistes, un pour chaque canal, pour piloter les multiples haut-parleurs.

Le champ sonore peut être dans un espace physique, s’il est généré par des haut-parleurs, ou dans un espace virtuel, s’il est généré par des écouteurs ou des écouteurs. La fonction exécutée dans le processeur de scène sonore est basée sur l’acoustique et la psychoacoustique computationnelles, et elle prend en compte la propagation des ondes sonores et les interférences dans le champ sonore souhaité et les HRTF pour l’auditeur et le champ sonore souhaité.

Par exemple, si l’auditeur va utiliser des écouteurs, le générateur sélectionne un ensemble de HRTF sur la base de la configuration des emplacements de source sonore souhaités, puis utilise les HRTF sélectionnés pour filtrer les pistes de source sonore isolées. Enfin, le processeur de scène sonore combine toutes les sorties HRTF pour générer les pistes gauche et droite pour les écouteurs. Si la musique doit être lue sur des haut-parleurs, au moins deux sont nécessaires, mais plus il y a de haut-parleurs, meilleur est le champ sonore. Le nombre de sources sonores dans le champ sonore recréé peut être supérieur ou inférieur au nombre d’enceintes.

Lire aussi  Le zéro net est toujours possible, mais les dépenses en énergie propre doivent aller plus vite

Nous avons lancé notre première application de scène sonore, pour l’iPhone, en 2020. Elle permet aux auditeurs de configurer, d’écouter et d’enregistrer de la musique de scène sonore en temps réel – le traitement ne provoque aucun retard perceptible. L’application, appelée 3D Musica, convertit la musique stéréo de la bibliothèque musicale personnelle d’un auditeur, du cloud ou même de la musique en streaming sur scène sonore en temps réel. (Pour le karaoké, l’application peut supprimer les voix ou produire n’importe quel instrument isolé.)

Plus tôt cette année, nous avons ouvert un portail Web, 3dsoundstage.com, qui fournit toutes les fonctionnalités de l’application 3D Musica dans le cloud ainsi qu’une interface de programmation d’application (API) rendant les fonctionnalités disponibles aux fournisseurs de musique en streaming et même aux utilisateurs de n’importe quel Navigateur Web. Tout le monde peut désormais écouter de la musique dans l’audio de la scène sonore sur pratiquement n’importe quel appareil.

Lorsque le son se rend à vos oreilles, les caractéristiques uniques de votre tête (sa forme physique, la forme de vos oreilles externes et internes, même la forme de vos cavités nasales) modifient le spectre audio du son d’origine.

Nous avons également développé des versions distinctes du logiciel 3D Soundstage pour les véhicules et les systèmes et appareils audio domestiques afin de recréer un champ sonore 3D à l’aide de deux, quatre haut-parleurs ou plus. Au-delà de la lecture de musique, nous fondons de grands espoirs sur cette technologie en visioconférence. Beaucoup d’entre nous ont vécu l’expérience fatigante d’assister à des vidéoconférences au cours desquelles nous avions du mal à entendre clairement les autres participants ou à ne pas savoir qui parlait. Avec la scène sonore, l’audio peut être configuré de manière à ce que chaque personne soit entendue venant d’un emplacement distinct dans une pièce virtuelle. Ou le “lieu” peut simplement être attribué en fonction de la position de la personne dans la grille typique de Zoom et d’autres applications de visioconférence. Pour certains, au moins, la visioconférence sera moins fatigante et la parole sera plus intelligible.

Lire aussi  La société de cybersécurité Darktrace accepte un rachat de 5 milliards de dollars

Tout comme l’audio passé du mono au stéréo, et du stéréo à l’audio surround et spatial, il commence maintenant à passer à la scène sonore. À ces époques antérieures, les audiophiles évaluaient un système audio en fonction de sa fidélité, en fonction de paramètres tels que la bande passante, la distorsion harmonique, la résolution des données, le temps de réponse, la compression des données sans perte ou avec perte et d’autres facteurs liés au signal. Désormais, la scène sonore peut être ajoutée comme une autre dimension à la fidélité du son – et, osons le dire, la plus fondamentale. Pour les oreilles humaines, l’impact de la scène sonore, avec ses repères spatiaux et son immédiateté captivante, est beaucoup plus important que les améliorations progressives de la fidélité. Cette fonctionnalité extraordinaire offre des capacités auparavant au-delà de l’expérience même des audiophiles les plus riches.

La technologie a alimenté les révolutions précédentes dans l’industrie audio, et elle en lance maintenant une autre. L’intelligence artificielle, la réalité virtuelle et le traitement du signal numérique exploitent la psychoacoustique pour offrir aux passionnés d’audio des capacités qu’ils n’ont jamais eues. En même temps, ces technologies offrent aux maisons de disques et aux artistes de nouveaux outils qui insuffleront une nouvelle vie aux anciens enregistrements et ouvriront de nouvelles voies à la créativité. Enfin, l’objectif centenaire de recréer de manière convaincante les sons de la salle de concert a été atteint.

Cet article apparaît dans le numéro imprimé d’octobre 2022 sous le titre “Comment l’audio récupère son groove”.

À partir des articles de votre site

Articles connexes sur le Web

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Recent News

Editor's Pick