Écouteurs : recherche, conception et évolution
Les écouteurs Valve Index ont été optimisés en vue de l'expérience de réalité virtuelle et de ce fait, leur conception diverge sur plusieurs aspects intéressants de celle des écouteurs traditionnels du commerce.
Dès le début de notre expérimentation en VR, il est devenu évident que pour que les personnes utilisant la VR parviennent à une « suspension de l'incrédulité » adéquate*, il fallait non seulement se reposer sur les méthodes narratives, environnementales et émotionnelles des jeux et des films traditionnels, mais aussi résoudre une catégorie entièrement nouvelle de problèmes physiologiques propres à la VR. Lorsque nous portons un casque pour jouer à Budget Cuts, nous nous attendons à ce que la VR nous donne l'impression que notre corps a été transporté dans un bureau rempli de robots meurtriers plutôt que de nous montrer leur environnement via un écran statique.
Nos recherches et nos tests en jeu nous ont permis de comprendre que l'obtention d'une immersion sonore maximale imposait autant d'exigences sur la conception des composants audio que sur le système de suivi 3D ou sur les panneaux d'affichage. Nous avons également appris que réaliser une conception axée sur ces exigences signifiait accepter des compromis intéressants, ce qui a influencé la position des haut-parleurs, le poids du transducteur, la forme du diaphragme du transducteur, le design industriel du boîtier du haut-parleur, et même les caractéristiques fondamentales de réponse en fréquence.
*Dans d'autres contextes, nous avons appelé « présence » cette suspension de l'incrédulité incarnée, mais ce terme porte d'autres connotations dans le monde audio, nous ne l'utiliserons donc pas dans le reste de cet article d'approfondissement.
S'appuyer à la fois sur le matériel et le logiciel
Une immersion audio convaincante ne peut être obtenue qu'en s'appuyant simultanément sur les domaines logiciel et matériel. Savoir où placer la frontière entre les responsabilités du matériel (appareils audio) et du logiciel (jeux, expériences de VR) exigeait une prise en compte holistique de l'ensemble du flux de l'audio pour la VR, depuis la façon dont le contenu sonore de la VR est créé jusqu'à la façon dont il est produit par les moteurs de jeu, en passant par toutes les manières dont il peut parvenir à l'oreille.
Du côté logiciel, les scientifiques et les équipes d’ingénierie du son des jeux vidéo travaillent à la création d'un contenu sonore immersif convaincant depuis les premières expériences de son panoramique apparues dans les années 1990 (Doom, Half-Life, Aureal3D etc.). Puis, grâce à la génération actuelle de la VR, nous avons constaté d'énormes améliorations dans les technologies audio spatiales. Le rendu binaural et les modules de simulation du son basés sur la physique comme SteamAudio permettent aux équipes de développement d'obtenir une précision positionnelle sonore encore plus grande, des réverbérations virtuelles physiquement justes, de l'occlusion sonore et de la propagation, tout cela en utilisant des écouteurs stéréo ordinaires. En recherchant le périphérique d'écoute optimal pour la VR actuelle, nous avons mis à profit les connaissances et les recherches suivantes dans les simulations de logiciels audio :
- Le contenu VR est principalement diffusé en stéréo : un canal audio gauche et un canal audio droit. Ces canaux peuvent contenir une coloration tonale binaurale et HRTF intégrée selon l'endroit où le joueur ou la joueuse regarde à un moment précis dans le temps.
- Nos oreilles externes, la forme de notre tête et la géométrie de notre visage ajoutent une signature tonale spécifique qui aide notre cerveau à identifier le son réel par rapport au son imaginé, ainsi que l'emplacement des sources sonores par rapport à nous (derrière, au-dessus, au-dessous, à gauche, à droite, etc.).
- La fidélité du son dans les moyennes et hautes fréquences est très importante.
- Les simulations binaurales s'appuient sur des changements subtils de timbre (1 kHz à 8 kHz) pour transmettre la position d'une source sonore par rapport à la personne référente. Si un périphérique d'écoute ajoute sa propre coloration de fréquence étouffée, cela interférera avec sa capacité à localiser le son.
- En général, les êtres humains sont très sensibles aux sons qui se trouvent dans la gamme de 2 kHz à 5 kHz (lien en anglais). Si la fréquence d'un son virtuel ne correspond pas à la fréquence attendue pour le son réel, il est plus probable que l'on identifie le son comme étant « non réel ». Ceci est particulièrement vrai quand on réalise à quel point il est facile de différencier la voix d'une personne diffusée par l'intermédiaire d'un haut-parleur de celle d'une personne qui parle à côté de vous.
- La fidélité du son dans les basses fréquences est importante.
- Alors que le contenu à basse fréquence ne se rencontre pas très souvent dans la nature, il se retrouve très régulièrement en VR et dans les contenus de divertissement (musique, grondements, explosions, coups de feu, battements de cœur, impacts, sorts magiques, etc.). Les basses sont essentielles pour donner une idée de la taille et de l'échelle. Elles augmentent l'immersion visuelle de la VR et créent certains indices émotionnels : le danger, la stupéfaction, la crainte, l'isolement, l'intériorisation, etc. Par conséquent, il était important que notre périphérique d'écoute maintienne une bonne réponse dans les graves.
Pourquoi pas des écouteurs ?
Les écouteurs traditionnels sont excellents pour fournir un son stéréo direct qui arrive tout droit dans chaque oreille. Les joueurs et joueuses peuvent regarder dans n'importe quelle direction dans le monde virtuel, et les moteurs de jeu 3D munis de modules de simulation sonore produiront le signal stéréo nécessaire pour transmettre l'emplacement correct de la source sonore virtuelle. C'est la raison pour laquelle les personnes jouant aux e-sports (p. ex. CS:GO) utilisent des casques audio plutôt que des haut-parleurs qui leur font face : les casques fournissent des informations sonores spatiales plus directes. Deux canaux de sortie (G/D), pour deux écouteurs (G/D), pour deux oreilles (G/D), c'est simple.
En général, cependant, les appareils audio traditionnels sont rarement conçus avec l'immersion sonore comme objectif principal. Les appareils personnels comme les écouteurs intra-auriculaires, les écouteurs supra-auriculaires et les écouteurs de type Bluetooth sont optimisés pour l'écoute de musique et de divertissement dans les endroits où les haut-parleurs ne sont pas appropriés et où les ressources énergétiques sont souvent extrêmement faibles (téléphones portables, appareils fonctionnant avec piles, etc.). L'accent est souvent mis sur l'isolation acoustique, l'efficacité énergétique, la réduction du bruit et des réponses en fréquence exagérées. Nous avons estimé que bon nombre de ces optimisations n'avaient peut-être pas autant de sens dans le contexte de la VR actuelle à l'échelle d'une pièce, où l'environnement d'écoute général est un espace dédié (p. ex. une pièce intérieure avec un léger fond sonore), et où une fuite sonore minime peut être acceptable. Nous avons accès à beaucoup de puissance, et les réponses en fréquence doivent appuyer les suppositions des simulations sonores binaurales.
Les écouteurs supra et intra-auriculaires doivent entrer en contact avec l'oreille ou l'entourer afin d'atteindre leurs objectifs de manière optimale. Nous avons constaté que cela peut parfois aller à l'encontre de l'immersion sonore pour les raisons suivantes :
- L'émission du son directement dans le conduit auditif court-circuite le processus d'écoute naturel qui résulte de l'interaction de l'oreille et de la tête avec les ondes sonores réelles. Les personnes recevant ces ondes sonores ne profitent pas de la signature tonale créée par les oreilles, la tête et la géométrie personnelle. Cela peut donner l'impression que le son est imaginé ou qu'il provient de l'intérieur de la tête, même si le contenu audio est très spatialisé et produit par une simulation de la physique. Nous prédisons que les simulations logicielles finiront par tenir compte de cela.
- La pression dans l'oreille peut devenir douloureuse et inconfortable après un certain laps de temps, ce qui sort les gens de la « présence » VR.
- Certaines personnes ayant testé les écouteurs ont rapporté que le simple fait qu’ils touchent leurs oreilles leur indiquait qu'aucun son à venir ne serait réel.
- Quand l'oreille est enfermée dans des écouteurs supra-auriculaires, cela peut emprisonner la chaleur, ce qui donne l'impression que les casques de VR sont plus chauds que ce que la personne ressentirait dans la vraie vie, et réduit donc la « présence ».
- La qualité sonore de certains écouteurs peut interférer avec les timbres de fréquence subtils des simulations binaurales. Par exemple, les écouteurs dont les fréquences moyennes et hautes sont soit exagérées, soit étouffées interféreront probablement avec les subtilités des filtres HRTF, ce qui se traduira par une mauvaise perception du son directionnel dans les jeux et en VR.
Pourquoi pas des haut-parleurs ?
Nous avons également envisagé les haut-parleurs et les haut-parleurs formant des faisceaux dans des configurations surround ou stéréo typiques. Les haut-parleurs évitent bon nombre des problèmes de confort associés aux écouteurs et émettent un son que nous pouvons facilement percevoir comme extérieur à nos propres têtes, mais il existe plusieurs obstacles à leur adoption :
- Les configurations existantes de haut-parleurs stéréo présument une orientation face à la personne utilisant le matériel, de sorte que le son est reproduit comme si l'on était dans dans le public écoutant un groupe de musique sur une scène ou si l'on regardait la télévision depuis un canapé. Cela convient pour la musique et des films sur un écran, cependant, les contenus de jeux stéréo et en VR sont émis en supposant que les canaux G/D arrivent immédiatement de chaque côté de la tête de la personne référente.
- Les systèmes de son surround 5.1 et 7.1 courants limitent la projection du son à un champ horizontal, alors que les contenus sonores des jeux ou de la VR peuvent être placés virtuellement n'importe où autour de la personne utilisant le matériel.
- Les systèmes de haut-parleurs peuvent nécessiter du temps et de l'espace pour être installés convenablement, ce qui crée une friction supplémentaire pour la configuration de la VR.
- Avec des haut-parleurs, la personne est contrainte de rester dans un petit « espace idéal » pour avoir un retour de son spatial précis. La VR peut parfois nécessiter que les gens se déplacent dans un grand espace.
- Les haut-parleurs peuvent être influencés par l'acoustique de la pièce réelle, qui peut entrer en conflit avec l'acoustique souhaitée du monde virtuel.
- Les haut-parleurs peuvent donner l'impression qu'un son est trop éloigné, ce qui contredit l'emplacement d'une source sonore virtuelle qui pourrait être très proche des oreilles des joueurs et des joueuses.
L'idée
En examinant tous les compromis ci-dessus, il est devenu évident que la solution optimale pour la VR serait une paire d'écouteurs à champ ultra proche, large bande et hors de l'oreille (extra-auriculaires). Ils devraient être assez près de l'oreille pour imiter des écouteurs stéréo relatifs à la personne et pour prendre en charge le format de sortie du contenu VR actuel, mais assez loin pour permettre aux oreilles et à la tête d'appliquer leur propre coloration tonale sur le son, tout en répondant aux problèmes de confort et de pression. C'est cette prise de conscience, ainsi que l'inspiration d'un souvenir d'enfance où, me tenant entre deux haut-parleurs hi-fi orientés vers l'intérieur, j'avais eu cette impression d'une immersion sonore complète, qui ont abouti aux premiers prototypes.
L'évolution
Le premier prototype a été réalisé en collant deux petits transducteurs large bande sur les côtés d'un casque de skateboard. Un ancien VIVE était attaché à l'extérieur du casque. Les haut-parleurs étaient alimentés par USB et la sortie audio par la prise casque du HTC VIVE. Ce prototype rudimentaire a étonnamment bien réussi à démontrer l'augmentation de l'immersion sonore et de l'extériorisation lorsque nous avons laissé nos oreilles et notre tête interpréter le son naturellement. Le sentiment d'immersion est difficile à mesurer quantitativement, c'est pourquoi, à ce stade, nous nous sommes appuyés sur les retours qualitatifs de nos collègues et des testeurs pour décrire la différence sonore entre ce prototype et une paire d'écouteurs supra-auriculaires KOSS Porta Pro pendant une expérience de VR. Les réponses étaient suffisamment en faveur des haut-parleurs pour que nous nous sentions encouragés à poursuivre dans cette voie. Toutefois, plusieurs problèmes se sont présentés :
- Une réponse très limitée dans les graves.
- De légères variations dans la position des haut-parleurs causées par le fait de mettre le casque différemment ou de se déplacer en VR ont provoqué un changement significatif du volume, de la réponse en fréquence et de l'équilibre sonore.
- Le poids et la taille. Les haut-parleurs étaient trop lourds (70 g chacun), ce qui allait à l'encontre de l'objectif plus global de notre produit de rendre notre casque léger et confortable. C'était probablement le problème majeur au début.
- Fuite sonore.
Pour régler les problèmes de poids, nous avons examiné la possibilité d'utiliser des transducteurs d'écouteurs plutôt que des transducteurs de haut-parleurs. Bien qu'ils soient plus légers et plus économes en énergie, le volume sonore était insuffisant lorsqu'on les tenait écartés de l'oreille à l'air libre. Même si nous savions déjà que ce serait le cas, il était intéressant d'entendre les compromis entre l'immersion sonore, la distance par rapport à l'oreille, la réponse en fréquence et le volume.
Nous voulions savoir exactement quelle devait être la taille des transducteurs d'écouteurs pour commencer à répondre à nos exigences de volume et de réponse en fréquence dans notre contexte extra-auriculaire. Nous avons discuté avec Audeze qui a développé une paire d'écouteurs extra-auriculaires planaires magnétiques pour répondre à cette interrogation. Le résultat donnait un son incroyable, cependant le poids, la taille et le coût n'étaient pas compatibles avec les objectifs de production de Valve Index.
Nous sommes alors repartis de la base de transducteurs de haut-parleurs pour poursuivre notre conception. L'un des avantages de la R-D audio à ce stade était de pouvoir travailler indépendamment du reste du système du casque Valve Index. Avec l'aide d'un ingénieur mécanicien, nous avons créé un « form factor » d'écouteurs extra-auriculaire autonome. Grâce à ce spécimen, nous avons été en mesure d'effectuer rapidement des itérations sur la réponse des graves, la calibration, l'orientation par rapport à l'oreille, la distance par rapport à l'oreille et d'effectuer des tests A/B sur les évaluations des transducteurs de haut-parleurs. Ce prototype a été le premier casque à écouteurs externes imprimé en 3D. En interne, nous appelons ces prototypes « Hummingbirds » (colibris).
Ces Hummingbirds colorés ont été créés dans le but d'évaluer différents types de petits transducteurs de haut-parleur large bande. Jusqu'à ce stade, nous avions reconverti des systèmes de haut-parleurs et d'écouteurs grand public complets. L'achat et l'évaluation de pièces génériques nous ont contraints à commencer à construire les bases du sous-système audio : amplis, puces audio, DSP (traitement numérique du signal) et microphones. Parallèlement, nous nous rapprochions de la définition de nos objectifs de livraison pour la distance optimale par rapport à l'oreille, la rotation, le poids, les dimensions des écouteurs et la réponse en fréquence.
Nous avons découvert les haut-parleurs BMR (Balance Mode Radiator) au cours de notre phase d'évaluation de transducteurs et nous avons immédiatement remarqué plusieurs avantages : ils réduisaient la coloration causée par un mauvais positionnement des écouteurs, ils se trouvaient presque dans la gamme de poids que nous visions, ils avaient une réponse en fréquence élevée dans les hautes et moyennes fréquences (ce qui est important pour les simulations binaurales) et ils étaient beaucoup plus minces que les transducteurs de haut-parleurs traditionnels. Nous avons commencé à travailler avec Tectonic pour concevoir un transducteur personnalisé à utiliser en tant qu'écouteur externe.
En interne, on s'inquiétait de plus en plus de la quantité de son que les écouteurs externes pourraient laisser s'échapper ainsi que de la quantité de son qu'ils pourraient laisser s'infiltrer. Pour avoir une idée de l'impact que cela pourrait avoir sur les clients, nous avons construit plus de 20 Hummingbirds et nous les avons prêtés à nos collègues pour qu'ils les testent à la maison. Personne ne voulait rendre son Hummingbird (Chet). C'était un bon signe, en plus des réactions extrêmement positives aux tests de jeu. Les testeurs ont fait remarquer que l'avantage de n'avoir rien qui touche l'oreille et le sentiment accru d'immersion sonore compensaient les problèmes causés par l'entrée d'un son externe ou la fuite d'un son interne. Nous avons décidé de poursuivre avec cette conception, tout en gardant ces préoccupations à l'esprit.
Le produit
Nous disposions maintenant d'un sous-système d'écouteurs externes qui fonctionnait bien et qui se situait dans les limites de nos objectifs en matière de fidélité, de coût et de conception. Nous avons commencé le processus de fusion de la conception des écouteurs externes avec le casque Valve Index. Il est alors devenu important de commencer à mesurer acoustiquement les performances de notre sous-système audio avec le casque. La prise de mesures précises nous a permis de saisir des améliorations incrémentielles ainsi que d'identifier les problèmes dans le sous-système audio. Au début, nous utilisions « Mr. HATS », notre mannequin de tête, pour mesurer la réponse en fréquence de nos écouteurs externes. Un ruban adhésif bleu sur le visage marque l'emplacement exact du casque sur le modèle pour que les mesures initiales puissent rester cohérentes.
Pour maximiser la qualité sonore, la réponse en fréquence et l'extension des graves ont été mesurées et affinées quotidiennement. Tandis que chez Valve, nous travaillions à améliorer l'extension des graves par traitement numérique du signal en utilisant l'égaliseur de fréquence et des algorithmes comme les basses psychoacoustiques, Tectonic travaillait sur l'amélioration mécanique des graves en optimisant les transducteurs eux-mêmes. La combinaison de ces efforts nous a permis d'atteindre et de dépasser nos objectifs de qualité sonore et de réponse des graves.
En utilisant des transducteurs BMR, nous sommes en mesure d'assurer une qualité sonore constante, sans coloration, même si les écouteurs sont légèrement mal positionnés sur les côtés de la tête. Cela est dû à la façon unique dont les BMR émettent le son. Dans les basses fréquences, ils se comportent comme des haut-parleurs traditionnels. Le signal électrique entre et le diaphragme entier (partie avant des haut-parleurs) se déplace dans un mouvement de va-et-vient, ce qui donne la forme du signal. Cependant, la vraie magie se produit à des fréquences plus élevées. Lorsque la longueur d'onde du son est similaire à la taille du diaphragme (au-dessus de 3 kHz), les transducteurs traditionnels commencent à se mettre en mode « bris de son », ce qui provoque la flexion et l'ondulation du diaphragme, créant des pics et des creux très prononcés dans la réponse en fréquence qui, en plus de créer un mauvais son, sont très sensibles à la position du transducteur. Le diaphragme des BMR fait l'objet d'une conception soigneuse dans la sélection de matériaux, la charge de masse et des simulations poussées. D'une façon générale, il s'agit de s'assurer que vos oreilles reçoivent toujours toute l'information sonore, même si elles ne sont pas parfaitement alignées avec les écouteurs BMR.
De plus, Tectonic a réussi à minimiser mécaniquement les pertes acoustiques. Comme le transducteur des écouteurs du Valve Index est ouvert à l'arrière, la pression de la face avant peut interagir avec la pression de la face arrière. Ces pressions sont déphasées par définition. Cependant, le transducteur lui-même fournit un certain degré « d'auto-isolation » grâce à son diamètre total. Globalement, pour tout transducteur de haut-parleurs, le diamètre extérieur permet d'éviter que la pression de la face avant ne rencontre celle de la face arrière. Mais cela n’est efficace que lorsque la longueur des ondes sonores dans l'air est plus petite que l'auto-isolation due au diamètre du transducteur. Lorsque la longueur d'onde devient plus grande que le diamètre du transducteur, la pression de la face avant interagit directement avec la pression de la face arrière, et une suppression importante du bruit se produit. Le diamètre total du transducteur est d'environ 5 cm. Cela signifie qu'au-delà de 3 kHz environ, il n'y a plus de réduction du bruit, mais, comme nous le savons, de moins en moins de contenu audio dépasse cette fréquence. La plus grande partie du contenu audio se situe en dessous de 3 kHz, là où la suppression du bruit est importante, et les personnes à proximité ne sont donc pas dérangées. Tim Whitwell, le directeur technique de Tectonic, nous explique : « La personne qui porte le casque a les oreilles si près du transducteur (champ proche) que la suppression du bruit n'est pas perceptible, puisque la pression de la face avant est RELATIVEMENT beaucoup plus proche de l'oreille que celle de la face arrière. »
Le microphone
Notre objectif d'avoir des microphones de haute qualité sur le casque pour répondre aux besoins des streamers et prendre en charge les expériences multijoueurs était facile à définir. Cependant, en raison de la conception des écouteurs externes, nous nous attendions à ce que la performance du microphone soit un défi difficile à relever. À notre grande surprise, cela n’a pas été le cas. Grâce à plusieurs caractéristiques uniques des écouteurs externes, nous avons pu éviter d'avoir recours à une quantité importante de traitements de réduction du bruit sur le signal du microphone, ce qui nous a permis de maintenir une fréquence d'échantillonnage du flux du microphone très élevée, soit à 48 kHz. Voici une liste de caractéristiques qui ont participé à la création d’une entrée microphone de haute qualité :
- un double microphone matriciel pour restreindre la réponse directionnelle et se concentrer sur l'origine du signal (la bouche de la personne) et pour éliminer les autres bruits parasites. Le microphone matriciel bidirectionnel concentre la prise de son sur la bouche de la personne et exclut tous les sons externes ;
- >« l'auto-isolation » des transducteurs BMR réduit les nuisances sonores externes bien plus que les écouteurs traditionnels ;
- l'acoustique des écouteurs et des microphones a été conçue pour réduire considérablement la rétroaction acoustique non linéaire. La tête de la personne absorbe une grande partie de l'énergie sonore initiale des haut-parleurs BMR ;
- des microphones et des prises de son à RSB élevé ;
- des microphones et des joints acoustiques de bonne qualité ;
- une compression dynamique du son entrant pour éviter de couper les voix fortes.
Conclusions
L’ensemble de ces recherches, itérations et retours d'information nous porte à croire que la conception des écouteurs externes du Valve Index se rapproche le plus possible d'un équilibre optimal de compromis et de fonctionnalités spécialement conçues pour une expérience audio adaptée à la VR à l’échelle d’une pièce . Les résultats de l'expérience audio nous ont paru très satisfaisants. Cela dit, il y a encore beaucoup à apprendre, et nous pouvons apporter encore de nombreuses améliorations.
Si vous êtes passionné(e) par l'audio et que vous aimeriez travailler avec nous pour résoudre ce genre de problèmes, veuillez consulter nos offres d'emploi dans les différents domaines liés à l'audio ou nous contacter à l'adresse e-mail jobs@valvesoftware.com.