Altoparlanti esterni: ricerca, progettazione ed evoluzione

Gli altoparlanti esterni di Valve Index sono stati ottimizzati per ottenere obiettivi specifici per la VR e questo ha fatto sì che il loro design divergesse in modo interessante da quello delle tipiche cuffie.

All'inizio della nostra sperimentazione VR, è diventato chiaro da subito che aiutare un utente VR a ottenere un’esperienza di sospensione dell’incredulità richiedeva non solo i grandi metodi narrativi, ambientali ed emotivi dei giochi e dei film tradizionali, ma anche un nuovo modo di risolvere problemi specifici per VR. Quando indossiamo un visore per giocare a Budget Cuts, ci aspettiamo che la VR ci faccia sentire come se il nostro corpo fosse stato trasportato in un ufficio pieno di robot assassini piuttosto che mostrarci semplicemente il loro ambiente attraverso uno schermo statico.

La nostra ricerca e i nostri test ci hanno portato a capire che il raggiungimento della massima immersione sonora impone una serie di requisiti sulla progettazione dei componenti audio come è stato per il sistema di tracciamento 3D o per lenti del display. Abbiamo anche appreso che progettare in base a tali requisiti significava accettare alcuni interessanti compromessi, che influivano su cose come la posizione degli altoparlanti, il peso del driver, la forma del diaframma del driver, il design del sistema di altoparlanti e persino la frequenza di risposta.

>*Abbiamo chiamato questa sospensione dell’incredulità "presenza" in altri contesti, ma questo termine ha altre connotazioni nel mondo dell'audio, quindi non lo useremo nel resto di questo articolo di approfondimento.

Hardware and Software

Un'immersione audio convincente può essere ottenuta solo facendo affidamento contemporaneamente su software e hardware. Sapere dove tracciare il confine tra le responsabilità dell'hardware (dispositivi audio) e del software (giochi, esperienze VR) ha richiesto una considerazione olistica dell'intera pipeline audio VR: da come viene creato il contenuto audio VR, a come viene emesso dai motori di gioco , a tutti i modi in cui può raggiungere l'orecchio.

Dal punto di vista software, ingegneri audio del gioco e scienziati hanno lavorato per creare contenuti audio coinvolgenti e convincenti sin da quando sono emerse le prime esperienze di panning relative al giocatore negli anni '90 (Doom, Half-Life, Aureal3D, ecc.). In seguito, grazie all'attuale generazione VR, abbiamo visto enormi miglioramenti nelle tecnologie audio spaziali. Plugin di simulazione audio basati sul rendering binaurale e basati sulla fisica come Steam Audio consentono agli sviluppatori di creare una precisione sonora ancora maggiore, riverberi virtuali fisicamente accurati, occlusione del suono e propagazione, anche con normali cuffie stereo. Nel considerare il dispositivo di ascolto ottimale per la VR attuale, abbiamo sfruttato le seguenti conoscenze e ricerche nelle simulazioni software dell’audio:

  • I contenuti VR sono per lo più forniti in stereo: un canale audio sinistro e uno destro. Questi canali possono contenere la colorazione tonale binaurale e HRTF incorporata rispetto a dove il giocatore sta guardando in un dato momento.
  • Le nostre orecchie esterne, la forma della testa e la geometria facciale aggiungono una firma tonale specifica che aiuta i nostri cervelli a identificare il suono reale rispetto al suono immaginato, nonché la posizione delle fonti sonore rispetto a noi (dietro, sopra, sotto, sinistra, destra, ecc.).
  • > La fedeltà del suono a frequenze medio-alte è molto importante.
    • > Le simulazioni binaurali si basano su sottili cambiamenti nella colorazione tonale (1kH-8kHz) per trasmettere la posizione di una sorgente sonora rispetto al giocatore. Se un dispositivo di ascolto aggiunge la sua colorazione di frequenza smorzata, ciò interferirà con la capacità del giocatore di localizzare il suono.
    • Gli umani in generale sono molto sensibili ai suoni compresi tra le frequenze 2kHZ-5kHz . Se la frequenza di un suono virtuale non corrisponde a ciò che ci aspettiamo che sia in realtà, allora è più probabile che identifichiamo il suono come "non reale". Ciò è particolarmente vero se si confronta quanto sia facile dire se la voce di qualcuno viene trasmessa attraverso un altoparlante rispetto a qualcuno che parla al tuo fianco.
  • La fedeltà del suono a bassa frequenza è importante.
    • Sebbene i contenuti a bassa frequenza non si verifichino troppo spesso in natura, appaiono molto di frequente nella VR e nei contenuti di intrattenimento (musica, rumori, esplosioni, spari, battiti cardiaci, impatti, incantesimi, ecc.). I bassi sono fondamentali per trasmettere un senso di dimensioni e scala. Ciò aumenta l'immersione visiva della VR e suscita alcuni segnali emotivi come ad esempio pericolo, timore, isolamento, interiorizzazione, ecc. Pertanto, era importante che il nostro dispositivo di ascolto mantenesse una buona quantità di risposta dei bassi.

Perché non le cuffie?

Le cuffie tradizionali sono eccellenti nel fornire contenuti audio diretti a ciascun orecchio in base alla posizione del giocatore. I giocatori possono guardare in qualsiasi direzione nel mondo virtuale e i motori di gioco 3D con plug-in di simulazione sonora emetteranno il segnale stereo richiesto per trasmettere la posizione corretta della sorgente sonora virtuale. Questo è il motivo per cui i giocatori di e-sport competitivi (es. CS: GO) usano le cuffie invece degli altoparlanti frontali: le cuffie forniscono informazioni più dirette sul suono spaziale. Due canali di uscita (Sinistro / Destro), per due auricolari (Sinistro / Destro), per due orecchie (Sinistro / Destro) e così via.

In generale, tuttavia, i dispositivi audio tradizionali sono raramente progettati con l'immersione sonora come obiettivo principale. I dispositivi personali come auricolari, cuffie auricolari e cuffie sono ottimizzati per l'ascolto di musica e intrattenimento in luoghi in cui gli altoparlanti non sono appropriati e spesso i requisiti di alimentazione sono estremamente bassi (ad esempio telefoni cellulari, dispositivi alimentati a batteria). L'attenzione si concentra spesso sull'isolamento acustico, sull'efficienza energetica, sull'eliminazione del rumore e sulle risposte di frequenza esagerate. Abbiamo ritenuto che molte di queste ottimizzazioni potrebbero non avere senso nel contesto della VR attuale a intera stanza, dove l'ambiente di ascolto generale è un volume dedicato di spazio (ad esempio una stanza interna con leggeri rumori ambientali) in cui una piccola quantità di perdita del suono potrebbe andare bene. Abbiamo accesso a molta potenza e le risposte in frequenza devono supportare i presupposti delle simulazioni binaurali del suono.

Le cuffie e gli auricolari devono entrare in contatto o circondare l'orecchio per raggiungere i propri obiettivi in modo ottimale e abbiamo notato che questo a volte può limitare l'immersione audio nei seguenti modi:

  • L'emissione del suono direttamente nel condotto uditivo ignora il naturale processo di ascolto causato dall'interazione dell'orecchio e della testa con onde sonore reali. Gli ascoltatori perdono la firma sonora tonale creata dalle orecchie, dalla testa e dalla geometria facciale. Ciò può far apparire il suono come se fosse immaginato, o proveniente dall'interno della testa, anche se il contenuto audio è altamente spaziale e simulato fisicamente. Prevediamo che alla fine le simulazioni software terranno conto di questi fattori.
  • La pressione sulle orecchie può diventare dolorosa e scomoda dopo prolungati periodi di tempo, con la conseguenza di ridurre l’immersione dell’utente nella VR.
  • Alcuni tester hanno riferito che l'atto stesso delle cuffie che toccavano l'orecchio segnalava loro che qualsiasi suono non sarebbe stato reale.
  • Sigillare l'orecchio con cuffie sopra le orecchie può intrappolare il calore, facendo sentire le cuffie VR più calde di quanto in realtà siano, riducendo l’immersione dell’utente nella VR.
  • La qualità del suono tonale di alcune cuffie può interferire con le sottili colorazioni di frequenza delle simulazioni binaurali. Ad esempio, le cuffie in cui le frequenze medio-alte sono esagerate o ovattate interferiranno molto probabilmente con le sottigliezze dei filtri HRTF, causando uno scarso senso del suono direzionale nei giochi e nella VR.

Perché non gli altoparlanti?

Abbiamo anche considerato glialtoparlanti e altoparlanti beamforming con configurazioni stereo tipiche o surround audio. Gli altoparlanti evitano molti dei problemi di comfort associati alle cuffie ed emettono suoni che possiamo facilmente percepire come esterni alle nostre stesse teste, ma hanno posto diversi ostacoli all'utilizzo:

  • Le configurazioni stereo di altoparlanti esistenti assumono un orientamento frontale, quindi il suono viene riprodotto come se fossi parte di un pubblico che ascolta una band su un palco o guarda la TV da un divano. Questo va bene per la musica e film su uno schermo, tuttavia, i contenuti di gioco stereo e VR vengono riprodotti supponendo che i canali Sinistro/Destro stiano arrivando immediatamente su ciascun lato della testa dell'ascoltatore.
  • > I comuni sistemi audio surround 5.1 e 7.1 limitano la riproduzione a un campo orizzontale, mentre i contenuti audio di giochi e VR possono essere praticamente posizionati ovunque intorno all'ascoltatore.
  • I sistemi di altoparlanti possono richiedere tempo e spazio per la corretta configurazione dell'utente, creando ulteriore attrito per la configurazione VR.
  • Gli altoparlanti richiedono che il giocatore rimanga all'interno di un piccolo "punto ottimale" per una riproduzione spaziale accurata, mentre la realtà virtuale a volte può richiedere al giocatore di spostarsi in un ampio spazio.
  • Gli altoparlanti possono essere influenzati dall'acustica della stanza reale, che può essere in conflitto con l'acustica desiderata nel mondo virtuale.
  • Gli altoparlanti potrebbero far sembrare un suono troppo lontano, contraddicendo la posizione di una sorgente sonora virtuale che potrebbe essere molto vicina alle orecchie dei giocatori.

L'idea

Nel rivedere tutti i compromessi di cui sopra, è diventato evidente che la soluzione ottimale per la VR potevano essere un paio di cuffie ultra-ravvicinate, a intervallo pieno e extra auricolari: abbastanza vicine all'orecchio per imitare le cuffie stereo e supportare il formato di uscita dei contenuti VR attuali, ma abbastanza lontane da consentire alle orecchie e alla testa di imprimere la propria colorazione tonale sul suono, risolvendo anche problemi di comfort e pressione. È stata questa realizzazione, combinata all'ispirazione che proveniva da un ricordo d'infanzia di essere completamente immersi nel suono mentre si è tra due altoparlanti hi-fi rivolti verso l'interno, che ha portato alla creazione dei primi prototipi.

Il nostro primo prototipo di altoparlanti esterni

L'evoluzione

Il primo prototipo è stato prodotto attaccando due piccoli driver di altoparlanti desktop a frequenza intera ai lati di un casco da skateboard e attaccando un vecchio visore Vive attorno al casco. Gli altoparlanti erano alimentati tramite USB e l'uscita audio attraverso il jack per le cuffie presente sull'HTC Vive. Questo rudimentale prototipo se la cavò sorprendentemente bene nel dimostrare l'aumento dell'immersione sonora e dell'esternalizzazione quando si consente alle orecchie e alla testa di interpretare i suoni in maniera naturale. La sensazione di immersione è difficile da misurare quantitativamente, quindi a quel punto nello sviluppo, per descrivere la differenza sonora in VR tra il nostro prototipo e un paio di cuffie classiche KOSS Porta Pro, ci siamo basati maggiormente sul feedback relativo alla qualità proveniente da colleghi e tester. Le risposte favorivano in larga parte gli altoparlanti, tanto che ci siamo convinti a procedere con questa scelta di design. Tuttavia, c'erano anche molti problemi da affrontare:

  • Risposta molto limitata dei bassi.
  • Il volume, la frequenza in risposta e il bilanciamento del suono cambiavano notevolmente con leggere variazioni della posizione degli altoparlanti provocate dal modo in cui si indossava il casco e da movimenti effettuati all'interno della realtà virtuale.
  • Peso e dimensioni. Gli altoparlanti erano troppo pesanti (70 grammi ciascuno), il che andava contro il nostro obiettivo di rendere il visore leggero e comodo. Questa è stata probabilmente la nostra più grande preoccupazione durante la fase iniziale di sviluppo.
  • Dispersione del suono.
Esperimenti con i driver degli altoparlanti

Per risolvere i dubbi relativi al peso abbiamo investigato utilizzando driver di cuffie invece di driver di altoparlanti. Anche se più leggeri ed energeticamente efficienti, non erano in grado di fornire un volume sufficiente quando tenuti a distanza dalle orecchie. Tuttavia anche se sapevamo che sarebbe stato così, è stato interessante analizzare questo compromesso tra immersione sonora, distanza dalle orecchie, risposta in frequenza e volume.

Concept di altoparlanti magnetici planari esterni

Volevamo sapere quanto devono essere grandi i driver delle cuffie per iniziare a soddisfare i nostri requisiti di volume e risposta in frequenza nel nostro contesto extra auricolare. Abbiamo parlato con Audeze, che ha sviluppato un paio di cuffie extra aurali planari magnetiche per aiutarci a scoprirlo. Il risultato sembrava incredibile, tuttavia, il peso, le dimensioni e il costo non erano fattibili per gli obiettivi di produzione di Valve Index.

I primi "Hummingbird" basati su altoparlanti

Siamo tornati a utilizzare i driver degli altoparlanti come base per il nostro design futuro. Uno dei vantaggi della prima ricerca e sviluppo audio in questa fase era la capacità di lavorare indipendentemente dal resto del sistema del visore Valve Index. Con l'aiuto di un ingegnere meccanico abbiamo creato un fattore di forma cuffie extra-auricolare autonomo. In questo nuovo contesto, siamo stati in grado di controllare rapidamente la risposta dei bassi, l'accordatura, l'orientamento all'orecchio, la distanza dall'orecchio e le valutazioni del driver dell'altoparlante A/B. Questo prototipo è stato il primo altoparlante per orecchio stampato in 3D. Internamente lo chiamiamo "Hummingbird"

Hummingbird con piccoli altoparlanti a intervallo pieno basati sul tradizionale design "a pistone".

Questi eccitanti Hummingbird sono stati creati con l'obiettivo di valutare vari tipi di piccoli driver per gli altoparlanti. Fino a questo momento, le prove richiedevano la conversione di interi sistemi di altoparlanti e cuffie presenti sul mercato. Acquistare e valutare componenti presenti sul mercato richiedeva la creazione di ogni aspetto di un sottosistema audio: amplificatori, chip audio, DSP (elaborazione numerica dei segnali) e microfoni. Allo stesso tempo ci siamo così avvicinati ai nostri obiettivi come la distanza ottimale dalle orecchie, la rotazione, il peso, le dimensioni degli altoparlanti e la risposta in frequenza.

Il primo paio di Hummingbird a utilizzare i driver BMR di Tectonic

Durante la nostra fase di valutazione dei driver per altoparlanti abbiamo messo alla prova dei driver BMR (Balance Mode Radiator) e abbiamo immediatamente notato parecchi vantaggi: hanno ridotto la colorazione dovuta a un errato posizionamento degli altoparlanti, erano vicini ai nostri limiti prefissati in termini di peso, avevano un'ottima risposta in frequenza negli intervalli medio-alti (molto importante per le simulazioni binaurali) ed erano molto più sottili dei driver tradizionali. Abbiamo iniziato a lavorare con Tectonic per progettare un driver personalizzato da utilizzare per un altoparlante esterno.

Il nostro team interno, intanto, iniziava a preoccuparsi della quantità di suono che questi altoparlanti avrebbero disperso nell'ambiente esterno, ma anche di quanti suoni esterni non sarebbero stati in grado di filtrare. Per avere un'idea di quanto questo potesse impattare sui clienti, abbiamo costruito oltre 20 hummingbird e li abbiamo affidati ai colleghi, in modo che potessero provarli a casa. Nessuno voleva riportarli indietro! Questo è stato un ottimo segno, assieme al feedback estremamente positivo dei test. I tester hanno trovato molto positivo il fatto di non avere nulla a contatto con le orecchie e hanno trovato che l'aumentata sensazione di immersione sonora compensava i problemi causati dai suoni esterni che giungevano alle orecchie dell'ascoltatore e/o dalla diffusione dei suoni verso l'esterno. Abbiamo deciso così di procedere con questo design, tenendo bene a mente queste considerazioni.

Signor HATS

Il prodotto

A questo punto, avevamo un sottosistema di altoparlanti auricolari che stava venendo valutato positivamente in fase di test e che era molto vicino ai nostri obiettivi di fedeltà nella riproduzione, costo e design. Abbiamo quindi iniziato a unire il design degli altoparlanti con il visore Valve Index, ponendo particolare attenzione alla misurazione acustica delle prestazioni del sistema audio nel contesto del visore. Attraverso accurate misurazioni, siamo stati in grado di notare miglioramenti graduali e identificare problemi con il sottosistema audio. Inizialmente abbiamo usato il "signor HATS", il nostro manichino, per ottenere misurazioni della risposta in frequenza dei nostri altoparlanti auricolari. Del nastro adesivo blu sul volto indicava l'esatto piazzamento del visore sul manichino, così che le prime misurazioni potessero rimanere consistenti.

Grafico della risposta in frequenza dei driver BMR di Valve Index in camera anecoica

Per massimizzare la qualità sonora, la risposta in frequenza e l'estensione dei bassi sono state misurate e valutate giornalmente. Mentre qui a Valve lavoravamo per migliorare l'estensione dei bassi tramite DSP con una messa a punto dell'equalizzazione e con algoritmi di psicoacustica dei bassi, Tectonic lavorava al miglioramento meccanico dei bassi ottimizzando i driver degli altoparlanti. L'unione di questi sforzi ci ha consentito di raggiungere e superare i nostri obiettivi in quanto a qualità sonora e risposta dei bassi.

Il diagramma polare della risposta e la mappa dei livelli di pressione sonora del driver BMR di Valve mostra come la qualità sonora sia costante in una vasta gamma di posizioni del driver degli altoparlanti.

Usando dei driver BMR siamo in grado di assicurare una qualità sonora costante e neutrale, anche se gli altoparlanti sono posizionati in maniera non perfetta ai lati della testa. Questo è grazie al modo unico in cui i driver BMR diffondono il suono. Alle basse frequenze si comportano come altoparlanti tradizionali. Il segnale elettrico entra e l'intero diaframma (la parte frontale degli altoparlanti) si muove avanti e indietro, tracciando la forma del segnale. Tuttavia, la magia avviene alle frequenze più alte: quando la lunghezza d'onda delle onde sonore piegate che passano attraverso il diaframma è simile alla dimensione del diaframma stesso (> 3 kHz), i driver tradizionali iniziano ad andare in modalità "break-up". In questa modalità, il diaframma si piega e si increspa, causando intensi massimi e minimi nella risposta in frequenza che, oltre a suonare sgradevoli, dipendono molto dal posizionamento. I driver BMR sono progettati per trarre vantaggio dal comportamento naturale del diaframma e bilanciano le vibrazioni provenienti da diverse aree grazie a un'attenta selezione dei materiali, distribuzione delle massa e un'estensiva fase di simulazione. In questo modo, le tue orecchie riceveranno sempre tutte le informazioni relative ai suoni, anche se non sono perfettamente allineate agli altoparlanti BMR.

Riduzione meccanica della dispersione sonora

Inoltre Tectonic è riuscita a ridurre meccanicamente al minimo la dispersione sonora. Poiché gli altoparlanti di Valve Index sono di tipo "open back", la pressione proveniente dalla parte frontale può interagire con quella posteriore, con le due pressioni che sono fuori fase per definizione. Tuttavia, l'unità fornisce una certa quantità di "auto-assorbimento" in tutto il suo diametro. Essenzialmente, per ogni altoparlante, il diametro esterno aiuta a evitare che la pressione proveniente dalla parte frontale si incontri con quella posteriore. Questa soluzione, tuttavia, è funzionale solo quando la forma d'onda delle onde sonore nell'aria è inferiore alla capacità di auto-assorbimento del diametro del driver. Quando le forme d'onda diventano più ampie del diametro del driver, la pressione proveniente dalla parte frontale interagirà direttamente con quella proveniente dalla zona posteriore, portando a evidenti fenomeni di cancellazione. Il diametro totale dell'unità è di circa 5 cm, il che significa che oltre 3 kHz non avviene alcun fenomeno di cancellazione ma, come sappiamo, sempre più contenuti operano al di sotto di questa frequenza. La maggior parte dei contenuti audio è inferiore a 3 kHz ed è in questa "zona" che la cancellazione è più evidente, per evitare che il suono disturbi le persone nelle vicinanze. "L'ascoltatrice che indossa il visore ha le orecchie così vicine ai driver (near-field) che la cancellazione non è percepita, in quanto la pressione dalla zona frontale è RELATIVAMENTE molto più vicina alle orecchie rispetto alla zona posteriore", ha dichiarato Tim Whitwell, CTO di Tectonic.

Il microfono

Il nostro obiettivo di avere microfoni di alta qualità sul visore per supportare gli streamer e le esperienze multigiocatore è stato facile da stabilire. Tuttavia, a causa del design basato su altoparlanti esterni, sapevamo che le prestazioni del microfono sarebbero state una sfida. Con nostra sorpresa, non è andata così. Grazie a molte delle caratteristiche uniche degli altoparlanti, siamo riusciti ad evitare l'uso significativo di DSP di cancellazione del rumore sul segnale del microfono, cosa che ci ha permesso di mantenere la frequenza di campionamento del segnale del microfono al valore molto elevato di 44,1 kHz. Ecco una lista delle caratteristiche che ci hanno consentito di ottenere un input del microfono di questa qualità:

  • Doppia matrice del microfono, per restringere la risposta direzionale e concentrarsi sul segnale (la bocca dell'utente) eliminando altri rumori estranei. Il microfono a doppia direzione è incentrato sulla ricezione dei suoni emessi dalla bocca dell'utente ed esclude altri suoni esterni.
  • Il cosiddetto "auto-assorbimento" dei driver BMR riduce l'inquinamento acustico proveniente da rumori esterni molto più degli altoparlanti tradizionali.
  • L'acustica degli altoparlanti e del microfono è stata progettata per ridurre enormemente la risposta ai flussi acustici non lineari. La testa dell'utente assorbe la maggior parte dell'energia sonora iniziale proveniente dagli altoparlanti BMR.
  • Flussi di audio e microfoni ad alto SNR.
  • Microfoni di ottima qualità e sigilli acustici.
  • Compressione dinamica dell'audio in arrivo per evitare il fenomeno del clipping nelle voci ad alto volume.

Considerazioni finali

Dopo tutte queste ricerche, studi e riscontri, crediamo che il design degli altoparlanti di Valve Index sia un ottimo bilanciamento di funzionalità specificamente ideate per la riproduzione audio in VR. Siamo molto felici dei risultati ottenuti, anche se c'è sempre tanto da imparare e potremmo sempre implementare ulteriori miglioramenti.

Se hai una passione per il suono e ti piacerebbe lavorare con noi nella risoluzione di questo genere di problemi, ti invitiamo a esplorare le offerte relative all'audio o inviare un'e-mail a jobs@valvesoftware.com

Valve Index®

Articoli venduti separatamente o come kit completo sul Negozio di Steam.