A livello di elaborazione del segnale il riverbero è uno degli aspetti più interessanti. Partiamo definendo cos’è il riverbero.
Il riverbero naturale è il risultato del suono che si riflette sulle superfici in uno spazio delimitato. Il suono emesso da una sorgente si propaga alla velocità di 340 metri al secondo e colpisce le superfici delle pareti, riflettendosi con angolazioni diverse. Alcune di queste riflessioni incontrano immediatamente le nostre orecchie (“early reflections” – riflessioni primarie), altre continuano invece a rimbalzare su altre superfici fino a raggiungerci. Superfici dure e massicce, come ad esempio i muri di cemento, riflettono il suono con un’attenuazione scarsa, mentre le superfici più morbide assorbono gran parte del suono, specialmente le componenti acute. Le dimensioni della stanza, la complessità e gli angoli delle pareti, il contenuto della stanza e la densità delle superfici sono fattori che determinano “come suona” la stanza.
Prima dell’avvento dell’elaborazione digitale, il riverbero veniva creato posizionando dei trasduttori – un diffusore e un microfono – alle due estremità di un elemento utilizzato per la creazione di un ritardo fisico. Quell’elemento poteva essere un insieme di molle metalliche, una piastra metallica sospesa o una stanza reale. L’elemento di ritardo fisico offriva poche variazioni nel controllo del suono riverberato e questi “spazi” per dar vita all’effetto riverbero non erano molto facili da trasportare: il riverbero a molla era l’unica opzione portatile e conveniente, ma non proprio fantastica in termini di suono.
Consideriamo un paio di approcci possibili per la simulazione digitale del riverbero.
Il riverbero è un effetto indipendente dal tempo (Time-Invariant): non importa quando una nota verrà suonata, si otterrà sempre lo stesso riverbero. I sistemi indipendenti dal tempo possono essere caratterizzati totalmente dalla loro risposta all’impulso. Entrando in una grande stanza vuota — un salone, un magazzino, una palestra — è possibile ascoltarne il suono caratteristico. È sufficiente battere una volta le mani e ascoltare il riverbero che si attenua. Questa è la risposta all’impulso della stanza.
Quel singolo battito di mani ci dirà immediatamente quanto sia intenso il riverbero e quanto tempo ci vuole per spegnersi, e se la stanza suona “bene”. Non solo è facile per le orecchie classificare la stanza in base alla risposta all’impulso, ma è possibile anche eseguire sofisticate analisi del segnale su una registrazione del riverbero risultante. La risposta all’impulso dice tutto sulla stanza: un impulso è, nella sua forma ideale, un suono istantaneo che trasporta la stessa energia a tutte le frequenze. Ciò che ritorna, sotto forma di riverbero, è la risposta della stanza a quell’esplosione istantanea di tutte le frequenze.
Nel mondo reale, il battito delle mani — o un palloncino che scoppia o un petardo che esplode — è definito impulso. Digitalizzando la risposta risultante della stanza e osservandola sulla schermata di un programma di editing del suono, questa appare come un rumore in decadimento: possiamo notare un certo accumulo di densità all’inizio seguito da un decadimento graduale verso lo zero (Le stanze con il suono più regolare mostrano un decadimento più regolare).
Nel dominio digitale è facile rendersi conto che ogni punto campione della risposta può essere visto come un’eco discreta dell’impulso e dal momento che, idealmente, l’impulso è un singolo campione diverso da zero, non è difficile rendersi conto che una serie di campioni — un suono riprodotto nella stanza — sarebbe la somma delle risposte di ogni singolo campione nei rispettivi momenti (questo si definisce sovrapposizione).
In altre parole, partendo da una risposta all’impulso digitalizzata, possiamo facilmente aggiungere quella caratteristica esatta della stanza a qualsiasi suono dry (suono originale non elaborato) digitalizzato. Moltiplicando ogni punto della risposta all’impulso per l’ampiezza di un campione si ottiene la risposta della stanza a quel campione: lo facciamo semplicemente per ogni campione del suono che vogliamo “collocare” in quella stanza. Questo produce una serie di risposte sovrapposte — tanti quanti sono i campioni — che semplicemente sommiamo insieme.
Tutto questo è facile, ma estremamente costoso dal punto di vista informatico. Ogni campione dell’input viene moltiplicato individualmente per ogni campione della risposta all’impulso e aggiunto al mix. Considerando “n” campioni da elaborare e la risposta all’impulso è lunga “m” campioni, dobbiamo eseguire “n + m” moltiplicazioni e addizioni. Quindi, se la risposta all’impulso è di tre secondi (corrispondente ad una stanza grande) e abbiamo la necessità di elaborare un minuto di musica, occorrono circa 350 trilioni di moltiplicazioni e lo stesso numero di addizioni (ipotizzando una frequenza di campionamento di 44,1 KHz). Tempo necessario: una giornata. Peccato non sia utilizzabile per effetti in tempo reale, avrebbe reso possibile imitare accuratamente qualsiasi stanza al mondo conoscendone la risposta all’impulso e ci sarebbe stata la possibilità di generare facilmente le proprie risposte all’impulso artificiale per inventare le proprie “stanze”.
(In realtà, è possibile gestirlo in maniera più pratica. Abbiamo parlato dell’elaborazione nel dominio del tempo e il processo di moltiplicazione dei due segnali campionati è chiamato convoluzione. Mentre la convoluzione nel dominio del tempo richiede molte operazioni, l’equivalente nel dominio della frequenza richiede un calcolo drasticamente ridotto…)
Un approccio differente è quello dei riverberi digitali. Di base utilizzano più ritardi e feedback per costruire una fitta serie di echi che si estinguono nel tempo. Gli elementi costitutivi funzionali sono ben noti: sono le variazioni e il modo in cui sono impilate che conferiscono a un’unità di riverbero digitale il suo suono caratteristico.
L’approccio più semplice sarebbe un singolo ritardo con parte del segnale che, reimmessa nel ritardo, crea un’eco ripetuta che si dissolve (il gain del feedback deve essere inferiore a 1). La miscelazione in simili ritardi di dimensioni diverse aumenterebbe la densità dell’eco e si avvicinerebbe al riverbero. Ad esempio, l’utilizzo di lunghezze di ritardo diverse in base ai numeri primi garantirebbe ad ogni eco di cadere tra altri echi, migliorando la densità.
A lato pratico questa semplice disposizione non funziona molto bene. Occorrono troppi di questi potenti echi per creare un muro di riverbero regolare. Inoltre, il semplice feedback è la ricetta per un filtro a pettine (comb), con conseguenti cancellazioni di frequenza che possono imitare gli effetti della stanza, ma possono anche produrre risonanze e instabilità.
Sebbene utili, questi filtri comb da soli non offrono un effetto riverbero soddisfacente. Alimentando avanti e indietro, riempiamo le cancellazioni di frequenza, rendendo il sistema un filtro All-Pass. I filtri All-Pass producono gli echi come prima, ma una risposta in frequenza più fluida. Hanno l’effetto di un ritardo dipendente dalla frequenza, spalmando le armoniche del segnale in ingresso e avvicinandosi a un vero suono di riverbero. Combinazioni di questi ritardi di ricircolo Comb e All-Pass — in serie, in parallelo e persino annidati — e altri elementi, come il filtraggio nel percorso di feedback per simulare l’assorbimento ad alta frequenza, danno come risultato il prodotto finale.