Het neutrale geluid manipuleren

waveform

Met de komst van de opnametechniek in de vorige eeuw probeerde men muziek in haar meest perfecte vorm vast te leggen. In plaats van een enkele liveopname voor publiek kon men hierdoor in de studio zoveel takes doen als men nodig had voor het vastleggen van de “perfecte” uitvoering.

Les Paul vond eind jaren 40 uit dat je met twee recorders stukje bij beetje een soort orkestje van gitaren en stemmen kon opnemen door de ene recorder op afspelen te zetten terwijl de andere recorder opneemt terwijl je er een andere partij bij speelt. Een soort audiopingpong. En Les verzon nog een revolutionaire truc, door op halve snelheid zijn partijen op te nemen klonken deze bij weergave op normale snelheid als razendsnel virtuoos spel:

De klassieke pianist Glenn Gould raakte in de 60-er jaren gefrustreerd van het geven van concerten. Nooit was de uitvoering naar zijn idee perfect terwijl hij die perfecte uitvoering wel in zijn hoofd hoorde. Hij stopte daarom geheel met het geven van concerten en was alleen nog maar in de studio te vinden. In de studio koos Glenn de beste delen uit en plakte de audiotapes daarvan aan elkaar om zo zijn perfecte uitvoering te creëren.

Met de komst van de multitrack-recorder midden jaren 50 werd het mogelijk om instrumenten spoor voor spoor verspreid over meerdere kanalen op te nemen. Hierdoor kreeg men nog meer controle over de muziek en klank. The Beatles met name waren ware pioniers op dit vlak. Hun muziek klonk niet meer als een live uitvoering maar als muziek die je alleen in een studio kunt maken. The Beatles stopten in dezelfde periode als Glenn Gould met het geven van liveoptredens vanwege eenzelfde argument. Het vormt een opvallend parallel tussen deze pioniers.

Vervolgens kwamen achtereenvolgend de drumcomputers, de polyfone (meerstemmige) synthesizers en de samplers op de markt en werden de partijen steeds vaker geprogrammeerd in plaats van door muzikanten ingespeeld. Hiermee werd de controle over het geluid ook steeds preciezer. Inmiddels is met behulp van de computer en de digitale techniek het spel van muzikanten totaal elastisch geworden. Zodoende kan de klankkeur achteraf, na opname, aangepast worden, kan de timing verbeterd worden en kan de toonhoogte onhoorbaar aangepast. Zelfs zanglijnen die behoorlijk vals klonken tijdens opname kunnen perfect in tune gemaakt worden zonder dat het publiek hoort dat de stem slechts een klankbron vormt voor een melodie die door de engineer geboetseerd is.

We kunnen stellen dat tegenwoordig elk geluid een bron kan zijn voor het maken van klanken die als muziek klinkt. Zo maakte ik een keer in opdracht van Disquiet Junto een muziekstuk dat als basis 1 sample had: een opname die ik maakte van een uitklontje in een glas. Dankzij de sampler en uitgebreide manipulatie tools kon ik uit die ene sample van slechts een paar seconden een heel muziekstuk persen:

Dankzij de complete controle over geluid kunnen we elk geluid produceren. Het levert een ongekende vrijheid op. We zijn hooguit afhankelijk van onze fantasie, kennis van geluid en de kunde om het te manipuleren. De kennis over hoe we geluid kunnen manipuleren neemt nog altijd toe. En daarmee ook de mogelijkheden en de tools die ons daarbij helpen. We kunnen als het ware steeds dieper inzoomen in het geluid en het aanpassen.

Het manipuleren van geluid lijkt grenzeloos. Het is niet gebonden aan een bepaalde stijl. Niet gebonden aan een bepaalde vorm. Het is neutraal van karakter, blanco. Als een wit scherm waar de schrijver in staart. Het daagt me uit.

VoCo is een audio app die woorden kan veranderen

Onder de noemer VoCo is Adobe bezig een soort Photoshop voor audio te bouwen waarmee je een opname van de menselijke stem zover kunt gaan aanpassen dat die stem andere woorden gaat uitspreken. De software heeft ongeveer 20 minuten aan spraak van een persoon nodig om op basis daarvan nieuwe woorden en zinnen te kunnen bouwen. Tijdens het Adobe MAX 2016 Sneak Peeks evenement werd een demo van de tool gepresenteerd:

Het is een kwestie van tijd voordat zo’n tool vlekkeloos werkt. Dat was met Photoshop immers ook het geval. Dankzij de digitale techniek kunnen we vandaag de dag al best heel veel. In tegenstelling tot analoog kun je digitaal echt onhoorbaar knippen in audio. Zelfs in een woord. En met de huidige techniek kunnen we de toonhoogte van een stem veranderen. We kunnen het formant (resonantie van specifieke frequentie/s) aanpassen om bv van een mannenstem een vrouwenstem te maken. We kunnen de snelheid van de stem versnellen of vertragen terwijl de toonhoogte gelijk blijft. En nog meer van dat soort foefjes. Een soort kleien met audio.

Met gemak knip ik woorden uit een interview. Een poos geleden werd tijdens een interview een achternaam verkeerd uitgesproken. Ik kon het niet over mijn hart krijgen dat de geïnterviewde met die fout op de radio te horen zou zijn en dus sleutelde ik net zo lang totdat het helemaal naturel klonk. En een jaartje terug werkte ik aan een documentairefilm waarin een Indiër voorkwam die ongelofelijk traag sprak. Niet te doen! Als oplossing werd het interview met behulp van software versneld, ook op beeld dus (het moet natuurlijk wel sync lopen!). Het zag er totaal overtuigend uit. Niemand die het doorhad, behalve de man zelf. En zijn vrouw die voor het eerst een beetje trots kon zijn op haar man…

Met een beetje (veel!) geduld kan ik zelfs een synthesizer mijn naam laten zeggen:

Deze VoCo tool zal nieuwe ethische vragen opwerpen. Hetzelfde gold ooit ook voor Photoshop. En nog altijd is daar discussie over. Want hoe ver ga je in het “mooier” maken van fotomodellen? Inmiddels zijn we toch helemaal gewend geraakt aan die onechtheid die we massaal beschouwen als echt. Of hebben we precies in de gaten dat het zwaar gemanipuleerde foto’s zijn? Ik denk het niet, slechts een klein deel van het publiek zal zien dat het niet echt is. Kritisch kijken en luisteren is een vak apart.

De werkelijkheid aanpassen/manipuleren is wat we graag doen. Vaak doen we dat vanuit het oogpunt van esthetiek. Maar we slaan er ook vaak in door. Je ziet het in het gebruik van Photoshop maar ook in het gebruik van Instagram-filters en dergelijke, iedereen slaat een beetje door in het aanpassen van de werkelijkheid. En over 50 jaar zal men zich gaan afvragen: hoe zag het er nu echt uit?

Onlangs zag ik een prachtige expositie van fotograaf Peter Lindbergh in de Kunsthal van Rotterdam. Peter staat bekend om zijn modefoto’s waarin hij de modellen op een rauwe en eerlijke manier fotografeert. Hij onderscheid zich in een modewereld die bol staat van doorgeslagen photoshoppers.

Tja… wat is mooi?

Mede door zo’n tool als VoCo zullen de discussies ook op het gebied van interviews en documentaires gaan komen. Je kunt straks mensen namelijk dingen laten zeggen die ze helemaal niet gezegd hebben. Is het wel ethisch verantwoord? En hoe zit het met de esthetische aspecten?

Net als met Photoshop moeten de mensen opvoed worden: wees je ervan bewust dat dit de werkelijkheid niet is, maar dat deze gemanipuleerd is. En laat ik er duidelijk over zijn: op zich is er niets mis met die techniek. Ik ben voor innovatie. Denk alleen goed na. Werkelijkheid en fictie dienen uit elkaar gehouden te worden. Ja toch?

 

bron, onder andere: The Verge