Mens en machine: het gevaar van AI-vertalingen

Door Martin de Haan

Ruim twintig geleden schreef ik voor het vertaaltijdschrift Filter een reeksje artikelen over een nieuwe vertaalmachine: Tovertaal, ‘de TOtale VERTAALoplossing’. Dankzij een live verbinding met internet en duizenden los aan te schaffen taalmodules (van de befaamde Oxford English Dictionary tot een botanisch woordenboek Micronesisch-Kiribatisch) bleek het programma alle mogelijke vertaalproblemen minstens net zo goed op te lossen als een goede menselijke vertaler, niet in de laatste plaats door de mogelijkheid om met een druk op de knop ook een hoger of lager stijlregister te kiezen, dus ik was niet zuinig met mijn lof.

Natuurlijk bestond Tovertaal niet echt en ging het me vooral om de woeste vertaalexperimenten die ik in mijn neprecensies kon uitvoeren, maar algauw begon ik ongeruste mails van collega-vertalers te krijgen: vormde dat programma geen enorme bedreiging voor de toekomst van ons beroep? Zelfs na de laatste aflevering, waarin ik Tovertaal eerst een sonnet van Raymond Queneau perfect rijmend en metrisch liet vertalen en vervolgens tussen neus en lippen door nog even meldde dat alle vier de recensies door het programma zelf waren geschreven, bleven er reacties komen, ook van wildvreemden die wilden weten waar ze het konden kopen.

Fast forward naar 2024. Tovertaal bestaat nog steeds niet, maar zo’n reeksje neprecensies zou nu onmogelijk meer geschreven kunnen worden. Niet alleen omdat de tijden niet echt naar speelsheid staan, maar vooral omdat de fictie allang is ingehaald door de werkelijkheid. Niemand kijkt meer op van een mededeling als de volgende: ‘Onze neurale automatische vertaaltool zal de online positie van jouw bedrijf verbeteren, of je nu een e-commerce website heeft, een reis- en toerismeprovider bent, een internationale onderneming bent of zelfs leeroplossingen biedt voor klanten over de hele wereld!’ Aldus Linguise, een aanbieder van automatische vertalingen voor websites.

Ook voor boeken worden al vertaalmachines gebruikt. Uitgevers en schrijvers ruiken hun kans: waarom nog kostbare, tijdrovende menselijke vertalingen laten maken als je het gewoon zelf kunt doen met een simpele druk op de knop? Ja, je moet het resultaat natuurlijk nog wel even nalezen, want auteur Boon van Uitgeverij Boom moet in de literatuurlijst van de zelf uitgebrachte Engelse editie niet auteur Bean van Tree Editions worden, maar daarvoor schakel je een goedkope post-editor in, die de foutjes eruit kan halen in een fractie van de tijd van een menselijke vertaler. Tel uit je winst!

Ook handige vertalers ruiken natuurlijk hun kans. Betaald worden zoals voorheen, maar dankzij Google Translate, DeepL en ChatGPT ondertussen veel sneller kunnen werken, wie zou dat niet willen? Alleen blijkt het in de praktijk hard tegen te vallen. Ik heb in 2022 mijn eigen proef op de som genomen met Anéantir van Houellebecq (733 Franse pagina’s) en kon niet anders concluderen dan dat het door de machine aangeleverde klad zoveel slechter was dan mijn eigen eerste versie, dat de totale tijdwinst vrij precies nul komma nul procent bedroeg. De machine mag dan in een paar minuten een heel boek kunnen omzetten, van literaire stijl heeft DeepL (het beste automatische vertaalprogramma) geen kaas gegeten, om nog maar te zwijgen van de talloze begripsfouten.

Het geeft een heerlijk superioriteitsgevoel, vooral wanneer je beseft dat programma’s als DeepL alles omzetten met het Engels als tussentaal. Allemaal erg goed voor het vertalershumeur: het Franse salaud (klootzak) wordt via het Engelse bastard vertaald als bastaard, het Franse bâtard (bastaard) via dezelfde weg als klootzak. Een zaklamp wordt een fakkel, lindebloesem wordt limoen, een etage wordt vloer, cijfers worden figuren, een collectebus wordt een kofferbak, de hoofdpersoon krijgt een Engelse naam (Mr. Reason), de buurvrouw wordt een buurman (het Engels kent geen geslachtsuitgangen), en DeepL weet ook prachtige nieuwe uitdrukkingen uit zijn mouw te schudden: ‘Wat kon zij mogelijk weten?’, ‘Hij deed al het praten’, ‘Het was maar een slecht moment om door te brengen’. Hoewel dat laatste voorbeeld natuurlijk gewoon letterlijk vertaald Frans is: ook een beginnende menselijke vertaler had dit fout kunnen doen.

Het verbeteren van al die fouten vergt erg veel tijd en oplettendheid, veel meer dan de doorsnee post-editor kan opbrengen, maar uiteindelijk zijn die missers niet het probleem. Het grootste gevaar dat menselijke vertalers op de korte termijn bedreigt is onderschatting. Toen ik afgelopen december in een Rode Hoed vol vertalers een verhaal mocht houden over literair vertalen en AI, bleek het grootste deel van de aanwezigen nooit gebruik te maken van ChatGPT – hetzij uit onwetendheid, hetzij uit onwil, hetzij uit gebrek aan interesse, en misschien wel een combinatie van die drie. Veel mensen waren stomverbaasd toen ze zagen wat het programma allemaal kon en in wat voor keurige zinnen het antwoord gaf op de vragen die ik stelde. En ChatGPT bestaat nog maar anderhalf jaar. Is het niet wat naïef om te denken dat de peuter altijd zo klein zal blijven?

Toegegeven, de gemiddelde leeftijd van boekvertalers is hoog – wat op zichzelf al een teken aan de wand is. Maar oudere vertalers lezen in elk geval nog de krant, dus het zal ze niet zijn ontgaan dat er deze maand net weer een nieuwe versie van ChatGPT is gelanceerd, GPT-4o (‘o’ voor ‘omni’) geheten, die bewegend beeld, geluid en tekst kan combineren tot levensecht overkomende video. Die stap maakt op bijzonder indringende manier duidelijk wat ons in de nabije toekomst te wachten staat: de nieuwe Houellebecq, met een druk op de knop in het Nederlands voorgelezen door Houellebecq zelf, desgewenst met een Zeeuws accent. Waarom zouden we in hemelsnaam nog een beroep op menselijke vertalers doen? Want vertaalfouten zal AI binnen niet al te lange tijd ook nauwelijks meer maken, of in elk geval niet meer dan een mens.

Wat ooit begon als een hulpmiddel ter verhoging van de menselijke productiviteit, is nu een meer dan volwaardige concurrent van de mens geworden. AI is niet zomaar ‘handig’ of ‘nuttig’ meer, maar staat op het punt om van de menselijke vertaler zélf een handig of nuttig hulpmiddel te maken, in afwachting van het moment dat ook dat hulpmiddel overbodig wordt. Prima, zou je kunnen denken, dan verdwijnt het beroep maar; jonge mensen vinden wel een andere manier om van hun creativiteit te kunnen leven. En geef ze maar eens ongelijk, want slechtbetaald, geestdodend lopendebandwerk als post-editor is wel het laatste wat je als jong (of oud) taaltalent moet willen doen.

Eind goed, al goed? Vanuit economisch perspectief bezien misschien wel, als we voor het gemak even aannemen dat AI de mensheid niet afschaft vanwege haar overbodigheid en/of schadelijkheid, en dat er voldoende nieuwe energiebronnen worden aangeboord om al die virtuele werelden te kunnen blijven genereren. De vraag is alleen wat die werelden met ons doen. Wat zou het precies betekenen als we een virtuele Houellebecq in het Nederlands zijn eigen boeken konden horen en zien voorlezen? Zou het gewoon een andere (betere? leukere?) manier zijn om toegang te krijgen tot een cultureel consumptieproduct dat nu nog grotendeels door menselijke ‘content creators’ tot stand wordt gebracht?

De vorig jaar overleden Frans-Tsjechische schrijver Milan Kundera schreef ooit in een essay, Het doek: ‘De geschiedenis van de kunst is vergankelijk. Het gebabbel van de kunst is eeuwig.’ Kundera, die de laatste jaren van zijn leven met zware alzheimer te kampen had, is zich waarschijnlijk nooit bewust geweest van de opkomst van AI, maar hij heeft zich altijd verzet tegen elke vorm van digitale verspreiding van zijn werk: omdat kunst die ‘content’ wordt, niets anders meer is dan een eindeloos gebabbel – inhoud om zakken mee te vullen. Dit in tegenstelling tot de kunst zoals we die in Europa ruwweg sinds de renaissance hebben gekend, gebaseerd op het eigen geluid dat elke kunstenaar voortbrengt in reactie op de wereld en op de reacties van zijn voorgangers.

AI-(ver)taalmodellen zijn gebaseerd op statistiek. Op grond van héél veel input leren ze wat de waarschijnlijkste manier voor mensen is om elementen met elkaar te combineren, en dankzij die waarschijnlijkheid kunnen ze zelf combinaties van elementen gaan maken die ons ‘intelligent’ toeschijnen. Voor wie in Thailand op het strand de plaatselijke ijsverkoper niet verstaat kan dat inderdaad heel handig zijn, maar voor teksten waarin het nu juist gaat om de individuele stem van de schrijver – dat wil zeggen, volgens Kundera, niet de algemene norm of het statistisch gemiddelde maar de afwijking ervan – zijn we bij de huidige AI-modellen in principe aan het verkeerde adres. Bij een literaire vertaling moet de vraag immers niet luiden: ‘Hoe zeggen we dat in het Nederlands?’ maar: ‘Hoe zou de schrijver dat in het Nederlands hebben gezegd?’

Volgens Marcel Proust kun je de taal alleen maar verdedigen door haar aan te vallen, en dat is precies wat schrijvers doen. Literair vertalers, van hun kant, moeten de verhouding tussen de norm en de afwijking ervan – de stijl – zien te vangen in een nieuwe tekst die met heel andere middelen (de woorden en conventies van een andere taal) een vergelijkbare verhouding aanhoudt. Dat is niet makkelijk, en vooral: elke vertaler doet het weer op een andere manier, want elke vertaler brengt zijn eigen levenservaring en culturele bagage met zich mee. Het is net als met muziekuitvoeringen: elke pianist wil recht doen aan de Beethovensonate die hij speelt, maar het resultaat is toch steeds weer anders.

Het is ongetwijfeld technisch mogelijk (hoewel waarschijnlijk niet economisch rendabel) om AI zo te programmeren dat die precies hetzelfde gaat doen als een menselijke vertolker: op een ‘persoonlijke’ manier de stijl van een tekst proberen na te bootsen in een andere taal. Het dubbele auteurschap dat op die manier ontstaat, en dat kenmerkend is voor elke vorm van uitvoerende kunst, is niet voorbehouden aan de mens: er is geen enkele reden om aan te nemen dat een kunstzinnige AI-uitvoering van een oorspronkelijk werk bij voorbaat onmogelijk is. Sterker nog, AI zou net als Tovertaal ook zelf die oorspronkelijke werken kunnen schrijven, misschien wel betere dan wij mensen tot nu toe hebben voortgebracht.

Maar waarom zouden we dat moeten willen? Om de kunst tot in de eeuwigheid te kunnen laten babbelen via een permanente aanvoer van nieuwe content, opium voor het al dan niet elitaire volk? In dat geval heeft kunst niets meer te maken met het eigen geluid – nauw verbonden met de vrijheid van meningsuiting – van een kunstenaar die een manier zoekt om zich te verhouden tot zijn tijd en zijn voorgangers. Willen we machines vanaf nu dezelfde individualiteit en de daarbij horende grondrechten toedichten? Of ruilen we het idee van eigenheid en herkenbaarheid voor het gemak maar gewoon in voor dat van permanent vermaak, waarbij het niet uitmaakt wie het ons voorschotelt, een mens of een machine?

Door taal en literatuur in handen te geven van AI besteden we onze menselijkheid uit aan een algoritme dat geen gevoel, geen levenservaring, geen existentiële angsten en geen verlangens heeft – hoewel het heel goed kan worden geprogrammeerd (of zichzelf kan programmeren) om die na te bootsen. De voor de hand liggende tegenwerping dat we toch zelf ook niets anders dan biologische algoritmen zijn, snijdt geen hout. Taalkundige AI is niet gevaarlijk op dezelfde manier als bijvoorbeeld militaire AI dat kan zijn, maar sluipenderwijs toch even dodelijk, omdat ze iets wat onlosmakelijk met ons mens-zijn verbonden is daarvan losrukt en buiten ons plaatst.

Moeten we actie gaan voeren en gaan staken, zoals de Engelse handwevers deden toen het machinale weefgetouw werd uitgevonden? Ze wonnen er wat tijd mee, meer niet. Ook de opmars van AI is niet meer te stoppen: net als bij de atoombom is er een vóór en een na, zegt Christopher Nolan, de maker van Oppenheimer. Wat we wel kunnen en moeten doen is AI zo goed mogelijk indammen met wet- en regelgeving, hoewel dat niets zal veranderen aan de hebzucht van uitgevers en schrijvers die de menselijke vertaler alleen maar als een kostenpost zien.

Maar uiteindelijk, als de waterscheiding tussen commerciële en niet-commerciële literatuur daardoor nog veel scherper is geworden dan ze nu al is, hebben we in elk geval nog één ding over dat ons niet kan worden afgenomen: de vrije keus om onze eigen menselijkheid niet op te geven. Schrijven en vertalen, gewoon omdat je er de innerlijke noodzaak toe voelt, zou dat niet heerlijk zijn?

Wat zegt de wet?
Elk oorspronkelijk werk geniet automatisch auteursrechtelijke bescherming, tot 70 jaar na de dood van de maker. Die maker is eigenaar van het werk en bepaalt zelf wat ermee gebeurt – bijvoorbeeld door een overeenkomst met een uitgever aan te gaan. Op vertalingen berust een dubbel auteursrecht, want zowel de schrijver als de vertaler heeft een oorspronkelijk werk voortgebracht; meestal maakt een vertaler de vertaling dan ook in opdracht van een uitgever die de vertaalrechten heeft aangekocht. Het auteursrecht kent een aantal uitzonderingen, bijvoorbeeld het citaatrecht: auteurs en uitgevers kunnen niet verbieden dat er uit hun publicaties wordt geciteerd. Ook voor datamining, waarbij werken worden ingelezen in een computergeheugen en dus verveelvoudigd, geldt sinds de Europese DSM-richtlijn van 2019 zo’n uitzondering: commerciële datamining is toegestaan tenzij de rechthebbenden hebben aangegeven dat ze daar niet aan mee willen doen (‘opt-out’). De nieuwe Europese AI Act dwingt AI-ontwikkelaars tot transparantie over de gebruikte bronnen, maar de Europese verenigingen van makers vinden dat niet ver genoeg gaan. Zij vragen om strengere wetgeving en om compensatie voor het gebruik van hun werk door een vraatzuchtige nieuwe concurrent. Waarbij overigens moet worden opgemerkt dat voortbrengels van machines zelf niet auteursrechtelijk beschermd zijn: iedereen mag er vrijelijk uit plunderen.

Hoe intelligent is intelligent?

Vraag: ‘Klopt de volgende redenering? Alle mensen zijn sterfelijk. Socrates is sterfelijk. Dus Socrates is een mens.’

ChatGPT: ‘Ja, de redenering klopt. Het is een voorbeeld van een geldig syllogisme, een logische redenering met twee premissen en een conclusie. In dit geval zijn de premissen: Alle mensen zijn sterfelijk. Socrates is sterfelijk. De conclusie volgt logisch uit deze premissen: Dus Socrates is een mens. De conclusie volgt omdat Socrates wordt geassocieerd met de eigenschap van sterfelijkheid, die wordt gedeeld door alle mensen volgens de eerste premisse.’

Vraag: ‘En klopt de volgende redenering? Alle apen zijn sterfelijk. Socrates is sterfelijk. Dus Socrates is een aap.’

ChatGPT: ‘Nee, de redenering is onjuist. De conclusie Socrates is een aap volgt niet logisch uit de gegeven premissen. Hoewel alle apen sterfelijk zijn (premisse 1) en Socrates ook sterfelijk is (premisse 2), betekent dit niet automatisch dat Socrates een aap is. De redenering maakt een fout in het verband tussen sterfelijkheid en het zijn van een aap. Het is een voorbeeld van de drogreden van de onjuiste gevolgtrekking, waarbij de conclusie niet geldig is op basis van de gegeven premissen.’

Na enige discussie vervolgt de intelligente machine: ‘Laten we een ander voorbeeld nemen: Alle mensen zijn sterfelijk. Socrates is een kat. Dus Socrates is sterfelijk. Hoewel de tweede premisse duidelijk onwaar is, blijft de redenering geldig omdat de conclusie logisch volgt uit de premissen. Dit toont aan dat geldigheid inderdaad niet afhankelijk is van de waarheid van de premissen.’

De vertaler op het omslag
Er is een duidelijke trend gaande om de naam van de vertaler op het omslag van het boek te zetten. In tal van landen is daar door vertalers en hun beroepsverenigingen voor gepleit. Immers, de vertaler is de tweede auteur van het boek, die elk woord en elke zinsconstructie heeft moeten bedenken: het maakt nogal veel uit wie een boek heeft vertaald. In tijden van AI krijgt die zichtbare vermelding van de vertaler een extra lading, want de uitgever geeft er een signaal mee af: DIT BOEK IS VERTAALD DOOR EEN MENS.

Een eerdere versie van dit artikel verscheen op 8 juni 2024 in de Volkskrant.

Deel dit bericht: