13 min Leestijd

Hoe bewijst een auteur dat hij geen AI is? Twee tips.

Inleiding

Nieuwe kunstwerken van al lang dode schilders, nummers in de stijl en met de stam van artiest A gezongen door de computer, samenvattingen in minder dan een minuut die de toets der kritiek van de leraren met vlag en wimpel doorstaan, wat kan Artifical Intelligence (AI) tegenwoordig niet? Eén druk op de knop en AI heeft het al gedaan. Daarbij een enorme output met talloze AI-creaties uitspugend. Creaties die zich op het eerste gezicht in weinig onderscheiden van dat wat schilders, componisten en mensen van vlees en bloed maken.

De vraag is of het auteursrecht er is om al deze AI-creaties te beschermen. Het antwoord is nee. Het auteursrecht is er om de menselijke auteur te beschermen doordat diens creatie wordt beschermd. Dat is ingegeven door economische motieven: auteurs zijn belangrijk voor onze samenleving dus we moeten hun de kans geven geld te verdienen met hun werk. Daarom moeten we hun werk beschermen tegen profiteurs. Ook spelen motieven een rol die op het terrein van moraal en ethiek liggen: het geeft geen pas te profiteren van het werk van auteurs zonder hen daarvoor te betalen en ook daarom moeten we hun werk beschermen. Beide redenen om de auteur te beschermen zijn geen redenen om AI te beschermen. En dat gebeurt dus ook niet. Het werk van een AI is in principe niet beschermd.

Probleemstelling

De nabijheid van AI-creaties bij menselijke creaties roept intussen een heel ander probleem op. Hoe verweert een auteur zich tegen de beschuldiging dat niet hij of zij, maar een AI het werk heeft gemaakt?

Zoektocht en naamsvermelding

Deze blog beschrijft een tamelijk frustrerende zoektocht naar de mogelijkheden voor zo’n verweer. Voordat we aan die zoektocht beginnen, is het goed te wijzen op de betrekkelijkheid van de noodzaak tot het voeren van zo’n verweer.

Het gaat om het volgende: het is niet de auteur die moet bewijzen dat een creatie die zijn naam draagt niet door een AI is gemaakt, het is degene die zich erop beroept dat de creatie niet door de auteur is gemaakt, die dat zal moeten bewijzen. Dat laatste is zeer lastig, zo niet onmogelijk. Behalve natuurlijk als de auteur met zoveel woorden zegt dat hij niet degene is die het werk maakte.

Het is artikel 4 Auteurswet dat daarin een belangrijke rol speelt. Dat artikel geeft een zogenaamd “vermoeden van makerschap” voor de auteur. Dat houdt in dat volgens de Auteurswet degene die bij een creatie staat vermeld als de auteur, geacht wordt auteur te zijn. Strikt genomen zou dit de auteur niet kunnen helpen want de vraag is hier immers niet van wie de creatie is, maar of er een creatie is.

Wij zijn geneigd om dit artikel zo te interpreteren dat als een auteur-mens vermeld is als maker, dat dan ook deze geacht wordt de maker te zijn van de betreffende creatie en dat daarmee deze creatie in een moeite door geacht wordt niet door een AI te zijn vervaardigd.

Een ander element (dat hieronder verder wordt uitgewerkt) is dat een menselijke maker de output van de AI verder kan bewerken. Doet hij dat op een manier die auteursrechtelijk gezien voldoende creatief is, verkrijgt deze maker auteursrecht op die wijzigingen, wijzigingen vaak innig verbonden zijn met het AI werk. Het overnemen van het bewerkte AI werk zal dan ook een auteursrechtinbreuk jegens de auteur die het Ai werk bewerkte opleveren.

ChatGPT

Nu terug naar onze zoektocht naar een antwoord op de vraag hoe de auteur, los van de naamsvermelding, een betere bewijspositie te geven.

Het leek voor de hand te liggen om als auteur de verschillende stappen in het creatieve proces vast te leggen, zoals in schetsen of in aantekeningen. Zo zouden de creatieve keuzes kunnen worden aangetoond die afkomstig zijn van de maker zelf. Maar de auteur kan worden tegengeworpen dat het maar de vraag is of de auteur deze creatieve keuzes wel zelf heeft gemaakt. Een nep-auteur kan natuurlijk gewoon aan de AI vragen dergelijke schetsen of aantekeningen te maken. Daarmee lijkt deze route niet tot veel zaligheid te leiden.

Een volgend idee was AI in te zetten om te bewijzen dat AI niet betrokken is bij de creatie. We hebben ons daarbij vooral beperkt tot teksten, omdat we daar zelf als schrijvende professionals het makkelijkst mee om kunnen gaan.

Chat GPT

Toen we aan ChatGPT vroegen of hij een tekst (die door hemzelf was geschreven) had geschreven antwoordde hij:

‘Ja, ik heb de tekst geschreven die je zojuist hebt geciteerd. Als een AI-model heb ik de mogelijkheid om tekst te genereren op basis van de input die ik ontvang. De tekst die ik schrijf, is gebaseerd op mijn trainingsdata en algoritmes die tekst samenstellen op een coherente en relevante manier.’

Uiteraard gaat het bij een auteur dan om een negatief antwoord op die vraag. Bij uploaden van een door onszelf geschreven eigen tekst antwoordde ChatGPT:

Nee, de tekst die je hebt geciteerd, is niet door mij geschreven. Als je nog andere vragen hebt of hulp nodig hebt, aarzel dan niet om ze te stellen!

Dit lijkt een oplossing te zijn voor het probleem, maar helaas is de AI niet echt betrouwbaar. Hij kletst vaak maar wat, onaardig gezegd. Teksten die door ChatGPT zijn geschreven, worden eerst als door hem geschreven getypeerd, maar de volgende dag al bestempeld als ‘menselijk’. Het omgekeerde komt ook voor. ChatGPT heeft geen geheugen waarin hij kan graven waardoor de output, dus ook zijn antwoord op deze vraag, iedere keer opnieuw wordt gegenereerd. En aangezien een AI taalgebaseerd is, is de kans dus groot dat hij maar wat zegt, mits dat goed bekt. Dat betekent niet dat een negatief antwoord waardeloos is. Het betekent alleen dat er geen volledige zekerheid is dat ChatGPT de tekst niet zelf schreef.

Zoals ChatGPT zelf schrijft:

‘Nee, ChatGPT heeft geen geheugen in de zin dat het zich eerdere interacties of informatie van het ene gesprek naar het andere kan onthouden. Elke interactie met ChatGPT is op zichzelf staand en wordt niet opgeslagen voor toekomstig gebruik. Het model onthoudt geen persoonlijke gegevens of informatie over individuele gebruikers tussen gesprekken. Elke keer dat je een vraag stelt of een opmerking maakt, wordt de reactie gegenereerd op basis van de directe context van dat gesprek en de tekstuele input die wordt verstrekt. ChatGPT is ontworpen met privacy en gegevensbeveiliging in gedachten, en het slaat geen persoonlijke informatie of gegevens op.’

Daarmee lijkt het stellen van de vraag of een AI de auteur is of niet, wel degelijk (enige) zin te hebben. Het voegt in ieder geval enig bewijs toe aan de stelling dat de auteur en niet de AI de auteur is. En daarmee dat de tekst of het ontwerp een creatie is die wordt beschermd door de auteurswet. Dat dat bewijs niet sluitend is, betekent niet dat het niet waardevol is.

Helaas blijkt uit onze verdere testen hieronder (in verband met door een mens bewerkte teksten van AI afkomstig) dat de kracht van dit bewijs nog lager is dan “niet sluitend”. Maar eerst nog een opmerking over de zogenaamde AI detectors.

AI detectors

Inmiddels zitten ook de programmeurs niet stil. Zeker in verband met het detecteren van nep nieuws en door AI geschreven opstellen en dergelijke zijn al meerdere AI-detectors ontwikkeld. Dat zijn partijen als TurnitIn, Copyleaks of OpenAI’s Classifier[1]. Deze zijn echter evenmin 100% effectief. TurnitIn zegt 99% accuraat te zijn als het gaat om teksten, net als Copyleaks. Dat zou een mooie score zijn, maar de juistheid daarvan valt te betwijfelen. Wij checkten een door AI geschreven tekst die Copyleaks beoordeelde als 64,1% waarschijnlijk geschreven door AI. Terwijl je als het uitgangspunt een 99% correctheid is, daar toch in plaats van 64,1% een hoger percentage had verwacht (dat komt overigens wellicht doordat de tekst aan de korte kant was). Maar, los daarvan, het is natuurlijk opmerkelijk dat twee AI-detectors precies dezelfde score beloven (99%). Daarbij is 99% een ongeloofwaardig getal in die zin dat 99% een getal is dat vaak wordt gebruikt om een geringe mate van afwijking weer te geven, zonder die te preciseren. Wij kunnen ons niet aan de indruk onttrekken dat dat hier ook is gebeurd. Het echte slagingspercentage zal lager kunnen liggen, waarbij meespeelt dat AI nog in de kinderschoenen staat. AI kan en zal zich verder ontwikkelen en de kans lijkt aanwezig dat, al doende leert de AI, deze het herkenbare gaatje met de menselijke geest kan gaan dichten waardoor de trefzekerheid van deze programma’s sterk kan afnemen. Anders gezegd: zelfs als de AI-detector nu goed werkt, betekent dat niet dat die morgen ook nog goed werkt. Waarbij we moeten bedenken natuurlijk dat ook de AI-detectie nog in de kinderschoenen staat. Er is in die zin sprake van een voortdurende wapenwedloop tussen de AI die zich steeds meer als mens zal willen voordoen en de AI opsporingsdienst die de machine wil ontmaskeren. [2]

(Ook programma’s voor het detecteren van door AI gegenereerde afbeeldingen zijn niet waterdicht. Een te lage resolutie, te klein deel van de afbeelding of een lichte bewerking kunnen er al voor zorgen dat de detectors geheel onbetrouwbaar zijn.[3] De detectors zijn daarnaast veelal getraind op beelden van een specifieke AI, waardoor foto’s van andere systemen niet herkend worden.[4])

De auteur bewerkt AI-output

Een laatste issue, tenslotte, is dat een auteur de output van een AI kan bewerken en zo de AI en Copyleaks c.s. kan laten denken dat de door hem bewerkte input het resultaat van een menselijke creatie is terwijl een deel, klein of heel groot, wel degelijk afkomstig is van een computer.

Auteursrechtelijk wordt het nu ingewikkeld: een bewerking van een tekst kan namelijk ook auteursrechtelijk beschermd zijn, zonder dat dat afdoet aan de bescherming van de oorspronkelijke onbewerkte tekst.

Er zijn, als een auteur met een tekst, een werk, van iemand anders aan de gang gaat drie smaken in, zeg maar, oplopende ingrijpendheid van de bewerking:

  1. De bewerking is minimaal en is zelf niet “creatief”: de bewerker verkrijgt geen auteursrecht en alleen de oorspronkelijke auteur heeft auteursrechten met betrekking tot het “bewerkte” werk.
  2. De bewerking is ingrijpender en is zelf ook “creatief”. Denk aan een vertaling of een duchtig herschrijven. Er rust dan nog steeds auteursrecht van de oorspronkelijke auteur op het “bewerkte” werk maar ook op de bewerking zelf: de bewerking (de vertaling) dus. Er is dus sprake van twee auteursrechthebbenden met betrekking tot de bewerking: de oorspronkelijke auteur en de bewerker.
  3. De bewerking is zodanig ingrijpen en zelf ook zo “creatief” dat er een geheel nieuw werk ontstaat. Dan heeft alleen de bewerker auteursrecht met betrekking tot de bewerking en is deze, auteursrechtelijk, geen bewerker meer maar zelf auteur.

Met dit in het achterhoofd hebben we eerst een stevige bewerking getest (ergens tussen 2 en 3 in) en vervolgens een minimale bewerking.

Dat deden we als volgt: allereerst vroegen we de AI een opstel te schrijven over auteursrecht en foto’s op het internet. De volgende alinea is uit dat opstel afkomstig:

Chat GPT: Het auteursrecht, in essentie, beschermt het intellectuele eigendom van makers. Voor foto’s geldt dit ook, ongeacht of ze analoog of digitaal zijn gemaakt. Wanneer iemand een foto maakt, is hij of zij in veel gevallen automatisch de houder van het auteursrecht. Dit betekent dat anderen de foto niet zomaar kunnen gebruiken zonder toestemming van de maker. Het plaatsen van een foto op het internet verandert niets aan dit basisprincipe.

Copyleaks herkende deze zin als 64,1% waarschijnlijk AI gegenereerd. Ook ChatGPT meldde ons dat deze tekst door hem kon zijn gegenereerd. Bij wijze van experiment herschreven we dit stuk tekst stevig, zonder echter de bedoelingen van de zinnen of de volgorde ervan aan te passen. Dit is het resultaat:

In de kern is het auteursrecht er om het intellectuele eigendom van makers te beschermen. Dat geldt ook voor foto’s waarbij het niet uitmaakt of ze analoog of digitaal zijn. Als een persoon een foto maakt, zal die in de meeste gevallen vanzelf het auteursrecht op die foto krijgen. Als anderen die foto dan willen gebruiken, zullen ze toestemming moeten vragen aan die persoon. Als de foto wordt gebruikt op het internet, blijft dat gelden.

 We vroegen ChatGPT of dit zijn tekst was en het antwoord was nee:

Nee, de tekst die je hebt geciteerd, is niet door mij geschreven, maar het behandelt wel hetzelfde onderwerp dat ik in het eerdere opstel heb besproken: het auteursrecht op foto’s en de bescherming van het intellectuele eigendom van makers.

Copyleaks beoordeelde onze herschreven tekst als 97,7% waarschijnlijk menselijk.

Dat betekent dat als deze tekst een bewerking is zonder dat er sprake is van een geheel nieuw werk, de auteur (ondergetekende) nu het auteursrecht heeft op zijn bewerking maar niet op de door de AI gegenereerde tekst.

Vervolgens herschreven we de tekst minimaal. Zodanig minimaal dat onze bewerking waarschijnlijk de noodzakelijk creativiteitstoets niet haalt. Dit is de licht bewerkte tekst:

Het auteursrecht beschermt in essentie het intellectuele eigendom van makers. Voor digitale of analoge foto’s geldt dit ook. Wanneer iemand een foto maakt, is hij of zij in veel gevallen automatisch de houder van het auteursrecht. Anderen mogen de foto hierdoor niet zomaar gebruiken zonder toestemming van de maker. Het plaatsen van een foto op het internet verandert niets aan dit basisprincipe.

ChatGPT zegt desgevraagd over deze tekst: “Nee, ik heb de tekst die je hebt verstrekt niet geschreven.” Copyleaks weet vrijwel zeker dat deze tekst menselijk is. Met 96,4% waarschijnlijkheid is dit een menselijke tekst volgens Copyleaks.

Dit betekent een verdere afkalving van de status van de AI en AI-detectors als vraagbaak over het auteurschap. De echte auteur kan immers telkens het verwijt krijgen, een AI-tekst licht te hebben gewijzigd om de illusie van een door hem gemaakt werk te creëren. Dus niet alleen bieden AI en de AI-detectors geen 100% zekerheid over het auteurschap van een levende auteur, maar gegeven het gemak waarmee een auteur zich voor kan doen als een levende auteur van een AI tekst, helpen ze zelfs vrijwel niets. Vooralsnog.

Wat nu?

Kan de auteur dan niets doen? Het gaat erom dat de auteur een geloofwaardig creatief spoor van zijn werk aanlegt. Dat helpt bij diens verdediging tegen de stelling dat niet de auteur maar de computer het werk heeft gemaakt, ook al kan een kwaadwillende auteur een vergelijkbaar spoor aanleggen.

Wij zouden daarom zeggen: bewaar de oorspronkelijke werken (teksten en ontwerpen) in alle varianten. Daarbij kan wellicht gebruik gemaakt worden van beschikbare registratietools of registratietechnieken zoals, bijvoorbeeld, blockchain. Een werk met een datum daaraan verbonden die te verifiëren is in een externe database, laat een AI nabootsing meteen door de mand vallen.

En verder geldt natuurlijk nog dat een echte auteur vooralsnog goed beschermd blijft als die auteur zijn naam als auteur onder zijn werk blijft zetten. En een auteur met minder scrupules kan zelfs een wereld winnen. Zo’n auteur kan simpelweg de AI het werk laten doen, dan de tekst snel een beetje aanpassen en zijn naam erbij zetten als auteur en dan is hij dat ook omdat het vooralsnog niet mogelijk is het tegendeel te bewijzen. Daarmee kan zo’n auteur vele malen sneller werken en in korte tijd een enorm oeuvre opbouwen. Dergelijk handelen is nu nog niet te detecteren. Of je als gevierd “nep” auteur rustig kan blijven slapen, is niet duidelijk en zelfs onwaarschijnlijk. De techniek schrijdt voort en de kans dat dit gat technisch gedicht wordt, is zeker aanwezig.

Conclusie

Voorlopig leveren AI zelf en AI-detectors alleen enige hulp bij ongewijzigde teksten. Gegeven het relatieve gemak waarmee die detectiekracht kan worden omzeild, door kleine wijzigingen toe te voegen, is die hulp zeer betrekkelijk. Wij zien daarom vooralsnog geen manier voor de menselijke maker om afdoende te bewijzen dat deze mens de auteur is en niet AI.

We raden aan de teksten (en ontwerpen) in hun verschillende stadia met datum te bewaren. Zo creëert de auteur een enigszins geloofwaardig spoor. Registratietechnieken met een betrouwbaar datumstempel zouden kunnen helpen.

Maar vooral raden we aan dat de auteur zijn naam en hoedanigheid van auteur vermeldt bij al zijn werk.

Met dank aan Bloeme de Boer

nawoord: dit artikel is herschreven naar aanleiding van de ontwikkelingen op AI gebied. In een eerdere versie werd nog belang gehecht aan het stellen van vragen aan AI.

[1] New Tool Can Tell If Something Is AI-Written With 99% Accuracy (forbes.com)

[2] Another Side of the AI Boom: Detecting What AI Makes – The New York Times (nytimes.com)

[3] How Easy Is It to Fool A.I.-Detection Tools? – The New York Times (nytimes.com)

[4] Hoe zie je of een foto gegenereerd is door AI? | EOS Wetenschap

 

About Jetse Sprey

Jetse is aan ons kantoor verbonden als legal counsel. Hij vindt oplossingen in plaats van problemen en is telkens weer in staat om impasses te doorbreken. Hij zegt wat hij ergens van vindt en niet wat hij denkt dat zijn cliënten willen horen.

Hij schrijft scherpe contracten die goed te lezen zijn. Hij heeft veel ervaring met Blockchain en onderneemt daar zelf in. Hij schrijft processtukken en adviezen die overtuigen. Hij weet veel van intellectueel eigendom, privacy en ondernemingsrecht.

Meer over Jetse Sprey