Hoe herken je AI-geschreven teksten? + voorbeelden

Je moet je steeds vaker gaan afvragen: is deze tekst, of een deel ervan, geschreven door AI?

Al meer dan 12 jaar schrijf ik teksten, voornamelijk voor het web en met een focus op websites in eigen beheer. De ontwikkelingen in dit vakgebied gaan de laatste tijd echt razendsnel. Tegenwoordig maak ik zelf ook gebruik van AI-chatbots, zoals Google Gemini, ChatGP en Microsoft Copilot. Dit vooral als hulp bij het schrijven van teksten. Ik gebruik deze tools absoluut niet voor het genereren van hele artikelen. Artikelen die volledig of grotendeels zijn geschreven door AI vind ik namelijk slecht en kan ik (vooralsnog) erg goed herkennen. In dit artikel leg ik je uit waar ik een AI-tekst aan herken en hoe betrouwbaar AI-detectoren zijn voor geschreven tekst.

Vooraf: Tekst geschreven door een mens is niet altijd waar, tekst geschreven door een LLM is niet altijd onwaar.

Inhoudsopgave

Wat is een LLM? (Volgens een LLM zelf 😉)

Prompt: Geef een definitie in een paar zinnen, zonder opsommingen of tussenkopjes. Doelgroep: brede doelgroep. Leg het toegankelijk en beknopt uit.

Een LLM, of Large Language Model, is een vorm van kunstmatige intelligentie die menselijke taal kan begrijpen en genereren door te leren van grote hoeveelheden tekst. Dit stelt het in staat om taken zoals teksten schrijven, vragen beantwoorden en vertalen uit te voeren.

Prompt: Geef nu een voorbeeld in een vergelijking, kort en bondig, voor een brede doelgroep toegankelijke taal, duidelijk. Paar zinnen, geen heading.

Een Large Language Model (LLM) werkt een beetje zoals een zeer uitgebreide receptenboek voor taal. Net zoals een kok ingrediënten combineert op basis van recepten om een gerecht te maken, combineert een LLM woorden en zinnen op basis van de enorme hoeveelheden tekst die het heeft gelezen, om nieuwe teksten te creëren die zinvol en relevant zijn voor de gestelde vragen.

Leuk om te weten: Als tekstschrijver van meerdere websites gebruik ik AI-tools, zoals ChatGPT en Google Gemini, regelmatig als ik teksten schrijf. Ik vind het ideaal voor bijvoorbeeld het genereren van korte definities van moeilijke woorden in mijn tekst, of om een inhoudsopgave te schrijven. Ik stel dan de vraag:
Prompt: Ik wil voor mijn website aikundig.nl een artikel schrijven over [onderwerp]. Maak een inhoudsopgave waarin alle punten opgesomd staan die in het artikel echt aan bod moeten komen. De doelgroep is breed. Tekst moet toegankelijk zijn en wordt in ik-vorm geschreven. Aanspreekvorm is je. 
Ik krijg als antwoord alle hoofdpunten in een opsomming. Hier staan vaak wat punten tussen waar ik zelf nog niet aan had gedacht. Het opvullen van de punten met tekst doe ik dan wel weer volledig zelf.
Heb ik een artikel af? Dan laat ik Google Gemini soms een leuke, pakkende, SEO-vriendelijke titel genereren.

Een AI detector gebruiken, is dat betrouwbaar?

Ai detectoren gebruiken betrouwbaarheid - schilderij van een docent die huiswerk nakijkt met AI detector

Ai-detectoren, zoals GPTZero, Smodin.io, Plagiarismdetector en Scibbr zijn, naar mijn mening, onbetrouwbaar om een definitief uitsluitsel te geven of een tekst door de mens of AI is geschreven. Naarmate AI-tools de wereld steeds meer gaan overnemen, hebben we ook steeds meer behoefte aan betere detectoren. Deze zijn er nu nog niet. Het gebruik ervan heeft dan niet heel veel nut. Je kan bijvoorbeeld een leerling niet bestraffen als een AI-detector zegt dat zijn of haar tekst ‘waarschijnlijk door AI is geschreven’. Tijdens mijn eigen testen werd dit ook over mijn eigen 100% zelfgeschreven teksten gezegd, in alle populaire AI-detectoren. Er zijn wel een aantal veelbelovende onderzoeken en bedrijven bezig met deze technologie, waar de Amerikaanse start-up Reality Defender er voor mij bovenuit springt. Deze technologie is echter (nog?) niet beschikbaar voor normale consumenten.

Goed om te weten: Geschreven inhoud waarvan een deel door AI is geschreven, maar een groot deel door mensen is moeilijk te detecteren. Dit soort teksten kunnen zelfs de beste detectie omzeilen. De meeste AI-detectoren werken voor Engelse teksten beter dan Nederlandse teksten. Er is dan ook meer trainingsdata beschikbaar in het Engels dan het Nederlands.

Hoe ik teksten herken die door AI zijn geschreven

Om te bepalen of een tekst is geschreven door een LLM gebruik ik geen AI-detector. Deze zijn naar mijn mening erg onbetrouwbaar, helemaal sinds ChatGPT-4 is uitgekomen. Teksten gegenereerd met eerdere versies, zoals ChatGPT 3 en 3.5 konden deze detectoren er vaak wel tussenuit pikken. Ik denk dat je er tegenwoordig zelf een grondige analyse op los moet laten om AI echt te kunnen onderscheiden van echte teksten.

Nederlandse teksten, die – volledig of voor een deel – zijn geschreven door AI kom ik tegenwoordig zo vaak tegen, dat ik patronen ben gaan herkennen in dit soort teksten. Vaak zie ik het aan woorden en zinnen die in het normaal menselijk Nederlands niet vaak worden gebruikt in teksten, maar door AI wel. Een aantal punten op een rij waarin ik herken dat een tekst door AI is geschreven.

Er wordt veel gebruik gemaakt van bied, biedt, bieden. Dit zijn woorden die normaal niet veel voorkomen in Nederlandse teksten, maar AI gebruikt dit wel veel. Dit komt wellicht ook omdat het Engelse offer (als in:” A services company offers a range of software”), in het Nederlands letterlijk wordt vertaalt als bied (als in: “Een dienstenbedrijf biedt een reeks software aan”).
Een conclusie. Bijna alle teksten die snel door AI zijn geschreven bevatten een conclusie, ook teksten die helemaal geen conclusie hoeven te hebben. Soms is het een nieuwe alinea met een heading genaamd Conclusie, soms zijn het een aantal zinnen aan het eind van het artikel. “Kortom..”, “als conclusie..” etc.
Tekst is te constant. Ik ken maar weinig schrijvers die door de hele tekst heen hun eigen stijl kunnen behouden, dezelfde aanspreekvorm blijven gebruiken e.d. AI kan dit vaak wel
Elke Zin Begint Met Een Hoofdletter. Dit zie je vaak in titels / tussenkopjes. In het Nederlands doen we dit eigenlijk nooit. Dit is iets Amerikaans, wat hopelijk niet gaat overwaaien naar Nederland. AI doet dit wel heel erg vaak, omdat het o.a. op teksten is getraind waar dit vaak zo gedaan wordt.
In AI-teksten staan vaak lange zinnen. Deze worden veel met ,en gescheiden. Hoewel de hele oude schoolregel ‘een komma mag nooit voor en’ komen onwaar is, gebruiken we dit ook weer niet zo vaak. Daarnaast zitten er best wat regels aan het gebruik voor een komma voor het woord en. Ik ga altijd na of de schrijver van de tekst deze regels wel zou kennen en overal goed zou kunnen toepassen, zonder hier fouten in te maken.
Duiken. In het Nederlands duiken we in de zee of een zwembad. We duiken zelden een tekst in. Zoek je in Nederlands naar de zin “in een goed boek duiken” of “Laten we in deze recensie duiken!” dan krijg je daar informatie over de duiksport of AI-gegenereerde artikelen. Dit woord, als het niet over duiksport gaat, staat enorm vaak in AI-artikelen in het Nederlands. Een slechte vertaling van het Engelse: A Deep Dive into. Dit is iets wat in de Engelse taal wel heel gebruikelijk is.
Cruciaal belang: AI zegt over heel veel dingen dat deze van cruciaal belang zijn, terwijl dat stiekem wel meevalt. Soms zie ik het zelfs twee of meer keer in een tekst staan, terwijl dit echt niet nodig is. Sommige teksten lenen zich ook niet voor een cruciaal belang. Bijvoorbeeld: “Als je Valencia bezoekt is het van cruciaal belang dat je een wandeling maakt door het oude stadscentrum”.
Weinig tekst onder tussenkopjes: Bij teksten waar gebruik wordt gemaakt van titels en subtitels staan er bij AI-teksten vaak weinig zinnen onder een tussenkopje. Het is normaal gesproken gebruikelijk om meer informatie onder een subtitel te schrijven i.p.v. een paar zinnen.
Engelse woorden: Gamechanger, Tapestry, Sentinel, e.d. Dit zijn woorden die ik vaak tegenkom in door AI-geschreven teksten waar geen goede Nederlandse vertaling voor is, of waarvan AI denkt dat dit gewoon gebruikt word. De zin “Food that’s cheap, plentiful and capable of feeding large numbers of people is part of the tapestry of a community.” wordt zelfs door Google Translate vertaalt als: Voedsel dat goedkoop en overvloedig is en dat grote aantallen mensen kan voeden, maakt deel uit van het tapijt van een gemeenschap. Staan zulke woorden in een Nederlandse tekst? Dan kan je er vanuit gaan dat het door AI is geschreven.
Woorden die in het Nederlands niet vaak worden gebruikt in een bepaalde context, maar een slechte vertaling zijn uit het Engels: Testament, Symphony, Symbolizes, Resonates, etc.
Intro en Conclusie: Er is altijd een introductie en een conclusie, ook bij teksten waarbij dit helemaal niet nodig is.
Zelden controversieel: LLM’s, zoals ChatGPT en Gemini, zijn zo getraind om ervoor te zorgen dat dat niemand wordt beledigd. Dit merk je ook terug in de tekst. Het is allemaal erg algemeen en er wordt zelden een (controversieel) standpunt ingenomen.
Niet bestaande bronnen: Ai-chatbots, zoals ChatGPT, Microsoft Copilot, Jasper, Gemini e.d. geven regelmatig een URL van een bron die niet bestaat. Klik op de URL om te kijken of deze bron wel juist is. Een voorbeeld dat ik in het echt heb gezien: In een artikel over bijen stond onderaan een bron die moest leiden naar een onderzoek over de hoeveelheid bijen in Nederland. De link ging echter naar een onderzoek over Multi-Objective Optimization Applied to the Design of Sustainable Pedestrian Bridges. Overigens merkte je aan de rest van het artikel ook overduidelijk dat het niet door een mens was geschreven.

Goed om te weten: Je kan bij veel LLM’s instructies invoeren. Toch zal de LLM het soms gewoon negeren omdat er geen andere (goede) optie beschikbaar is, bijvoorbeeld in het geval van bied, biedt en bieden. Ook als je ChatGPT een rol laat aannemen worden alle bovenstaande punten ook gewoon gebruikt. Het enige verschil is dat ChatGPT dan acteert alsof het iemand anders is voor de tekst.

Algemene kenmerken waaraan je door AI-geschreven tekst kan herkennen

Naast mijn bovenstaande voorbeelden die ik uit eigen ervaring heb opgeschreven, heb ik hieronder een aantal algemene punten voor je op een rij gezet om Nederlandse teksten die door AI zijn geschreven te herkennen.

Overmatig formele of neutrale taal: AI-geschreven teksten missen vaak een persoonlijke toon en kunnen overkomen als erg ongewoon formeel of neutraal voor het onderwerp of de context.
Herhaling van woorden: AI-systemen kunnen soms dezelfde woorden of uitdrukkingen herhalen binnen een tekst. Dit komt doordat het model tijdens het genereren van tekst bepaalde woorden als waarschijnlijker beschouwt en deze vaker gebruikt.
Gebrek aan nuances en diepgang: Teksten die door AI zijn gegenereerd, kunnen een oppervlakkig begrip van complexe onderwerpen tonen. Ze missen vaak de subtiele nuances die echte tekstschrijvers wel meegeven in een tekst.
Onnatuurlijke zinsconstructies: Hoewel AI grammaticaal correcte zinnen kan produceren, kunnen de zinnen soms onnatuurlijk lang of ingewikkeld zijn, zonder dat dit een duidelijk doel dient, en zonder dat dat de correcte zin echte spelfouten bevatten, maar toch onjuist aanvoelen. <– Precies zoals deze zin 😉.
Consistentie in stijl en woordkeuze: AI-modellen zijn vaak zeer consistent in hun gebruik van taal. Dit zie je maar zelden terug in teksten geschreven door normale tekstschrijvers.

Een lijst van woorden waaraan ik een AI-tekst herken

Ik zal de lijst regelmatig aanvullen!

Baken – baken van hoop, baken van verandering.
In de diepten van – bijvoorbeeld als het gaat over wanhoop
Standvastig – toewijding, toewijding, veerkracht …
Transformatief – veranderingen, acties. . .
Hubs van — artistieke expressie, creativiteit en leren. . .
Lichtend voorbeeld van – samenwerking, synergie, leiderschap, moed …
Ontdekken – de bron, het mysterie, de diepten …
Tapestry – dit draagt bij aan de rijke tapestry van het volk
Behoeften – vooral als het voor een woord staat “dit sluit perfect aan bij jouw fitnessbehoeften”
Aangedreven – Bijvoorbeeld: een door AI-aangedreven start-up.
Ontdekken – Bijvoorbeeld in de intro van een tekst : Laten we samen ontdekken..

Kan je AI detectoren en menselijke controle omzeilen?

Ja, dat kan zeker. Ik wil je echter wel de vraag stellen: waarom zou je dat willen?

Ben je een leerling of student en moet je een tekst schrijven voor school? Waarom zou je dan AI gebruiken? Het doel is om te leren over een onderwerp. De opdracht heeft de docent echt niet voor de lol gegeven. Hoewel het erg verleidelijk kan zijn om lekker snel een essay voor school te maken en in te sturen, is dit echt niet nuttig voor wie dan ook.

Waarschijnlijk (lees: zeker weten) had ik dit advies op jonge leeftijd ook niet willen aannemen, maar ik wil het je toch graag meegeven: leren is best heel erg belangrijk voor je toekomst. Leren om docenten te misleiden met AI-gegenereerde teksten is dat niet.

Ben je een tekstschrijver voor het web en wil je artikelen genereren die door de detector heen kunnen komen? Waarom zou je dan AI gebruiken? Over een X aantal jaar is het internet dood (zie: https://nl.wikipedia.org/wiki/Theorie_van_het_dode_internet) en staat het vol met AI-geschreven artikelen. Jouw AI-artikelen gaan dan echt niet meer gevonden worden. Ik denk zelfs dat deze artikelen niet eens meer in de index van zoekmachines komen te staan. Alleen artikelen die wat toevoegen (lees: persoonlijke expertise, ervaringen, eigen mening, eigen schrijfstijl e.d.) zullen nog wat kunnen toevoegen aan het dode internet. Een website met 500.000 woorden aan AI artikelen gaan je in de toekomst echt nergens brengen.

Dit betekent niet dat het erg is om AI te gebruiken om tekst te maken, kunst te maken en dergelijke, maar dit is iets voor een ander artikel!

AI kan een waardevolle hulpbron zijn, maar het vervangt nooit de waarde van persoonlijke groei en continue leren. Blijf je verdiepen in onderwerpen, blijf leren en blijf je kennis verbreden.
Edwin – aikundig.nl