Generatieve AI tot nu toe: hoe we zo ver gekomen zijn

Kunstmatige intelligentie bestaat al sinds 1955. In principe dan, want de mogelijkheden van ChatGPT nu zijn niet te vergelijken het eerste AI-programma dat bijna zeventig jaar geleden werd ontwikkeld.

Dat AI het afgelopen jaar het onderwerp is van veel gesprekken, is dan ook niet vreemd. Met name de opkomst en snelle ontwikkeling van generatieve AI, zoals ChatGPT, Midjourney en DALL-E, spreekt tot de verbeelding.

In deze tweedelige serie gaan we in op de geschiedenis en toekomst van generatieve AI. Eerst: hoe zijn we zo ver gekomen? Wat is generatieve AI eigenlijk en uit welke technologieën is het opgebouwd?

In de volgende aflevering bespreken de volgende fase in de evolutie van generatieve AI. Als de voortekenen ons niet bedriegen, staan we aan de vooravond van opnieuw een grote doorbraak in de mogelijkheden van generatieve AI. Retrieval-augmented generation gaat veel problemen oplossen waar we nu nog mee te maken hebben.

We beginnen met de basics. Wat zijn de bouwstenen van generatieve AI?

De basis: machine learning

Machine learning (ML) is de kern van veel AI-systemen. ML-modellen zijn in staat om te leren van data, zonder dat expliciet geprogrammeerd zijn voor specifieke situaties. Deze modellen herkennen patronen en regelmatigheden in datasets en leren daarvan.

Een goed voorbeeld is het filteren van spam in je e-mail. Een ML-model kan worden getraind met voorbeeld-e-mails, die zowel spam bevatten als ‘echte’ berichten. Het systeem leert onderscheid te maken op basis van kenmerken zoals sleutelwoorden, afzender en opmaak. Zodra het model getraind is, kan het nieuwe e-mails beoordelen en spam effectief filteren.

Complexere patronen herkennen: deep learning

Deep learning is een subset van machine learning die gebruik maakt van neurale netwerken. Deze bestaan uit meerdere lagen (vandaar ‘deep’) en kunnen daarmee complexe patronen herkennen in grote datasets. Deep learning modellen zijn daarom uitermate geschikt voor beeldherkenning en classificatie. Ze kunnen afbeeldingen analyseren en objecten zoals gezichten, voertuigen en landschappen identificeren.

Deze technologie wordt bijvoorbeeld gebruikt in zelfrijdende auto’s, waar het cruciaal is dat de systemen voetgangers, verkeersborden en andere voertuigen herkennen. Deep learning vereist doorgaans grote hoeveelheden trainingsdata en rekenkracht. De vele lagen in neurale netwerken stellen de systemen in staat om steeds complexere kenmerken en patronen te abstraheren uit de ruwe data. Dit leidt tot nauwkeurige modellen voor beeldherkenning en classificatie.

Leren door interactie: reinforcement learning

Reinforcement learning (RL) is een andere vorm van machine learning, waarbij een model leert door interactie met zijn omgeving. Het model ontvangt beloningen voor juiste beslissingen en soms straffen voor fouten, met als doel: optimaal gedrag bereiken voor het uitvoeren van een specifieke taak.

Een voorbeeld van RL is een computerspel, waarbij een AI-agent leert om een spel te spelen zonder voorafgaande kennis. De agent probeert verschillende strategieën uit en leert welke acties tot succes leiden, vaak gemeten door scores of het bereiken van bepaalde doelen in het spel.

Deze technologie is gebruikt om bijvoorbeeld GPT-4 mee te verbeteren. Slechte uitkomsten werden bestraft, goede uitkomsten beloond.

Creatieve algoritmes: generatieve AI

Generatieve AI gaat nog een stap verder. Deze vorm van AI analyseert en classificeert niet alleen data, maar genereert ook nieuwe content. Denk aan kunstwerken, muziek, of zelfs tekst die niet van menselijk werk te onderscheiden is.

Een voorbeeld is GPT-4 van OpenAI, een taalmodel dat in staat is om overtuigende tekst te genereren. Dit kan variëren van het schrijven van artikelen tot het beantwoorden van vragen in natuurlijke taal. Deze systemen leren van een enorme dataset van bestaande teksten om nieuwe, coherente en relevante content te creëren en worden ook wel large language models genoemd.

The new kid on the block: retrieval-augmented generation

Deze AI-technologieën samen vormen het spectrum van moderne AI. Machine learning destilleert inzichten uit data. Deep learning gaat een stapje verder door nog complexere patronen in grote datasets te ontdekken. Reinforcement learning introduceert het aspect van leren door interactie met een omgeving. Large language models combineren al deze technieken: ze creëren nieuwe data en content, van teksten tot afbeeldingen. Een van de grootste uitdagingen: LLM’s doen nu nog niet aan bronvermelding. Je weet dus niet waar het model een uitkomst op gebaseerd heeft.

Daar komt verandering in met retrieval-augmented generation. Deze techniek is ontwikkeld om de kwaliteit van gegenereerde antwoorden te verbeteren. Relevante feiten worden opgehaald uit een externe database of kennissysteem. Zo krijgt een LLM als het ware een feitencheck, om er zeker van te zijn dat gebruik wordt gemaakt van de nieuwste en meest correcte informatie.

Retrieval-agumented generation wordt daarom gezien als de volgende belangrijke stap in de evolutie van generatieve AI, omdat het een antwoord biedt op een van de grootste uitdagingen van dit moment: je weet nooit zeker of de output van generatieve AI betrouwbaar en nauwkeurig is.

Hoe de technologie werkt, welke voordelen je ermee kunt behalen en hoe RAG in de praktijk kan worden toegepast, daarover kun je meer lezen in deel twee van deze serie:

De volgende fase in de evolutie van generative AI: Retrieval-augmented generation als feitenchecker