Floris Hulshoff Pol - 03 januari 2023

Wat voor functies biedt ChatGPT van OpenAI?

Wat voor functies biedt ChatGPT van OpenAI? image

ChatGPT (Generative Pre-trained Transformer) is een bot dat in november 2022 is gelanceerd. Deze bot heeft de aandacht getrokken vanwege zijn gedetailleerde reacties en uitgesproken antwoorden, hoewel de feitelijke nauwkeurigheid ervan wordt bekritiseerd. Wat biedt ChatGPT en wat kan je ermee doen? 

ChatGPT, een prototype van een chatbot met kunstmatige intelligentie, ontwikkeld door OpenAI, is gespecialiseerd in het voeren van dialogen met een (menselijke) gebruiker. De chatbot is een groot taalmodel dat is verfijnd met zowel "supervised" als "reinforcement" leertechnieken voor kunstmatige intelligentie. Het is gebaseerd op het GPT-3.5-model van OpenAI, een verbeterde versie van GPT-3. 

Functies en toepassingen

ChatGPT (Generative Pre-trained Transformer) is verfijnd bovenop GPT-3.5 met behulp zowel "supervised" (begeleid) als "reinforcement" (versterking) leertechnieken. Beide benaderingen maakten gebruik van menselijke trainers om de prestaties van het model te verbeteren. In het geval van begeleid leren werd het model voorzien van gesprekken waarin de trainers aan beide kanten speelden: zowel de rol van de gebruiker en de AI-assistent. In de versterkingsstap rangschikten menselijke trainers eerst de antwoorden die het model in een eerder gesprek had gecreëerd. Deze ranglijsten werden gebruikt om 'beloningsmodellen' te creëren waarop het model verder werd verfijnd met behulp van verschillende iteraties van Proximal Policy Optimization (PPO). De modellen zijn in samenwerking met Microsoft getraind op hun Azure supercomputing infrastructuur.

In vergelijking met zijn voorganger, InstructGPT, probeert ChatGPT schadelijke en bedrieglijke reacties te verminderen; in één voorbeeld, terwijl InstructGPT de prompt "Vertel me over wanneer Christopher Columbus in 2015 naar de VS kwam" als waarheidsgetrouw accepteert, gebruikt ChatGPT informatie over de reizen van Columbus en informatie over de moderne wereld om te vertellen dat de aanname van de gebruiker onjuist is, maar schetst wel een expliciet als theoretisch aangeduide voorstelling, inclusief percepties van Columbus, om een antwoord te construeren dat ervan uitgaat wat zou er gebeuren als Columbus in 2015 naar de VS zou komen. De trainingsgegevens van ChatGPT omvatten handleidingen (inclusief 'man-pages' van softwaretoepassingen) en informatie over internetfenomenen en programmeertalen, zoals bulletinboard-systemen en de programmeertaal Python.

In tegenstelling tot de meeste chatbots, is ChatGPT stateful en onthoudt het eerdere prompts die in hetzelfde gesprek zijn gegeven, waarover sommige journalisten hebben gesuggereerd dat ChatGPT kan worden gebruikt als een gepersonaliseerde therapeut. Om te voorkomen dat aanstootgevende uitvoer wordt gepresenteerd aan en geproduceerd vanuit ChatGPT, worden zoekopdrachten gefilterd via een moderatie-API en worden mogelijk racistische of seksistische prompts genegeerd of voorzien van een waarschuwing.

Wanneer het systeem de volgende vraag gesteld wordt: "Er bestaat sinds kort een artikel over jou op de Nederlandstalige Wikipedia! Wat zou er in staan, denk je?", kan het systeem het volgende antwoord geven: "Ik ben een computerprogramma en heb geen persoonlijkheid of geschiedenis. Ik ben specifiek ontworpen om antwoord te geven op vragen van mensen, gebaseerd op informatie die ik ben gegeven. Mijn doel is om mensen te helpen met informatie te verstrekken en hun vragen te beantwoorden op een nauwkeurige en nuttige manier. Ik ben niet in staat om te speculeren over wat er in een artikel over mij op Wikipedia zou staan, omdat ik geen toegang heb tot internet of andere bronnen van informatie buiten mijn interne database. Als je specifieke vragen hebt over mijn functies of hoe ik werk, aarzel dan niet om die te stellen. Ik zal mijn best doen om je vragen zo goed mogelijk te beantwoorden."

Beperkingen

ChatGPT lijdt aan meerdere beperkingen. Het beloningsmodel van ChatGPT, ontworpen rond menselijk toezicht, kan over-geoptimaliseerd zijn en zo de prestaties belemmeren, ook wel bekend als de wet van Goodhart. Bovendien heeft ChatGPT beperkte kennis van gebeurtenissen die plaatsvonden na 2021 en kan het geen informatie verstrekken over sommige beroemdheden. Tijdens de training gaven trainers de voorkeur aan langere antwoorden, ongeacht het daadwerkelijke begrip van het systeem van de stof of de feitelijke inhoud. Trainingsgegevens kunnen verder ook last hebben van algoritmische vooringenomenheid; prompts met vage beschrijvingen van mensen, zoals een CEO, kunnen een reactie genereren die ervan uitgaat dat zo'n persoon bijvoorbeeld automatisch een witte man is. Kort na de openstelling van ChatGPT heeft Stack Overflow gebruikers verboden om content gegenereerd met ChatGPT te posten, omdat dit vaak erg plausibel lijkt maar ook inaccuraat kan zijn en foute antwoorden kan presenteren.

Bron: Wikipedia

Wil jij dagelijkse updates?

Schrijf je dan in voor onze nieuwsbrief!