OpenAI test o3- en o3-mini-modellen
OpenAI is gestart met zijn nieuwe large lange model (LLM) o3. Opvallend aan dit model is dat het gebruik maakt van wat OpenAI omschrijft als een redeneringsproces voor het vergroten van zijn betrouwbaarheid in onder meer wiskundige- en programmeertaken.
Het bedrijf kondigt zowel o3 als o3-mini aan, waarbij o3-mini een kleinere en goedkopere versie is van o3. OpenAI presenteert beide modellen in een video.
Redeneren, coderen en wiskundige vraagstukken
o3 en o3-mini zijn specifiek gericht op redeneren, coderen en het oplossen van wiskundige vraagstukken. De prestaties van het model zijn sterk afhankelijk van de hoeveelheid beschikbare rekenkracht. o3 kan namelijk in verschillende modi draaien. In low compute-modus behaalt het model een score van 75,7 op de ARC AGI-benchmark, terwijl de score in high compute-modus 87,5 bedraagt. Deze benchmark is ontwikkeld door het Aligment Research Center om de intelligentie van AI-tools te vergelijken met die van mensen.
Beide modellen zijn alleen voor wetenschappelijk onderzoek beschikbaar. Naar verwachting volgt een versie voor het bredere publiek eind januari.