GPT-4.5: hype of gamechanger?

“GPT-4.5 bevindt zich aan de grens van wat mogelijk is met unsupervised learning, een methode waarbij AI zelfstandig patronen en structuren herkent zonder vooraf gedefinieerde labels. We blijven verrast door de creativiteit van de gemeenschap in het ontdekken van nieuwe mogelijkheden en onverwachte toepassingen.”

Dat schreef OpenAI bij de lancering van GPT-4.5, een nieuw AI-model dat belooft slimmer, intuïtiever en nauwkeuriger te zijn dan zijn voorgangers. Het model is voor nu exclusief beschikbaar voor gebruikers van ChatGPT Pro (USD 200 per maand, ook de prijs in Nederland en andere Europese landen) en API-klanten. OpenAI positioneert GPT-4.5 als de meest geavanceerde versie van zijn generatieve AI met verbeteringen in tekstbegrip, creativiteit en gespreksvaardigheid. Uit verschillende benchmark testen en praktijkervaringen blijkt echter dat het model op cruciale gebieden niet de verwachte vooruitgang boekt. Wat is er nieuw aan GPT-4.5? Welke kanttekeningen kunnen er bij dit nieuwe model worden geplaatst? En rechtvaardigen de prestaties de hoge kosten?

Wat is nieuw in GPT-4.5?

GPT-4.5 is getraind met meer data en rekencapaciteit dan zijn voorgangers. Dit resulteert in:

  • Beter begrip van intentie gebruikers – subtiele signalen en complexe prompts worden accurater geïnterpreteerd. Waar eerdere modellen moeite hadden met dubbelzinnige of impliciete vragen, laat GPT-4.5 zien dat het beter in staat is om context te begrijpen en gebruikersintentie correct af te leiden.
  • Natuurlijkere communicatie – reacties voelen minder ‘robotachtig’ en meer gespreksgericht aan. De reacties van GPT-4.5 zijn vloeiender, empathischer en beter afgestemd op de toon van de gebruiker. Hiervoor leent het model zich beter voor interacties waarbij nuance en emotionele intelligentie een rol spelen.
  • Minder ‘hallucinaties’– OpenAI claimt dat GPT-4.5 minder snel onnauwkeurige of misleidende antwoorden zal produceren. Hoewel AI-modellen soms de neiging hebben om verzonnen feiten te presenteren als waarheid, zou GPT-4.5 in theorie beter moeten presteren op dit gebied. De eerste tests laten echter zien dat hallucinaties nog steeds voorkomen.
  • Hogere accuraatheid in vraag-antwoord-benchmarks – het model presteert beter op Simple QA-tests dan zijn voorgangers. Dit suggereert dat het model betrouwbaarder is in het correct beantwoorden van feitelijke vragen. Dit is vooral gunstig voor toepassingen zoals zoekmachines en kennisbanken.
  • Brede compatibiliteit – GPT-4.5 werkt met bestaande functionaliteiten zoals file uploads en canvas, waardoor gebruikers eenvoudiger bestanden kunnen uploaden en bewerken binnen dezelfde interface. Dit biedt meer flexibiliteit voor professionals die AI willen inzetten in hun workflow.
  • Hogere creativiteit – het model excelleert in creatieve taken zoals contentgeneratie, brainstormsessies en schrijfondersteuning. Dit maakt GPT-4.5 bijzonder geschikt voor copywriters, marketeers en contentmakers die behoefte hebben aan een AI die meedenkt en originele ideeën kan aandragen.

Vooruitgang met kanttekeningen

Hoewel GPT-4.5 verbeteringen laat zien op enkele gebieden, roept de release ook vragen op. Dit ook omdat OpenAI de beschrijving van GPT-4.5 als ‘geen frontier model’ stilzwijgend heeft verwijderd uit de oorspronkelijke documentatie van GPT-4.5. Ook is de trainingsdataset niet nieuwer dan eerdere modellen, met een dataset die is bijgewerkt tot oktober 2023.

Andere kanttekeningen:

  • Niet altijd beter dan eerdere modellen – in benchmarks voor wiskunde en logische redenering blijft GPT-4.5 achter bij gespecialiseerde modellen zoals DeepSeek R1 en Claude 3.7 Sonnet. Dit betekent dat het model nog steeds moeite heeft met complexe analytische taken en redenatie op hoog niveau.
  • Hoge kosten – het model is aanzienlijk duurder in gebruik (zie volgende paragraaf) en roept daarmee de vraag op of de prestaties de meerprijs rechtvaardigen.
  • Twijfels over schaalbaarheid – AI-experts speculeren dat de voordelen van het opschalen van generatieve AI afnemen.  Waar eerdere GPT-modellen enorme sprongen in prestaties lieten zien door simpelweg meer data en rekenkracht toe te voegen lijkt dit effect bij GPT-4.5 af te vlakken.
  • Gemengde resultaten bij complexe analyses – voor juridische, wetenschappelijke of financiële toepassingen biedt GPT-4.5 geen significante verbetering ten opzichte van eerdere modellen. Dit betekent dat professionals in deze sectoren mogelijk weinig baat hebben bij een upgrade naar GPT-4.5.
  • Betere interactie, maar geen grote doorbraak – het model scoort goed op menselijke interactie en creativiteit, maar laat weinig vooruitgang zien op het gebied van diepgaand redeneren. In het gebruik voor complexe taken, diepgaande analyse en begrip van abstracte concepten wordt dus relatief weinig vooruitgang geboekt met GPT-4.5.

De kosten

Een van de grootste kritiekpunten is de prijs van GPT-4.5.

OpenAI hanteert een aanzienlijk hoger tarief dan bij eerdere modellen:

  • $75 per miljoen input tokens en $150 per miljoen output tokens – ter vergelijking: GPT-4o kost slechts $2.50 per miljoen input tokens en $10 per miljoen output tokens. Dit maakt GPT-4.5 maar liefst 30 keer duurder.
  • Hoge kosten voor API-gebruikers – organisaties die AI-toepassingen willen ontwikkelen met GPT-4.5 moeten forse bedragen neertellen. Dit kan het model ontoegankelijk maken voor startups en kleinere organisaties..
  • Twijfels over lange termijn beschikbaarheid – OpenAI heeft zelf aangegeven dat het twijfelt of het GPT-4.5 op de lange termijn in de API zal blijven aanbieden, vanwege de extreem hoge kosten om het model te draaien. Dit suggereert dat OpenAI zelf ook erkent dat GPT-4.5 financieel minder aantrekkelijk is dan eerdere versies.
  • Alleen beschikbaar voor Pro-gebruikers – momenteel is GPT-4.5 alleen beschikbaar voor ChatGPT Pro-gebruikers die $200 per maand betalen. Voor deze groep is het de vraag of GPT-4.5 voldoende voordelen biedt ten opzichte van goedkopere modellen zoals GPT-4o. OpenAI heeft aangegeven dat GPT-4.5 op termijn ook beschikbaar wordt gesteld voor gebruikers van het ChatGPT Plus plan.

Conclusie

GPT-4.5 brengt duidelijke verbeteringen in interactie, creativiteit en foutreductie, maar is geen fundamentele doorbraak. Het model is duur, presteert niet altijd beter dan alternatieven en roept vragen op over de schaalbaarheid van traditionele AI-trainingstechnieken.