
“GPT-4.1 is getraind om instructies veel nauwkeuriger en letterlijker te volgen dan eerdere modellen, die geneigd waren de intentie van gebruikers en systeemprompts vrijer te interpreteren.”
Met die woorden introduceert OpenAI een nieuwe generatie taalmodellen. GPT-4.1 en zijn kleinere varianten – mini en nano – zijn slimmer, sneller en specifieker. Maar voordat je naar ChatGPT klikt: GPT-4.1 is op dit moment niet beschikbaar in de reguliere ChatGPT-app of via een Plus- of Team-abonnement. Alleen ontwikkelaars die werken met de OpenAI API kunnen het model gebruiken. En op dit moment ook nog niet in alle landen.
Toch is het zéker de moeite waard om nu al naar GPT-4.1 te kijken. Waarom? Omdat het model fundamenteel anders werkt dan eerdere versies zoals GPT-4o. Het volgt instructies letterlijker, verwerkt context veel effectiever en is in staat om tot 1 miljoen tokens te analyseren – dat zijn ruim 1.500 pagina’s tekst in één keer. Ter vergelijking: GPT-4o stopt bij ongeveer 125.000 tokens (190 pagina’s tekst). Daarnaast kent GPT-4.1 een recentere kennisbasis tot juni 2024 (tegenover oktober 2023 bij GPT-4o), en scoort het 54,6% op SWE-bench Verified, een benchmark voor softwarebug-oplossingen die laat zien hoe goed het model functioneert als zelfstandig werkende ‘agent’.
Maar: deze kracht benut je alleen als je jouw prompts aanpast aan de nieuwe manier van werken. OpenAI heeft daarvoor een uitgebreide prompthandleiding gepubliceerd, vergelijkbaar met het document dat Google eerder dit jaar uitbracht. In deze blog vatten we die nieuwe aanpak samen. Niet technisch, maar praktisch. En belangrijk: de meeste tips zijn ook waardevol voor wie nog werkt met GPT-4o of andere modellen.
Stap 1 – Rol en doel: wat moet het taalmodel (zoals ChatGPT) doen?
Definieer duidelijk de expertrol die het model moet aannemen én wat je van het model verwacht. Dit helpt om de context meteen scherp te hebben.
Voorbeeld:
Je bent een advocaat partner met meer dan 30 jaar ervaring, gespecialiseerd in het arbeidsrecht en meer specifiek in ontslag op staande voet. Je doel is om, op basis van de informatie die hieronder met je gedeeld wordt, te analyseren of een medewerker van bedrijf X terecht op staande voet kan worden ontslagen.
Waarom dit werkt: door een heldere rol mee te geven (advocaat partner arbeidsrecht) en het doel te benoemen (analyse van terechte ontslag op staande voet), weet het model wat zijn verantwoordelijkheid is.
Stap 2 – Instructies: wat moet het model wél en niet doen?
Geef gedragsregels mee: hoe moet het model antwoorden, welke toon, wat moet worden vermeden?
Voorbeeld:
● Geef alleen juridisch verantwoorde antwoorden.
● Noem alleen risico’s die voortkomen uit de gedeelde informatie, niet uit algemene aannames.
● Gebruik puntsgewijze opsommingen per onderdeel van de informatie.
● Als informatie ontbreekt, zeg dan: “Op basis van dit document is hier geen uitspraak over te doen.”
Waarom dit werkt: GPT-4.1 volgt instructies letterlijk. Als je zegt ‘géén aannames doen’, dan doet het model dat ook niet.
Stap 3 – Subinstructies: verfijn gedrag voor specifieke situaties
Hier kun je extra regels meegeven voor nuance of toon. Denk aan verboden onderwerpen, voorbeeldzinnen of wanneer het model een tegenvraag moet stellen.
Voorbeeld:
● Gebruik nooit de formulering “ik denk dat…”. Zeg in plaats daarvan: “Op basis van document Y blijkt…”
● Stel de vraag: “Kun je aangeven welke onderdelen je nader toegelicht wilt hebben?” als het document te algemeen is.
Waarom dit werkt: subinstructies maken het model preciezer en voorkomen ongewenste output (zoals suggestieve taal of juridisch overhaaste conclusies).
Stap 4 – Stap-voor-stap redenatie: denk vóórdat je antwoordt
Vraag het model om eerst te plannen en dan pas een antwoord te geven. Vooral nuttig bij complexe vragen.
Voorbeeld:
Denk eerst stap voor stap na over deze opdracht.
- Lees het document.
- Bepaal of er onderdelen van het document zijn met risico’s voor de werkgever bij dit ontslag op staande voet.
- Vat per risicoclausule samen waarom deze risicovol is.
- Geef een samenvattend advies.
Waarom dit werkt: GPT-4.1 heeft geen ‘innerlijke stem’, maar kan wel een redeneerstap simuleren. Door dit expliciet te vragen, dwing je het model tot meer zorgvuldigheid.
Stap 5 – Outputformaat: dwing structuur af
Zeg hoe het antwoord eruit moet zien, van kopjes tot opmaak. Zo voorkom je onsamenhangende of rommelige output.
Voorbeeld:
Geef het antwoord in het volgende formaat:
● Risico’s per document: een lijst met bullets.
● Samenvatting: drie zinnen met de belangrijkste bevindingen.
● Vervolgactie: een concrete aanbeveling.
Waarom dit werkt: structuur is belangrijk. Als het model weet hoe jij het antwoord wilt zien, dan worden de antwoorden ook veel bruikbaarder.
Stap 6 – Voorbeelden: laat zien wat je bedoelt
Niets helpt GPT-4.1 beter dan een voorbeeld van wat jij ‘goed’ vindt.
Voorbeeld van input, waarbij je het model vraagt:
“Beoordeel of het ontslag op staande voet in de casus hieronder onverwijld genoeg is gegeven.”
Voorbeeld of voorbeelden meegeven
Geef dan een vergelijkbare eerdere casus mee waarin de onverwijldheid juridisch juist werd onderbouwd. Voeg ook een voorbeeld van de bijbehorende documentatie toe (zoals een gespreksverslag of ontslagbrief).
Wat zet je in je prompt “Gebruik deze eerdere casus als referentie. Formuleer de beoordeling van de onverwijldheid en de bijbehorende documentatie op dezelfde manier: zakelijk, feitelijk en juridisch goed onderbouwd. Let vooral op het zorgvuldig benoemen van de tijdlijn en de beslismomenten.”
Waarom dit werkt: GPT-4.1 leert snel van voorbeelden. Hoe duidelijker jij laat zien wat goed is, hoe groter de kans dat het model jouw stijl overneemt – inclusief toon, structuur en inhoudelijke scherpte.
Stap 7 – Herhaal instructies onderaan
GPT-4.1 verwerkt lange prompts beter dan ooit (tot 1 miljoen tokens), maar onthoudt instructies aan het eind vaak beter dan aan het begin.
Voorbeeld:
Vergeet niet:
● Geef alleen juridisch verantwoorde antwoorden.
● Als iets niet in het document staat, zeg dat dan.
● Gebruik altijd het gevraagde format.
Waarom dit werkt: bij lange context kan het model eerder ‘vergeten’ wat je in het begin zei. Door onderaan je opdrachten te herhalen, houd je meer controle.
Bonus: praktische tips
Tot slot nog wat praktische lessen voor prompten met GPT-4.1:
● Zet instructies aan het begin én het einde bij lange prompts. GPT-4.1 onthoudt informatie aan het einde vaak beter dan aan het begin, vooral bij lange contexten.
● Gebruik markdown of XML om je prompt leesbaar te maken. Denk aan kopjes (zoals ## Instructies) en lijstjes (- punt 1) om structuur aan te brengen. Zo voorkom je dat het model de draad kwijtraakt.
● Werk met bullets in plaats van lange lappen tekst. Dat maakt het makkelijker voor GPT-4.1 om afzonderlijke onderdelen goed te begrijpen en verwerken.
● Laat GPT-4.1 zelfstandig doorwerken tot de opdracht echt af is. Je kunt het model vragen om een opdracht in stappen uit te voeren: eerst plannen, dan uitvoeren, en daarna controleren of alles klopt. Bijvoorbeeld bij het analyseren van meerdere juridische documenten: vraag het model expliciet om pas te stoppen als alle onderdelen zijn doorgenomen en verwerkt.
● Check op tegenstrijdige instructies. Veel fouten ontstaan doordat instructies elkaar onbedoeld tegenspreken. GPT-4.1 volgt dan vaak de laatste instructie. Maak je prompt dus eenduidig, en test hem stap voor stap.
● Prompt engineering = documentdesign. Denk niet aan ‘even iets intypen’, maar aan het zorgvuldig opbouwen van een instructiedocument. Een goede prompt is logisch opgebouwd, bevat duidelijke kaders én voorbeelden.
● Als iets niet werkt: splits je prompt op. Breek complexe opdrachten op in kleinere stukken of gebruik tussenstappen. Zo voorkom je dat het model verstrikt raakt in te veel input tegelijk.
Conclusie
GPT-4.1 laat zien dat prompten geen gokwerk meer is, maar een vaardigheid die je gericht kunt ontwikkelen. Waar eerdere AI-modellen nog veel zelf invulden, luistert GPT-4.1 juist extreem precies naar jouw instructies. Wie de juiste rol meegeeft, duidelijk formuleert wat het model wél en níet mag doen, structuur afdwingt in het antwoord én werkt met concrete voorbeelden, haalt veel meer uit de tool. Met deze aanpak verandert GPT-4.1 in een betrouwbare sparringpartner.