Tag Archief van: openai

OpenAI publiceerde deze week een prompting guide voor GPT-5.5. De centrale boodschap: korte, resultaatgerichte instructies werken beter dan lange stappenplannen. Veel van wat je gewend bent uit eerdere modellen werkt bij GPT-5.5 juist tegen je.

Focus op het resultaat, niet op de stappen

Bij eerdere modellen hielp het om alles stap voor stap uit te schrijven. Dat hield het model op koers. Bij GPT-5.5 werkt dat anders. Te veel sturing levert stijve en beperkte antwoorden op, omdat het de zoekruimte van het model onnodig verkleint.

Het werkt wel om het eindresultaat, de context en de randvoorwaarden te beschrijven. Het model kiest zelf de beste aanpak. Dus korter, maar wel scherper waar het nodig is. In plaats van een uitgebreid stappenplan geef je één duidelijke opdracht, zoals: “Schrijf een blogpost van 300 woorden voor mkb-ondernemers die AI overwegen. Praktisch en nuchter. Gebruik het meegestuurde rapport als bron.”

Gebruik regels alleen als ze echt nodig zijn

Woorden als ‘altijd’ en ‘nooit’ kun je beter vermijden, tenzij het echt een harde grens is. Voor veiligheidsinstructies of verplichte outputvelden zijn ze zinvol. Voor alles waarbij het model een afweging moet maken, werkt een simpele richtlijn beter. Stel ook alleen een vraag als het antwoord echt iets verandert aan de uitkomst.

OpenAI raadt aan om stopopdrachten toe te voegen: wanneer is het antwoord goed genoeg om te stoppen? Dat voorkomt dat het model blijft zoeken of redeneren terwijl de vraag al beantwoord is.

Geef aan wat feitelijk moet kloppen en wat vrij mag

Gebruik je GPT-5.5 voor presentaties, e-mails of samenvattingen, geef dan expliciet aan wat feitelijk correct moet zijn en wat creatief ingevuld mag worden. Doe je dat niet, dan vult het model zelf gaten op met cijfers, namen of voorbeelden die logisch klinken maar niet kloppen.

De guide raadt aan om bij creatieve opdrachten te schrijven: gebruik aangeleverde feiten voor concrete claims en cijfers. Verzin geen specifieke namen, metrics of klantresultaten om het verhaal sterker te laten klinken. Als er weinig bronmateriaal is, schrijf dan een bruikbaar concept met placeholders.

Toon en stijl stuur je apart aan

GPT-5.5 heeft een efficiënte, directe standaardstijl. Voor klantenservice, coaching of andere gesprekservaringen is dat niet altijd wat je wilt. De guide maakt onderscheid tussen persoonlijkheid, hoe het model klinkt, en samenwerkingsstijl, hoe het model werkt. Beide stuur je apart aan, maar houd beide instructies kort. Persoonlijkheid vormt de gebruikerservaring, niet de taakinstructies.

Wat dit betekent voor jouw gebruik

Als je GPT-5.5 gebruikt met prompts die je ontwikkelde voor GPT-4 of GPT-5.4, is het de moeite waard die opnieuw te bekijken. Lange, procesgerichte instructies kunnen nu juist ruis toevoegen. Een kortere prompt die het gewenste resultaat omschrijft levert vaak betere output op. De volledige prompting guide van OpenAI geeft concrete voorbeeldstructuren voor complexere toepassingen.

Maak iedere week een sprong vooruit in je marketing AI transformatie

Elke vrijdag brengen wij je de meest actuele inzichten, nieuws en praktijkvoorbeelden over de impact van AI in de marketingwereld. Of je nu je marketing efficiency wilt verbeteren, klantbetrokkenheid wilt verhogen, je marketingstrategie wilt aanscherpen of je bedrijf digitaal wilt transformeren. ‘Marketing AI Friday’ is jouw wekelijkse gids.

Meld je gratis aan voor Marketing AI Friday.

Marketing AI Friday

OpenAI heeft Codex flink uitgebreid. Wat begon als ontwikkeltool kan nu zelfstandig je Mac bedienen, koppelt met meer dan 90 werktools, onthoudt wat jij belangrijk vindt en plant werk in voor de komende dagen of weken. Codex wordt volgens OpenAI wekelijks door meer dan drie miljoen ontwikkelaars gebruikt.

Codex bedient zelf je computer

De grootste verbetering is dat Codex op de achtergrond zelfstandig programma’s op je Mac kan gebruiken. Het ziet wat er op je scherm staat, klikt en typt met een eigen cursor. Meerdere Codex-agents kunnen tegelijk aan de slag zonder je eigen werk in andere programma’s te verstoren.

Voor ontwikkelaars betekent dit dat je sneller kunt testen en sneller werkt in programma’s zonder API. Het laat ook zien waar OpenAI naartoe wil: een AI-assistent die niet alleen code schrijft, maar taken uitvoert in elk programma dat je op je computer gebruikt. Daarnaast zit er nu een ingebouwde browser in de app, waarmee je rechtstreeks opmerkingen op pagina’s kunt plaatsen om Codex precieze instructies te geven. Dit is voorlopig vooral handig bij front-end ontwikkeling, maar OpenAI wil dit uitbreiden zodat Codex straks de browser volledig kan bedienen.

Koppelingen met meer dan 90 werktools

OpenAI voegt ruim 90 nieuwe plugins toe waarmee Codex informatie kan ophalen en taken kan uitvoeren in andere programma’s. Denk aan Atlassian Rovo voor JIRA, GitLab, Microsoft 365 en CircleCI. Dat maakt Codex een schakelpunt tussen de programma’s die je dagelijks gebruikt. Dezelfde beweging zie je bij Claude, waar het aantal integraties met Asana, Slack, Google Drive en HubSpot snel groeit.

Codex onthoudt en plant vooruit

Codex krijgt nu geheugen. Het onthoudt je voorkeuren, eerdere correcties en context die veel tijd kostte om te verzamelen. Nieuwe taken gaan daardoor sneller, zonder dat je elke keer uitgebreide instructies hoeft mee te geven.

Daarnaast kan Codex nu zelf werk inplannen. Het zet een taak weg en pakt die automatisch weer op, ook als dat dagen of weken duurt. Teams gebruiken dit bijvoorbeeld om openstaande codewijzigingen op te volgen of gesprekken in Slack, Gmail en Notion te blijven monitoren. Codex stelt ook zelf voor waar je mee door kunt gaan, op basis van openstaande opmerkingen, relevante context uit je tools en een geprioriteerde lijst voor je werkdag.

Waar gaat dit naartoe?

AI werkt niet langer alleen in een chatvenster. Het bedient programma’s, onthoudt wat je doet en neemt terugkerend werk over. Codex is nog gericht op ontwikkelaars, maar de onderliggende technologie laat zien wat er binnenkort ook in marketingsoftware zal opduiken. AI die zelf programma’s bedient en terugkerend werk oppakt, zit binnen een jaar standaard in veel werktools.

De updates zijn nu beschikbaar voor Codex-desktopgebruikers die zijn ingelogd met ChatGPT. Computergebruik werkt voorlopig alleen op macOS en rolt later uit in de EU.

Maak iedere week een sprong vooruit in je marketing AI transformatie

Elke vrijdag brengen wij je de meest actuele inzichten, nieuws en praktijkvoorbeelden over de impact van AI in de marketingwereld. Of je nu je marketing efficiency wilt verbeteren, klantbetrokkenheid wilt verhogen, je marketingstrategie wilt aanscherpen of je bedrijf digitaal wilt transformeren. ‘Marketing AI Friday’ is jouw wekelijkse gids.

Meld je gratis aan voor Marketing AI Friday.

Marketing AI Friday

Anthropic heeft een nieuw topmodel ontwikkeld dat zo krachtig is dat het bedrijf het niet openbaar uitbrengt. Claude Mythos Preview is volgens Amerikaanse overheidsinstanties het eerste AI-model dat in staat wordt geacht een Fortune 100-bedrijf plat te leggen, grote delen van het internet te verstoren of in te breken in nationale defensiesystemen. In plaats van een publieke lancering start Anthropic een gesloten coalitie van techgiganten om het model uitsluitend voor defensieve cyberveiligheid in te zetten.

Een model dat decennia oude kwetsbaarheden vindt

Wat Mythos Preview beter maakt dan eerdere modellen is zijn vermogen om softwarekwetsbaarheden te vinden en te misbruiken op een niveau dat vrijwel geen enkel mens kan evenaren. In de afgelopen weken vond het model duizenden zogenaamde zero-day kwetsbaarheden, beveiligingslekken die nog onbekend zijn bij de ontwikkelaars van de software, in alle grote besturingssystemen en browsers.

Een paar voorbeelden die de schaal duidelijk maken: het model vond een 27 jaar oude bug in OpenBSD, een besturingssysteem dat speciaal is ontworpen om moeilijk te hacken en wordt gebruikt voor firewalls en kritieke infrastructuur. Het ontdekte ook een 16 jaar oud lek in FFmpeg, videosoftware die in talloze applicaties zit verwerkt, in een stukje code dat geautomatiseerde tests al vijf miljoen keer hadden gepasseerd zonder het probleem op te merken. En het model vond zelfstandig meerdere kwetsbaarheden in de Linux-kernel die het aan elkaar koppelde om volledige controle over een systeem te krijgen. Alle gevonden lekken zijn inmiddels gemeld aan de betrokken ontwikkelaars en gedicht.

Project Glasswing: een coalitie voor verdediging

Omdat Anthropic het model te gevaarlijk acht voor publieke toegang, maar de defensieve waarde te groot vindt om het op de plank te leggen, is Project Glasswing opgericht. Deze coalitie bestaat uit meer dan veertig organisaties, waaronder Apple, Amazon Web Services, Microsoft, Google, Cisco, CrowdStrike, JPMorganChase, NVIDIA en de Linux Foundation. Anthropic steekt tot 100 miljoen dollar aan gebruikstegoed in het project, plus 4 miljoen dollar aan directe donaties aan open-source beveiligingsorganisaties.

De deelnemende partijen gebruiken Mythos Preview om kwetsbaarheden in hun eigen systemen op te sporen en te dichten, voordat kwaadwillenden er misbruik van kunnen maken. De gedachte daarachter is duidelijk: als AI het vinden van beveiligingslekken dramatisch goedkoper en toegankelijker maakt voor aanvallers, moeten verdedigers dezelfde technologie hebben om bij te blijven.

De race tussen aanval en verdediging

Dat de tijdsdruk reëel is, laten de reacties van de partners zien. CrowdStrike stelt dat het tijdvenster tussen het ontdekken van een kwetsbaarheid en het misbruiken ervan is ingekort van maanden naar minuten. Palo Alto Networks waarschuwt dat aanvallers dezelfde modellen zullen proberen in te zetten zodra ze beschikbaar komen, en dat de wereld zich moet voorbereiden op meer, snellere en geavanceerdere aanvallen.

De Linux Foundation wijst op een bijzonder kwetsbare groep: de beheerders van open-source software. Die software vormt de basis van vrijwel alle moderne systemen, inclusief de systemen die AI-agents gebruiken om nieuwe code te schrijven. Maar open-source beheerders werken vaak zonder grote beveiligingsteams of budget. Project Glasswing geeft ook hen toegang tot Mythos Preview om hun code te scannen.

Veiligheid of capaciteitsgebrek?

Of de terughoudendheid puur een veiligheidskeuze is, staat niet vast. Mythos Preview presteert zwaarder dan alle huidige modellen en Anthropic kampt al met capaciteitsproblemen door zijn sterk gegroeide gebruikersbestand. Actieve gebruikers op Max-abonnementen lopen regelmatig tegen limieten aan tijdens drukke uren. De beperkte release kan daarmee deels ook een praktische keuze zijn, ook al presenteert Anthropic het primair als een verantwoorde aanpak.

Ook OpenAI werkt aan een model met vergelijkbare cyberveiligheidscapaciteiten dat het alleen aan een selecte groep bedrijven wil uitbrengen. AI-labs worden dus voorzichtiger naarmate hun modellen krachtiger worden, en kiezen er bewust voor om de toegang te beperken.

Wat betekent dit voor de digitale wereld?

De lancering van Project Glasswing laat zien dat AI een niveau heeft bereikt waarop het de balans in cyberveiligheid kan verschuiven, in beide richtingen. De vraag is niet langer of AI een rol gaat spelen in cyberaanvallen en verdediging, maar wie er als eerste mee aan de slag gaat en met welk doel. De tools om kwetsbaarheden te vinden worden krachtiger, maar dat geldt voor aanvallers en verdedigers tegelijk.

Maak iedere week een sprong vooruit in je marketing AI transformatie

Elke vrijdag brengen wij je de meest actuele inzichten, nieuws en praktijkvoorbeelden over de impact van AI in de marketingwereld. Of je nu je marketing efficiency wilt verbeteren, klantbetrokkenheid wilt verhogen, je marketingstrategie wilt aanscherpen of je bedrijf digitaal wilt transformeren. ‘Marketing AI Friday’ is jouw wekelijkse gids.

Meld je gratis aan voor Marketing AI Friday.

Marketing AI Friday

OpenAI sloot recentelijk de grootste investeringsronde ooit af: $122 miljard, tegen een waardering van $852 miljard. Tegelijkertijd kocht het bedrijf techpodcast TBPN. OpenAI groeit daarmee niet alleen als AI-bedrijf, maar ook als mediabedrijf.

De grootste investeringsronde ooit

Amazon investeerde $50 miljard, Nvidia en SoftBank elk $30 miljard. Microsoft deed ook mee, maar het exacte bedrag is niet bekendgemaakt. Daarnaast haalde OpenAI voor het eerst ruim $3 miljard op bij particuliere beleggers.

OpenAI zegt nu $2 miljard omzet per maand te draaien, heeft meer dan 900 miljoen wekelijkse gebruikers en meer dan 50 miljoen betalende abonnees. Zakelijke klanten zijn goed voor ruim 40 procent van de omzet, en dat aandeel groeit snel. Een advertentiepilot leverde in zes weken al meer dan $100 miljoen op jaarbasis op, een nieuw verdienmodel waar het bedrijf tot nu toe bewust van wegbleef.

Waar gaat het geld naartoe?

Het kapitaal gaat naar rekenkracht, datacenters en talent, onder andere om nieuwe modellen als “Spud” te kunnen draaien en de geplande AI-superapp te bouwen. De investeringsronde is ook een voorbereiding op een verwachte beursgang later dit jaar of begin 2027.

OpenAI koopt techpodcast TBPN

Naast de investeringsronde kocht OpenAI TBPN, een dagelijkse techpodcast die populair is in Silicon Valley. De show wordt gepresenteerd door ondernemers Jordi Hays en John Coogan en trekt regelmatig topbestuurders als Mark Zuckerberg en Satya Nadella als gast. TBPN startte in 2025, heeft 58.000 YouTube-abonnees en draaide vorig jaar zo’n $5 miljoen advertentieomzet. Dit jaar zou dat richting de $30 miljoen gaan. Volgens de Financial Times lag de overnameprijs in de “lage honderden miljoenen dollars”.

Onafhankelijk?

OpenAI zegt dat TBPN onafhankelijk blijft en zelf gasten en onderwerpen kiest. Maar TBPN is geen journalistiek programma. Het is een praatshow waar techbestuurders met elkaar praten. Kritische interviewjournalistiek zit er niet bij, waardoor die belofte van onafhankelijkheid in de praktijk weinig betekent. Bovendien valt de show onder Chris Lehane, verantwoordelijk voor de politieke strategie van OpenAI.

Een voor de hand liggende reden voor de overname is dat OpenAI zich voorbereidt op een beursgang en het verhaal rond AI zelf wil vormgeven. In een interne memo werd aangegeven dat “het standaard communicatiehandboek niet werkt” voor een bedrijf als OpenAI. Dus koopt het maar een videoshow om het AI-verhaal te vertellen. Opvallend, terwijl het bedrijf net zelf gestopt is met Sora en intern de boodschap was dat OpenAI zich minder op bijzaken en meer op zakelijke klanten wilde richten.

Wat een sterk contentconcept waard is

Deze overname laat zien wat consistent en gericht content maken kan opleveren. TBPN bestaat pas anderhalf jaar, maar heeft een vaste niche, een herkenbaar format en een trouw publiek van precies de juiste mensen. Dat bleek genoeg om honderden miljoenen waard te worden.

Een goede reminder dat een ‘trusted voice’ worden voor een specifiek publiek, zeker in het AI-tijdperk, enorm waardevol is. Niet alleen voor techmiljardairs, maar ook voor merken en marketeers die consistent zichtbaar zijn voor de mensen die er voor hen toe doen.

Maak iedere week een sprong vooruit in je marketing AI transformatie

Elke vrijdag brengen wij je de meest actuele inzichten, nieuws en praktijkvoorbeelden over de impact van AI in de marketingwereld. Of je nu je marketing efficiency wilt verbeteren, klantbetrokkenheid wilt verhogen, je marketingstrategie wilt aanscherpen of je bedrijf digitaal wilt transformeren. ‘Marketing AI Friday’ is jouw wekelijkse gids.

Meld je gratis aan voor Marketing AI Friday.

Marketing AI Friday

Terwijl de meeste gebruikers nog de laatste updates van Claude en ChatGPT ontdekken, bereiden Anthropic en OpenAI zich alweer voor op de uitrol van hun volgende topmodellen. Beide bedrijven spreken van een grote sprong vooruit.

Claude Mythos per ongeluk onthuld

Een beveiligingsonderzoeker ontdekte bijna 3.000 interne documenten van Anthropic in een onbeveiligde database, inclusief een blogpost over een nieuw model: Claude Mythos. Dit model wordt intern ook wel “Capybara” genoemd. Het gaat niet om een update van een bestaand model. Mythos is een nieuwe categorie boven Opus, tot nu toe het krachtigste Claude-model. Anthropic bevestigde dat het model echt is en noemde het “een grote sprong” en “het krachtigste model dat we tot nu toe hebben gebouwd”. Een kleine groep klanten mag het model alvast testen.

In de gelekte documenten waarschuwt Anthropic dat Mythos ver voorloopt op andere modellen op het gebied van cyberveiligheid. Beurzen reageerden meteen: aandelen van grote cyberveiligheidsbedrijven als CrowdStrike en Palo Alto Networks daalden 6 tot 9 procent in één dag.

Broncode van Claude Code ook uitgelekt

Een paar dagen later lekte ook de volledige broncode van Claude Code, de populaire programmeertool van Anthropic. Een fout bij een software-update maakte 512.000 regels code openbaar. In die code vonden onderzoekers verwijzingen naar Capybara en een omstreden “undercover mode” die sporen van Anthropic verbergt wanneer medewerkers aan externe projecten werken. Een pijnlijke week voor een bedrijf dat zich profileert op AI-veiligheid.

OpenAI Spud: twee jaar onderzoek in één model

Ook OpenAI bereidt een groot model voor. De training van een nieuw model met de codenaam “Spud” is afgerond. CEO Sam Altman vertelde medewerkers dat het een “heel sterk model” wordt dat “de economie kan versnellen”. Medeoprichter Greg Brockman noemde het op de Big Technology-podcast “een enorme inspanning van veel mensen in het bedrijf” en benadrukte dat het geen update is van een bestaand model, maar een volledig nieuw basismodel waar ongeveer twee jaar onderzoek in zit. Dit is volgens hem de eerste keer sinds GPT-4o in mei 2024.

Spud wordt de verwachte basis voor de geplande alles-in-één desktop-app waarin ChatGPT, programmeertool Codex en browser Atlas samenkomen. Om rekenkracht vrij te maken heeft OpenAI videoapp Sora stopgezet. Met Spud denkt OpenAI een flinke stap dichterbij AGI te zetten. De productafdeling is zelfs hernoemd naar “AGI Deployment”.

AI versnelt, maar baanverlies ook

Altmans uitspraak dat Spud “de economie kan versnellen” is niet zonder betekenis. In de praktijk vertaalt dat zich naar AI die het werk van kenniswerkers steeds verder overneemt. Oracle ontsloeg afgelopen week bijna 20 procent van zijn medewerkers via een mail om 06:00 uur ‘s ochtends, terwijl het tegelijkertijd miljarden investeert in AI-datacenters en mensen met andere vaardigheden aantrekt.

Dat patroon zien we bij steeds meer bedrijven. Traditionele functies verdwijnen, terwijl er nieuwe rollen ontstaan rond het bouwen en beheren van AI-systemen.

Betere modellen, maar ook duurder en schaarser

Beide modellen worden naar verwachting in de komende weken tot maanden beschikbaar. De afstand tussen wat labs intern testen en wat publiek beschikbaar is, bedraagt volgens experts zes tot twaalf maanden. Anthropic schrijft in de gelekte documenten dat Mythos “erg duur” zal zijn, zowel voor henzelf als voor klanten. Actieve Claude-gebruikers lopen op de huidige Max-abonnementen nu al tegen limieten aan tijdens drukke uren.

Die spanning tussen betere modellen, betaalbaarheid en beperkte capaciteit wordt de komende maanden alleen maar groter.

Betrouwbaarheid blijft een hardnekkig probleem

Ondertussen blijft de betrouwbaarheid van AI-modellen een structureel vraagstuk. Reuters publiceerde een analyse die stelt dat AI-modellen mogelijk nooit volledig foutloos zullen zijn. Omdat ze werken door steeds het meest waarschijnlijke volgende woord te kiezen, zijn fouten geen bug maar een eigenschap van de technologie zelf.

Voor creatieve taken zoals marketingteksten of brainstorms is “ongeveer goed” vaak prima. Maar voor werk waar kleine fouten grote gevolgen hebben, bijvoorbeeld juridisch advies, medische diagnoses of kritieke analyses, is zelfs een foutpercentage van 1 tot 2 procent onacceptabel. Een groot deel van de huidige AI-investeringen gaat juist uit van adoptie in dat soort risicovolle domeinen. De honderden miljarden die nu worden ingezet, zijn daarmee een enorme gok.

Blijf realistisch, blijf experimenteren

Voor wie dagelijks met AI werkt is het belangrijk om realistisch te blijven over wat de technologie wel en niet goed kan. Controleer de output, zeker bij werk waar fouten gevolgen hebben. En houd er rekening mee dat de tools die je vandaag gebruikt snel veranderen. Wat je nu hebt ingeregeld, is over een paar maanden misschien niet meer de beste aanpak. Blijf flexibel en blijf experimenteren.

Maak iedere week een sprong vooruit in je marketing AI transformatie

Elke vrijdag brengen wij je de meest actuele inzichten, nieuws en praktijkvoorbeelden over de impact van AI in de marketingwereld. Of je nu je marketing efficiency wilt verbeteren, klantbetrokkenheid wilt verhogen, je marketingstrategie wilt aanscherpen of je bedrijf digitaal wilt transformeren. ‘Marketing AI Friday’ is jouw wekelijkse gids.

Meld je gratis aan voor Marketing AI Friday.

Marketing AI Friday

De grote AI-labs verschuiven hun focus van consumentenproducten naar AI-systemen die zelfstandig taken uitvoeren voor bedrijven. OpenAI, Anthropic en Google zetten volop in op de zakelijke markt, terwijl de concurrentiestrijd tussen de labs steeds scherper wordt.

Anthropic wint terrein bij zakelijke klanten

Uit data van Ramp, een Amerikaans platform voor zakelijke financiën met inzicht in de software-uitgaven van meer dan 50.000 bedrijven, blijkt dat de verhoudingen in de zakelijke AI-markt snel verschuiven. Bedrijven die voor het eerst AI-tools aanschaffen kiezen inmiddels drie keer zo vaak voor Anthropic als voor OpenAI. Een jaar geleden was dat nog andersom. In directe vergelijkingen wint Anthropic nu bij 70 procent van de zakelijke klanten.

Bijna één op de vier bedrijven op Ramp betaalt inmiddels voor Anthropic. Een jaar geleden was dat nog één op de vijfentwintig. De groei wordt mede aangedreven door Claude Code, dat snel populair is geworden bij ontwikkelaars en bedrijven.

OpenAI reageert met een strategiewijziging

Onder druk van de groeiende concurrentie voert OpenAI een flinke koerswijziging door. Het bedrijf bouwt een desktop-app die ChatGPT, programmeertool Codex en webbrowser Atlas samenvoegt in één geheel. Losse producten worden afgebouwd of samengevoegd om de focus te bewaren.

Tegelijk investeert OpenAI in een volledig geautomatiseerde AI-onderzoeker. In september wil het bedrijf een autonoom systeem hebben dat zelfstandig specifieke onderzoeksproblemen oplost. In 2028 moet dat uitgroeien tot een compleet AI-onderzoeksteam in een datacenter.

Wat agents nu al kunnen

Oud-OpenAI-oprichter Andrej Karpathy liet met zijn project AutoResearch zien waar AI-agents al toe in staat zijn. De agent ontwierp volledig zelfstandig experimenten, verzamelde data, trainde modellen en analyseerde resultaten. Zonder menselijke tussenkomst voerde de agent in twee dagen 700 experimenten uit en verbeterde de prestaties van een taalmodel met 11 procent.

Shopify-directeur Tobias Lutke deed het hem na en behaalde in één nacht 19 procent verbetering. Karpathy geeft aan zelf sinds december geen regel code meer te hebben geschreven. In plaats daarvan stuurt hij meerdere AI-agents tegelijk aan die parallel aan verschillende taken werken.

De vaardigheid verschuift van uitvoeren naar aansturen

Karpathy stelt dat wanneer een agent een taak niet goed uitvoert, dit bijna altijd ligt aan de instructies, het geheugen of de taakverdeling, niet aan de technologie zelf. De vraag is niet meer hoe goed je kunt programmeren, maar hoe goed je agents kunt aansturen.

Dat heeft directe gevolgen voor hoe werk eruitziet. AI verschuift van een tool die wacht op jouw volgende vraag naar een systeem dat 24/7 zelfstandig onderzoek, analyses en werkzaamheden uitvoert.

Wat betekent dit voor marketeers?

De verschuiving naar agents is ook te merken in marketingwerk. Taken zoals het verzamelen van data, het opstellen van rapporten of het monitoren van campagnes kunnen steeds meer worden uitbesteed aan AI-systemen die zelfstandig doorwerken. De rol van de marketeer verschuift daarmee richting het aansturen en beoordelen van die systemen. De concurrentiestrijd tussen de labs versnelt deze ontwikkeling. Elke maand komen er nieuwe mogelijkheden bij.

Maak iedere week een sprong vooruit in je marketing AI transformatie

Elke vrijdag brengen wij je de meest actuele inzichten, nieuws en praktijkvoorbeelden over de impact van AI in de marketingwereld. Of je nu je marketing efficiency wilt verbeteren, klantbetrokkenheid wilt verhogen, je marketingstrategie wilt aanscherpen of je bedrijf digitaal wilt transformeren. ‘Marketing AI Friday’ is jouw wekelijkse gids.

Meld je gratis aan voor Marketing AI Friday.

Marketing AI Friday

OpenAI heeft afgelopen week meerdere aankondigingen gedaan rondom ChatGPT. De AI-videogenerator Sora wordt volledig stopgezet, terwijl OpenAI tegelijkertijd nieuwe functies uitrolt: een centrale bestandsbibliotheek en een vernieuwde shopping-ervaring.

OpenAI stopt met Sora

Na een korte levensduur als consumentenproduct trekt OpenAI de stekker uit Sora. De app, de API en sora.com worden volledig afgesloten. Ook de samenwerking met Disney, goed voor een deal van 1 miljard dollar, gaat niet door.

De stopzetting past in een bredere strategische koerswijziging. Eind vorig jaar riep CEO Sam Altman intern al ‘code rood‘ uit vanwege toenemende concurrentie van Gemini en Claude. Sindsdien worden losse projecten systematisch afgebouwd. De onderliggende technologie van Sora verdwijnt overigens niet volledig: OpenAI wil het model inzetten voor onderzoek naar robotica en simulatie van de fysieke wereld.

xAI springt in het gat

Het vertrek van Sora blijft niet onopgemerkt. xAI kondigt een forse upgrade aan van Grok Imagine, de videogenerator van Elon Musk. De update moet resulteren in betere beeldkwaliteit, langere clips en meer controle over stijl en inhoud. Technische details en een releasedatum zijn nog niet bekendgemaakt. De concurrentiestrijd op het gebied van AI-video gaat dus gewoon door, alleen zonder OpenAI als speler.

ChatGPT Library: bestanden centraal opslaan

Tegelijk met het nieuws over Sora lanceerde OpenAI ChatGPT Library. Met deze nieuwe functie kunnen Plus-, Pro- en Business-gebruikers bestanden die ze uploaden of genereren in ChatGPT centraal opslaan.

Bestanden blijven in de nieuwe versie beschikbaar in toekomstige gesprekken, ook als je een chat verwijdert. Voor marketeers die regelmatig werken met documenten, presentaties of afbeeldingen in ChatGPT is dit een praktische toevoeging die het hergebruik van materiaal eenvoudiger maakt.

Shopping in ChatGPT krijgt nieuwe focus

Ook de shopping-functie in ChatGPT verandert van aanpak. OpenAI laat Instant Checkout vallen, de optie waarmee gebruikers direct binnen ChatGPT konden afrekenen. Die bleek in de praktijk te weinig flexibel voor webshops.

De focus verschuift naar productontdekking. Gebruikers kunnen visueel door producten bladeren, opties naast elkaar vergelijken en een foto uploaden om vergelijkbare producten te vinden. Het afrekenen zelf gebeurt voortaan bij de webshop. Daarmee positioneert ChatGPT zich meer als inspiratie- en vergelijkingstool dan als verkoopkanaal.

Wat betekent dit voor marketeers?

De lancering van ChatGPT Library maakt ChatGPT geschikter als werkomgeving voor de lange termijn. Bestanden hoeven niet langer opnieuw geüpload te worden bij elk nieuw gesprek, wat repetitief werk vermindert.

De verschuiving in de shopping-functie is ook interessant. ChatGPT wordt steeds meer een plek waar koopbeslissingen worden beïnvloed, ook al vindt de transactie elders plaats. Voor marketeers betekent dit dat zichtbaarheid in ChatGPT-zoekresultaten steeds relevanter wordt.

Maak iedere week een sprong vooruit in je marketing AI transformatie

Elke vrijdag brengen wij je de meest actuele inzichten, nieuws en praktijkvoorbeelden over de impact van AI in de marketingwereld. Of je nu je marketing efficiency wilt verbeteren, klantbetrokkenheid wilt verhogen, je marketingstrategie wilt aanscherpen of je bedrijf digitaal wilt transformeren. ‘Marketing AI Friday’ is jouw wekelijkse gids.

Meld je gratis aan voor Marketing AI Friday.

Marketing AI Friday

OpenAI introduceerde vorige week twee nieuwe modellen: GPT-5.3 Instant en GPT-5.4. De releases volgden kort na elkaar. Begin vorige week verscheen GPT-5.3 Instant en later die week werd GPT-5.4 uitgerold. Beide modellen richten zich op verschillende verbeteringen: GPT-5.3 Instant moet gesprekken natuurlijker en directer maken, terwijl GPT-5.4 zich richt op complexere taken zoals programmeren, automatisering en het verwerken van grote hoeveelheden informatie.

GPT-5.3 Instant: directere antwoorden en minder fouten

Veel gebruikers merkten de afgelopen maanden dat ChatGPT voorzichtiger werd in gesprekken. De antwoorden werden langer, defensiever en soms onnodig omslachtig. GPT-5.3 Instant is door OpenAI opnieuw afgesteld om dat gedrag te verbeteren.

Het model reageert directer, vermijdt minder vaak vragen en sluit beter aan op de context van een gesprek. Volgens OpenAI zijn feitelijke fouten met 26,8 procent teruggebracht ten opzichte van GPT-5.2. Dat betekent minder incorrecte claims en minder correctierondes bij het schrijven of controleren van teksten.

Betere output voor dagelijks gebruik

Voor marketingteams kan dat verschil merkbaar zijn in dagelijkse workflows. Conceptteksten voor campagnes, productbeschrijvingen of e-mails vragen minder aanpassingen voordat ze bruikbaar zijn.

Daarnaast wordt de interactie met het model zelf efficiënter. Kortere, duidelijkere antwoorden maken het makkelijker om snel verder te werken zonder meerdere prompts nodig te hebben. GPT-5.3 Instant is beschikbaar voor alle ChatGPT-gebruikers, zowel gratis als betaald.

GPT-5.4: het krachtigste GPT-model tot nu toe

Naast de lichtere update bracht OpenAI ook GPT-5.4 uit. Dit model combineert de programmeercapaciteiten van GPT-5.3 Codex met sterkere redeneer- en automatiseringsvaardigheden.

Op de GDPval-test, die professionele taken in 44 beroepen meet, behaalt GPT-5.4 een score van 83 procent. Daarmee evenaart of overtreft het model in een groot deel van deze taken menselijke experts. Ter vergelijking: GPT-5.2 behaalde eerder een score van 70,9 procent.

AI die software kan bedienen

GPT-5.4 kan daarnaast zelfstandig software gebruiken. Het model kan formulieren invullen, navigeren tussen programma’s en taken uitvoeren over meerdere tools. Op de OSWorld-test voor computergebruik behaalt GPT-5.4 een score van 75 procent, iets boven menselijke prestaties.

Ook het contextvenster is uitgebreid. GPT-5.4 kan ongeveer één miljoen tokens verwerken, wat neerkomt op de inhoud van ongeveer tien dikke boeken tekst in één sessie. Daarnaast zijn feitelijke fouten volgens OpenAI 33 procent minder vaak aanwezig dan bij GPT-5.2.

Wat betekent dit voor marketeers?

De introductie van GPT-5.3 Instant en GPT-5.4 laat zien hoe snel AI-modellen blijven verbeteren. Het verschil zit niet alleen in krachtigere modellen, maar ook in betere interactie en betrouwbaardere output.

Voor marketeers betekent dat dat AI steeds vaker kan worden ingezet voor complexere taken: van contentcreatie tot data-analyse en automatisering van workflows. Tegelijk blijft het belangrijk om output te controleren en modellen bewust te kiezen voor specifieke taken.

Maak iedere week een sprong vooruit in je marketing AI transformatie

Elke vrijdag brengen wij je de meest actuele inzichten, nieuws en praktijkvoorbeelden over de impact van AI in de marketingwereld. Of je nu je marketing efficiency wilt verbeteren, klantbetrokkenheid wilt verhogen, je marketingstrategie wilt aanscherpen of je bedrijf digitaal wilt transformeren. ‘Marketing AI Friday’ is jouw wekelijkse gids.

Meld je gratis aan voor Marketing AI Friday.

Marketing AI Friday

OpenAI heeft meerdere updates doorgevoerd binnen ChatGPT. De functie deep research draait nu op GPT-5.2 in plaats van het eerdere o3-model, waardoor onderzoeksresultaten sneller worden gegenereerd. Daarnaast introduceerde OpenAI Codex Spark, een realtime codeermodel voor Pro-gebruikers, en breidde het de Canva-integratie uit zodat gebruikers direct ontwerpen kunnen maken en bewerken binnen ChatGPT. De updates zijn grotendeels beschikbaar voor Plus- en Pro-gebruikers, met verdere uitrol in de komende periode.

Deep research wordt interactiever

Met de overstap naar GPT-5.2 wordt deep research binnen ChatGPT inhoudelijk sterker. Het model kan complexere verbanden leggen, uitgebreider onderbouwen en sneller grote hoeveelheden informatie verwerken. Voor marketeers betekent dit dat analyses, marktverkenningen en concurrentieonderzoek meer diepgang krijgen.

Je kunt nu externe apps toegang geven tot deep research. ChatGPT kan nu, naast webbronnen, ook bestanden in Google Drive, SharePoint en Canva meenemen. Vraag je om een marktanalyse, dan combineert het openbare informatie met interne documenten, eerdere presentaties en strategische plannen.

Meer controle tijdens het onderzoeksproces

Waar je voorheen een deep research startte en wachtte op het eindresultaat, kun je nu tussentijds bijsturen. Je ziet in real-time welke richting het onderzoek opgaat en kunt ingrijpen als de focus niet klopt. Extra bronnen toevoegen of bepaalde invalshoeken aanscherpen kan tijdens het proces.

Daarnaast kun je vooraf het onderzoeksplan bekijken en aanpassen. Je bepaalt zelf op welke websites of domeinen ChatGPT wel of juist niet mag zoeken. Dit geeft meer controle over bronkeuze, relevantie en betrouwbaarheid. De uiteindelijke output wordt geleverd als een volledig rapport met inhoudsopgave, dat exporteerbaar is als PDF of Word-bestand.

Snel coderen met Codex Spark

Naast de deep research updates lanceerde OpenAI Codex Spark. Dit nieuwe model genereert meer dan duizend tokens per seconde en maakt realtime samenwerking mogelijk tijdens het schrijven van code. Je beschrijft in gewone taal wat je wilt bouwen en ChatGPT zet dit direct om in werkende code.

Dit maakt het steeds laagdrempeliger om zelf werkende tools te bouwen. Denk bijvoorbeeld aan het bouwen van een interactieve quiz, een eenvoudige calculator of een prijsvergelijker zonder tussenkomst van een developer. Je kunt tijdens het proces bijsturen, functies aanpassen en direct zien wat er verandert. Codex Spark is momenteel beschikbaar als preview voor ChatGPT Pro-gebruikers.

Canva volledig geïntegreerd in ChatGPT

De integratie met Canva is verder uitgebreid. Sinds juni vorig jaar kon je Canva-bestanden al doorzoeken via deep research. Nu kun je ook ontwerpen maken en bewerken, direct vanuit het chatvenster. Typ bijvoorbeeld dat je een presentatie wilt op basis van een onderzoek en ChatGPT maakt een volledig Canva-ontwerp.

Tekst aanpassen over alle slides tegelijk is mogelijk, net als het herschrijven van content of het vertalen van een complete presentatie naar een andere taal. De opmaak blijft intact, inclusief huisstijl, lettertypen en kleuren via Canva’s Brand Kits.

Wat betekent dit voor marketingteams?

Met deze updates verandert ChatGPT verder richting een centrale werkomgeving. Onderzoek, analyse, code en design komen samen in één interface. Voor marketeers betekent dit dat de manier van werken verandert. Je kunt niet alleen sneller content produceren, maar ook onderzoek verdiepen, interne kennis koppelen en direct visuele output creëren. De combinatie van GPT-5.2, Codex Spark en Canva-integratie laat zien dat ChatGPT zich ontwikkelt tot een geïntegreerde werktool waarin strategie, uitvoering en optimalisatie samenkomen.

Maak iedere week een sprong vooruit in je marketing AI transformatie

Elke vrijdag brengen wij je de meest actuele inzichten, nieuws en praktijkvoorbeelden over de impact van AI in de marketingwereld. Of je nu je marketing efficiency wilt verbeteren, klantbetrokkenheid wilt verhogen, je marketingstrategie wilt aanscherpen of je bedrijf digitaal wilt transformeren. ‘Marketing AI Friday’ is jouw wekelijkse gids.

Meld je gratis aan voor Marketing AI Friday.

Marketing AI Friday

OpenAI heeft GPT-5.3-Codex geïntroduceerd, een nieuw model binnen ChatGPT dat kort na de release van Claude Opus 4.6 van Anthropic is aangekondigd. GPT-5.3-Codex presteert beter op meerdere programmeertests, werkt efficiënter dan zijn voorganger en is merkbaar sneller. Opvallend is dat dit het eerste model is dat actief is ingezet bij zijn eigen training en uitrol, een stap die volgens OpenAI laat zien hoe snel zelflerende systemen zich ontwikkelen.

Nieuw tempo in de concurrentiestrijd

De timing van deze release is veelzeggend. OpenAI en Anthropic reageren steeds sneller op elkaar, waardoor nieuwe modellen elkaar in hoog tempo opvolgen. GPT-5.3-Codex laat zien dat ChatGPT niet alleen beter scoort op coderingstaken, maar ook slimmer omgaat met middelen. Minder rekenkracht, meer output. Voor gebruikers betekent dit snellere resultaten en meer ruimte om het model in te zetten voor dagelijkse werkzaamheden.

Er is nog geen officiële Elo-score gepubliceerd op het Artificial Analysis leaderboard. De verwachting is dat GPT-5.3-Codex net onder Opus 4.6 zal eindigen. Toch zegt dat weinig over de praktische inzet, waar het draait om wat je met het model kan doen binnen je workflow.

ChatGPT als deelnemer in zijn eigen bouwproces

Wat GPT-5.3-Codex onderscheidt, is de rol die het speelde in zijn eigen ontwikkeling. Vroege versies werden gebruikt om fouten in trainingsprocessen op te sporen, testresultaten te analyseren en de uitrol te begeleiden. Sam Altman omschreef dit als een voorproef van wat volgt. ChatGPT wordt hier niet alleen ingezet als hulpmiddel, maar als actieve schakel binnen het ontwikkelproces.

Dit bevestigt een trend die ook eerder werd benoemd door leiders van onder andere Anthropic en Google DeepMind. Systemen die bijdragen aan het bouwen van nieuwe systemen zorgen voor een versnelling die moeilijk te vergelijken is met eerdere fases van AI-ontwikkeling.

Waarom dit direct relevant is voor marketeers

Als ChatGPT zichzelf kan verbeteren, verandert ook de manier waarop je campagnes, content en analyses inzet binnen marketing. Denk aan AI-agents die hun aanpak aanpassen op basis van prestaties, zonder dat elke optimalisatie handmatig hoeft te worden doorgevoerd. Of content die zich aanpast aan gedrag en context, terwijl jij stuurt op richting en doel.

Dit betekent niet dat de marketeer overbodig wordt. De rol verschuift van uitvoeren naar regisseren. Je bepaalt kaders, bewaakt kwaliteit en interpreteert uitkomsten. ChatGPT ondersteunt bij analyse, uitwerking en schaal, waardoor teams sneller kunnen schakelen en experimenteren.

Van code-assistent naar werkpartner

GPT-5.3-Codex en Claude Opus 4.6 laten zien dat deze modellen meer doen dan alleen code schrijven. Ze helpen ook bij presentaties, het analyseren van spreadsheets en andere taken die normaal veel handmatig werk kosten. Daarmee groeit ChatGPT uit tot een vaste hulp binnen het dagelijkse werk van marketingteams, in plaats van een losse tool.

Maak iedere week een sprong vooruit in je marketing AI transformatie

Elke vrijdag brengen wij je de meest actuele inzichten, nieuws en praktijkvoorbeelden over de impact van AI in de marketingwereld. Of je nu je marketing efficiency wilt verbeteren, klantbetrokkenheid wilt verhogen, je marketingstrategie wilt aanscherpen of je bedrijf digitaal wilt transformeren. ‘Marketing AI Friday’ is jouw wekelijkse gids.

Meld je gratis aan voor Marketing AI Friday.

Marketing AI Friday