OpenAI gaat open-source, Google's AI bouwt werelden en de nieuwe koning van code | De grootste releases van de week
PLUS: De strijd om webdata: waarom AI-bedrijven de bestaande regels van het internet negeren
De afgelopen jaren was de deal met OpenAI helder: je betaalde voor toegang tot een gesloten, krachtige 'black box'. Deze week gooiden ze die deur plotseling open en gaven ze voor het eerst twee van hun AI-modellen gratis weg.
Het directe resultaat voor bedrijven en ontwikkelaars is een doorbraak: een geavanceerd OpenAI-model kan nu op eigen servers worden geïmplementeerd. Deze nieuwe mogelijkheid is het gevolg van een berekende strategische keuze van OpenAI, bedoeld om de groeiende dominantie van Meta in het open-source landschap het hoofd te bieden.
In deze editie:
Waarom OpenAI zijn strategie omgooit en wat hun nieuwe, gratis modellen betekenen voor jouw data.
Hoe Google's 'Genie' complete werelden bouwt en waarom dit de toekomst van simulatie is.
De nieuwe koning van de code: hoe Anthropic's AI de taken van junior programmeurs automatiseert.
De strijd om webdata: waarom AI-bedrijven de ongeschreven regels van het internet negeren.
OpenAI Gooit Het Roer Om en Zet Meta Klem
De strategie van OpenAI was jarenlang helder: toegang bieden tot krachtige, gesloten modellen tegen betaling. Deze week is die strategie fundamenteel veranderd. Met de release van twee 'open-weight' modellen, gpt-oss-120b en gpt-oss-20b, stapt het bedrijf voor het eerst sinds lange tijd in de open-source arena.
De stap is een directe reactie op de successen van Meta's Llama-modellen en positioneert OpenAI om de concurrentie in het open-source landschap aan te gaan. Hiermee veranderen niet alleen de machtsverhoudingen, maar ook de manier waarop bedrijven toegang krijgen tot geavanceerde AI.
Even terugspoelen. Tot nu toe was de deal met OpenAI simpel: je kreeg toegang tot hun modellen via een betaalde API. Krachtig, maar ook een 'black box'. Je data ging de cloud in en je had geen controle over het model zelf. Met de nieuwe gpt-oss modellen is dat verleden tijd. Dit zijn 'open-weight' modellen. Je kunt ze downloaden, op je eigen servers of zelfs op een laptop draaien, en ze volledig aanpassen aan jouw specifieke behoeften. Ze zijn te vinden op platforms als Hugging Face en worden direct ondersteund door het hele ecosysteem.
Wat deze zet extra interessant maakt, is de timing en de context. OpenAI stond aan de zijlijn toe te kijken hoe Meta met zijn Llama-modellen en Chinese spelers als DeepSeek de open-source wereld veroverden. CEO Sam Altman gaf recent zelfs toe dat zijn bedrijf wat betreft open-source aan de “verkeerde kant van de geschiedenis” stond. Deze release is het antwoord.
Maar het is meer dan alleen een inhaalslag. Het is een meesterlijke zakelijke manoeuvre. Tegelijk met de release kondigde OpenAI een strategische zet richting AWS aan. Tot nu toe was Microsoft de exclusieve, grote cloudpartner, een relatie die naar verluidt onder spanning staat. Door nu met AWS, de grootste concurrent, in zee te gaan, creëert OpenAI concurrentie en versterkt het zijn onderhandelingspositie. Het is het schoolvoorbeeld van je eieren niet in één mandje leggen.
De drempel om geavanceerde, op maat gemaakte AI te bouwen is zojuist spectaculair verlaagd.
Volledige controle en datasoevereiniteit. Je kunt nu een state-of-the-art OpenAI-model draaien achter je eigen firewall. Voor bedrijven in de financiële sector, de zorg of juridische dienstverlening, waar datagevoeligheid heilig is, is dit een enorme doorbraak. Geen data meer naar externe servers, maar alles in eigen beheer.
Lagere kosten en snellere innovatie. Constant API-calls maken tikt aan. Voor taken met een hoog volume kan het lokaal draaien van een model aanzienlijk goedkoper zijn. Bovendien kun je razendsnel experimenteren. Een model finetunen op je eigen bedrijfsdocumentatie om een hyperrelevante interne chatbot te bouwen? Dat is nu een fluitje van een cent.
Nieuwe productkansen. Deze modellen zijn ontworpen voor zogenaamde 'agentic workflows'. Ze kunnen complexe, meerstapsredeneringen uitvoeren, tools zoals een webbrowser aanroepen en code uitvoeren. Dit opent de deur naar het bouwen van slimme assistenten die autonoom taken uitvoeren, van marktonderzoek tot het schrijven van complexe rapporten.
Maar er is een belangrijke ‘maar’. Voordat je nu direct je serverpark volzet met deze nieuwe modellen, is er een kanttekening. OpenAI noemt ze bewust 'open-weight', niet 'open-source'. Je krijgt de gewichten, de 'hersenen' van het model. Maar de trainingsdata en de precieze trainingsmethode blijven geheim. Je kunt het model dus gebruiken en aanpassen, maar niet volledig doorgronden of de ingebakken vooroordelen begrijpen.
Belangrijker nog: de modellen hebben een hogere hallucinatiegraad dan hun gesloten broers. Ze verzinnen vaker feiten. OpenAI geeft zelf toe dat dit komt omdat kleinere modellen minder 'wereldkennis' hebben. Voor zakelijk gebruik betekent dit dat de output altijd streng gevalideerd moet worden. Een model dat overtuigend onzin verkoopt, is een serieus bedrijfsrisico.
De conclusie is helder. De komst van gpt-oss is geen gewone productlancering, maar een strategische herpositionering die toegang tot krachtige AI democratiseert. Voor Nederlandse ondernemers verschuift de focus van het simpelweg gebruiken van AI via API's naar het bouwen met en controleren van AI-modellen. Dit biedt ongekende mogelijkheden voor maatwerk, kostenbesparing en privacy, mits je de beperkingen en risico's goed managet.
Google's 'Genie' bouwt nu complete werelden
Vergeet AI die een video voor je maakt. De volgende stap is geen filmpje, maar een complete, interactieve wereld waar je doorheen kunt lopen. Dat is precies wat Google DeepMind deze week liet zien met de onthulling van Genie 3.
Met een simpele tekstprompt genereert dit nieuwe wereldmodel een 3D-omgeving in 720p-resolutie die je in real-time kunt verkennen. En niet alleen dat: met nieuwe commando's kun je de wereld direct aanpassen, een feature die DeepMind 'promptable world events' noemt. Denk aan het veranderen van het weer, het toevoegen van objecten of het laten verschijnen van personages. Live, terwijl je erin zit.
Maar waarom is dit meer dan een fancy techdemo voor de volgende generatie videogames? Omdat Google hiermee niet primair op gamers mikt. De echte aap komt uit de mouw als je kijkt naar het grotere strategische doel: het trainen van geavanceerde AI-agenten.
De vooruitgang van AI wordt steeds meer beperkt door de beschikbaarheid van goede trainingsdata. De oplossing? Synthetische data. Genie 3 is in essentie een oneindige fabriek voor trainingsdata. Het kan non-stop unieke, complexe en interactieve scenario's creëren waarin een AI kan leren.
Dit is waar de connectie met een ander DeepMind-project, de SIMA agent, cruciaal wordt. SIMA is een AI-agent die, net als een mens, leert door te kijken en instructies in natuurlijke taal te volgen. Geef SIMA een oneindige, interactieve speeltuin als Genie 3, en je hebt de perfecte combinatie om robots en autonome voertuigen te trainen voor de onvoorspelbare echte wereld. DeepMind noemt het zelf een cruciale stap richting AGI, ofwel AI met mensachtige intelligentie.
Wat betekent dit concreet voor Nederlandse ondernemers en professionals?
Hyperrealistische Simulaties voor Prototyping. Architecten, ingenieurs en productontwerpers kunnen straks concepten bouwen en testen in een dynamische virtuele wereld, lang voordat er een fysiek prototype is. Test een nieuwe winkelindeling met gesimuleerde klantenstromen of een nieuw auto-onderdeel onder extreme weersomstandigheden.
Training en Opleiding 2.0. Dit gaat veel verder dan de huidige e-learning. Denk aan hyperrealistische simulaties voor chirurgen die complexe operaties oefenen, monteurs die leren werken aan gevaarlijke machines, of hulpdiensten die trainen voor rampen die te duur of riskant zijn om in het echt na te bootsen.
De Opkomst van de Digitale Tweeling. Dit is de meest strategische verschuiving. Bedrijven in logistiek, productie of retail kunnen een digitale tweeling van hun magazijn, fabrieksvloer of winkelketen creëren. Vervolgens kunnen ze oneindig veel simulaties draaien om processen te optimaliseren, knelpunten te vinden en de efficiëntie te verhogen, zonder de echte operatie te verstoren.
Maar voordat je je hele productlijn in een AI-wereld gooit… De technologie is veelbelovend, maar staat nog in de kinderschoenen. De simulaties van Genie 3 duren slechts een paar minuten, de 'natuurkunde' in de werelden is nog niet perfect, en de AI-personages kunnen de wereld nog niet echt op een betekenisvolle manier beïnvloeden. Bovendien zijn de computationele kosten gigantisch, wat betekent dat deze technologie voorlopig een speeltje blijft van de grote techbedrijven.
De kern is dat de volgende fase van AI niet draait om content, maar om simulatie. Voor ondernemers betekent dit: begin met het in kaart brengen van je fysieke processen alsof je ze morgen zou willen digitaliseren in een interactief model. De winnaars van morgen zijn de bedrijven die nu al begrijpen welke delen van hun operatie het meest gebaat zijn bij een digitale tweeling.
Van AI-assistent naar AI-ontwikkelaar: Anthropic's Claude 4.1 verlegt de grens van autonome taken
Terwijl de aandacht vaak uitgaat naar AI die content genereert, zoals Genie 3, vindt de meest strategische vooruitgang plaats op een ander vlak: het vermogen van AI om complexe, meerstaps taken autonoom uit te voeren. Deze week zette Anthropic hierin een belangrijke stap met de lancering van Claude Opus 4.1.
De upgrade lijkt op het eerste gezicht incrementeel, maar een specifieke prestatie toont een fundamentele verschuiving. Het model behaalde een score van 74,5% op de SWE-bench, een veeleisende benchmark die AI-modellen test op het zelfstandig oplossen van echte softwareproblemen uit projecten als Django en Matplotlib.
Het model krijgt hierbij een bugrapport van GitHub en moet de code analyseren, de fout lokaliseren, een oplossing schrijven en deze implementeren. Een succesratio van bijna drie op vier voor dit soort taken is een mijlpaal. Het toont aan dat we de fase van eenvoudige AI-assistentie voorbij zijn en de wereld van de autonome AI-agent betreden.
Deze ontwikkeling is een direct gevolg van Anthropic's focus op het perfectioneren van 'agentic workflows': de capaciteit van AI om zelfstandig een reeks logische stappen te doorlopen om een doel te bereiken. Voor ondernemers en professionals heeft dit twee concrete implicaties:
1. Automatisering van Junior Ontwikkeltaken. De problemen in de SWE-bench zijn representatief voor het werk van een beginnende softwareontwikkelaar: bugs oplossen, code onderhouden en kleine features implementeren. De prestaties van Claude Opus 4.1 suggereren dat dit werk in hoge mate geautomatiseerd kan worden, wat de rol van senior ontwikkelaars verschuift naar die van architect en opzichter van AI-systemen.
2. Focus op Betrouwbaarheid en Precisie. Een cruciaal aspect dat klanten als Rakuten Group benadrukken, is de precisie van het model. Het kan exacte correcties aanwijzen in complexe codebases zonder nieuwe fouten te introduceren. Deze betrouwbaarheid is essentieel voor zakelijke toepassingen; een AI die onbetrouwbare code genereert, creëert meer werk dan het oplost.
Er zijn echter praktische kanttekeningen. Ten eerste, de kosten. Complexe, autonome taken vereisen aanzienlijke rekenkracht. Met een prijs van $15 per miljoen input- en $75 per miljoen output-tokens is het automatiseren van complete workflows een aanzienlijke investering. Ten tweede is de benchmark-context belangrijk. De resultaten worden gerapporteerd op een specifieke set problemen, en de vergelijkbaarheid met scores van concurrenten is niet altijd één-op-één.
De kern van deze ontwikkeling is dat de frontlinie van AI steeds verder verschuift van wat een model kan genereren naar hoe het een proces kan uitvoeren. De focus ligt op het autonoom bereiken van een eindresultaat.
Keep reading with a 7-day free trial
Subscribe to Luciano Currie to keep reading this post and get 7 days of free access to the full post archives.