AI agents zijn geen demo meer. Ze runnen Goldman Sachs.
Vorige week crashte de beurs, lanceerden twee nieuwe supermodellen, en bouwde iemand een bedrijf met zes autonome agents. Welkom in de nieuwe werkelijkh
De S&P 500 daalde in vijf dagen met bijna 9 procent. Het bedrijf Thomson Reuters verloor meer dan 20 procent van z’n beurswaarde. Niet door een hack, niet door een recessie. Anthropic lanceerde een plugin voor juridische automatisering. Dat was genoeg.
Een enkel product, van een AI-bedrijf dat twee jaar geleden nog nauwelijks bekend was buiten Silicon Valley, liet investeerders massaal dumpen. Waarom? Omdat ze beseften dat AI niet langer iets is wat eraan komt. Het is er. En het vervangt nu echt software, diensten en uiteindelijk functies waar bedrijven miljarden aan uitgeven.
Dit was niet de enige ontwikkeling afgelopen week. Het was er een van tien. En samen vertellen ze een verhaal dat je als professional niet kunt negeren.
Alles tegelijk
Laat me even opsommen wat er de afgelopen dagen gebeurde. Want het is niet een ding. Het is alles tegelijk.
Goldman Sachs rolt Claude uit voor accounting en compliance. Niet als experiment. Anthropic-engineers zitten al zes maanden embedded bij Goldman, en bouwen samen systemen die functioneren als digitale collega’s. Zes maanden, in stilte. Terwijl wij het hadden over of AI wel of niet de boekhouding kon doen, werd het gewoon gebouwd. Bij een van de grootste banken ter wereld.
Greg Brockman, president van OpenAI, postte een uitgebreide memo over hoe software development een “renaissance” doormaakt. Zijn engineers gebruiken Codex nu voor vrijwel alle code en operations. Waar het in december nog beperkt was tot unit tests, schrijven ze er nu alles mee. Hij stelde een deadline: voor 31 maart moet OpenAI volledig over op agent-first development. Geen geleidelijke transitie. Een harde datum. Zijn memo bevatte zes concrete stappen voor de overstap, inclusief het aanwijzen van een “agents captain” per team en het herinrichten van codebases zodat agents er optimaal in kunnen werken. Brockman duwt hiermee een reorganisatie door.
Anthropic lanceerde agent teams in Claude Code. Meerdere AI-agents die parallel werken, met elkaar communiceren, en samen complexe taken oplossen. Een lead agent die coördineert, meerdere teammates die uitvoeren. In real-time.
En dan was er iemand die een compleet bedrijf bouwde met zes AI-agents, een VPS en een Supabase database. Na twee weken runden de agents het zelf. Autonoom. De website, de processen, het draaien van het bedrijf. Zes agents, nul medewerkers.
En als je dit allemaal bij elkaar optelt, dan zie je een patroon. AI agents verschuiven van “kijk wat ik kan” naar “kijk wat ik doe”. Van demo naar productie. Van speeltuin naar werkvloer.
De motoren erachter: Opus 4.6 en GPT-5.3 Codex
Wat dit allemaal mogelijk maakt, zijn de modellen. En die versnellen in een tempo dat zelfs mij af en toe verrast.
Vrijdag lanceerde Anthropic Opus 4.6 met een context window van 1 miljoen tokens. Ter vergelijking: een jaar geleden was 100.000 tokens al indrukwekkend. Nu stop je er tien boeken in en het model verliest niks. De system card van Opus 4.6 bevat passages die zelfs doorgewinterde AI-onderzoekers verbazen. Eigenlijk niet eens de marketing. De technische documentatie zelf is al indrukwekkend.
Aan de andere kant lanceerde OpenAI GPT-5.3 Codex. Het bijzondere? Dit model was betrokken bij het bouwen van zichzelf. Het hielp bij het debuggen en deployen van z’n eigen code. Denk daar even over na. En de release cycles? Van zes maanden naar twee tot drie maanden tussen grote versies.
Ik zeg het in mijn AI-trainingen altijd: we zitten op een hockeystick curve. Die exponentiële groei die je in de grafieken ziet, dat is niet theoretisch. Het is wat je voelt als je elke maand een model gebruikt dat fundamenteel beter is dan dat van de maand ervoor. En de afgelopen week was dat gevoel niet subtiel. Het was een klap in je gezicht.
Ter perspectief: anderhalf jaar geleden was GPT-4o het beste model dat bestond, met een context window van 128.000 tokens. Nu zitten we op modellen die 10 keer zoveel context aankunnen, die redeneren over complexe problemen, en die zichzelf helpen bouwen. De IQ-benchmarks die ik in mijn trainingen laat zien, laten precies die curve zien. Elk kwartaal een sprong die het vorige kwartaal onmogelijk leek. En het stopt niet. Het versnelt.
De belofte in actie
Dus wat doen mensen er nu concreet mee?
Een designer verving in een paar weken zijn hele toolstack. Notion werd lokale Markdown files in Obsidian. Midjourney werd vervangen door een lokaal image model. Cursor, Lovable en drie andere tools werden samengevoegd in een workflow met AI-agents en Codex. Vier gespecialiseerde Telegram-bots als persoonlijk controlecentrum. Resultaat: 5 tot 10 keer snellere output dan twee jaar geleden.
Met de nieuwe agent teams in Claude Code kun je een complete marketingafdeling opzetten. Een lead agent die coordineert, teammates die parallel concurrentieanalyses draaien, landingspagina’s bouwen met ingebouwde review, en advertentie-creatives ontwikkelen door onderling te debatteren. En dan is er de techniek van recursive self-improvement loops: laat een AI content genereren, zichzelf scoren op tien criteria, de zwaktes diagnosticeren, en itereren tot het goed genoeg is. Geen eenmalige prompt, maar een doorlopend kwaliteitssysteem.
En dan ClawdBot🦞, de autonome agent die via messaging-apps taken uitvoert op je computer. Een virale analyse die 40 uur research kostte, ging het internet over: 4,4 miljoen views, 35.000 bookmarks. Wat eruit kwam was ontnuchterend en waardevol tegelijk. Maar daar wil ik het zo even over hebben.
De werkelijkheid achter de belofte
Want hier begint het interessante deel. Het deel dat de meeste AI-nieuwsberichten overslaan.
40 uur research in ClawdBot laat de echte cijfers zien. Setup: 30 minuten tot 2 uur, afhankelijk van je technische niveau. De basis kan het prima: bestanden organiseren, simpel onderzoek, agenda-integratie, documenten verwerken. Maar wil je de geavanceerde functies? Dan bouw je zelf custom skills, en dat kost 2 tot 4 uur per stuk. De echte maandkosten? Niet de “$5 per maand” die sommige influencers roepen, maar $15 tot $150 afhankelijk van gebruik. En dan ben je er nog niet.
Maar er is een keerzijde die minstens zo belangrijk is. ClawdBot geeft AI shell-toegang tot je digitale leven. Het kan commando’s uitvoeren, bestanden openen, e-mails sturen, en berichten versturen. Autonoom. 24 uur per dag. Het UK’s National Cyber Security Centre waarschuwt dat prompt injection, waarbij kwaadwillenden verborgen instructies in content plaatsen die de AI oppikt en uitvoert, “onmogelijk volledig te elimineren” is bij LLMs. Er is een gedocumenteerd geval waarbij ClawdBot alle e-mails verwijderde nadat het verborgen instructies in een bericht ontving.
De installatie-handleidingen die rondgaan slaan cruciale stappen over. Pairing approval, security audits, sandbox configuratie. Dat zijn gewoon vangrails. Die heb je nodig om te voorkomen dat je AI-agent beslissingen maakt die je niet kunt terugdraaien.
Maar goed, ik wil je hier niet bang mee maken. Ik wil je realistisch maken. De tools zijn krachtig. Echt krachtig. Maar ze zijn niet plug-and-play. En wie dat wel beweert, verkoopt je iets.
Het grotere plaatje: banen, markten, en een eerlijke CEO
Dario Amodei, CEO van Anthropic, publiceerde vorige week zijn essay “The Adolescence of Technology”. De titel zegt eigenlijk alles. Adolescentie. De tienerfase.
In een video die rondging op X stelde hij een vraag die bleef hangen: “Can we create jobs faster than AI destroys them?” Zijn eigen antwoord: waarschijnlijk niet.
Dat hoor je zelden van een CEO die het product verkoopt dat die banen bedreigt. Maar het is eerlijk. En die eerlijkheid is precies waarom je als professional niet kunt wegkijken.
Die beurscrash was eigenlijk logisch. De markt besefte in real-time hetzelfde als wat Amodei beschrijft. AI agents vervangen niet alleen taken. Ze vervangen hele categorieën software. Juridische tools, accounting systemen, compliance platforms. Bedrijven zoals Thomson Reuters hebben hun hele verdienmodel gebouwd op diensten die AI agents nu in een fractie van de tijd en kosten kunnen leveren.
Zijn essay bevat 24 punten over de risico’s van AI, van economische ontwrichting tot autonome wapens tot governance-uitdagingen. Maar de kern is die titel: adolescentie. We hebben een technologie gebouwd die krachtig genoeg is om hele industrieën te hervormen, maar nog niet volwassen genoeg om dat zonder begeleiding te doen. Net als een tiener: vol talent, vol energie, maar ook in staat om spectaculaire fouten te maken als er niemand meekijkt.
Wat betekent dit voor jou?
Geen paniek. Maar ook niet wegkijken. Drie dingen om nu te doen:
Begrijp het verschil tussen AI als tool en AI als agent. Tot nu toe gebruikte je AI waarschijnlijk als een slim tekstvak. Je stelt een vraag, je krijgt een antwoord. Dat was fase een. Fase twee, waar we nu in zitten, is AI die zelfstandig taken uitvoert. Die meerdere stappen doorloopt, beslissingen neemt, en resultaten oplevert zonder dat jij elke stap begeleidt. Dat verschil is fundamenteel. Dus het draait nu niet meer om wat jij met AI kunt doen, maar om wat AI zonder jou kan doen.
Experimenteer, maar met open ogen. Agent teams in Claude Code, ClawdBot, autonome workflows: het is allemaal beschikbaar. Maar begin klein. Test het op taken die geen grote gevolgen hebben als het misgaat. Bouw je begrip op voordat je je bedrijfsprocessen eraan hangt. De security-risico’s zijn reëel. De kosten lopen op. En de kwaliteit varieert. Dat is geen reden om het niet te proberen. Het is een reden om het slim te proberen.
Denk na over je positie. Niet in paniek, maar strategisch. Welke delen van jouw werk zijn routinematig en regelgebonden? Dat zijn de delen die AI agents het eerst overnemen. Goldman Sachs begon bij accounting en compliance. Niet bij strategie, niet bij relatiebeheer. Bij het werk dat regels volgt. Kijk naar je eigen week. Hoeveel uur besteed je aan werk dat een duidelijk patroon volgt? Dat is je kwetsbaarheid. Maar het is ook je kans, want als je dat werk kunt delegeren aan een agent, heb je tijd over voor het werk dat echt waarde toevoegt. En dat is precies waar de waarde verschuift: van uitvoering naar sturing. De persoon die weet welk rapport er geschreven moet worden en waarom, die wordt onmisbaar.
De vergelijking die ik steeds maak in mijn talks: we zitten in de fase waarin de smartphone net uitkwam. Iedereen had er een mening over, maar bijna niemand begreep de echte impact. Uiteindelijk ging het niet om bellen zonder snoer, maar om een heel ecosysteem aan apps, diensten en gedragsveranderingen die nog moesten komen. Zo is het nu ook. AI agents zijn niet het eindpunt. Ze zijn het startpunt van een verschuiving die we nu nog niet volledig kunnen overzien.
Maar vorige week? Vorige werd het een stuk zichtbaarder.
Ook het vermelden waard
ClawdBot op je Ray-Ban Meta bril Een student bouwde een versie van ClawdBot die draait op Ray-Ban Meta glasses. Je kijkt naar een product, de bril herkent het, en koopt het voor je. Het is een stunt, maar het laat zien waar dit naartoe gaat: AI agents die niet op je laptop wachten, maar meekijken met je dagelijks leven. Fascinerend en lichtelijk beangstigend tegelijk.
16 Claude agents bouwen samen een C compiler Anthropic demonstreerde hoe zestien parallelle Claude-sessies samen een volledig werkende C compiler bouwden. Elke agent werkte aan een eigen module, met een lead agent die de coordinatie deed. Het resultaat: werkende software, gebouwd door een team zonder mensen. De meest concrete demonstratie tot nu toe van wat agent teams in de praktijk kunnen.
Van magie naar malware: hoe AI agent skills een aanvalsvector worden 1Password onderzocht hoe de skills die je aan AI agents toevoegt een nieuw type beveiligingsrisico vormen. Kwaadwillenden kunnen verborgen instructies in skills plaatsen die de agent overneemt en uitvoert. Het is dezelfde prompt injection waar we het in het hoofdartikel over hebben, maar dan specifiek gericht op de extensies die je zelf installeert. Controleer je bronnen.
125.000 mensen bieden zich aan als “huurling” voor AI agents Een nieuw platform laat mensen zich aanmelden om taken uit te voeren die AI agents (nog) niet zelfstandig kunnen. Denk aan verificatie, kwaliteitscontrole, en fysieke handelingen. 125.000 aanmeldingen in de eerste week. Het laat zien dat de toekomst niet puur AI of puur mens is, maar een hybride model waarin agents het zware werk doen en mensen bijspringen waar het misgaat.








