Andrew Carnegie gaf zijn managers ooit één opdracht mee: "Watch the costs and the profits will take care of themselves." Honderd jaar later geldt precies diezelfde regel voor AI. Alleen vervang je "costs" vandaag door tokens.
Wat is een token?
Een AI-model leest geen tekst zoals wij dat doen. Het knipt elke zin eerst op in kleine stukjes - zogenaamde tokens - en zet die om in cijfers waarmee het kan rekenen. Soms is een token een volledig woord, soms een deel ervan, soms een leesteken. Elke prompt, elk document en elke tussenstap van een agent wordt zo afgerekend per token. Tokens zijn, met andere woorden, de brandstof van AI. Geen tokens, geen agents.
En die brandstof betaal je per stuk.
De prijs daalt, je factuur stijgt
De prijs per token is de voorbije jaren fors gedaald. Voor sommige frontier-modellen met 75% of meer. AI is dus goedkoper geworden. Of dat zou je toch denken.
In 2024 stuurde je een vraag naar een model en kreeg je een antwoord: zo'n 2.000 tokens, een paar cent. Een agent in 2026 werkt heel anders. Zo’n agent roept sub-agents aan, doet tool calls, haalt data op, valideert resultaten en probeert opnieuw. Eén taak die vroeger 2.000 tokens kostte, verbruikt nu al snel een half miljoen. De prijs per token daalde met 75%, maar het verbruik per taak ging 250 keer omhoog. Het resultaat is een factuur die niet daalt, maar vermenigvuldigt.
Dat verbruik blijft bovendien groeien. Modellen kunnen meer, context windows worden groter, agents zetten meer stappen en pakken complexere taken aan. Een lage tokenprijs maal explosief verbruik levert geen besparing op, maar een hogere totale AI-factuur.
Tokenstrategie
De cijfers laten zien hoe snel dit op iedereen afkomt. Volgens McKinsey gebruikt 88% van de organisaties vandaag AI in minstens één bedrijfsfunctie, tegenover 78% een jaar eerder. 62% experimenteert met AI agents, maar amper 23% schaalt die effectief op. Gartner verwacht dat tegen eind 2026 zo'n 40% van de enterprise-applicaties task-specific agents zal bevatten, tegenover minder dan 5% in 2025.
Meer adoptie, meer agents, meer stappen per taak. Allemaal verbruiken ze tokens. En de rekening laat zich voelen: Gartner voorspelt dat tegen eind 2027 meer dan 40% van de agentic-AI-projecten opnieuw wordt stopgezet, onder meer door oplopende kosten en onduidelijke business value.
Want dat is wat er gebeurt als je AI bouwt zonder tokenstrategie: je graaft een bodemloze put.
De vraag die je je écht moet stellen
De meeste bedrijven meten het verkeerde. Ze tellen hoeveel tokens ze verbruiken. Veel interessanter is een andere vraag: hoeveel waarde halen we uit elke euro aan tokens?
Want goedkoop is relatief. Het goedkoopste model is niet hetzelfde als de goedkoopste workflow. Een goedkoop model dat een taak drie keer fout doet, kost je misschien meer dan een duur model dat het in één keer juist doet. Omgekeerd is veel werk pure overkill: simpele taken die perfect door een klein, goedkoop model kunnen, maar die uit gemakzucht naar het zwaarste model gaan.
En nee, self-hosting is niet de gratis uitweg. Hardware, elektriciteit, onderhoud, latency, lagere kwaliteit en developer time tellen allemaal mee. Self-hosting wint pas bij hoog en voorspelbaar volume… Voor de meeste bedrijven dus niet.
De knoppen waar je wél aan kan draaien zijn intussen bekend: model routing, context discipline, indexing en RAG, caching, compression, een budget per agent-run en duidelijke output limits. Stuk voor stuk technische keuzes met een directe impact op je factuur.
Van adoptie naar governance
De eerste AI-bedrijven werden groot door adoptie: zoveel mogelijk mensen, zoveel mogelijk tools, zoveel mogelijk verbruik. Dat begint stilletjesaan te veranderen. De AI-bedrijven die willen winnen, moeten focussen op efficiëntie. Wanneer tokens de nieuwe arbeidseenheid worden, met een kost per agent en een token-ROI, kan je die net zo goed opvolgen als de prestaties van een team.
Daarom moeten bedrijven die AI gebruiken al beginnen met verschuiven van adoptie naar governance: budgetten, dashboards en heldere usage policies. Hoe kan je merken of je te veel aan AI uitgeeft? Stel jezelf een paar vragen. Wanneer je niet kan zeggen hoeveel AI per team, project of klant kost, wanneer je verbruik meet maar geen output, of wanneer je AI-kost sneller stijgt dan je marge, dan weet je dat er iets mis is.
Watch your tokens
Elke euro aan tokens moet meer dan één euro aan waarde creëren. Dat is tokenomics in één zin.
AI gaat niet verdwijnen, maar inefficiënte AI wordt wel onbetaalbaar. Daarom bouwen wij bij Wisemen geen AI experimentjes “voor de show”, maar business-kritische applicaties waarin agents veilig, schaalbaar én meetbaar waarde creëren, gekoppeld aan je CRM, ERP, planningstool of klantportaal, met de governance om elke token te verantwoorden.
Carnegie zou het vandaag zo zeggen: Gentlemen, watch your (costs) tokens.











