Tokenmaxxing: Produktivität auf der Kippe?

27. Mai 2026 um 14:27·LGR Reutlingen Redaktion

LGR Reutlingen – 27 Mai 2026 | In der Tech-Branche sorgt ein neuer Begriff für Aufsehen: Tokenmaxxing. Dabei handelt es sich um die Praxis, den Verbrauch von AI-Tokens zu maximieren, um interne Produktivitätsziele zu erreichen oder sich auf firmeninternen Ranglisten einen Platz an der Spitze zu sichern. Diese Entwicklung nimmt insbesondere nach der jüngsten Google I/O-Keynote Fahrt auf, bei der CEO Sundar Pichai den Begriff explizit erwähnte. Doch während einige Unternehmen den Tokenverbrauch als Erfolgsmesser betrachten, warnen Experten vor den wirtschaftlichen Folgen, die diese Praxis mit sich bringen kann.

Ein besonders eindrucksvolles Beispiel für die massiven Ausgaben durch Tokenmaxxing liefert Peter Steinberger, Gründer von OpenClaw und derzeit bei OpenAI tätig. Auf der Plattform X teilte er einen Screenshot, der belegte, dass er in nur 30 Tagen Tokens im Wert von rund 1,3 Millionen Dollar für OpenAIs Coding-Agenten Codex verbraucht hat. Dieses Beispiel verdeutlicht, wie schnell der Tokenverbrauch von einem Insider-Witz zu einem ernsthaften Kostenproblem avancieren kann.

Der Begriff selbst hat seine Wurzeln im Gen-Z-Slang, ähnlich wie „looksmaxxing“ oder „sleepmaxxing“. Im April 2026 wurde Tokenmaxxing durch einen Bericht des Branchenmediums The Information populär, der von einem internen Dashboard bei Meta Platforms berichtete. Ein Mitarbeiter hatte ein Leaderboard mit dem Titel „Claudeonomics“ ins Leben gerufen, das Kollegen nach ihrem individuellen Tokenverbrauch einordnete und Titel wie „Token Legend“ und „Cache Wizard“ vergab. Laut den Berichten verbrauchten Meta-Mitarbeitende in nur 30 Tagen satte 60 Billionen Tokens, wobei der Spitzenreiter auf etwa 281 Milliarden Tokens kam – ein Betrag, der bei den aktuellen API-Preisen Millionen kosten kann. Das Dashboard wurde daraufhin schnell wieder offline genommen.

Ähnliche interne Wettbewerbe wurden auch bei Microsoft und Amazon dokumentiert. Pichai räumte auf der I/O-Bühne ein, dass einige von diesen Praktiken als Tokenmaxxing bezeichnet werden könnten und dass es durchaus einen wahren Kern darin gebe. Google verarbeitet mittlerweile beeindruckende 3,2 Billiarden Tokens pro Monat – ein Anstieg von 9,7 Billionen vor zwei Jahren.

Ein weiteres besorgniserregendes Beispiel ist der Fall von Uber. Der CTO Praveen Neppalli Naga gab in einem Interview mit The Information zu, dass das Unternehmen sein gesamtes Jahresbudget für 2026 bereits nach vier Monaten für Tools wie Claude Code und Cursor aufgebraucht hatte. Die Nutzung von Claude Code stieg im ersten Quartal 2026 von 32 auf 84 Prozent der Ingenieure. Bei etwa 5.000 Ingenieuren gibt jeder Einzelne monatlich zwischen 500 und 2.000 US-Dollar für AI-Tools aus – das summiert sich schnell auf Millionenbeträge. Uber-Präsident Andrew Macdonald sprach von einem „head-exploding moment“ und stellte infrage, ob die höheren Token-Ausgaben tatsächlich zu einem proportionalen Anstieg der Produktivität führen. Sein Fazit: Obwohl mehr Features bereitgestellt werden, lässt sich keine direkte Verbindung zwischen Tokenverbrauch und einem signifikanten Anstieg nützlicher Funktionen herstellen.

Die Reaktion von Microsoft auf ähnliche Kostenexplosionen war drastisch: Tausenden interner Ingenieure wurde der Zugang zu Claude Code entzogen, um im Hinblick auf das neue Fiskaljahr Kosten zu sparen.

In dieser Debatte meldet sich nun auch Eugene Cheah, CEO und Mitgründer von Featherless.ai, zu Wort. Er warnt die Branche davor, den Tokenverbrauch als Maßstab für den Erfolg zu nutzen. „Token-Nutzung ist eine Metrik, aber extremer Verbrauch im Gewand von Tokenmaxxing ist in den meisten Fällen kein nachhaltiges Geschäftsmodell“, erklärt Cheah. „Es ist ein plumpes Mittel, um Erfolg zu messen. Nicht alle Tokens sind gleich; unterschiedliche Aktionen erzeugen unterschiedliche Returns für Unternehmen.“

Cheah ist überzeugt, dass die nächste Phase der Enterprise-AI nicht auf Maximierung, sondern auf Token-Minimierung ausgerichtet sein wird. „Jedes unnötig generierte Token wirkt wie eine direkte Steuer auf die Produktivität eines Unternehmens“, warnt er. „Smartere Architekturen setzen auf kleinere, spezialisierte Modelle, die mit einem Bruchteil der Rechenleistung präzise Ergebnisse liefern können.“ In naher Zukunft werden die besten AI-Frameworks daran gemessen werden, wie wenig sie tatsächlich generieren müssen, um eine Aufgabe zu erfüllen.

Ein weiterer Punkt, den Cheah hervorhebt, ist der Anfangseffekt, der bei neuen AI-Produkten häufig auftritt: „Ein Anstieg des Tokenverbrauchs ist in den frühen Tagen eines neuen Produkts normal, besonders wenn die Einstiegspreise niedrig sind. Die wahre Nachfrage und die langfristige Tragfähigkeit einer AI-Plattform zeigen sich jedoch erst, wenn die Preise sich normalisieren und die tatsächlichen Kosten für Unternehmen anfallen.“

Das Phänomen Tokenmaxxing wird zunehmend als Beispiel für Goodharts Gesetz interpretiert – die Beobachtung, dass eine Kennzahl ihre Aussagekraft verliert, sobald sie zum Ziel erklärt wird. Cristina Cordova, COO von Linear, brachte es auf den Punkt: Ingenieure nach Tokenausgaben zu bewerten, ist vergleichbar mit der Beurteilung eines Marketing-Teams nach den Ausgaben.

Es gibt jedoch auch Verteidiger dieser Praktiken. Garry Tan, CEO von Y Combinator, hat Tokenmaxxing positiv kommentiert, und Meta-CTO Andrew Bosworth erklärte gegenüber Forbes, dass sein bester Ingenieur das Äquivalent seines Gehalts in Tokens ausgibt, dabei jedoch „fünf- bis zehnmal produktiver“ sei.

Die Tech-Riesen scheinen die Bedenken ernst zu nehmen. Pichai stellte Gemini 3.5 Flash als Lösung für die Herausforderungen des Tokenmaxxings vor. Ein Kunde, der täglich eine Billion Tokens verbraucht, könnte durch die Verlagerung von 80 Prozent seiner Workloads auf Flash jährlich über eine Milliarde US-Dollar einsparen.

Die Lehren aus den Fällen von Meta, Uber und Microsoft sowie die Warnungen von Cheah sind klar: Unternehmen, die im Jahr 2026 noch immer glauben, dass mehr Tokens zwangsläufig zu mehr Produktivität führen, könnten bei der nächsten Rechnung überrascht werden.

#AI-Tools #Google #Kostenmanagement #Künstliche Intelligenz #Produktivität #Technologie #Tokenmaxxing #Unternehmen

Tokenmaxxing: Produktivität auf der Kippe?

Verwandte Artikel

Google warnt vor verwaisten Apps im Play Store ohne Updates

Tokenmaxxing: Ein direkter Steuer auf die Produktivität

NordVPN wird zur Sicherheitszentrale: KI-Antivirus ab 27. Mai

Tokenmaxxing: Produktivität auf der Kippe?

Verwandte Artikel

Google warnt vor verwaisten Apps im Play Store ohne Updates

Tokenmaxxing: Ein direkter Steuer auf die Produktivität

NordVPN wird zur Sicherheitszentrale: KI-Antivirus ab 27. Mai