Xiaomi und DeepSeek senken Preise für KI-Token drastisch: Bis zu 99% Rabatt

LGR Reutlingen – 28 Mai 2026 | In einem unerwarteten Schachzug haben die chinesischen KI-Anbieter Xiaomi und DeepSeek ihre API-Preise für AI-Token drastisch gesenkt, was den globalen Wettbewerb um große Sprachmodelle neu belebt. Ab dem 27. Mai 2026 bietet Xiaomi mit seiner MiMo-V2.5-Serie Preisnachlässe von bis zu 99 Prozent an. Parallel dazu hat DeepSeek die zuvor befristete Rabattaktion für sein Flaggschiffmodell V4-Pro in einen dauerhaften Preis gesenkt, wodurch die Nutzungskosten auf ein Viertel des ursprünglichen Niveaus fallen.
Diese Maßnahmen zielen gezielt auf zahlende Enterprise-Kunden und Entwickler:innen ab, die täglich Milliarden von Token verarbeiten. Für sie stellt der Preis pro Million Token mittlerweile eine der entscheidendsten betriebswirtschaftlichen Kennzahlen dar.
Preisreduktionen bei Xiaomi und DeepSeek
Xiaomi positioniert sich mit der MiMo-V2.5-Reihe als klarer Preisbrecher. Der Konzern, unter der Führung von CEO Lei Jun, plant bis 2029 Investitionen von mindestens 8,7 Milliarden US-Dollar in KI. Zu den wichtigsten Ankündigungen gehören:
- Die API-Preise der gesamten V2.5-Serie sinken um bis zu 99 Prozent im Vergleich zum bisherigen Tarif. Die vorherige Unterscheidung nach Eingabelänge entfällt, stattdessen wird ein einheitlicher Preis pro Million Token angeboten.
- Bestandskund:innen mit aktivem „Token Plan“ erhalten künftig fünf- bis achtmal so viele nutzbare Credits zum gleichen Preis.
- Bereits verbrauchte Credits von laufenden Paketen werden zum Stichtag vollständig zurückgesetzt, um die Kundenbindung zu stärken.
- Das Ende April gestartete „100 Trillion Token Creator Incentive“-Programm wurde vorzeitig beendet, da das gesamte Token-Volumen bereits ausgeschüttet wurde.
Auf Drittanbieter-Plattformen wie OpenRouter wird MiMo-V2.5-Pro derzeit für 0,435 US-Dollar pro Million Input-Token und 0,87 Dollar pro Million Output-Token gelistet. Das Modell bietet ein Kontextfenster von einer Million Token und konkurriert laut Xiaomi mit westlichen Top-Anbietern.
DeepSeek hingegen hat seine temporäre Rabattaktion für das V4-Pro-Modell in einen Dauerpreis umgewandelt. Die API-Preise liegen nun zwischen 0,025 und 6 Yuan pro Million Token, was umgerechnet etwa 0,0035 bis 0,83 US-Dollar entspricht. Vor der Anpassung lagen die Preise noch zwischen 0,1 und 24 Yuan. Die exakte Höhe hängt von der Art der Nutzung ab, ob es sich um Texteingaben oder die rechenintensivere Textgenerierung handelt.
Preisdruck und strategische Überlegungen
Die entscheidende Frage für westliche Anbieter und Investor:innen ist, wie es chinesischen Unternehmen gelingt, Preise zu verlangen, die nur einen Bruchteil dessen betragen, was Unternehmen wie OpenAI oder Anthropic aufrufen, ohne dabei strukturelle Verluste zu schreiben. Die Antwort liegt in einer Kombination aus Hardware, Software und politischer Ökonomie.
1. Inferenz-Optimierung auf Software-Ebene: Xiaomi hat in seiner Ankündigung offenbart, dass das Inferenz-Team eine grundlegende Umstrukturierung der KV-Cache-Architektur vorgenommen hat. Durch den Einsatz von SGLang HiCache in Kombination mit Sliding Window Attention (SWA) wird das Datenvolumen, das zwischen den Speicherebenen transferiert werden muss, auf etwa ein Siebtel des bisherigen Wertes gesenkt.
2. Eigene Hardware-Strategie: DeepSeek setzt für sein V4-Modell konsequent auf Huawei Ascend 950-Halbleiter anstelle der schwer zu beschaffenden Nvidia-GPUs. Diese Strategie könnte sich als kosteneffizienter erweisen, da Ascend-Chips in China günstiger erhältlich sind.
3. Politische Ökonomie: Sollte sich der Einstieg des „Big Fund III“ bestätigen, würde DeepSeek faktisch zum staatlich mitfinanzierten Champion, der nicht primär auf kurzfristige Profitabilität angewiesen ist, sondern strategische Marktanteile in einem geopolitisch umkämpften Sektor gewinnen soll.
Für westliche Anbieter wird die Situation zunehmend herausfordernd. OpenAI und Anthropic verlangen für ihre Spitzenmodelle pro Million Token typischerweise ein Vielfaches dessen, was DeepSeek und Xiaomi nun anbieten. Bei einfachen Anwendungen wie Klassifikation und Übersetzung wird die Wechselbarriere weiter sinken. Komplexere Aufgaben, die qualitativ hochwertige Modelle, Sicherheits-Tooling und Enterprise-Integration erfordern, bleiben jedoch Differenzierungsmerkmale.
Für Startups und Entwickler:innen bedeutet dies, dass KI-Modelle zunehmend wie Infrastruktur behandelt werden, was die Kosten für die Validierung von Ideen mit KI-Backends erheblich senkt. Mittel- bis langfristig könnte sich die Wertschöpfung von den reinen Modellen hin zu Datenintegration, Tooling, Sicherheit und vertikaler Expertise verschieben.
Die aggressive Preispolitik der chinesischen Anbieter könnte auch die westlichen Märkte unter Druck setzen. Ob und wie schnell Open-Source-Alternativen die Differenz in der Modellqualität ausgleichen, wird entscheidend sein für die Zukunft des Wettbewerbs.
Verwandte Artikel

Micron und SK Hynix im Billionen-Dollar-Club – dank der Speicherkrise und AI
LGR Reutlingen – 28 Mai 2026 | Ein historischer Moment für die Halbleiterindustrie: Die beiden Branchenriesen Micron und SK Hynix haben die beeindruckende Mark…

Markenstrategien im Zero-Click-Zeitalter: Sichtbarkeit durch KI-Optimierung sichern
LGR Reutlingen – 28 Mai 2026 | Im digitalen Zeitalter, in dem Nutzer zunehmend auf KI-Dienste wie ChatGPT oder Googles AI Overviews zurückgreifen, wird die Sic…

Micron und SK Hynix erreichen eine Billion Dollar – KI treibt historischen Boom bei Speicherchips voran
LGR Reutlingen – 28 Mai 2026 | Ein historischer Moment für die Halbleiterindustrie: Sowohl der US-Riese Micron als auch der südkoreanische Marktführer SK Hynix…

Xiaomi senkt die API-Kosten um 99 Prozent: Chinas KI-Preiskrieg eskaliert
LGR Reutlingen – 28 Mai 2026 | In einer dramatischen Wende im globalen Wettbewerb um große Sprachmodelle hat Xiaomi die Preise für seine API-Dienste um bis zu…