Kurz gesagt, DeepSeek, eine chinesische KI-Chatbot-App, hat sich innerhalb kürzester Zeit einen Namen in der globalen Landschaft der künstlichen Intelligenz gemacht. Sein rasanter Aufstieg – durch den Apple App Store und die Google Play-Charts – ist ein starker Konkurrent für westliche KI-Giganten, dessen Einsatz zu Kontroversen über Datensicherheit, Geopolitik und KI-Innovationen führt. Der Artikel versucht, einen umfassenden und aktuellen Überblick über den Hintergrund, die Technologie, das Geschäftsmodell, die Kontroversen und die Auswirkungen von DeepSeek auf die gesamte KI-Branche zu geben.
Origins: From Quantitative Trading to AI Research
Die Geschichte von DeepSeek beginnt in der Welt der quantitativen Finanzen. Im Jahr 2015 war Liang Wenfeng, ein KI-Enthusiast und Zhejiang-Absolvent, Mitbegründer von High-Flyer Capital Management, einem Hedgefonds, der sich mit algorithmischem Handel unter Verwendung überlegener statistischer Methoden und Deep Learning beschäftigt. High-Flyer investierte viel Kapital in die Einrichtung von GPU-Clustern und eröffnete eine KI-Forschungsabteilung, um seine datenintensiven Aktivitäten zu unterstützen.
Im Jahr 2023 gliederte High-Flyer diese Forschungsabteilung als DeepSeek aus, um grundlegende KI-Modelle zu entwickeln und künstliche allgemeine Intelligenz (AGI) zu erforschen. Anstatt erfahrene Industrieveteranen zu rekrutieren, stellte DeepSeek offensiv Doktoranden von Chinas Spitzenuniversitäten ein und förderte so eine Kultur der intensiven Forschung und schnellen Innovation. Dieser einzigartige Ansatz, der Spitzenforschung Vorrang vor unmittelbaren kommerziellen Erträgen einräumt, wurde zu einem Eckpfeiler des Erfolgs von DeepSeek.
Technische Innovationen und Modellpalette
Computereffiziente Ausbildung
Die Modelle von DeepSeek zeichnen sich durch ihre Recheneffizienz aus. Trotz des US-Exportverbots für High-End-KI-Hardware, das das Unternehmen dazu zwang, auf weniger leistungsstarken Nvidia-H800-Chips zu trainieren (im Vergleich zu den H100-Chips, die US-Firmen zur Verfügung stehen), gelang es DeepSeek, Modelle zu entwickeln, die in puncto Leistung und Kosteneffizienz mit westlichen Pendants konkurrieren oder diese sogar übertreffen.
Modellfreigaben
DeepSeek Coder, DeepSeek LLM, und DeepSeek Chat: Diese ersten Modelle, die im November 2023 auf den Markt kamen, legten den Grundstein für die späteren Durchbrüche von DeepSeek.
DeepSeek-V2: Dieses im Frühjahr 2024 auf den Markt gebrachte universelle Text- und Bildmodell übertraf die Benchmarks der Branche und kostete deutlich weniger als alle seine Konkurrenten. Das Aufkommen von DeepSeek-V2 zwang ByteDance und Alibaba, ihre Preise zu senken oder ihre eigenen Modelle kostenlos anzubieten.
DeepSeek-V3: V3 wurde im Dezember 2024 auf den Markt gebracht und war angeblich bei allen internen Benchmarks besser als Open-Source-Modelle wie Metas Llama und auch geschlossene Modelle wie OpenAIs GPT-4o.
DeepSeek-R1: R1 wurde im Januar 2025 veröffentlicht und ist ein Logikmodell, das auf die Überprüfung von Fakten und das Lösen komplexer Probleme ausgerichtet ist. Es entspricht dem o1-Modell von OpenAI in den wichtigsten Benchmarks für logisches Denken und ist besonders stark in MINT-Fächern, bei der Analyse von Dokumenten und bei Aufgaben, die sich an Anweisungen orientieren.
Technische Herangehensweise: Verstärkungslernen für Reasoning
Das herausragende Merkmal von DeepSeek-R1 ist die Verwendung von groß angelegtem Verstärkungslernen (Reinforcement Learning, RL) zur Entwicklung von Argumentationsfähigkeiten, anstatt sich ausschließlich auf eine überwachte Feinabstimmung zu verlassen. Dieser Ansatz führte zu signifikanten Verbesserungen bei Aufgaben, die langes Kontextverständnis, mathematisches Denken und faktische Genauigkeit erfordern. Beim AIME 2024-Benchmark beispielsweise stieg der pass@1-Score von R1 nach RL von 15,6 % auf 71,0 %, und mit Mehrheitsabstimmung erreichte er 86,7 % und entsprach damit dem Modell o1-0912 von OpenAI.
Das Unternehmen destillierte auch die logischen Fähigkeiten von R1 in kleinere, leichter zugängliche Modelle, die die neuesten Open-Source-Äquivalente in logischen Benchmarks übertrafen.
Geschäftsmodell: Disruption durch Kosten und Offenheit
Die Geschäftsstrategie von DeepSeek ist ebenso unkonventionell wie sein technischer Ansatz. Das Unternehmen bietet seine Modelle und Dienstleistungen zu Preisen an, die weit unter dem Marktwert liegen, wobei einige Produkte sogar kostenlos erhältlich sind. Diese aggressive Preisgestaltung hat Konkurrenten dazu gezwungen, nachzuziehen und die etablierten Ertragsmodelle im KI-Sektor zu stören.
Bemerkenswert ist, dass DeepSeek trotz des starken Interesses von Risikokapitalgebern kein Geld von außen aufgenommen hat und stattdessen auf Effizienzsteigerungen setzt, um seine Wettbewerbsfähigkeit zu erhalten. Obwohl einige Experten die Nachhaltigkeit dieser Behauptungen anzweifeln, hat die Strategie eine große Entwicklergemeinde angezogen. Auf Hugging Face wurden mehr als 500 abgeleitete Modelle von DeepSeek R1 erstellt, die 2,5 Millionen Mal heruntergeladen wurden.
Obwohl die DeepSeek-Modelle nicht im engeren Sinne „quelloffen“ sind, werden sie unter freizügigen Lizenzen vertrieben, die eine kommerzielle Nutzung zulassen, was die Verbreitung und Innovation weiter beschleunigt.
Auswirkungen in der realen Welt und Reaktion der Industrie
Marktstörung
Der schnelle Aufstieg von DeepSeek hatte spürbare Auswirkungen auf den globalen KI-Markt. Sein Erfolg trug dazu bei, dass der Aktienkurs von Nvidia im Januar 2025 um 18 % einbrach, und führte zu öffentlichen Reaktionen von Branchenführern wie OpenAI-CEO Sam Altman und Meta-CEO Mark Zuckerberg. Microsoft stellt zwar das R1-Modell von DeepSeek auf Azure AI Foundry zur Verfügung, hat aber seinen Mitarbeitern die Nutzung der DeepSeek-App aufgrund von Bedenken hinsichtlich Datensicherheit und Propaganda untersagt.
Annahme und Verwendung
DeepSeek hatte im März 2025 mehr als 16,5 Millionen Besuche und war zu diesem Zeitpunkt der am zweithäufigsten genutzte Chatbot der Welt, hinter ChatGPT mit mehr als 500 Millionen wöchentlich aktiven Nutzern. Entwickler und Unternehmen experimentieren zunehmend mit den Modellen von DeepSeek, da sie von deren Leistung und der freizügigen Lizenzierung überzeugt sind.
Kontroversen: Sicherheit, Zensur und Geopolitik
Datenschutz und Sicherheitsbedenken
Der chinesische Ursprung von DeepSeek und seine Datenpraktiken haben eine erhebliche Kontroverse ausgelöst. Da chinesische Server Nutzerdaten speichern, werden sie durch chinesische Gesetze reguliert, was Zweifel an staatlichem Zugriff und Überwachung aufkommen lässt. Darüber hinaus entsprechen die Modelle von DeepSeek den chinesischen Internetvorschriften, indem sie Themen zensieren, die die Regierung für sensibel hält, wie den Platz des Himmlischen Friedens und Taiwan.
Globale Verbote und Beschränkungen
Eine wachsende Zahl von Ländern und Organisationen hat DeepSeek verboten oder eingeschränkt, insbesondere auf Geräten von Behörden, und begründet dies mit Risiken für die nationale Sicherheit und den Datenschutz:
- Vereinigte Staaten: Die Navy, das Pentagon, die NASA und mehrere Bundesbehörden haben DeepSeek blockiert, wobei Texas auf bundesstaatlicher Ebene die meisten Verbote ausgesprochen hat.
- Australien: Alle Regierungsbehörden sind verpflichtet, DeepSeek-Produkte von ihren Systemen zu entfernen.
- Italien: Die italienische Datenschutzbehörde hat DeepSeek wegen Bedenken hinsichtlich der Datenverarbeitung verboten.
- Taiwan und Südkorea: Beide Länder haben DeepSeek in Behörden und kritischen Infrastrukturbereichen verboten.
- Indien: Das Finanzministerium hat sein Verbot von KI-Tools auf DeepSeek ausgeweitet.
Auch Microsoft hat die Nutzung von DeepSeek durch Mitarbeiter verboten, und der Bundesstaat New York hat die Nutzung auf Regierungsgeräten untersagt.
Der Weg in die Zukunft: Herausforderungen und Chancen
Die Zukunft von DeepSeek bleibt ungewiss. Es wird erwartet, dass das Unternehmen seine Modelle weiter verbessert, aber es sieht sich einer zunehmenden behördlichen Kontrolle und geopolitischem Gegenwind gegenüber. Berichten zufolge erwägt die US-Regierung ein landesweites Verbot von DeepSeek für Regierungszwecke, und andere Länder könnten diesem Beispiel folgen.
Trotz dieser Herausforderungen haben die technischen Errungenschaften und das disruptive Geschäftsmodell von DeepSeek die globale KI-Landschaft umgestaltet. Sein Fokus auf Argumentation, Kosteneffizienz und Zugänglichkeit für Entwickler hat neue Maßstäbe in der Branche gesetzt und etablierte Akteure gezwungen, sich anzupassen.
Schlussfolgerung
DeepSeek hat sich von einem von Hedge-Fonds unterstützten Forschungslabor zu einem globalen KI-Disruptor entwickelt, der den wachsenden Wettbewerb und die geopolitischen Herausforderungen der Branche widerspiegelt. Die neuartigen Systeme, die aggressiven Preise und die schnelle Akzeptanz des Unternehmens haben die westlichen KI-Märkte verunsichert und Bedenken hinsichtlich Datenschutz, Sicherheit und staatlicher Einflussnahme auf die Technologie geweckt. Während verschiedene Akteure mit diesen Fragen ringen, deutet die Entwicklung von DeepSeek auf mögliche Verschiebungen bei der KI-Innovation, der Regulierung und dem globalen Wettbewerb hin. Um die Zukunft der künstlichen Intelligenz zu begreifen, müssen Entwickler, Unternehmen und politische Entscheidungsträger DeepSeek verstehen.