Die Entwicklung im Bereich der Künstlichen Intelligenz (KI) schreitet rasant voran. Besonders im Bereich der großen Sprachmodelle (LLMs) ist ein dynamischer Wettbewerb zwischen westlichen und östlichen Unternehmen zu beobachten. Während die USA lange Zeit als Vorreiter galten, drängen chinesische Firmen zunehmend auf den Markt und präsentieren leistungsstarke Modelle, die mit etablierten westlichen LLMs konkurrieren.
Zwei chinesische Unternehmen, die in letzter Zeit besondere Aufmerksamkeit erregt haben, sind DeepSeek und Alibaba mit seiner Qwen-Modellfamilie. DeepSeek hat mit dem DeepSeek-R1, einem KI-Modell mit Fokus auf logisches Denken und Schlussfolgerungen, ein beachtliches Ergebnis erzielt. In Benchmarks wie AIME und MATH, die die Leistungsfähigkeit von KI-Modellen in Mathematik und anderen wissenschaftlichen Bereichen messen, erreicht DeepSeek-R1 laut den Entwicklern das Niveau von OpenAIs o1-Modellen.
Alibaba hat mit Qwen ebenfalls eine Reihe von LLMs veröffentlicht, die in verschiedenen Benchmarks überzeugen. Besonders hervorzuheben ist die Open-Source-Strategie von Alibaba, die die Community-Entwicklung fördert und die Weiterentwicklung der Modelle beschleunigt. Die mehrsprachigen Fähigkeiten von Qwen, das in 29 Sprachen trainiert wurde, stellen einen weiteren Vorteil dar und erweitern den Zugang zu fortschrittlichen KI-Technologien für eine größere Nutzerbasis.
Sowohl DeepSeek als auch Alibaba setzen mit ihren neuesten Modellen, DeepSeek-R1 und QwQ, auf verbesserte "Reasoning"-Fähigkeiten. Diese Modelle sind darauf trainiert, komplexe Probleme gründlicher zu analysieren und schrittweise zu lösen, bevor sie eine Antwort liefern. Dies führt zwar in der Regel zu längeren Antwortzeiten, soll aber die Genauigkeit und die Fähigkeit zur Lösung komplexer Aufgaben verbessern.
Trotz der beeindruckenden Fortschritte stehen chinesische KI-Unternehmen auch vor Herausforderungen. Die US-amerikanischen Handelsbeschränkungen im Bereich der Halbleitertechnologie erschweren den Zugang zu leistungsstarker Hardware, die für das Training komplexer KI-Modelle benötigt wird. Zudem müssen sich chinesische Unternehmen an die regulatorischen Vorgaben der chinesischen Regierung halten, was sich in der Zurückhaltung der Modelle bei politisch sensiblen Themen zeigt.
Ein weiterer Aspekt ist die Frage nach der Offenheit der Modelle. Während Alibaba einige Qwen-Modelle als Open Source veröffentlicht hat, sind die Details zur Architektur und zum Trainingsprozess oft begrenzt. Dies erschwert die Reproduzierbarkeit der Ergebnisse und die unabhängige Überprüfung der Leistungsfähigkeit.
Die Entwicklung im Bereich der LLMs ist dynamisch und der Wettbewerb zwischen den verschiedenen Anbietern wird sich weiter intensivieren. Chinesische Unternehmen wie DeepSeek und Alibaba haben gezeigt, dass sie in der Lage sind, leistungsstarke KI-Modelle zu entwickeln, die mit etablierten westlichen LLMs konkurrieren können. Die Open-Source-Strategie, die mehrsprachigen Fähigkeiten und der Fokus auf "Reasoning" stellen wichtige Differenzierungsmerkmale dar. Es bleibt abzuwarten, wie sich der Wettbewerb in Zukunft entwickelt und welche Rolle chinesische KI-Modelle im globalen Kontext spielen werden.
Bibliographie: - Heise Online: DeepSeek-R1: New AI language model with reasoning from China against OpenAI o1 - LinkedIn: Niels Rogge's Post about recent developments in open AI - Medium: The Shifting Sands of AI: How Alibaba’s Qwen Signals China’s Rise in the Global LLM - GitHub: NielsRogge - YouTube: China's 'DeepSeek R1' DEFEATS OpenAI's o1! - Rest of World: China’s biggest AI model is challenging American dominance - Reddit: Chinese AI startup Stepfun up near the top on - YouTube: China STUNS OpenAI With NEW Model That BEATS o1 (DeepSeek-R1-Lite)