OpenAI präsentiert o3: Fortschritte in der KI-Technologie

Kategorien:
No items found.
Freigegeben:
December 21, 2024

Artikel jetzt als Podcast anhören

OpenAIs neues Sprachmodell o3: Ein Sprung in der KI-Entwicklung?

OpenAI hat mit o3 und o3-Mini die Nachfolger seiner erst kürzlich veröffentlichten Reasoning-Modelle o1 und o1-Mini vorgestellt. o3 verspricht durch einen komplexeren "Denkprozess" deutliche Leistungssteigerungen in verschiedenen Bereichen wie Softwareentwicklung, Mathematik und naturwissenschaftlichen Disziplinen.

Bahnbrechende Leistung in Benchmarks

In diversen Benchmarks setzt o3 neue Maßstäbe. Beim AGI-Benchmark ARC Prize, einem Indikator für Fortschritte in Richtung Künstlicher Allgemeiner Intelligenz (AGI), erreicht o3 mit Standard-Rechenleistung 75,7 Prozent und mit erhöhter Rechenleistung sogar 87,5 Prozent. Beeindruckend sind auch die Ergebnisse im Bereich Mathematik: Bei der American Mathematical Olympiad (AIME) 2024 löste o3 96,7 Prozent der Aufgaben. Im Frontier Math Benchmark von EpochAI, der für seine Schwierigkeit bekannt ist, erzielte o3 25,2 Prozent – eine erhebliche Verbesserung gegenüber Vorgängermodellen, die die 2-Prozent-Marke nicht überschreiten konnten. Auch in der Softwareentwicklung zeigt o3 mit einer Genauigkeit von 71,7 Prozent eine Leistungssteigerung von 20 Prozent gegenüber o1. Im Bereich des kompetitiven Programmierens erreichte o3 einen Codeforces-Score von 2727 und übertraf damit sogar den Score des Chief Scientist von OpenAI. Bei Fragen auf PhD-Niveau in den Naturwissenschaften im GPT Diamond Benchmark erzielte o3 87,7 Prozent und liegt damit deutlich über dem Durchschnitt von etwa 70 Prozent, den Experten in ihren jeweiligen Fachgebieten erreichen.

Der Preis des Denkens

François Chollet, Entwickler des ARC-Benchmarks, beschreibt die Leistung von o3 als "überraschenden und wichtigen sprunghaften Anstieg der KI-Fähigkeiten". Im Gegensatz zu herkömmlichen Sprachmodellen, die hauptsächlich gespeicherte Muster abrufen, erstellt o3 in Echtzeit neue Programme, um unbekannte Herausforderungen zu lösen. Chollet vergleicht die Arbeitsweise von o3 mit Googles AlphaZero, das methodisch mögliche Lösungen durchsucht. Dieser Prozess erklärt den hohen Rechenleistungsbedarf von o3, das bis zu 33 Millionen Token für eine einzelne Aufgabe verarbeitet. Die hohe Rechenleistung geht mit erheblichen Kosten einher. Die High-Efficiency-Version kostet etwa 20 US-Dollar pro Aufgabe, was sich schnell summiert. Die Low-Efficiency-Version benötigt noch mehr Ressourcen – 172-mal mehr Rechenleistung als die High-Efficiency-Version.

(Noch) keine Künstliche Allgemeine Intelligenz

Trotz der beeindruckenden Ergebnisse betont Chollet, dass o3 noch keine AGI darstellt. Das System hat weiterhin Schwierigkeiten mit einigen grundlegenden Aufgaben und unterscheidet sich grundlegend von menschlicher Intelligenz. Echte AGI, so Chollet, wird erst erreicht sein, wenn keine Aufgaben mehr konstruiert werden können, die für Menschen einfach, für KI aber schwierig sind. Da o3 die Grenzen des aktuellen ARC-Benchmarks ausreizt, hat Chollet einen anspruchsvolleren Nachfolger für 2025 angekündigt. Erste Tests deuten darauf hin, dass o3 bei ARC-AGI-2 nur etwa 30 Prozent erreichen wird, während Menschen ohne spezielles Training etwa 95 Prozent der Aufgaben lösen können.

o3-Mini und Sicherheit

OpenAI plant, Ende Januar 2025 eine kostengünstigere Version namens o3-Mini zu veröffentlichen, gefolgt von der Vollversion. o3-Mini wird drei Geschwindigkeitseinstellungen (niedrig, mittel und hoch) bieten und selbst bei mittlerer Einstellung o1 übertreffen. In einer Live-Demo zeigte OpenAI, wie o3-Mini selbstständig Code generiert und ausführt. Die Mini-Version unterstützt auch API-Funktionen wie Funktionsaufrufe und strukturierte Ausgaben. Vor der Veröffentlichung startet OpenAI ein Sicherheitstestprogramm, für das Bewerbungen bis zum 10. Januar eingereicht werden können. Das Unternehmen führt außerdem "Deliberative Alignment" ein, einen neuen Sicherheitsansatz, der die Fähigkeiten des Modells nutzt, um bessere Sicherheitsgrenzen zu setzen. Die Namensgebung "o3" erklärt sich dadurch, dass "o2" aufgrund des Telekommunikationsunternehmens O2 aus markenrechtlichen Gründen ausgelassen werden musste.

Mindverse und die Zukunft der KI-Entwicklung

Die Entwicklungen rund um o3 unterstreichen das rasante Tempo der KI-Forschung und die zunehmende Bedeutung von Reasoning-Modellen. Für Unternehmen wie Mindverse, die maßgeschneiderte KI-Lösungen entwickeln, bieten diese Fortschritte neue Möglichkeiten. Von Chatbots und Voicebots über KI-Suchmaschinen bis hin zu Wissenssystemen – die Verbesserungen im Bereich des komplexen Denkens können die Entwicklung noch leistungsfähigerer und nützlicherer KI-Anwendungen vorantreiben.

Bibliographie: - https://www.zdnet.com/article/openai-unveils-its-most-advanced-o3-reasoning-model-on-its-last-day-of-shipmas/ - https://techcrunch.com/2024/12/20/openai-announces-new-o3-model/ - https://the-decoder.com/openai-unveils-o3-its-most-advanced-reasoning-model-yet/ - https://www.yahoo.com/tech/openai-unveils-o3-next-reasoning-192700606.html - https://news.az/news/openai-launches-its-most-advanced-ai-model-for-deeper-problem-solving - https://venturebeat.com/ai/openai-confirms-new-frontier-models-o3-and-o3-mini/ - https://uk.finance.yahoo.com/news/openai-unveils-more-advanced-reasoning-180002263.html - https://wandb.ai/byyoung3/ml-news/reports/OpenAI-Introduces-o3-Pushing-the-Boundaries-of-AI-Reasoning--VmlldzoxMDY3OTUxMA - https://www.marketscreener.com/quote/stock/MICROSOFT-CORPORATION-4835/news/OpenAI-unveils-o3-reasoning-AI-models-in-test-phase-48638988/ - https://news.bloomberglaw.com/ip-law/openai-unveils-more-advanced-reasoning-model-in-race-with-google
Was bedeutet das?

Wie können wir Ihnen heute helfen?

Das Expertenteam von Mindverse freut sich darauf, Ihnen zu helfen.