OpenAI hat kürzlich die Veröffentlichung seines neuesten Modells, o1, bekannt gegeben. Dieses Modell verspricht, durch verstärkte Rechenleistung und Selbstüberprüfung komplexe Aufgaben besser zu lösen als seine Vorgänger. Die Modelle o1-preview und o1-mini sind ab sofort in der Chatbot Arena verfügbar, wo sie von der Community getestet und bewertet werden können.
Das o1-Modell, intern als "Strawberry" bekannt, ist darauf ausgelegt, mehr Zeit mit der Berechnung von Antworten zu verbringen, bevor es auf Benutzeranfragen reagiert. Dies ermöglicht es dem Modell, mehrstufige Probleme zu lösen, einschließlich komplizierter mathematischer und programmiertechnischer Fragen. Es gibt zwei Versionen des Modells: o1-preview und o1-mini, wobei letztere eine kleinere, effizientere Version ist, die speziell für die Codegenerierung entwickelt wurde.
Abonnenten von ChatGPT Plus oder Team können das o1-Modell bereits in der ChatGPT-Anwendung nutzen. Enterprise- und Bildungsnutzer erhalten ab nächster Woche Zugang. Das Modell ist jedoch teuer: In der API kostet o1-preview 15 US-Dollar pro 1 Million Eingabetokens und 60 US-Dollar pro 1 Million Ausgabetokens. Dies ist dreimal so teuer wie GPT-4o für Eingabe- und viermal so teuer für Ausgabetokens.
Was o1 qualitativ von anderen generativen KI-Modellen unterscheidet, ist seine Fähigkeit, vor der Beantwortung von Anfragen "nachzudenken". Dies ermöglicht es dem Modell, Aufgaben ganzheitlich zu durchdenken, vorauszuplanen und eine Reihe von Aktionen über einen längeren Zeitraum hinweg auszuführen, um zu einer Antwort zu gelangen. Dadurch eignet sich o1 besonders gut für Aufgaben, die die Synthese von Ergebnissen mehrerer Unteraufgaben erfordern, wie z.B. das Erkennen privilegierter E-Mails in einem Anwalts-Posteingang oder das Brainstorming einer Produktmarketingstrategie.
In einer Qualifikationsprüfung für die Internationale Mathematik-Olympiade (IMO) löste o1 83% der Aufgaben korrekt, während GPT-4o nur 13% löste. OpenAI gibt außerdem an, dass o1 das 89. Perzentil der Teilnehmer erreichte, besser als das Flaggschiff-System AlphaCode 2 von DeepMind. Bei Problemen in den Bereichen Datenanalyse, Wissenschaft und Programmierung soll o1 besser abschneiden als seine Vorgänger.
Pablo Arredondo, VP bei Thomson Reuters, der Zugang zu o1 hatte, berichtete, dass das Modell besser als frühere OpenAI-Modelle bei der Analyse von juristischen Schriftsätzen und der Identifizierung von Lösungen für Probleme in LSAT-Logikspielen abschnitt. "Wir sahen, dass es substanzielle, facettenreiche Analysen durchführte," sagte Arredondo. "Unsere automatisierten Tests zeigten auch Verbesserungen bei einer Vielzahl von einfachen Aufgaben."
Es gibt jedoch auch Nachteile. OpenAI o1 kann langsamer sein als andere Modelle, je nach Anfrage. Arredondo sagt, dass o1 für einige Fragen über 10 Sekunden benötigt. Außerdem gibt es Berichte, dass o1 häufiger Halluzinationen hat, d.h. falsche Informationen selbstbewusst erstellt, und seltener zugibt, wenn es keine Antwort auf eine Frage hat.
OpenAI ist nicht der einzige Anbieter, der Methoden zur Verbesserung der Modellfaktualität untersucht. Forscher von Google DeepMind haben kürzlich eine Studie veröffentlicht, die zeigt, dass die Leistung von Modellen durch mehr Rechenzeit und Anleitung bei der Erfüllung von Anfragen signifikant verbessert werden kann. OpenAI hat sich entschieden, die Rohdaten der "Gedankenkette" von o1 in ChatGPT nicht zu zeigen, zum Teil wegen des "Wettbewerbsvorteils".
OpenAI plant, o1-mini für alle kostenlosen Nutzer von ChatGPT zugänglich zu machen, hat jedoch noch kein Veröffentlichungsdatum festgelegt. Darüber hinaus beabsichtigt das Unternehmen, mit o1-Modellen zu experimentieren, die über Stunden, Tage oder sogar Wochen nachdenken, um ihre Denkfähigkeiten weiter zu verbessern.
Die Zukunft von OpenAI o1 sieht vielversprechend aus, und es bleibt abzuwarten, wie schnell OpenAI verbesserte Versionen von o1 liefern kann. Das Unternehmen sagt, dass es plant, mit o1-Modellen zu experimentieren, die über längere Zeiträume hinweg nachdenken, um ihre Denkfähigkeiten weiter zu verbessern.
Die Einführung von OpenAI o1 markiert einen bedeutenden Fortschritt in der Entwicklung von KI-Modellen. Mit seiner Fähigkeit, komplexe Aufgaben besser zu lösen und sich selbst zu überprüfen, setzt o1 neue Maßstäbe in der KI-Forschung und -Anwendung. Obwohl es noch einige Herausforderungen gibt, zeigt o1 großes Potenzial, insbesondere in den Bereichen Datenanalyse, Wissenschaft und Programmierung.