Jetzt reinschauen – neue Umgebung live

OpenAI präsentiert neue Entwicklungen in der API und Finetuning-Technologien

Kategorien:
No items found.
Freigegeben:
December 20, 2024

Artikel jetzt als Podcast anhören

OpenAIs Aktuelle Entwicklungen: o1 API, Echtzeit-API und DPO-Finetuning

OpenAI hat in den letzten Wochen eine Reihe von Updates für Entwickler veröffentlicht, die sich auf die Verbesserung der Modellleistung, Anpassungsoptionen und Kosteneffizienz konzentrieren. Zu den wichtigsten Neuerungen gehören die Einführung des o1-Modells in der API, Verbesserungen der Echtzeit-API, eine neue Methode zum Finetuning und zusätzliche SDKs.

Das o1-Modell in der API

Das o1-Modell ist ein produktionsreifes Argumentationsmodell, das für komplexe, mehrstufige Aufgaben entwickelt wurde. Es stellt eine Weiterentwicklung des vorherigen o1-Preview-Modells dar und bietet erhebliche Verbesserungen in Bezug auf Genauigkeit, Kosteneffizienz und Latenz. Zu den wichtigsten Funktionen gehören:

Funktionsaufrufe: Nahtlose Integration mit externen Daten und APIs.
Strukturierte Ausgaben: Zuverlässige Einhaltung benutzerdefinierter JSON-Schemas.
Entwicklernachrichten: Anpassbarer Ton, Stil und Verhaltensrichtlinien.
Vision-Funktionen: Bildverarbeitung für Anwendungen in Wissenschaft, Fertigung und Programmierung.
Geringere Latenz: Reduzierter Token-Verbrauch um 60% im Vergleich zu o1-Preview.
Ein neuer Parameter "reasoning_effort" ermöglicht es Entwicklern, die Antwortzeiten zu steuern.

Die neueste Version, o1-2024-12-17, wurde basierend auf Benutzerfeedback nachtrainiert und erzielt in Benchmarks wie MATH (96,4% Erfolgsquote) und LiveCodeBench (76,6%) hervorragende Ergebnisse. Die Einführung in die API erfolgt schrittweise.

Verbesserungen der Echtzeit-API

Die Echtzeit-API bietet nun folgende Verbesserungen:

WebRTC-Unterstützung: Vereinfacht die Entwicklung von Echtzeit-Sprachanwendungen mit Funktionen wie Audiocodierung, Rauschunterdrückung und Staukontrolle.
Neue GPT-4o-Modelle: Die Snapshots GPT-4o-realtime-preview und GPT-4o-mini-realtime-preview bieten verbesserte Sprachqualität und reduzierte Kosten. Die Preise für Audio-Token sind beispielsweise um 60% gesunken, während GPT-4o-mini eine kostengünstige Option für kleinere Anwendungen darstellt.
Verlängerte Sitzungsdauer: Sitzungen können jetzt bis zu 30 Minuten dauern.
Gleichzeitige Out-of-Band-Antworten: Ermöglicht Hintergrundaufgaben wie Inhaltsmoderation, ohne die Benutzerinteraktionen zu unterbrechen.

DPO-basiertes Finetuning (Preference Fine-Tuning)

Eine neue Methode zum Finetuning namens "Preference Fine-Tuning" wurde eingeführt. Im Gegensatz zum traditionellen überwachten Finetuning verwendet dieser Ansatz die direkte Präferenzoptimierung (DPO), um Modelle basierend auf bevorzugten und nicht bevorzugten Ausgaben zu trainieren. Diese Methode ist besonders effektiv für subjektive Aufgaben wie kreatives Schreiben oder Zusammenfassungen. Erste Ergebnisse von Partnern wie Rogo AI zeigen eine verbesserte Genauigkeit bei komplexen Abfragen.

Neue SDKs für Go und Java

OpenAI hat offizielle SDKs für Go und Java in der Beta-Version veröffentlicht. Diese SDKs ergänzen die bestehenden Bibliotheken für Python, Node.js und .NET und erleichtern Entwicklern, die diese Sprachen verwenden, die Integration von OpenAI-Modellen in ihre Projekte.

Fazit

Die Einführung von o1, die Verbesserungen der Echtzeit-API und die DPO-Finetuning-Methode unterstreichen OpenAIs Engagement, die Leistung und Anpassbarkeit seiner KI-Modelle kontinuierlich zu verbessern und gleichzeitig die Kosten für Entwickler zu senken. Diese Entwicklungen ermöglichen eine breite Palette von Anwendungsfällen, von Echtzeit-Sprachassistenten bis hin zu anspruchsvollen Argumentationsaufgaben im Unternehmensbereich.

Quellenverzeichnis: https://openai.com/index/o1-and-new-tools-for-developers/ https://platform.openai.com/docs/changelog https://www.testingcatalog.com/openai-o1-launches-on-api-with-structured-outputs-and-vision-tools/ https://www.ainews.com/p/fine-tuning-now-available-for-gpt-4o-boost-performance-accuracy https://www.linkedin.com/posts/techsachinkumar_hermes-3-llama-31-405b-model-first-full-parameter-activity-7230789898503421952-3pQF https://www.datacamp.com/de/tutorial/fine-tuning-gpt-4o-mini https://buttondown.com/ainews/archive/ainews-not-much-happened-today-8168/ https://www.youtube.com/watch?v=GnllWNE8qLQ https://medium.com/pondhouse-data/fine-tune-openais-gpt-4o-mini-llm-ai-model-for-free-37c7222e95eb https://buttondown.com/ainews/archive/ainews-qwen-2-beats-llama-3-and-we-dont-know-how/
Was bedeutet das?

Wie können wir Ihnen heute helfen?

Das Expertenteam von Mindverse freut sich darauf, Ihnen zu helfen.