OpenAI Senkt Feintuningskosten für GPT-4o Mini mit Sonderaktion
Einführung des GPT-4o Mini Modells
OpenAI hat kürzlich das GPT-4o Mini Modell vorgestellt, eine abgespeckte Version des GPT-4o-Modells, die zu einem deutlich niedrigeren Preis angeboten wird. Diese neue Version zielt darauf ab, die Nutzung von AI-Modellen für Entwickler zugänglicher und kostengünstiger zu gestalten.
Vergleich zu Vorherigen Modellen
Im Vergleich zu GPT-3.5 Turbo sind die Kosten für das Feintuning des GPT-4o Mini um 50 Prozent reduziert. Darüber hinaus bietet OpenAI bis zum 23. September 2024 eine Sonderaktion an, bei der Entwickler täglich bis zu zwei Millionen Trainingstoken kostenlos nutzen können.
- GPT-4o Mini kostet 50 Prozent weniger im Feintuning als GPT-3.5 Turbo
- Bis zu zwei Millionen kostenlose Trainingstoken pro Tag bis 23. September 2024
Leistungsmerkmale und Verbesserungen
Das GPT-4o Mini Modell bietet nicht nur Kostenvorteile, sondern auch erhebliche Leistungsverbesserungen:
- 90 Prozent kostengünstiger für Eingabetoken und 80 Prozent günstiger für Ausgabetoken im Vergleich zu GPT-3.5 Turbo
- Viermal längere Trainingskontexte mit 65.000 Token und achtmal längere Inferenzkontexte mit 128.000 Token
Das Modell unterstützt zudem Bildverarbeitung, auch wenn Feintuning derzeit nur für Text möglich ist. Diese Verbesserungen machen GPT-4o Mini zu einer attraktiven Option für Entwickler, die spezifische Anwendungsfälle optimieren möchten.
Microsoft und Phi-3 Modelle
Parallel zu OpenAIs Einführung von GPT-4o Mini hat Microsoft serverlose Feintuning-Dienste für seine Phi 3-mini und Phi 3-medium Modelle in Azure AI vorgestellt. Diese Dienste ermöglichen es Entwicklern, Modelle für Cloud- und Edge-Szenarien schnell anzupassen, ohne umfangreiche Rechenressourcen zu benötigen.
- Serverloses Feintuning für Phi 3-mini und Phi 3-medium Modelle in Azure AI
- Verbesserungen in Kernqualität, Befolgung von Anweisungen und strukturierten Ausgaben
Wettbewerb im Sprachmodellmarkt
Die Discount-Kampagne von OpenAI spiegelt den zunehmenden Wettbewerb im Markt für Sprachmodelle wider. Sowohl kleine als auch große Modelle konkurrieren um begrenzte Anwendungsszenarien in einem Markt, der viel Interesse, aber wenig Umsatz generiert. Diese Preisreduzierungen führen zu einem regelrechten Preiskampf.
- Mehr Modelle von mehr Anbietern, einige Open Source, konkurrieren um begrenzte Anwendungsszenarien
- Preisreduzierungen führen zu intensiverem Wettbewerb
Alternative Ansätze zum Feintuning
Bevor Entwickler das Feintuning in Betracht ziehen, gibt es auch andere Ansätze, um maßgeschneiderte Ergebnisse von Sprachmodellen zu erhalten:
- Feintuning kostet $3 pro Million Trainingstoken, während GPT-3.5 Turbo $8 kostet
- Zwei Millionen kostenlose Token pro Tag bis zum 23. September 2024
Zusätzlich zum Feintuning gibt es auch alternative Methoden wie die „Retrieval-Augmented Generation“ (RAG) oder Funktion-Calls, die spezifische Fragen in den Prompt injizieren und die Anforderung einer sehr spezifischen Form der Antwort stellen.
- RAG erfordert Anfragen an eine externe Datenbank, hat aber Vorteile
- Funktion-Calls bieten eine sehr spezifische Form der Antwort
Erwartungen an die Zukunft
OpenAI betont, dass die Menge an Trainingsdaten, die für das Feintuning des Modells verwendet werden kann, viermal so hoch ist wie bei GPT-3.5, nämlich 65.000 Token. Feintuning ist jedoch nur für die textuelle Funktionalität und nicht für Bildaufgaben verfügbar.
- Viermal höhere Menge an Trainingsdaten im Vergleich zu GPT-3.5
- Feintuning nur für textuelle Funktionalität verfügbar
Google bietet ebenfalls Feintuning für seine Modelle über das Vertex AI Programm an, und viele andere Modellanbieter tun dies ebenfalls. Re-Training von Modellen wird wahrscheinlich häufiger vorkommen und könnte sogar auf mobilen Geräten möglich werden, sofern genügend Rechenleistung vorhanden ist.
Fazit
Mit der Einführung von GPT-4o Mini und der Senkung der Feintuning-Kosten zeigt OpenAI sein Engagement, fortschrittliche KI für eine breitere Palette von Anwendungen zugänglich und nützlich zu machen. Diese Entwicklungen bieten nicht nur spannende Möglichkeiten für Entwickler, sondern versprechen auch, die Landschaft der Online-Suche und KI-gesteuerten Technologie zu verändern.
Quellen:
- https://openai.com/index/gpt-4o-mini-advancing-cost-efficient-intelligence/
- https://www.zdnet.com/article/openais-budget-gpt-4o-mini-model-is-now-cheaper-to-fine-tune-too/
- https://www.wired.com/story/openai-gpt-4o-mini/
- https://openai.com/pricing/
- https://medium.com/@learngrowthrive.fast/openai-announced-gpt-4o-mini-fine-tuning-and-searchgpt-3aff2bda80b2
- https://www.developer-tech.com/news/openai-slashes-ai-costs-high-performance-gpt-4o-mini/
- https://www.zdnet.com/article/openai-offers-gpt-4o-mini-to-slash-cost-of-applications/