LG AI Research hat EXAONE 3.5 vorgestellt, eine neue Serie von Large Language Models (LLMs), die für den Einsatz in realen Anwendungen optimiert wurden. Die Modelle sind in drei Größen verfügbar – 2,4 Milliarden, 7,8 Milliarden und 32 Milliarden Parameter – und bieten gegenüber früheren Versionen erhebliche Verbesserungen. Dieser Artikel beleuchtet die wichtigsten Funktionen und Neuerungen von EXAONE 3.5.
EXAONE 3.5 zeichnet sich durch verbesserte Fähigkeiten im Befolgen von Anweisungen aus, ein entscheidender Faktor für den praktischen Einsatz. In sieben Benchmarks, die diese Fähigkeit messen, erzielten die Modelle Bestwerte. Auch das Verständnis von längeren Texten wurde deutlich verbessert, was durch Spitzenleistungen in vier entsprechenden Benchmarks belegt wird. Zusätzlich zeigt die Serie in neun allgemeinen Benchmarks Ergebnisse, die mit den führenden Open-Source-Modellen vergleichbarer Größe konkurrieren können.
Die EXAONE 3.5-Modelle basieren auf der Decoder-only-Transformer-Architektur und wurden mit einem umfangreichen Datensatz trainiert. Ein zweistufiger Post-Training-Prozess, bestehend aus Supervised Fine-Tuning (SFT) und Direct Preference Optimization (DPO), spielt eine entscheidende Rolle. SFT ermöglicht dem Modell, sich an neue Aufgaben zu generalisieren, während DPO die Antworten an menschliche Präferenzen anpasst, was zu qualitativ hochwertigeren und relevanteren Texten führt.
LG AI Research betont den praktischen Nutzen von EXAONE 3.5. Die Modelle wurden für den Einsatz in einer Vielzahl von realen Szenarien entwickelt. Die verbesserte Leistung bei der Ausführung von Anweisungen und das Verständnis von langen Texten machen sie zu einem vielversprechenden Werkzeug für Anwendungen wie Chatbots, Textgenerierung, Übersetzung und vieles mehr. Die Modelle sind auf der Hugging Face Plattform für Forschungszwecke verfügbar.
EXAONE 3.5 wurde speziell für die Sprachen Englisch und Koreanisch trainiert. Besonderes Augenmerk wurde auf die Optimierung der Tokenisierung für Koreanisch gelegt, um den Herausforderungen der agglutinativen Sprachstruktur gerecht zu werden. Dies führt zu einer effizienteren Verarbeitung und besseren Ergebnissen bei koreanischen Texten.
Die EXAONE 3.5-Modelle sind für Forschungszwecke frei verfügbar. Für den kommerziellen Einsatz ist jedoch eine Kontaktaufnahme mit LG AI Research erforderlich. Dieses duale Lizenzmodell ermöglicht es Forschern, die Modelle zu erkunden und weiterzuentwickeln, während LG gleichzeitig die kommerzielle Nutzung steuert.
Mit EXAONE 3.5 unterstreicht LG AI Research sein Engagement für die Entwicklung leistungsstarker und anwendungsorientierter Sprachmodelle. Parallel zur Veröffentlichung von EXAONE 3.5 wurde auch ChatEXAONE, ein KI-Agent für Unternehmen, eingeführt. ChatEXAONE nutzt die Fähigkeiten von EXAONE 3.5 und bietet LG-Mitarbeitern Funktionen wie Echtzeit-Websuche, Dokumentenzusammenfassung, Übersetzung und vieles mehr, wobei Datenschutz und Datensicherheit im Vordergrund stehen. Die Kombination aus verbesserter Leistung, Fokus auf reale Anwendungsfälle und der Möglichkeit der kommerziellen Nutzung macht EXAONE 3.5 zu einem vielversprechenden Werkzeug für Unternehmen und Forscher. Die Veröffentlichung der Modelle auf Hugging Face unterstreicht das Engagement von LG für Open Science und den Austausch innerhalb der KI-Community.
Bibliographie: https://www.mind-verse.de/news/fortschritte-lg-exaone-3-5-grosse-sprachmodelle-anwendungen https://huggingface.co/papers/2412.04862 https://huggingface.co/LGAI-EXAONE/EXAONE-3.5-2.4B-Instruct https://aijourn.com/lg-released-new-version-of-generative-ai-exaone-3-5/ https://finance.yahoo.com/news/lg-released-version-generative-ai-050000377.html https://koreajoongangdaily.joins.com/news/2024-12-09/business/industry/LG-AI-Research-opensources-three-versions-of-its-Exaone-LLM/2196203 https://justainews.com/applications/chatbots-and-virtual-assistants/lg-launches-ai-model-exaone-3-5/ https://www.lgresearch.ai/blog/view?seq=460