Gemma 2 setzt neue Standards in KI-Leistung und Effizienz

Kategorien:
No items found.
Freigegeben:
August 4, 2024
Gemma 2: Ein Durchbruch in der KI-Forschung und -Entwicklung

Gemma 2: Ein Durchbruch in der KI-Forschung und -Entwicklung

Die technologische Landschaft erlebt derzeit eine Revolution mit der Veröffentlichung von Gemma 2, einem neuen Modell aus der Gemma-Familie von Google. Diese Veröffentlichung zieht die Aufmerksamkeit von Forschern und Entwicklern weltweit auf sich, da sie bedeutende Fortschritte in der Effizienz und Leistung von Künstlicher Intelligenz (KI) verspricht. Gemma 2 wurde sowohl in 9 Milliarden (9B) als auch in 27 Milliarden (27B) Parametergrößen entwickelt und bietet eine beeindruckende Performance, die mit größeren proprietären Modellen konkurriert.

Ein neuer Maßstab für Effizienz und Leistung

Gemma 2 basiert auf einer neu entworfenen Architektur, die sowohl außergewöhnliche Leistung als auch Inferenz-Effizienz bietet. Hier sind einige der hervorstechenden Merkmale:

Erstklassige Leistung: Bei 27B liefert Gemma 2 die beste Leistung in seiner Größenklasse und bietet sogar wettbewerbsfähige Alternativen zu Modellen, die mehr als doppelt so groß sind. Das 9B Gemma 2 Modell übertrifft ebenfalls andere offene Modelle in seiner Größenkategorie.

Unübertroffene Effizienz und Kosteneinsparungen: Das 27B Gemma 2 Modell ist darauf ausgelegt, Inferenz effizient bei voller Präzision auf einer einzelnen Google Cloud TPU-Host, NVIDIA A100 80GB Tensor Core GPU oder NVIDIA H100 Tensor Core GPU auszuführen, wodurch die Kosten erheblich reduziert werden, während die hohe Leistung erhalten bleibt. Dies ermöglicht zugänglichere und budgetfreundlichere KI-Implementierungen.

Blitzschnelle Inferenz über Hardware hinweg: Gemma 2 ist optimiert, um mit unglaublicher Geschwindigkeit auf einer Vielzahl von Hardware zu laufen, von leistungsstarken Gaming-Laptops und High-End-Desktops bis hin zu cloud-basierten Setups. Probieren Sie Gemma 2 mit voller Präzision in Google AI Studio aus, schalten Sie die lokale Leistung mit der quantisierten Version mit Gemma.cpp auf Ihrer CPU frei oder probieren Sie es auf Ihrem Heimcomputer mit einer NVIDIA RTX oder GeForce RTX über Hugging Face Transformers aus.

Für Entwickler und Forscher gebaut

Gemma 2 ist nicht nur leistungsstärker, sondern auch darauf ausgelegt, sich einfacher in Ihre Arbeitsabläufe zu integrieren:

Offen und zugänglich: Genau wie die ursprünglichen Gemma-Modelle ist Gemma 2 unter unserer kommerziell freundlichen Gemma-Lizenz erhältlich, die Entwicklern und Forschern die Möglichkeit gibt, ihre Innovationen zu teilen und kommerziell zu nutzen.

Breite Framework-Kompatibilität: Nutzen Sie Gemma 2 problemlos mit Ihren bevorzugten Werkzeugen und Arbeitsabläufen dank seiner Kompatibilität mit den wichtigsten KI-Frameworks wie Hugging Face Transformers und JAX, PyTorch und TensorFlow über native Keras 3.0, vLLM, Gemma.cpp, Llama.cpp und Ollama. Darüber hinaus ist Gemma optimiert mit NVIDIA TensorRT-LLM, um auf NVIDIA-beschleunigter Infrastruktur oder als NVIDIA NIM Inferenz-Mikroservice zu laufen, mit Optimierung für NVIDIA’s NeMo in Planung. Sie können heute mit Keras und Hugging Face feinabstimmen. Wir arbeiten aktiv daran, zusätzliche parameter-effiziente Feinabstimmungsoptionen zu ermöglichen.

Mühelose Bereitstellung: Ab dem nächsten Monat können Google Cloud-Kunden Gemma 2 problemlos auf Vertex AI bereitstellen und verwalten.

Entdecken Sie das neue Gemma Cookbook, eine Sammlung praktischer Beispiele und Rezepte, die Sie durch den Aufbau Ihrer eigenen Anwendungen und die Feinabstimmung von Gemma 2 Modellen für spezifische Aufgaben führen. Entdecken Sie, wie Sie Gemma problemlos mit Ihrem bevorzugten Werkzeug verwenden können, einschließlich für gängige Aufgaben wie Retrieval-Augmented Generation.

Verantwortungsvolle KI-Entwicklung

Wir sind bestrebt, Entwicklern und Forschern die Ressourcen zur Verfügung zu stellen, die sie benötigen, um KI verantwortungsvoll zu entwickeln und bereitzustellen, einschließlich durch unser Responsible Generative AI Toolkit. Das kürzlich als Open Source veröffentlichte LLM Comparator hilft Entwicklern und Forschern bei der eingehenden Bewertung von Sprachmodellen. Ab heute können Sie die Begleit-Python-Bibliothek verwenden, um vergleichende Bewertungen mit Ihrem Modell und Ihren Daten durchzuführen und die Ergebnisse in der App zu visualisieren. Darüber hinaus arbeiten wir aktiv daran, unsere Text-Watermarking-Technologie SynthID für Gemma-Modelle als Open Source bereitzustellen.

Beim Training von Gemma 2 haben wir unsere robusten internen Sicherheitsprozesse befolgt, die Vortrainingsdaten gefiltert und rigorose Tests und Bewertungen gegen eine umfassende Reihe von Metriken durchgeführt, um potenzielle Verzerrungen und Risiken zu identifizieren und zu mindern. Wir veröffentlichen unsere Ergebnisse auf einer großen Anzahl öffentlicher Benchmarks in Bezug auf Sicherheit und repräsentative Schäden.

Projekte, die mit Gemma gebaut wurden

Unsere erste Gemma-Veröffentlichung führte zu mehr als 10 Millionen Downloads und unzähligen inspirierenden Projekten. Navarasa zum Beispiel nutzte Gemma, um ein Modell zu erstellen, das in Indiens sprachlicher Vielfalt verwurzelt ist.

Jetzt wird Gemma 2 Entwicklern helfen, noch ambitioniertere Projekte auf den Weg zu bringen und neue Leistungs- und Potenzialstufen in ihren KI-Kreationen freizuschalten. Wir werden weiterhin neue Architekturen erkunden und spezialisierte Gemma-Varianten entwickeln, um eine breitere Palette von KI-Aufgaben und Herausforderungen zu bewältigen. Dazu gehört ein bevorstehendes 2.6B Parameter Gemma-2-Modell, das darauf ausgelegt ist, die Lücke zwischen leichter Zugänglichkeit und leistungsstarker Leistung weiter zu schließen. Mehr über diese bevorstehende Veröffentlichung erfahren Sie im technischen Bericht.

Erste Schritte

Gemma 2 ist jetzt im Google AI Studio verfügbar, sodass Sie seine vollständigen Leistungsfähigkeiten bei 27B ohne Hardware-Anforderungen testen können. Sie können auch die Modellgewichte von Gemma 2 von Kaggle und Hugging Face Models herunterladen, wobei Vertex AI Model Garden bald verfügbar sein wird.

Um Zugang für Forschung und Entwicklung zu ermöglichen, ist Gemma 2 auch kostenlos über Kaggle oder über eine kostenlose Stufe für Colab-Notebooks verfügbar. Erstanwender von Google Cloud-Kunden können sich für 300 US-Dollar Guthaben qualifizieren. Akademische Forscher können sich für das Gemma 2 Academic Research Program bewerben, um Google Cloud-Guthaben zu erhalten, um ihre Forschung mit Gemma 2 zu beschleunigen. Bewerbungen sind jetzt bis zum 9. August geöffnet.

Fazit

Die Veröffentlichung von Gemma 2 markiert einen bedeutenden Fortschritt in der KI-Forschung und -Entwicklung. Mit seiner verbesserten Leistung, Effizienz und Zugänglichkeit steht Gemma 2 Entwicklern und Forschern weltweit zur Verfügung und bietet eine Plattform für innovative und verantwortungsvolle KI-Entwicklung.

Bibliographie

- Adina Yakup (@AdeenaY8). "Submissions from diverse sources make the papers page even better! Gemma 2 tech report submitted by @osanseviero." X.com, 2. Aug. 2024. - Farabet, Clement, and Tris Warkentin. "Gemma 2 is now available to researchers and developers." Google DeepMind, 27. Juni 2024. - Schmid, Philipp, et al. "Google released Gemma 2, the latest addition to its family of state-of-the-art open LLMs." Hugging Face, 27. Juni 2024. - Warkentin, Tris, Xiaohua Zhai, and Ludovic Peran. "Introducing PaliGemma, Gemma 2, and an Upgraded Responsible AI Toolkit." Google AI Essentials, 14. Mai 2024.
Was bedeutet das?