In der Welt der Künstlichen Intelligenz (KI) vollzieht sich eine rasante Entwicklung, die insbesondere auf dem Gebiet der Sprachmodelle sichtbar wird. Google hat hier mit seinem jüngsten Upgrade auf Gemini 1.5 Pro einen signifikanten Fortschritt erzielt. Die neue Version des Modells verarbeitet nun bis zu einer Million Token – eine bemerkenswerte Steigerung gegenüber der ursprünglichen Obergrenze von 32.000 Token bei Gemini 1.0 Pro und sogar deutlich mehr als die 128.000 Token des GPT-4 Turbo von OpenAI.
Mit der Einführung von Gemini 1.5 Pro nur zwei Monate nach der Vorstellung der ersten Version demonstriert Google, wie schnell die Entwicklungen im Bereich der KI voranschreiten. Das neue Modell soll nicht nur leistungsfähiger sein, sondern auch mit weniger Rechenleistung auskommen und dabei mehr Kontext in den Prompt-Eingaben verarbeiten können.
Gemini 1.5 Pro nutzt eine Architektur namens Mixture of Experts (MoE), die aus mehreren kleineren Sprachmodellen besteht, die jeweils auf bestimmte Aufgaben spezialisiert sind. Dieser Ansatz soll die Effizienz steigern und ermöglicht es dem Modell, große Datenmengen – seien es Texte, Bilder, Audio, Video oder Code – simultan zu analysieren und zu interpretieren.
Die Fähigkeit, einen so großen Kontext zu verarbeiten, eröffnet neue Möglichkeiten für Entwickler und Unternehmen. Insbesondere bei der Anwendung in AI-basierten Tools könnten sich dadurch neue Funktionen und eine bessere Nutzererfahrung ergeben. Google hebt zudem hervor, dass Gemini 1.5 Pro auch in der Lage ist, multimodalen Kontext zu verarbeiten, also Eingaben in Form von Bildern, Sprache oder Video zu verstehen und zu analysieren. Als Beispiel führt Google an, dass ein Stummfilm mit einer Länge von 44 Minuten, der etwa 700.000 Token entspricht, vom Modell erkannt und analysiert werden kann.
Derzeit steht die neue Version allerdings nur einer begrenzten Gruppe von Entwicklern und Unternehmen zur Verfügung, die über Googles AI-Tools wie AI Studio und Vertex AI darauf zugreifen können. Eine breitere Öffentlichkeit soll zunächst eine Version mit einem Kontextfenster von 128.000 Token erhalten, später sind dann verschiedene Preisstufen geplant, wobei die Version mit einer Million Token die teuerste sein wird.
Noch befindet sich Gemini 1.5 Pro in der Testphase, und Google führt Sicherheitstests durch, die auch die umfangreichere Kontextlänge berücksichtigen. Das Unternehmen legt großen Wert darauf, dass die neuen Funktionen sicher und zuverlässig funktionieren, bevor sie einer breiteren Nutzerschaft zur Verfügung gestellt werden.
Die Entwicklung von Gemini 1.5 Pro markiert einen wichtigen Schritt in der Evolution der KI-Sprachmodelle und zeigt das enorme Potenzial dieser Technologien auf. Sie hat das Potential, die Art und Weise, wie wir mit Computern interagieren, grundlegend zu verändern und neue Anwendungen zu ermöglichen, die bisher nicht realisierbar waren.
Quellen:
- ComputerBase.de
- Golem.de
- OnlineMarketing.de
- Heise.de