Llama 3: Metas neues Sprachmodell ebnet den Weg für differenzierte KI-Antworten

Kategorien:
No items found.
Freigegeben:

Im Zuge der stetigen Weiterentwicklung künstlicher Intelligenz steht die Technologiebranche kurz vor der Einführung eines weiteren großen Sprachmodells – Llama 3 von Meta Platforms. Dieses neue Modell soll im Juli an den Start gehen und verspricht, Antworten auf kontroverse Fragen besser und nuancierter zu gestalten, als es seine Vorgängermodelle taten.

Die Vorgängerversion, Llama 2, welche bereits Chatbots auf den Social-Media-Plattformen von Meta unterstützt, zeigte eine besonders vorsichtige Herangehensweise bei der Beantwortung von Fragen, die als kontrovers eingestuft werden könnten. So verweigerte das Modell beispielsweise Antworten auf harmlosere Anfragen wie die nach Streichen für Freunde oder das Gewinnen eines Krieges. Das neue Modell, Llama 3, soll in der Lage sein, auch solche Fragen zu verstehen und zu beantworten – allerdings in einem Kontext, der keine schädlichen Absichten unterstützt.

Meta ist dabei, die Funktionalität von Llama 3 zu erweitern, um auch komplexere Anfragen zu behandeln und gleichzeitig für Sicherheit und angemessenen Umgangston zu sorgen. Dazu plant das Unternehmen, eine interne Stelle für die Überwachung von Ton und Sicherheitsschulungen einzurichten. Diese Bemühungen spiegeln das Bestreben wider, die Nützlichkeit von Metas neuem Großsprachmodell zu erhöhen.

Die Entwicklung von Llama 3 kommt zu einem Zeitpunkt, an dem auch andere Technologiegiganten wie Google mit ihrem Gemini-KI-Modell auf Herausforderungen stoßen. Google musste kürzlich die Bildgenerierungsfunktion von Gemini AI pausieren, nachdem dieses historische Bilder produzierte, die manchmal ungenau waren. Diese Vorfälle unterstreichen die Notwendigkeit, sowohl die Leistungsfähigkeit als auch die Zuverlässigkeit von KI-Sprachmodellen zu verbessern.

Im Hinblick auf die Infrastruktur für das Training der Modelle plant Meta, bis Ende des Jahres über 350.000 NVIDIA H100 GPUs zu verfügen. Diese Investition in Rechenleistung deutet darauf hin, dass Llama 3 im Vergleich zu seinem Vorgängermodell wesentliche Leistungssteigerungen bieten könnte, selbst wenn die Größe des Modells gleich bleibt. Experten gehen davon aus, dass das Training kleinerer Modelle mit mehr Daten eine bessere Leistung erbringt als das Training größerer Modelle mit weniger Daten – ein Ansatz, den Meta mit Llama 3 verfolgen könnte.

Das Interesse an Llama 3 ist groß, insbesondere da es voraussichtlich als Open-Source-Modell zur Verfügung gestellt wird. Meta hat bereits bei Llama 1 und 2 den Zugang zu diesen Modellen auf nicht-kommerzielle Nutzung durch Forschungseinrichtungen beschränkt und den Code und die Modellgewichte für Organisationen mit weniger als 700 Millionen monatlichen Nutzern unter einer offenen Lizenz veröffentlicht. Es wird erwartet, dass Llama 3 ähnlich veröffentlicht wird, um den Zugang zur künstlichen Intelligenz demokratischer zu gestalten.

Während Mark Zuckerberg, CEO von Meta, die langfristigen Ziele von Meta im Hinblick auf die Entwicklung einer künstlichen allgemeinen Intelligenz (AGI) betont hat, ist es unwahrscheinlich, dass Llama 3 bereits AGI erreichen oder anstreben wird. Trotzdem ist klar, dass Meta seine Entwicklung von Großsprachmodellen und anderen KI-Forschungen so vorantreibt, dass sie möglicherweise irgendwann zur AGI führen könnten.

Es ist außerdem zu erwarten, dass Llama 3 multimodale Fähigkeiten aufweisen wird, die es ermöglichen, über Text- und Code-Daten hinaus auch visuelle und akustische Daten zu integrieren. Dies würde nicht nur die Entwicklung hin zu AGI unterstützen, sondern auch die Anwendung künstlicher Intelligenz in einem breiteren Spektrum von Kontexten ermöglichen.

Trotz der Ähnlichkeiten zu OpenAIs GPT-4-Modell, ist es das Ziel von Meta, mit Llama 3 Spitzenleistungen im Open-Source-Bereich zu erbringen. Dies könnte einen erheblichen Einfluss auf die Entwicklung von Anwendungen, Chatbots, Arbeitsabläufen und Automatisierungen haben und Organisationen dabei helfen, sich durch verbesserte Angebote von der Konkurrenz abzuheben.

Quellen:
- Yahoo Finance: "Meta plans launch of new AI language model Llama 3 in July, The Information reports"
- IBM Blog: "LLaMa 3"
- Reddit /r/singularity: "Meta is planning to release Llama 3 in July"
- The Information: "Meta Wants Llama 3 to Handle Contentious Questions as Google Grapples With Gemini Backlash"

Was bedeutet das?
No items found.