Grok: xAIs KI-Chatbot erweitert seine Fähigkeiten um visuelle Echtzeiterkennung und mehrsprachige Sprachausgabe
Elon Musks KI-Unternehmen xAI hat seinem Chatbot Grok ein umfassendes Update spendiert und damit die Funktionalität deutlich erweitert. Neben der bereits bestehenden Text- und Bildanalyse kann Grok nun auch über die Smartphone-Kamera Objekte in Echtzeit erkennen und beschreiben – eine Funktion, die unter dem Namen „Grok Vision“ eingeführt wurde. Nutzer können beispielsweise ihr Smartphone auf einen Baum richten und Grok per Sprachbefehl nach der Art des Baumes fragen. Die Antwort erfolgt dann ebenfalls per Sprachausgabe. Bisher war die Bildanalyse bei Grok nur möglich, indem Bilder manuell hochgeladen wurden. Die Echtzeiterkennung ermöglicht nun eine deutlich intuitivere und schnellere Interaktion mit dem KI-Assistenten.
Mit dieser Erweiterung schließt Grok zu den Konkurrenzprodukten ChatGPT von OpenAI und Gemini von Google auf, die bereits ähnliche visuelle Erkennungsfunktionen anbieten. Die Erweiterung wurde zunächst von der Webseite Testingcatalog entdeckt und kurze Zeit später von xAI-Mitarbeiter Ebby Amir in einem Video auf X offiziell bestätigt.
Neben der visuellen Echtzeiterkennung hat xAI auch die Sprachausgabe von Grok verbessert. Der Chatbot kann nun neben Englisch auch in anderen Sprachen antworten, darunter Spanisch, Französisch, Türkisch, Japanisch und Hindi. Diese Erweiterung unterstreicht die globalen Ambitionen von xAI und lässt vermuten, dass weitere Sprachen in Zukunft folgen werden. Deutsch wird derzeit noch nicht unterstützt.
Ein weiteres neues Feature ist die Integration einer Echtzeitsuche in den Sprachmodus von Grok. Diese ermöglicht es Nutzern, direkt über die Spracheingabe Informationen aus dem Internet abzurufen, ohne den Chatbot verlassen zu müssen.
Die neuen Funktionen sind allerdings nicht für alle Nutzer gleichermaßen verfügbar. Grok Vision ist aktuell ausschließlich für iOS-Geräte verfügbar, während die mehrsprachige Sprachausgabe und die Echtzeitsuche auch auf Android-Geräten funktionieren – allerdings nur für Nutzer des kostenpflichtigen SuperGrok-Abonnements.
Die jüngsten Updates folgen auf eine weitere Neuerung, die es Grok ermöglicht, sich an frühere Konversationen zu erinnern. Diese Funktion, die bei anderen etablierten Chatbots bereits Standard ist, trägt dazu bei, Grok zu einem persönlicheren KI-Assistenten zu entwickeln.
Mit der aktuellen Erweiterungswelle unterstreicht xAI seine Ambitionen, Grok als multimodale Alternative zu ChatGPT und Gemini zu etablieren. Das Ziel ist es, Grok von einem reinen Text-basierten Chatbot zu einer umfassenden Applikation weiterzuentwickeln, die verschiedene Funktionen vereint – eine Vision, die Elon Musk seit langem verfolgt.
Bibliographie:
- t3n.de: Grok Vision: Musks KI-Chatbot erklärt euch die Welt
- t3n.de: Grok gegen Musk
- X (ehemals Twitter): t3n
- t3n.de: Chatbot (Tag)
- t3n.de
- newstral.com: Grok Vision: Musks KI-Chatbot erklärt euch die Welt
- t3n.de: Software-Entwicklung (Tag)
- Threads: @mel__aura