Die Welt der Künstlichen Intelligenz (KI) entwickelt sich rasant. Neue Modelle und Funktionen versprechen Verbesserungen in verschiedenen Bereichen, von der Suchmaschinenoptimierung bis hin zur Computerinteraktion. Dieser Artikel bietet einen Überblick über die wichtigsten Entwicklungen, darunter die neuen Versionen von Claude, die Fortschritte bei Google Gemini und weitere Innovationen.
Anthropic hat mit Claude 3.5 Sonnet und Claude 3.5 Haiku zwei aktualisierte Versionen seines KI-Sprachmodells vorgestellt. Claude 3.5 Sonnet übertrifft in Benchmarks zum Teil GPT-4o und den Vorgänger Claude 3 Opus. Besonders hervorzuheben sind die verbesserte Geschwindigkeit, das 200.000 Token umfassende Kontextfenster und die Fortschritte bei der Bildverarbeitung.
Eine der bemerkenswertesten Neuerungen ist die Funktion „Computer Use“ (derzeit in der Beta-Phase), die es Claude ermöglicht, Computeraktionen wie Tastatureingaben und Mausklicks zu generieren. Damit kann die KI beispielsweise Online-Formulare ausfüllen oder im Internet recherchieren. Die Navigation erfolgt über Screenshots, die Claude analysiert, um die Position der Maus und die Pixelabstände zu Buttons oder Fenstern zu bestimmen. Obwohl diese Funktion vielversprechend ist, gibt Anthropic zu, dass sie noch experimentell und fehleranfällig ist. Schwierigkeiten bereiten der KI derzeit noch Aktionen wie Scrollen und Zoomen.
Google integriert seinen KI-Assistenten Gemini in Google Maps und die Google Such-API. In Maps fasst Gemini Bewertungen von über 250 Millionen Orten zusammen und gibt Empfehlungen für Aktivitäten. Zudem ermöglicht die KI eine intelligentere Routenplanung mit Vorschlägen für Zwischenstopps. Die verbesserte Navigation zeigt detailliertere Spurinformationen, Verkehrsschilder und Zebrastreifen an. Diese Funktionen sind zunächst nur in den USA verfügbar. Weltweit verfügbar sind dagegen Echtzeitdaten zu Wetter und Straßenzuständen sowie eine verbesserte Parkplatzsuche mit AR-Unterstützung.
Entwickler können nun auch die Google-Suche in die Gemini-API integrieren. Die Funktion „Grounding with Google Search“ soll genauere und aktuellere KI-Antworten ermöglichen. Durch die Integration basieren die Antworten auf aktuellen Fakten und sind detaillierter. Entwickler müssen bei der Integration auch die „Google Search Suggestions“ implementieren, die zusätzliche Suchanfragen und Einnahmen für Google generieren sollen.