Die KI-Landschaft entwickelt sich rasant, und neue Funktionen und Modelle werden in immer kürzeren Abständen veröffentlicht. Ein aktuelles Beispiel dafür ist die "Computer Use"-Funktion von Anthropic für das große Sprachmodell Claude 3.5 Sonnet. Diese Funktion ermöglicht es Claude, Computer ähnlich wie Menschen zu bedienen – durch Bildschirmansicht, Cursorbewegung, Klicken und Tippen. Studien untersuchen nun, wie gut Claude 3.5 Computer Use in verschiedenen Szenarien und Anwendungen funktioniert.
Anstatt Claude spezifische Tools für einzelne Aufgaben zur Verfügung zu stellen, hat Anthropic ihm allgemeine Computerkenntnisse vermittelt. Claude kann somit eine breite Palette von Standard-Tools und -Software verwenden. Die Technologie basiert auf der Analyse von Screenshots des Benutzerbildschirms. Claude berechnet die Pixelabstände für Cursorbewegungen, um Klicks und andere Aktionen korrekt auszuführen. Über eine API können Entwickler Anweisungen in Computerbefehle übersetzen. So kann Claude beispielsweise Formulare ausfüllen, indem es Daten vom Computer und aus dem Internet abruft, oder einen Webbrowser öffnen und zu bestimmten Webseiten navigieren.
Die "Computer Use"-Funktion birgt enormes Potenzial für die Automatisierung repetitiver Prozesse, die Softwareentwicklung und -tests sowie für offene Aufgaben wie Recherchen. Erste Tests zeigen vielversprechende Ergebnisse, jedoch ist die Technologie noch in der Beta-Phase und weist gewisse Einschränkungen auf. Aktionen wie Scrollen, Ziehen und Zoomen stellen Claude derzeit noch vor Herausforderungen. Auch die Genauigkeit der Ausführung ist noch nicht perfekt. In einem Test zur Flugbuchung lag die Erfolgsquote bei 46%. Anthropic räumt ein, dass Claude noch weit von menschlichen Fähigkeiten entfernt ist, erwartet aber rasche Verbesserungen.
Die Sicherheitsaspekte von Computer Use werden von Anthropic ernst genommen. Das Modell wurde nicht mit benutzergenerierten Daten trainiert, einschließlich der verarbeiteten Screenshots. Es hatte während des Trainings auch keinen Internetzugang. Um das Risiko von Prompt-Injection-Angriffen zu minimieren, wurden spezielle Sicherheitsmaßnahmen implementiert. Klassifikatoren und Überwachungssysteme sollen Missbrauch wie Spam, Fehlinformationen oder Betrug erkennen und verhindern. Claude kann beispielsweise keine Inhalte in sozialen Medien posten oder mit Regierungswebsites interagieren.
Neben der "Computer Use"-Funktion hat Anthropic auch ein verbessertes Claude 3.5 Sonnet und ein neues Claude 3.5 Haiku Modell vorgestellt. Claude 3.5 Sonnet zeigt deutliche Verbesserungen im Bereich Coding und Tool-Nutzung. Claude 3.5 Haiku ist das kostengünstigere Modell und bietet schnellere Antworten sowie verbesserte Anweisungsgenauigkeit und Tool-Nutzung. Es eignet sich besonders für Anwendungen mit Benutzerinteraktion und die Generierung personalisierter Erlebnisse aus Daten.
Die "Computer Use"-Funktion von Claude 3.5 Sonnet und die neuen Modelle markieren einen weiteren Schritt in der Entwicklung von KI-Agenten. Die Fähigkeit, Computer wie Menschen zu bedienen, eröffnet neue Möglichkeiten für die Automatisierung und Interaktion mit Software. Während die Technologie noch in den Kinderschuhen steckt, verspricht sie, die Art und Weise, wie wir mit Computern arbeiten, grundlegend zu verändern. Weitere Studien und Feedback aus der Praxis werden dazu beitragen, die Leistungsfähigkeit und Sicherheit von Computer Use weiter zu verbessern.
Bibliographie: https://www.anthropic.com/news/3-5-models-and-computer-use https://www.datacamp.com/blog/what-is-anthropic-computer-use https://www.constellationr.com/blog-news/insights/anthropics-claude-35-sonnet-model-can-use-your-computer https://www.anthropic.com/claude/sonnet https://www.reddit.com/r/ClaudeAI/comments/1g9k8z8/introducing_computer_use_a_new_claude_35_sonnet/ https://www.linkedin.com/posts/thompson-paine_introducing-computer-use-a-new-claude-35-activity-7254533956564377601-VPNB https://www.techrepublic.com/article/claude-sonnet-computer-control/ https://www.marketingaiinstitute.com/blog/the-ai-show-episode-121