OpenAI, das Unternehmen hinter dem populären Chatbot ChatGPT, hat eine neue Funktion namens "Operator" vorgestellt. Diese Erweiterung ermöglicht es ChatGPT, auf das Internet zuzugreifen und somit deutlich komplexere Aufgaben zu bewältigen. "Operator" agiert als KI-Agent, der sowohl Text- als auch Bildinformationen verarbeiten kann, um Benutzeranfragen zu interpretieren und entsprechende Aktionen im Webbrowser auszuführen. Damit eröffnet sich ein breites Spektrum an Anwendungsmöglichkeiten, von der Buchung von Reisen und der Erledigung von Online-Einkäufen bis hin zur Suche nach Angeboten und der Automatisierung alltäglicher Aufgaben.
Mit der Einführung von "Operator" positioniert sich OpenAI im Wettbewerb mit anderen Tech-Giganten wie Google und Anthropic, die ebenfalls KI-Agenten mit Internetzugang entwickelt haben. KI-Agenten gelten als die nächste Evolutionsstufe nach Chatbots und versprechen eine erhebliche Steigerung der Produktivität und Effizienz. Im Gegensatz zu herkömmlichen Chatbots, die primär auf Textbasis funktionieren, können KI-Agenten komplexe, mehrstufige Arbeitsabläufe im Internet ausführen.
Peter Welinder, VP of Product bei OpenAI, betont den Wandel der KI von einem reinen Frage-Antwort-Tool hin zu einem Akteur, der aktiv in der Welt agieren kann. Diese Entwicklung birgt enormes Potenzial für die Produktivität und die Qualität der Arbeitsergebnisse.
OpenAI räumt jedoch auch ein, dass der Internetzugang für ChatGPT neue Risiken mit sich bringt. "Operator" könnte beispielsweise Befehle falsch interpretieren oder unerwünschte Buchungen oder Käufe tätigen. Um diesen Risiken entgegenzuwirken, hat OpenAI verschiedene Sicherheitsvorkehrungen implementiert. So muss "Operator" vor der Ausführung riskanter Aktionen die Zustimmung des Benutzers einholen.
In einem veröffentlichten "System Card" skizziert OpenAI die potenziellen Probleme im Zusammenhang mit "Operator". Dazu gehören Missverständnisse von Befehlen, Missbrauch durch Benutzer und die Gefahr von Cyberangriffen. Yash Kumar, Product and Engineering Lead für OpenAIs Computer Using Agent, unterstreicht die erhöhten Sicherheitsherausforderungen durch die erweiterte Angriffsfläche.
Zunächst wird "Operator" als "Research Preview" für ChatGPT-Nutzer mit einem Pro-Account verfügbar sein. OpenAI plant, den Zugang schrittweise zu erweitern, um aus den Erfahrungen der Nutzer zu lernen und die Funktionalität kontinuierlich zu verbessern.
Demonstrationen haben das Potenzial von "Operator" als Web-Assistenten aufgezeigt. Das Tool verfügt über einen Remote-Webbrowser und ein Chatfenster zur Kommunikation mit dem Benutzer. In einem Beispiel buchte "Operator" auf Anfrage eine Zugreise und suchte in einem anderen Fall nach einem Restauranttisch. OpenAI arbeitet mit verschiedenen Webseiten, darunter OpenTable, zusammen, um die reibungslose Funktion von "Operator" zu gewährleisten.
Die Technologie hinter "Operator" basiert auf OpenAIs GPT-4o KI-Modell, das Browser und Webseiten interpretieren und in Textform kommunizieren kann. Zusätzliches Training ermöglicht es dem Tool, Online-Aufgaben effektiv auszuführen. OpenAI wird seinen Computer Use Agent auch über seine API zur Verfügung stellen.
Die Einführung von "Operator" markiert einen wichtigen Schritt in der Entwicklung von KI-Agenten und eröffnet neue Möglichkeiten für die Interaktion mit dem Internet. Obwohl die Technologie noch in den Kinderschuhen steckt und mit Risiken verbunden ist, verspricht sie eine Zukunft, in der KI-Agenten alltägliche Aufgaben automatisieren und die Produktivität erheblich steigern können.
Bibliographie: - https://www.wired.com/story/openai-sets-chatgpt-loose-on-the-web/ - https://www.technologyreview.com/2025/01/23/1110484/openai-launches-operator-an-agent-that-can-use-a-computer-for-you/ - https://openai.com/index/introducing-chatgpt-search/ - https://www.reddit.com/r/OpenAI/comments/1ggjfwi/openai_brings_a_new_web_search_tool_to_chatgpt/ - https://bgr.com/tech/chatgpt-operator-feature-could-launch-as-soon-as-this-week/ - https://www.theinformation.com/briefings/openai-preps-operator-release-for-this-week - https://venturebeat.com/ai/openais-agentic-era-begins-chatgpt-tasks-offers-job-scheduling-reminders-and-more/ - https://www.theverge.com/2025/1/14/24343528/openai-chatgpt-repeating-tasks-agent-ai - https://www.pcmag.com/news/openai-brings-chatgpts-advanced-voice-mode-to-your-browser - https://openai.com/