Die Revolution der Chatbot-gesteuerten Roboter: Wie Google DeepMind die Zukunft gestaltet
Einführung: Die Verschmelzung von KI und Robotik
In einer offenen Bürofläche in Mountain View, Kalifornien, ist ein schlanker Roboter auf Rädern beschäftigt, als Tourguide und informeller Bürohelfer zu agieren. Dank eines Upgrades auf ein großes Sprachmodell, wie Google DeepMind heute bekannt gegeben hat, ist dieser Roboter in der Lage, komplexe Anweisungen zu verstehen und umzusetzen. Diese Entwicklung markiert einen wichtigen Schritt in der Integration von Künstlicher Intelligenz (KI) und Robotik und ist nur ein Teil einer größeren Revolution.
Die Rolle von Google Gemini
Der Roboter nutzt die neueste Version von Googles Gemini, einem multimodalen Sprachmodell, das sowohl Text als auch Video verarbeiten kann. Dies ermöglicht es dem Roboter, seine Umgebung zu verstehen und sich angemessen zu orientieren. Beispielsweise führt der Roboter auf die Anweisung "Finde mir einen Ort zum Schreiben" hin eine Person zu einem Whiteboard im Gebäude. Gemini kombiniert die Verarbeitung von visuellen und textbasierten Informationen, um sinnvolle Aktionen zu generieren.
Forschung und Entwicklung: Neue Horizonte für KI und Robotik
Demis Hassabis, CEO von Google DeepMind, betonte bei der Einführung von Gemini im Dezember, dass die multimodalen Fähigkeiten des Modells neue Roboterfähigkeiten freischalten würden. Das Unternehmen testet kontinuierlich die robotischen Potenziale des Modells. Eine kürzlich veröffentlichte Studie zeigt, dass der Roboter in 90 Prozent der Fälle zuverlässig navigieren konnte, selbst bei komplexen Fragen wie "Wo habe ich meinen Untersetzer gelassen?".
Anwendungsbereiche und Investitionen
Akademische und industrielle Forschungslabore arbeiten daran, wie Sprachmodelle die Fähigkeiten von Robotern verbessern können. Die International Conference on Robotics and Automation in diesem Jahr listete fast zwei Dutzend Papiere auf, die sich mit der Nutzung von Vision-Language-Modellen beschäftigen. Investoren stecken erhebliche Summen in Startups, die KI-Fortschritte auf die Robotik anwenden wollen. Physical Intelligence und Skild AI sind zwei solcher Unternehmen, die beträchtliche Finanzierungen erhalten haben.
Real-World Anwendungen: Von der Theorie zur Praxis
Noch vor wenigen Jahren benötigte ein Roboter eine detaillierte Karte seiner Umgebung und sorgfältig ausgewählte Befehle, um erfolgreich zu navigieren. Heute enthalten große Sprachmodelle nützliche Informationen über die physische Welt und können Fragen beantworten, die Wahrnehmung erfordern. Google’s Roboter kann visuelle Anweisungen sowie gesprochene Befehle verstehen und umsetzen, was ihn vielseitiger und anpassungsfähiger macht.
Die Zukunft der Robotik: Eine neue Ära
Die Forscher planen, das System auf verschiedenen Roboterarten zu testen und gehen davon aus, dass Gemini komplexere Fragen bewältigen kann. Die Demonstration zeigt deutlich das Potenzial großer Sprachmodelle, in die physische Welt vorzudringen und nützliche Arbeiten zu verrichten. Dies könnte den Weg für eine neue Generation von Robotern ebnen, die in der Lage sind, vielfältige Aufgaben in unterschiedlichen Umgebungen zu erfüllen.
Schlussfolgerung
Die Verschmelzung von Künstlicher Intelligenz und Robotik könnte beide Felder auf neue Höhen katapultieren. Google DeepMind’s Fortschritte in diesem Bereich sind ein deutlicher Hinweis darauf, wie weit wir bereits gekommen sind und welche Möglichkeiten die Zukunft noch bereithält. Die Entwicklungen in der KI und Robotik versprechen nicht nur technologische Innovationen, sondern auch tiefgreifende Veränderungen in unserem Alltag und unserer Arbeitswelt.
Bibliographie
- https://www.nature.com/articles/d41586-024-01442-5
- https://www.youtube.com/watch?v=rD7MyNdyi_A
- https://www.youtube.com/watch?v=RYGsGX7WNOM
- https://techcrunch.com/2023/11/04/google-deepminds-robotics-head-on-general-purpose-robots-generative-ai-and-office-ai/
- https://www.diamandis.com/blog/abundance-43-figure-vs-tesla
- https://www.nytimes.com/2023/07/28/technology/google-robots-ai.html
- https://www.technologyreview.com/2024/04/11/1090718/household-robots-ai-data-robotics/
- https://en.wikipedia.org/wiki/Google_DeepMind
- https://schaeffler-tomorrow.com/en/article/the-ai-revolution