Roboter Revolution DeepMinds RT-2 ebnet den Weg für alltagstaugliche KI-Helfer

Kategorien:

No items found.

Freigegeben:

June 14, 2024

In der Welt der Robotik und Künstlichen Intelligenz (KI) sind bahnbrechende Fortschritte keine Seltenheit. Ein jüngstes Beispiel dafür ist die Entwicklung eines robotischen Systems durch Google DeepMind, das in der Lage ist, alltägliche Aufgaben wie Kochen und Reinigen zu übernehmen. Diese Innovation, bekannt als Robotics Transformer 2 oder RT-2, stellt einen Meilenstein in der Annäherung an die Vision von vielseitig einsetzbaren, unterstützenden Robotern dar, wie sie seit Jahrzehnten in der Science-Fiction-Literatur und -Filmen verewigt sind.

Die Grundlage des RT-2-Systems ist ein visionär-sprachliches Aktionsmodell (VLA), das auf dem Transformer-Prinzip beruht. Transformer sind KI-Modelle, die ursprünglich für die Verarbeitung natürlicher Sprache entwickelt wurden und sich durch ihre Fähigkeit auszeichnen, Informationen zu generalisieren und auf neue Zusammenhänge zu übertragen. RT-2 wurde mit Texten und Bildern aus dem Internet trainiert, ähnlich wie großangelegte Sprachmodelle, die beispielsweise hinter Chatbots wie ChatGPT stehen.

Ein wesentliches Merkmal von RT-2 ist die Fähigkeit, gelernte Konzepte auf neue Situationen zu übertragen. Dies bedeutet, dass der Roboter Aufgaben ausführen kann, für die er nicht explizit trainiert wurde, indem er das in der Sprache und den Vision-Daten eingebettete Wissen auf direkte Roboteraktionen anwendet. RT-2 hat gezeigt, dass es mit einer geringen Menge an Roboter-Trainingsdaten möglich ist, die in seinem Sprach- und Visionstraining eingebetteten Konzepte zu übertragen, um Aktionen zu steuern – selbst bei Aufgaben, die es nie zuvor gesehen oder trainiert hat.

Im Rahmen von über 6.000 Roboter-Tests konnte RT-2 Aufgaben, die in den Trainingsdaten vorhanden waren, genauso gut ausführen wie das Vorgängermodell RT-1. Bei neuen, zuvor ungesehenen Szenarien verdoppelte RT-2 nahezu seine Leistung auf 62 % gegenüber den 32 % von RT-1. Diese Fähigkeit, Konzepte auf neue Situationen zu übertragen, ist vergleichbar mit der Art und Weise, wie Menschen lernen und Wissen anwenden.

Die Forschung und Entwicklung, die zu RT-2 geführt haben, stehen im Einklang mit Googles Bestrebungen, als AI-first-Unternehmen zu agieren. Die Kombination zweier führender Forschungsteams im Bereich der KI – das Brain-Team von Google Research und DeepMind – unter dem Dach von Google DeepMind hat dazu beigetragen, die Entwicklung fortschrittlicher und verantwortungsvoller allgemeiner KI-Systeme zu beschleunigen. Diese Systeme sollen zukünftige Produkte und Dienstleistungen von Google mit Energie versorgen.

Neben RT-2 gibt es weitere spannende Entwicklungen in der KI-Branche. Samsung, Jensen Huang und Midjourney sind nur einige der Akteure, die bedeutende Fortschritte in der KI erzielt haben. Ebenso hat JPMorgan mit DocLLM und andere Unternehmen mit der Einführung neuer KI-Werkzeuge die Möglichkeiten der KI erweitert.

Während RT-2 bereits ein beachtliches Maß an Autonomie und Anpassungsfähigkeit zeigt, ist es wichtig zu betonen, dass noch ein langer Weg vor uns liegt, bevor Roboter in menschenzentrierten Umgebungen vollständig integriert werden können. Die Forschung muss sich weiterhin auf Sicherheit, ethische Aspekte und die soziale Akzeptanz von Robotern konzentrieren.

RT-2 und die damit verbundenen Fortschritte zeigen eindrucksvoll, dass wir uns einer Zukunft nähern, in der Roboter nicht mehr nur ein fester Bestandteil von Fabriken sind, sondern auch zuverlässige Gehilfen im Alltag werden könnten. Die Technologie schreitet in einem rasanten Tempo voran, und es ist faszinierend zu beobachten, wie die Grenzen zwischen dem, was möglich ist, und der einstigen Science-Fiction immer weiter verschwimmen.

Was bedeutet das?

No items found.