Robot Utility Models: Richtlinien für den Einsatz in unbekannten Umgebungen ohne Voranpassung

Kategorien:

No items found.

Freigegeben:

September 10, 2024

Robot Utility Models: Allgemeine Richtlinien für Zero-Shot-Einsätze in neuen Umgebungen

Einleitung

In den letzten Jahren haben Roboter, insbesondere solche, die mit großen Datenmengen trainiert wurden, eine Vielzahl von Fähigkeiten zur Manipulation und Navigation in der realen Welt gezeigt. Verschiedene unabhängige Bemühungen haben gezeigt, dass Roboter, wenn sie ausreichend Trainingsdaten in einer Umgebung erhalten, ihre Richtlinien auf gezeigte Variationen in dieser Umgebung verallgemeinern können. Jedoch steht die Notwendigkeit, Roboter in jeder neuen Umgebung nachzujustieren, im krassen Gegensatz zu Modellen in der Sprach- oder Bildverarbeitung, die Zero-Shot für offene Weltprobleme eingesetzt werden können. In dieser Arbeit präsentieren wir Robot Utility Models (RUMs), ein Rahmenwerk für das Training und die Bereitstellung von Zero-Shot-Roboter-Richtlinien, die direkt auf neue Umgebungen verallgemeinern können, ohne Nachjustierung.

Robot Utility Models

Wir verfolgen einen ganzheitlichen Ansatz zur Erstellung von Robot Utility Models. Im Kern folgt unser System dem Imitationslernrahmen. Um das Imitationslernen effektiv zu skalieren, entwickeln wir neue Werkzeuge und Techniken zur Verbesserung der Datenerfassung, des Modelltrainings, der Inferenz und der Bereitstellung.

Datenerfassungstool

Eine der Hauptanforderungen unseres Systems ist es, diverse und dennoch genaue Demonstrationsdaten kostengünstig zu skalieren. Zu diesem Zweck setzen wir auf die evolutionäre Entwicklung von Handheld-Tools zur Datenerfassung.

Modelltraining

Wir trainieren Richtlinien auf diesen diversen Datensätzen mit modernsten multimodalen Verhaltenslernalgorithmen. Dies zeigt, wie sie große Mengen an Demonstrationsdaten aufnehmen und skalieren können. Schließlich setzen wir die Richtlinie in verschiedenen Umgebungen ein, mit Selbstkritik durch multimodale Sprachmodelle (mLLMs) und Wiederholungen, um die Richtlinie robust auf kostengünstiger, universeller Hardware auszuführen.

Bereitstellung

Eine Auswahl unserer trainierten Modelle ist auf dem Hello Robot Stretch ohne größere Modifikationen verfügbar. Neben der Standardbereitstellung auf Stretch ermöglichen wir auch die Bereitstellung auf anderen Robotern, Kameras und Beleuchtungsbedingungen, was die Generalisierbarkeit unseres Ansatzes zeigt.

Erkenntnisse und Ergebnisse

Die Erstellung und Bereitstellung von RUMs hat zu mehreren interessanten Erkenntnissen geführt: - Die Quantität und Qualität der Daten ist entscheidend für das Training eines Utility-Modells, während die Wahl der Modellarchitektur weniger kritisch ist. - Die Vielfalt der gesammelten Daten ist entscheidend für die Generalisierung des Modells auf neue Umgebungen und wichtiger als die rohe Datenmenge. - Das Modell kann in einzelnen Umgebungen leistungsfähiger gemacht werden, indem eine Selbstkritik der Modellleistung mit einem unabhängigen Modell durchgeführt und bei Bedarf wiederholt wird. Um RUMs zu validieren, führen wir insgesamt 2.950 Roboter-Rollouts in realen Umgebungen durch, darunter in Wohnungen in New York City (NY), Jersey City (NJ) und Pittsburgh (PA). Diese Experimente ergeben folgende Erkenntnisse: - Es ist möglich, allgemeine Robot Utility Models mit einer moderaten Menge an Daten, in der Größenordnung von 1.000 Demonstrationen, zu erstellen. Diese RUMs erreichen eine durchschnittliche Erfolgsrate von 90% bei Zero-Shot-Bereitstellungen in 25 neuen Umgebungen. - Der Erfolg von RUMs beruht hauptsächlich auf zwei Schlüsseltechniken. Erstens, die Verwendung von multimodalen Richtlinien bietet eine Zero-Shot-Erfolgsrate von 74,4%. Zweitens, das mLLM-basierte Selbstkritik- und Wiederholungssystem verbessert die Erfolgsrate um weitere 15,6%. - Während das Gesamtframework für RUMs unkompliziert ist, liegt der Teufel im Detail, wo wir unerwartete Quellen für Gewinne finden, z.B. Datenvielfalt vs. Datenmenge.

Schlussfolgerung

RUMs zeigen, dass es möglich ist, Roboter-Richtlinien zu erstellen, die in neuen Umgebungen ohne weitere Daten oder Training erfolgreich sind. Dies stellt einen bedeutenden Fortschritt dar und ebnet den Weg für die Entwicklung robuster und vielseitiger Roboteranwendungen in der realen Welt. Unsere Code-, Daten-, Modell- und Hardwaredesigns sowie unsere Experiment- und Bereitstellungsvideos sind open-source und auf unserer Website verfügbar: robotutilitymodels.com.

Bibliographie

https://arxiv.org/html/2409.05865v1 https://robotutilitymodels.com/ https://deeplearn.org/arxiv/525324/robot-utility-models:-general-policies-for-zero-shot-deployment-in-new-environments https://twitter.com/gm8xx8/status/1833339598690226615 https://arxiv-sanity-lite.com/?rank=pid&pid=2409.05865 https://synthical.com/article/Robot-Utility-Models%3A-General-Policies-for-Zero-Shot-Deployment-in-New-Environments-a7887356-6e28-479e-b8b6-5dcd7b64afd8? https://github.com/haritheja-e/robot-utility-models https://paperswithcode.com/author/julian-mehu https://arxiv.org/list/cs.RO/recent

Was bedeutet das?