Jim Fan, Senior-Forscher bei Nvidia, erwartet in den nächsten zwei bis drei Jahren bedeutende Fortschritte in der Robotik. Er vergleicht diese potenziellen Entwicklungen mit dem Durchbruch von GPT-3 im Bereich der Sprachverarbeitung. In einem Interview und mehreren öffentlichen Auftritten erläuterte Fan seine Vision einer Zukunft, in der humanoide Roboter in den Alltag integriert werden könnten.
Fan leitet die Forschung zur sogenannten "embodied AI" bei Nvidia, wo sein Team an Projekt Groot arbeitet. Ziel dieses Projekts ist es, Grundlagenmodelle für humanoide Roboter zu entwickeln. Diese Modelle sollen ähnlich wie GPT-3 im Sprachbereich als Basis für spezialisierte Anwendungen dienen.
Die Entwicklung solcher Roboter-Modelle erfordert eine Kombination aus Internetdaten, Simulationsdaten und realen Roboterdaten. Fan betont die Stärken und Schwächen jeder Datenquelle und sieht ihre Kombination als Schlüssel zum Erfolg. Er vergleicht den aktuellen Stand der Robotik mit dem der Sprachverarbeitung vor dem GPT-3-Durchbruch und erwartet eine ähnliche Evolution, die von spezialisierten Modellen zu einer allgemeinen Herangehensweise führen könnte.
Eine der größten Herausforderungen sieht Fan in der Datenakquise. "Ich habe das Gefühl, dass wir das Potenzial von Transformern noch nicht voll ausgeschöpft haben", sagt er. Sobald die Datenpipeline vollständig entwickelt ist, könnten die Modelle skaliert werden. Nvidia arbeitet an Techniken wie "Eureka", die ein Sprachmodell nutzen, um Belohnungsfunktionen für das Robotertraining zu generieren und so einen zuvor manuellen Prozess zu automatisieren.
Fan sieht großes Potenzial in humanoiden Robotern, da die Welt um die menschliche Gestalt herum gebaut ist. "Alle unsere Restaurants, Fabriken, Krankenhäuser und alle Ausrüstungen und Werkzeuge sind für die menschliche Form und auch für menschliche Hände konzipiert", erklärt er. Ein fähiger humanoider Roboter könnte theoretisch jede Aufgabe ausführen, die auch ein Mensch bewältigen kann. Fan prognostiziert, dass das Ökosystem für humanoide Hardware in zwei bis drei Jahren bereit sein wird.
Die Forschung von Nvidia kombiniert Daten aus dem Internet, Simulationen und realen Robotern. Techniken wie "Eureka" sollen das Training von Robotern automatisieren. Langfristig zielt Fans Team darauf ab, ein Modell zu entwickeln, das sowohl virtuelle als auch physische Agenten steuern kann.
Fan zitiert Nvidia-CEO Jensen Huang: "Alles, was sich bewegt, wird irgendwann autonom sein." Er ist überzeugt, dass intelligente Roboter in Zukunft ebenso verbreitet sein werden wie Smartphones heute und dass wir heute mit dem Bau dieser Zukunft beginnen müssen.
Trotz seines optimistischen Ausblicks erkennt Fan an, dass noch Herausforderungen bestehen. Dazu gehört die Integration von schnellem, unbewusstem motorischem Steuerungsvermögen mit langsameren, bewussten Planungs- und Denkprozessen in einem einzigen Modell. Die Forschung von Nvidia, kombiniert mit den Fortschritten in der Datenakquise und -verarbeitung, könnte jedoch den Weg für eine neue Ära der Robotik ebnen.