Fortschritt der Technologie: Metas Aria Everyday Activities Dataset revolutioniert AR und KI-Forschung

Kategorien:
No items found.
Freigegeben:
June 14, 2024

Die Welt der Technologie und künstlichen Intelligenz entwickelt sich ständig weiter und bringt neue Errungenschaften hervor, die sowohl faszinierend als auch wegweisend sind. Ein aktuelles Beispiel für diese fortschreitende Innovation ist das von Meta vorgestellte „Aria Everyday Activities Dataset“ (AEA), ein multimodales offenes Dataset, das mit Hilfe der Project Aria-Brille aufgezeichnet wurde.

Project Aria ist ein Forschungsprogramm von Meta, das darauf abzielt, die Zukunft der erweiterten Realität (Augmented Reality, kurz AR) und künstlichen Intelligenz (KI) verantwortungsvoll zu gestalten. Im Mittelpunkt des Projekts stehen die speziell entwickelten Aria-Brillen, die mit bahnbrechender Technologie ausgestattet sind. Diese Brillen ermöglichen es den Forschern, Informationen aus der Perspektive des Benutzers zu sammeln, was wiederum zur Weiterentwicklung der egozentrischen Forschung im Bereich der Maschinenwahrnehmung und Augmented Reality beiträgt.

Das AEA Dataset enthält 143 Sequenzen von alltäglichen Aktivitäten, die von mehreren Trägern in fünf geografisch diversen Innenräumen aufgezeichnet wurden. Jede dieser Aufnahmen enthält multimodale Sensordaten, die durch die Project Aria-Brillen aufgenommen wurden. Zu den Daten gehören hochfrequente global ausgerichtete 3D-Trajektorien, Punktwolken der Szene, pro Frame 3D-Blickvektoren der Augen und zeitlich abgestimmte Sprachtranskriptionen.

Diese umfangreichen Informationen ermöglichen es Forschern, neue Anwendungsfälle zu erschließen, wie beispielsweise die neurale Szenenrekonstruktion und die segmentierte Aufforderung zur Interaktion. Darüber hinaus bietet das Dataset Maschinenwahrnehmungsdaten, die zusätzlichen Kontext zu den räumlich-zeitlichen Bezugsrahmen liefern, wie etwa Mehrbenutzerposen in einem gemeinsamen Referenzrahmen und Kamerakalibrierungen für eine hochwertige egoszentrische Datenerfassung.

Die Aria-Brillen selbst sind mit einer Vielzahl von Sensoren ausgestattet, darunter eine RGB-Kamera mit einem Sichtfeld von 110 Grad, mehrere monochrome Kameras für SLAM (Simultaneous Localization and Mapping) und Handtracking, Kameras für die Augenverfolgung, Umgebungssensoren wie IMUs (Inertial Measurement Units), Mikrofone und GPS. Diese Instrumentierung ermöglicht es, die Interaktionen der Benutzer mit ihrer Umgebung aus einer First-Person-Perspektive zu erfassen und zu analysieren.

Die Verantwortlichen von Meta betonen die Bedeutung einer verantwortungsvollen Innovation. Daher wurden alle Sequenzen im AEA Dataset mit vollständig einwilligenden Akteuren in kontrollierten Umgebungen aufgezeichnet. Gesichter und Autokennzeichen wurden manuell verpixelt, um die Privatsphäre zu wahren, bevor die Daten öffentlich zugänglich gemacht wurden.

Das AEA Dataset ist eine Erweiterung des früheren Aria Pilot Dataset, das bereits 159 Sequenzen für die Forschung bereitstellte. Mit dem AEA Dataset sollen nun neue Forschungsbereiche erschlossen werden, die für die Weiterentwicklung von Maschinenwahrnehmung und KI von zentraler Bedeutung sind. Forscher können das Dataset nutzen, um die Herausforderungen von AR-Geräten praxisnah zu erforschen und Algorithmen für die Szenenwahrnehmung, -rekonstruktion und -verständnis zu entwickeln.

Meta bietet Forschungspartnern ein Aria Research Kit an, das neben den Project Aria-Brillen auch ein SDK (Software Development Kit) umfasst, sodass unabhängige Studien durchgeführt und die Zukunft der AR mitgestaltet werden kann.

Für Forscher, die auf dem Gebiet der KI oder ML (Maschinelles Lernen) tätig sind, können die Project Aria-Datasets und die begleitenden Werkzeuge von der offiziellen Meta-Website heruntergeladen werden. Darüber hinaus stehen leistungsfähige Tools zur Verfügung, um auf die Aria-Datasets zuzugreifen, mit ihnen zu interagieren und alle verfügbaren Rohdaten und Annotationen zu visualisieren.

Das AEA Dataset ist ein Beispiel dafür, wie öffentlich zugängliche Forschungsdaten die Entwicklung von KI und AR vorantreiben können, indem sie eine Grundlage für reproduzierbare Forschung und Innovation bieten. Es ist ein wichtiger Schritt in Richtung einer Zukunft, in der immer komplexere und intelligentere Systeme unsere Interaktion mit der Welt bereichern und verbessern.

Quellen:
- Project Aria Webseite: https://www.projectaria.com/
- Aria Everyday Activities Dataset Dokumentation: https://www.projectaria.com/datasets/apd
- Aria Data Tools Dokumentation: https://facebookresearch.github.io/Aria_data_tools/docs/pilotdata/pilotdata-index/
- YouTube Video über Project Aria: https://www.youtube.com/watch?v=nKqLeJQa2F8

Was bedeutet das?
No items found.