In der Welt der künstlichen Intelligenz (KI) und maschinellen Wahrnehmung sind Daten das Lebenselixier für Forschung und Entwicklung. Die Verfügbarkeit von umfangreichen und vielfältigen Datensätzen ist grundlegend für die Fortschritte in der Computer Vision und Mustererkennung. In diesem Zusammenhang präsentierte Meta kürzlich das "Aria Everyday Activities" (AEA) Dataset, einen neuen, auf Egozentrik basierenden multimodalen offenen Datensatz, der mit Hilfe von Project Aria-Brillen aufgezeichnet wurde. Dieser Datensatz umfasst 143 Sequenzen von täglichen Aktivitäten, die von mehreren Trägern in fünf geografisch unterschiedlichen Innenräumen aufgezeichnet wurden. Die Vielfalt dieser Daten ist für die Entwicklung von Anwendungen von unschätzbarem Wert, die das menschliche Verhalten besser verstehen und unterstützen sollen.
Parallel dazu stellt das Zenseact Open Dataset (ZOD) einen weiteren bedeutenden Fortschritt in der autonomen Fahrzeugtechnologie dar. Dieser von einem Team um Mina Alibeigi, William Ljungbergh und Kollegen zusammengestellte Datensatz bietet eine umfangreiche Sammlung multimodaler Daten, die über zwei Jahre hinweg in verschiedenen europäischen Ländern gesammelt wurden. ZOD deckt ein neunmal größeres Gebiet ab als bestehende Datensätze und zeichnet sich durch Sensoren mit der höchsten Reichweite und Auflösung unter vergleichbaren Datensätzen aus. Der Datensatz umfasst detaillierte Schlüsselbildannotationen für 2D- und 3D-Objekte (bis zu 245m), Straßeninstanz-/semantische Segmentierung, Verkehrsschilderkennung und Straßenklassifizierung.
Die einzigartige Kombination dieser Merkmale bietet neue Möglichkeiten für Durchbrüche in der Wahrnehmung über große Entfernungen und beim multiaufgaben Lernen. Das ZOD besteht aus Frames, Sequenzen und Drives, die sowohl Datendiversität als auch Unterstützung für raumzeitliches Lernen, Sensorenfusion, Lokalisierung und Kartierung bieten. Frames umfassen 100.000 kuratierte Kamerabilder mit zwei Sekunden unterstützender Sensordaten, während die 1473 Sequenzen und 29 Drives die gesamte Sensorsuite über 20 Sekunden bzw. einige Minuten einschließen.
ZOD ist der einzige großangelegte AD-Datensatz, der unter einer permissiven Lizenz veröffentlicht wird, was sowohl Forschung als auch kommerzielle Nutzung ermöglicht. Weitere Informationen und ein umfangreiches Entwicklerkit sind über die entsprechende URL abrufbar.
Diese fortschrittlichen Datensätze sind von großer Bedeutung, da sie die Grundlage bilden für die Entwicklung intelligenter Systeme, die in der Lage sind, komplexe Umgebungen zu navigieren und zu interpretieren. Sie eröffnen Möglichkeiten für Wissenschaftler und Entwickler, Algorithmen und Modelle zu trainieren, die das Potenzial haben, die Art und Weise, wie wir interagieren und Technologie in unserem täglichen Leben einsetzen, grundlegend zu verändern.
Die Verfügbarkeit solcher offenen Datensätze ist auch ein Zeugnis der sich wandelnden Dynamik in der Forschungsgemeinschaft, wo Zusammenarbeit und gemeinsame Ressourcennutzung zunehmend gefördert werden, um Innovation zu beschleunigen. Letztlich profitiert die gesamte Gesellschaft von solchen Entwicklungen, da sie zu sichereren und effizienteren Systemen für autonome Fahrzeuge, verbesserten Assistenzsystemen für sehbehinderte Personen und anderen Anwendungen führen können, die das tägliche Leben erleichtern.
Quellen:
1. Meta kündigt Aria Everyday Activities Dataset an - Twitter-Meldung von @_akhaliq und @yshan2u.
2. Zenseact Open Dataset: Ein groß angelegter und vielfältiger multimodaler Datensatz für autonomes Fahren - arXiv:2305.02008 [cs.CV].
3. Informationen zum Project Aria von Meta - Offizielle Ankündigungen und Pressemitteilungen von Meta.