KI für Ihr Unternehmen – Jetzt Demo buchen

Interaktive 3D-Szenengenerierung aus einem Bild in Echtzeit durch neues KI-System

Kategorien:
No items found.
Freigegeben:
October 9, 2024

Artikel jetzt als Podcast anhören

Forscher der Stanford University und des MIT haben ein KI-System entwickelt, das interaktiv 3D-Szenen aus einem einzigen Bild in Echtzeit generieren kann. Diese neue Technologie, genannt WonderWorld, ermöglicht es Nutzern, virtuelle Umgebungen Schritt für Schritt aufzubauen und zu erkunden, indem sie den Inhalt und das Layout der generierten Szenen steuern. Die größte Herausforderung bei der Entwicklung von WonderWorld war die schnelle Generierung von 3D-Szenen. Während frühere Ansätze oft Dutzende von Minuten bis Stunden benötigten, um eine einzelne Szene zu generieren, kann WonderWorld eine neue 3D-Umgebung innerhalb von 10 Sekunden auf einer Nvidia A6000 GPU erzeugen. Diese Geschwindigkeit ermöglicht eine Echtzeit-Interaktion, ein bedeutender Fortschritt auf diesem Gebiet. WonderWorld arbeitet, indem es mit einem Eingabebild beginnt und eine erste 3D-Szene generiert. Es tritt dann in eine Schleife ein, in der abwechselnd Szenenbilder und entsprechende FLAGS-Repräsentationen erstellt werden. Benutzer können durch Bewegen der Kamera steuern, wo neue Szenen generiert werden, und über Texteingaben die Art der gewünschten Szene festlegen. Die FLAGS-Repräsentation besteht aus drei Ebenen: Vordergrund, Hintergrund und Himmel. Jede Ebene enthält eine Reihe von "Surfels" - Elemente, die durch ihre 3D-Position, Ausrichtung, Skalierung, Deckkraft und Farbe definiert sind. Diese Surfels werden unter Verwendung geschätzter Tiefen- und Normalen-Maps initialisiert und dann optimiert, um die endgültige Szene zu erstellen. Um geometrische Verzerrungen an Szenenübergängen zu reduzieren, verwendet WonderWorld einen geführten Tiefendiffusionsprozess. Dieser verwendet ein vortrainiertes Diffusionsmodell für Tiefenkarten und passt die Tiefenschätzung an die Geometrie vorhandener Teile der Szene an. Experimente haben gezeigt, dass WonderWorld frühere Methoden zur Generierung von 3D-Szenen in Bezug auf Geschwindigkeit und visuelle Qualität deutlich übertrifft. In Benutzerstudien wurden die generierten Szenen als visuell überzeugender bewertet als die von anderen Ansätzen erzeugten. Das System weist jedoch einige Einschränkungen auf. Es können nur nach vorne gerichtete Oberflächen erstellt werden, wodurch die Benutzerbewegung in der virtuellen Welt auf etwa 45 Grad beschränkt ist. Die generierten Welten sehen derzeit wie Scherenschnitte aus. Das System hat auch Probleme mit detaillierten Objekten wie Bäumen, was zu "Löchern" oder "schwebenden" Elementen führen kann, wenn sich der Betrachtungswinkel ändert. Trotz dieser Einschränkungen sehen die Forscher ein erhebliches Potenzial für WonderWorld in verschiedenen Anwendungen. Spieleentwickler könnten damit 3D-Welten iterativ aufbauen. Es könnte größere und vielfältigere Inhalte für Virtual-Reality-Erlebnisse generieren. Langfristig könnte es Nutzern ermöglichen, frei erkundbare, sich dynamisch entwickelnde virtuelle Welten zu erschaffen. Weitere Beispiele zum Ausprobieren finden Sie auf der Projektseite von WonderWorld. ## Bibliographie - Yu, H.-X., Duan, H., Herrmann, C., Freeman, W. T., & Wu, J. (2024). WonderWorld: Interactive 3D Scene Generation from a Single Image. arXiv preprint arXiv:2406.09394. https://arxiv.org/abs/2406.09394 - Yu, H.-X., Duan, H., Hur, J., Sargent, K., Rubinstein, M., Freeman, W. T., ... & Herrmann, C. (2024). WonderJourney: Going from Anywhere to Everywhere. arXiv preprint arXiv:2406.09394. https://www.aimodels.fyi/papers/arxiv/wonderworld-interactive-3d-scene-generation-from-single - Zhou, S., Fan, Z., Xu, D., Chang, H., Chari, P., Bharadwaj, T., ... & Kadambi, A. (2024). DreamScene360: Unconstrained Text-to-3D Scene Generation with Panoramic Gaussian Splatting. arXiv preprint arXiv:2406.09394. https://kovenyu.com/wonderworld/
Was bedeutet das?
Mindverse vs ChatGPT Plus Widget

Warum Mindverse Studio?

Entdecken Sie die Vorteile gegenüber ChatGPT Plus

Sie nutzen bereits ChatGPT Plus? Das ist ein guter Anfang! Aber stellen Sie sich vor, Sie hätten Zugang zu allen führenden KI-Modellen weltweit, könnten mit Ihren eigenen Dokumenten arbeiten und nahtlos im Team kollaborieren.

🚀 Mindverse Studio

Die professionelle KI-Plattform für Unternehmen – leistungsstärker, flexibler und sicherer als ChatGPT Plus. Mit über 50 Modellen, DSGVO-konformer Infrastruktur und tiefgreifender Integration in Unternehmensprozesse.

ChatGPT Plus

❌ Kein strukturierter Dokumentenvergleich

❌ Keine Bearbeitung im Dokumentkontext

❌ Keine Integration von Unternehmenswissen

VS

Mindverse Studio

✅ Gezielter Dokumentenvergleich mit Custom-Prompts

✅ Kontextbewusste Textbearbeitung im Editor

✅ Wissensbasierte Analyse & Zusammenfassungen

📚 Nutzen Sie Ihr internes Wissen – intelligent und sicher

Erstellen Sie leistungsstarke Wissensdatenbanken aus Ihren Unternehmensdokumenten.Mindverse Studio verknüpft diese direkt mit der KI – für präzise, kontextbezogene Antworten auf Basis Ihres spezifischen Know-hows.DSGVO-konform, transparent und jederzeit nachvollziehbar.

ChatGPT Plus

❌ Nur ein Modellanbieter (OpenAI)

❌ Keine Modellauswahl pro Use Case

❌ Keine zentrale Modellsteuerung für Teams

VS

Mindverse Studio

✅ Zugriff auf über 50 verschiedene KI-Modelle

✅ Modellauswahl pro Prompt oder Assistent

✅ Zentrale Steuerung auf Organisationsebene

🧠 Zugang zu allen führenden KI-Modellen – flexibel & anpassbar

OpenAI GPT-4: für kreative Texte und allgemeine Anwendungen
Anthropic Claude: stark in Analyse, Struktur und komplexem Reasoning
Google Gemini: ideal für multimodale Aufgaben (Text, Bild, Code)
Eigene Engines: individuell trainiert auf Ihre Daten und Prozesse

ChatGPT Plus

❌ Keine echte Teamkollaboration

❌ Keine Rechte- oder Rollenverteilung

❌ Keine zentrale Steuerung oder Nachvollziehbarkeit

VS

Mindverse Studio

✅ Teamübergreifende Bearbeitung in Echtzeit

✅ Granulare Rechte- und Freigabeverwaltung

✅ Zentrale Steuerung & Transparenz auf Organisationsebene

👥 Kollaborative KI für Ihr gesamtes Unternehmen

Nutzen Sie Mindverse Studio als zentrale Plattform für abteilungsübergreifende Zusammenarbeit.Teilen Sie Wissen, erstellen Sie gemeinsame Workflows und integrieren Sie KI nahtlos in Ihre täglichen Prozesse – sicher, skalierbar und effizient.Mit granularen Rechten, transparenter Nachvollziehbarkeit und Echtzeit-Kollaboration.

Bereit für den nächsten Schritt?

Sehen Sie Mindverse Studio in Aktion. Buchen Sie eine persönliche 30-minütige Demo.

🎯 Kostenlose Demo buchen

Wie können wir Ihnen heute helfen?

Das Expertenteam von Mindverse freut sich darauf, Ihnen zu helfen.
Herzlichen Dank! Deine Nachricht ist eingegangen!
Oops! Du hast wohl was vergessen, versuche es nochmal.

🚀 Neugierig auf Mindverse Studio?

Lernen Sie in nur 30 Minuten kennen, wie Ihr Team mit KI mehr erreichen kann – live und persönlich.

🚀 Demo jetzt buchen