NVIDIA verbessert generative KI mit beschleunigten Stable Diffusion Modellen

Kategorien:

No items found.

Freigegeben:

June 14, 2024

In der Welt der künstlichen Intelligenz und Computergrafik sind ständige Neuerungen und Verbesserungen der Schlüssel zum Erfolg. NVIDIA, ein führendes Unternehmen im Bereich der Grafikprozessoren und KI-Technologien, hat kürzlich eine bedeutende Entwicklung in diesem Bereich bekannt gegeben. Es handelt sich um die Beschleunigung von Stable Diffusion Modellen mit NVIDIA TensorRT, inklusive einer Demonstration durch a1111 @Gradio.

Stable Diffusion Modelle sind Teil der revolutionären Welle generativer KI-Modelle, die es ermöglichen, aus einfachen Textbeschreibungen realistische Bilder und Videos zu generieren. Diese Technologie hat das Potenzial, zahlreiche Branchen zu transformieren, von der Medien- und Unterhaltungsindustrie bis hin zu Design und Architektur. Die Beschleunigung dieser Modelle durch NVIDIA TensorRT ist ein entscheidender Schritt, um die Effizienz und Zugänglichkeit dieser Technologie zu verbessern.

NVIDIA TensorRT ist eine High-Performance Deep Learning Inference Plattform, die es ermöglicht, neuronale Netzwerke für die Produktion zu optimieren und zu beschleunigen. Die Plattform ist darauf ausgelegt, die Latenz zu minimieren und den Durchsatz für Deep Learning Anwendungen zu maximieren, was besonders für Echtzeitanwendungen von Bedeutung ist.

Die Neuerungen beinhalten die Beschleunigung verschiedener Stable Diffusion Modelle wie SDXL Turbo, LCM-LoRA und Stable Video Diffusion. Beginnen wir mit SDXL Turbo, das mit einer neuen Destillationstechnologie Spitzenleistungen erzielt und eine einzelne Schrittbildgenerierung ermöglicht. Die Hardware von NVIDIA, beschleunigt durch Tensor Cores und TensorRT, kann bis zu vier Bilder pro Sekunde produzieren. Dies ermöglicht den Benutzern erstmals den Zugang zur Echtzeit-SDXL-Bildgenerierung.

LCM-LoRA, eine Kombination aus dem latenten Konsistenzmodell (LCM) und der Technik zur geringrangigen Anpassung (Low-Rank Adaptation, LoRA), ermöglicht eine drastische Reduzierung der Anzahl an Sampling-Schritten, die benötigt werden, um ein Stable Diffusion Bild zu produzieren. Dies beschleunigt den Prozess erheblich, auch wenn dabei ein leichter Qualitätsverlust in Kauf genommen wird. LCM-LoRA kann etwa 9x schneller laufen, da es nur vier Schritte benötigt, verglichen mit den traditionell 50 Schritten, und wird durch TensorRT-Optimierungen beschleunigt.

Das Stable Video Diffusion Modell von Stability AI ist das erste Fundamentmodell für generatives Video basierend auf dem Bildmodell Stable Diffusion. Mit TensorRT läuft Stable Video Diffusion bis zu 40% schneller, was potenziell bis zu Minuten pro Generation sparen kann.

Für Entwickler, die sich für die Implementierung und Nutzung dieser Technologien interessieren, bietet NVIDIA zahlreiche Ressourcen. Dazu gehören technische Schulungen, Einblicke in Entwicklungen und der Zugang zu Experten auf der GTC (GPU Technology Conference). Darüber hinaus stehen diverse SDKs, Webinare und eine aktive Community für den Austausch und die Unterstützung zur Verfügung.

Die Stable Diffusion Web UI TensorRT-Erweiterung, die kürzlich aktualisiert wurde, umfasst die TensorRT-Beschleunigung für SDXL, SDXL Turbo und LCM-LoRA und ist auf dem NVIDIA/Stable-Diffusion-WebUI-TensorRT GitHub-Repository verfügbar. Eine Demo, die die Beschleunigung eines Stable Diffusion-Pipeline zeigt, ist ebenfalls verfügbar und bietet einen Einblick in die Leistungsfähigkeit der Anwendung.

NVIDIA organisiert auch einen Wettbewerb für Entwickler, die Ideen für von generativer KI angetriebene Windows-Apps oder Plugins haben. Die Teilnehmer haben die Chance, eine GeForce RTX 4090 GPU, einen vollständigen GTC-Konferenzpass und weitere Preise zu gewinnen.

Die Ankündigungen von NVIDIA zeigen nicht nur die dynamische Fortentwicklung im Bereich der generativen KI, sondern auch das Engagement des Unternehmens, Entwicklern die Werkzeuge an die Hand zu geben, mit denen sie die Grenzen des Möglichen weiter verschieben können. Mit der Beschleunigung von Stable Diffusion Modellen durch NVIDIA TensorRT werden neue kreative und effiziente Arbeitsabläufe ermöglicht, die in einer Vielzahl von Anwendungen und Branchen von Nutzen sein können.

Was bedeutet das?

No items found.