Vergleich führender KI Bildgeneratoren: Dall-E, Midjourney und Stable Diffusion im Fokus

Kategorien:
No items found.
Freigegeben:

Dall-E, Midjourney und Stable Diffusion: Ein umfassender Überblick über die besten KI-Bildgeneratoren

Einleitung

Die Welt der KI-Bildgeneratoren hat in den letzten Jahren erhebliche Fortschritte gemacht. Drei der bekanntesten und am häufigsten verwendeten Tools sind Dall-E, Midjourney und Stable Diffusion. Diese Technologien haben die Art und Weise, wie wir visuelle Inhalte erzeugen und nutzen, revolutioniert. Dieser Artikel gibt einen umfassenden Überblick über diese drei führenden KI-Bildgeneratoren, ihre Funktionsweise, Vor- und Nachteile sowie ihre Anwendungsbereiche.

Wie funktioniert eine Bild-KI?

Aus Nutzersicht funktionieren Bildgeneratoren denkbar einfach: Man beschreibt, was man gerne sehen möchte, und die KI liefert ein passendes Bild. Dabei kann man beispielsweise einen bestimmten Zeichenstil wählen, die Farben festlegen oder auch eine Aufnahme durch einen spezifischen Kameratyp nachahmen lassen.

Technisch betrachtet ist der Prozess hingegen deutlich komplexer. Grundsätzlich gibt es mehrere Methoden, um Bilder mithilfe einer KI zu erzeugen. Am weitesten verbreitet sind mittlerweile sogenannte Diffusionsmodelle. Dabei wird einem künstlichen neuronalen Netzwerk beigebracht, wie es Bildrauschen von Bildern entfernt. Dieser Prozess wird nach dem Training quasi umgedreht, und das Diffusionsmodell kann dann aus zufällig generiertem Rauschen ein neues Bild erzeugen.

Dall-E 3: Das kann der Bildgenerator von OpenAI

Das Vorgängermodell Dall-E 2 hat maßgeblich dazu beigetragen, die Produktkategorie überhaupt erst populär zu machen. Erstmals konnten Nutzer:innen qualitativ überzeugende Bilder anhand von Texteingaben erzeugen. Qualitativ wurde das KI-Modell in der Folgezeit aber deutlich von einigen Konkurrenten überholt. Erst mit der Einführung von Dall-E 3 im August 2023 spielt OpenAI auch wieder an der Spitze mit.

Derzeit gibt es zwei Möglichkeiten, Dall-E 3 zu verwenden. Bei der ersten kann man direkt aus ChatGPT heraus Bilder erzeugen. Allerdings geht das nur, wenn man ein kostenpflichtiges ChatGPT-Plus-Abonnement hat, das 20 US-Dollar pro Monat kostet. Zusätzlich zur priorisierten Nutzung von OpenAIs Chatbot kann man damit täglich bis zu 50 Bilder von Dall-E 3 generieren lassen.

Alternativ bietet Microsoft kostenfreien Zugriff auf Dall-E 3 über den Bing Image Creator. Dabei gibt es jedoch gewisse Einschränkungen. Für jeden Prompt erzeugt der Bing Image Creator vier Bildvarianten. Dafür wird jeweils ein sogenannter „Boost“ abgezogen. Das sind Punkte, von denen man pro Woche maximal 15 erhält. Wenn alle aufgebraucht sind, kann man zwar weiterhin Bilder generieren, das dauert dann aber mitunter deutlich länger.

Midjourney: Extrem gute Bild-KI mit gewissen Usability-Nachteilen

Midjourney liefert konsistent die besten Ergebnisse aller Anbieter. Allerdings hat das Tool aus Nutzungssicht einen erheblichen Nachteil: Im Gegensatz zur Konkurrenz verfügt Midjourney über kein eigenes Web-Interface. Vielmehr erfolgt der Zugriff über den Chat-Dienst Discord. Dort kann man über den Befehl /imagine seine Bildvorstellung an Midjourney übermitteln und erhält dann jeweils vier Bildvarianten.

Die Bedienung in Discord geht grundsätzlich schnell von der Hand. Nutzer:innenfreundlich ist das Ganze aber nicht wirklich. Immerhin arbeitet Midjourney an einem eigenen Web-Interface. Darüber kann man derzeit aber noch keine eigenen Bilder generieren.

Auch das Preismodell von Midjourney ist relativ kompliziert. Los geht es mit dem Basic-Plan für 10 Dollar monatlich oder 96 Dollar jährlich. Bei dem Plan ist man auf 3,3 Rechenstunden pro Monat begrenzt. Für 30 Dollar pro Monat oder 288 Dollar pro Jahr erhöht sich die für die Bildberechnung notwendige GPU-Zeit auf 15 Stunden.

Stable Diffusion 3 auf Discord oder als Web-Chat

Stable Diffusion 3 ist die aktuelle Variante der wohl bekanntesten quelloffenen Bild-KI. Weil das Modell unter einer Open-Source-Lizenz steht, kann man es auch selbst hosten, lokal auf dem eigenen Rechner einsetzen oder einen der vielen kommerziellen Web-Anbieter nutzen, um damit Bilder zu generieren. Um einen besseren Vergleich mit den vorangegangenen Anbietern zu gewährleisten, wollen wir uns aber vor allem die zwei Cloud-Angebote von Hersteller Stability AI anschauen.

Wie Midjourney bietet auch Stability AI den Zugriff über den Chatdienst Discord an. Das wird unter dem Namen Stable Artisan angeboten. Alternativ gibt es aber auch einen eigenen webbasierten Chat zur Bilderzeugung, der sich Stable Assistant nennt.

Bei Stable Diffusion gibt es neben dem eigentlichen Prompt, in dem man das gewünschte Bild beschreibt, auch den sogenannten Negativ-Prompt. Hier legt man fest, was auf dem Bild nicht zu sehen sein soll. So soll man genauer definieren können, was man eigentlich sehen will.

Je nach gewünschtem Endergebnis ist auch die Sketch-Funktion enorm hilfreich. Hier legt man dem Prompt eine kleine Skizze bei. Die muss nicht sonderlich gut gezeichnet sein. In Kombination mit dem richtigen Prompt werden hier aus ein paar Rechtecken schnell eine Skyline. Grundsätzlich hat man durch die Funktion eine Möglichkeit, die Bildkomposition selbst zu bestimmen.

Egal, ob man sich für oder gegen Discord entscheidet, die Preise sind identisch. Abhängig von dem gewählten Abonnement erhält man eine bestimmte Anzahl Credits. Pro erzeugtem Bild werden 6,5 Credits vom Guthaben abgezogen. Außerdem kostet jede Nachricht an den Chatbot 0,1 Credit.

Los geht es bei neun Dollar pro Monat. Dafür erhält man 900 Credits. Für 19 Dollar erhält man monatlich 1.900 Credits und für 49 Dollar gibt es 5.500 Credits. Das teuerste Paket schlägt mit 99 Dollar monatlich zu Buche. Hier bekommt man dann 12.000 Credits monatlich.

Fazit

Die Wahl des besten KI-Bildgenerators hängt stark von den individuellen Anforderungen und Vorlieben ab. Midjourney beeindruckt durch seine hohe Bildqualität, hat aber Usability-Nachteile aufgrund der Discord-Integration. Dall-E 3 bietet eine einfache Nutzung und Integration in bestehende OpenAI-Dienste, während Stable Diffusion durch seine Flexibilität und Open-Source-Natur besticht. Jeder dieser Generatoren hat seine eigenen Stärken und Schwächen, und die beste Wahl hängt oft von den spezifischen Bedürfnissen und Vorlieben des Nutzers ab.

Bibliographie


   - https://t3n.de/news/dall-e-midjourney-und-stable-diffusion-die-besten-ki-bildgeneratoren-im-ueberblick-1629159/
   - https://www.finanznachrichten.de/nachrichten-2024-06/62450084-dall-e-midjourney-und-stable-diffusion-die-besten-ki-bildgeneratoren-im-ueberblick-397.htm
   - https://t3n.de/news/midjourney-dall-e-stable-diffusion-bild-ki-bildgenerator-1587907/
   - https://www.landtwing.org/midjourney-vs-dall-e-vs-stable-diffusion-vergleich-der-ki-bildgeneratoren/
   - https://www.gradually.ai/ki-bildgeneratoren/
   - https://robert-leitinger.com/ki-bildgeneratoren/
   - https://marketing-ki.de/ki-im-einsatz/vergleich-der-top-bildgeneratoren-2024-dall-e-3-adobe-firefly-midjourney-stable-diffusion/
   - https://www.experte.de/ki-bildgeneratoren
   - https://www.bajorat-media.com/vergleich-der-ki-bildgeneratoren-2023-17414/
   - https://www.ki-im-alltag.de/ki-bild-generatoren/

Was bedeutet das?
No items found.