Googles Bild-KI Imagen 3 jetzt für alle Gemini-Nutzer verfügbar
Google hat seine neueste Bildgenerierungs-KI, Imagen 3, für alle Nutzer seiner KI-Plattform Gemini weltweit freigegeben, einschließlich der kostenlosen Konten. Das Unternehmen bezeichnet Imagen 3 als sein bisher leistungsstärkstes Bildmodell, das in internen Tests Konkurrenten wie DALL-E 3, Midjourney v6 und Stable Diffusion 3 übertrifft.
Beeindruckende Bildqualität und lebensechte Darstellung
Imagen 3 soll sich durch die präzise Befolgung detaillierter Textvorgaben und die Erstellung besonders fotorealistischer Bilder auszeichnen. Google zufolge erzeugt das Modell weniger störende Artefakte als frühere Versionen, hat aber immer noch Schwierigkeiten mit Aufgaben, die numerisches oder räumliches Denken sowie komplexe Sprachansagen erfordern.
Zu den wichtigsten Neuerungen von Imagen 3 gehören:
- Verbesserte Detailtreue und Farbtiefe für noch realistischere Bilder
- Besseres Verständnis natürlicher Sprache in den Eingabeaufforderungen
- Vielfältige Formate und Stile, von fotorealistisch bis hin zu Ölgemälde- oder Knetanimations-Optik
- Effizientere Texteinbindung in die Bilder, z.B. für Grußkarten oder Präsentationen
Sorge um Missbrauch: Sicherheitsfilter und digitale Wasserzeichen
Um potenziellem Missbrauch vorzubeugen, hat Google Sicherheitsfilter und digitale Wasserzeichen implementiert. Eine frühere Version von Imagen hatte Google vom Markt genommen, nachdem Nutzer die KI dazu verwendet hatten, Schwarze Menschen in Nazi-Uniformen zu generieren.
Die neuen Sicherheitsmaßnahmen umfassen:
- Umfangreiche Filterung der Trainingsdaten, um schädliche Inhalte zu minimieren
- Bewertung der KI auf Fairness, Voreingenommenheit und Inhaltssicherheit
- Begrenzung der Möglichkeiten zur Generierung von Bildern mit Personen
- Automatische Kennzeichnung aller generierten Bilder mit einem digitalen Wasserzeichen (SynthID)
Einfache Bedienung direkt in Gemini integriert
Die Nutzung von Imagen 3 ist denkbar einfach: Nutzer geben einfach eine textliche Beschreibung des gewünschten Bildes ein, und die KI generiert innerhalb weniger Sekunden ein entsprechendes Ergebnis. Die Funktion ist direkt in die Benutzeroberfläche von Gemini integriert, sowohl in der Webversion als auch in der mobilen App. Es ist keine zusätzliche Einrichtung oder separate Anwendung erforderlich.
Vielfältige Einsatzmöglichkeiten in verschiedenen Branchen
Mit der globalen Verfügbarkeit von Imagen 3 demokratisiert Google den Zugang zu fortschrittlicher KI-Bildgenerierung. Nutzer weltweit können diese Technologie nun in verschiedenen Bereichen einsetzen, von Design und Werbung über Architektur und Produktentwicklung bis hin zu Bildung und Unterhaltung.
Quellen
https://9to5google.com/2024/10/09/gemini-imagen-3/
https://blog.google/products/gemini/google-gemini-update-august-2024/
https://www.tomsguide.com/ai/google-gemini/google-gemini-just-got-ai-image-generation-back-with-imagen-3-how-to-try-it-now
https://www.techradar.com/computing/artificial-intelligence/google-geminis-new-ai-image-generator-just-rolled-out-to-everyone-for-free-with-one-annoying-limitation
https://www.business-standard.com/technology/tech-news/google-releases-imagen-3-for-image-generation-to-all-gemini-users-details-124101000596_1.html
https://web.swipeinsight.app/posts/google-s-imagen-3-ai-image-generation-now-available-globally-in-gemini-11596
https://www.moneycontrol.com/news/business/google-rolls-out-imagen-3-ai-generating-tool-to-gemini-and-is-available-to-all-users-12839531.html
https://mezha.media/en/2024/10/10/google-imagen-3-generative-ai-for-image-creation-is-now-available-to-all-users/
https://www.newsbytesapp.com/news/science/google-launches-imagen-3-ai-tool-for-gemini-users/story
https://ai.google.dev/gemini-api/docs/imagen