Die Welt der KI-gestützten Videogenerierung entwickelt sich rasant. Ein neuer Akteur auf diesem Gebiet ist KLING, eine Software der chinesischen Firma Kuaishou, die mit einer innovativen Funktion namens "Custom Models" aufwartet. Diese ermöglicht es Nutzern, eigene KI-Videocharaktere zu trainieren und in ihren Videos einzusetzen.
Erste Tests zeigen, dass das Training der Charaktere durch das Hochladen von 10 bis 30 Videos, jedes mindestens 10 Sekunden lang, erfolgt. Im Gegensatz zu traditionellen Bildmodellen, die auf Standbildern basieren, verwendet KLING Videomaterial für das Training. Interessanterweise kann dieses Trainingsmaterial auch KI-generierte Videos von KLING selbst beinhalten.
Nach dem Training können Nutzer das trainierte Charaktermodell im Prompt markieren und die gewünschte Szene beschreiben. Das System generiert dann Videos, in denen der Charakter konsistent dargestellt wird, sei es in 360-Grad-Rotationen oder komplexeren Szenen mit zeitversetzten Gesichtsaufnahmen und verschiedenen Kamerawinkeln.
KLING wurde im Juli 2023 international veröffentlicht und unterstützt in der aktuellen Version 1.5 HD-Videos mit einer Auflösung von 1080p. Verschiedene Formate, darunter Querformat (16:9, 4:3), Hochformat (9:16, 3:4) und quadratisches Format (1:1), stehen zur Verfügung.
Neben den "Custom Models" bietet KLING weitere Funktionen wie den "Motion Brush", mit dem Nutzer die Bewegung einzelner Elemente innerhalb eines Bildes präzise steuern können. Nutzer können sich mit einer E-Mail-Adresse registrieren und erhalten täglich 66 kostenlose Credits für die Videokreation.
KLING basiert, ähnlich wie OpenAI's Sora, auf einer Kombination aus Diffusionsmodellen und Transformer-Architektur. Diese Architektur ermöglicht die Verarbeitung großer Videodatensätze und effiziente Generierung von Ergebnissen. Ein möglicher Vorteil von KLING gegenüber Sora könnte der Zugang zu den umfangreichen Videodaten der Muttergesellschaft Kuaishou sein, einer der größten Short-Video-Plattformen Chinas.
Die derzeitige Beschränkung auf fünfsekündige Videos stellt eine Herausforderung für KLING dar. Längere Videos bergen das Risiko von Inkonsistenzen und Fehlern. Dennoch bietet die Technologie Potenzial für die Kurzvideo-Branche, in der kurze, prägnante Clips im Vordergrund stehen.
Der Erfolg von KLING wird auch von der weiteren Entwicklung im Bereich der Text-zu-Video-Tools abhängen. Mit Konkurrenten wie Runway, Luma AI und voraussichtlich auch ByteDance steht KLING in einem dynamischen und innovativen Marktsegment.
Bibliographie https://klingai.io/ https://www.technologyreview.com/2024/06/19/1094027/kling-kuaishou-video-ai-china/ https://iartificial.blog/en/applications/kling-ai-future-videos-artificial-intelligence/ https://www.nowadais.com/kuaishous-ai-powered-video-generation-model-kling/ https://www.youtube.com/watch?v=vn-Bmmu-Kvw https://informedsauce.com/news/ai/chinese-ai-video-generator-kling-is-now-available-internationally/ https://kling.kuaishou.com/en https://echocraftai.com/kling-ai-a-new-in-text-to-video-technology/ https://lumalabs.ai/dream-machine