Google Lumiere

Google Lumiere

Wie bereits im Blogbeitrag „Das war das KI-Jahr 2023 und das kommt 2024 auf uns zu“ angekündigt, dürfte 2024 unter anderem das Jahr generativer Videoerstellung werden.

Nun hat Google mit Lumiere ein fortschrittliches Text-to-Video (T2V) Diffusionsmodell vorgestellt, das sich durch seine Fähigkeit auszeichnet, realistische KI-Videos zu erzeugen. Dieses Modell nutzt eine innovative Architektur namens Space-Time U-Net (STUNet), die es ermöglicht, Videos mit kohärenten Bewegungsabläufen und hoher Qualität zu erzeugen. Diese Herangehensweise unterscheidet sich von vorherigen Modellen, die auf einer Abfolge von Teilschritten basierten und nur Teilbereiche des Videos gleichzeitig bearbeiten konnten.

Lumiere ist vielseitig einsetzbar, beispielsweise für Text oder Bild-zu-Video-Generierung und die Erstellung stilisierter Videos. Das Modell wurde mit einer umfangreichen Datensammlung von 30 Millionen Videos trainiert, die jeweils fünf Sekunden lang sind und mit Text-Untertiteln versehen wurden.

In einer Benutzerstudie übertraf Lumiere bestehende Text-zu-Video-Modelle wie Imagen Video , Pika , Stable Video Diffusion  und Gen-2 . Trotz seiner beeindruckenden Leistungsfähigkeit weist Lumiere auch Grenzen auf, wie die Unfähigkeit, Videos mit mehreren Szenen oder Szenenübergängen zu erzeugen, was zukünftige Forschungsbemühungen herausfordert.

Wie könnte sich dies auf den Tourismus auswirken?

  • Stadtplaner und Entwickler im Tourismussektor könnten das Modell nutzen, um geplante Projekte oder Entwicklungen in einem realistischen Format darzustellen, was bei der Planung und Genehmigung von Projekten helfen kann.
  • Lumiere könnte genutzt werden, um kulturelle Stätten oder Traditionen in einer Weise darzustellen, die physisch vielleicht nicht mehr existiert oder schwer zugänglich ist, wodurch ein Bewusstsein und eine Wertschätzung für diese Kulturen gefördert wird.
  • Tourismusorganisationen und -unternehmen könnten mithilfe von Lumiere beeindruckende, realistische Videos aus Textbeschreibungen erstellen. Dies ermöglicht die Erzeugung von Werbematerial, das spezifische Reiseziele oder Erfahrungen in hoher Qualität und mit großer Detailtreue darstellt, selbst wenn noch keine realen Aufnahmen existieren.

Diese Potenziale zeigen, dass Lumiere und ähnliche Technologien die Art und Weise, wie wir Reisen erleben und präsentieren, wesentlich verändern und bereichern könnten. Allerdings hängt die tatsächliche Nutzung und der Einfluss auf den Tourismus von verschiedenen Faktoren ab, einschließlich der Zugänglichkeit der Technologie, Kosten, rechtlichen Überlegungen und der Akzeptanz durch die Öffentlichkeit.