Google Veo
Google Veo ist der Name des Video Generation Projekt von Google, wobei Google einige KI Projekte am laufen hat, welche unter Google Deepmind verwaltet werden. Veo ist in Gemini, dem kostenlos verfügbaren Google KI Service, und in Flow integriert, wobei Flow das eigentliche AI Filmmaking Tool ist. Aktuell können damit Clips in cinematografischer Qualität, Szenen und Stories generiert werden. Auch Ton kann automatisch mit erstellt werden. Die Services von Flow sind nur für Premium Abo Kunden der Google AI Services verfügbar. Unter Google AI Studio ist jedoch eine limitierte Version verfügbar. Zu Flow gibt es unter Flow TV eine Seite mit Channels und Kurzfilmen.
Hailuo AI
Text to Video und Image to Video ist mit Hailuo AI möglich. Weitergehende Funktionen sind Kameraführung durch Sprache oder Prompts und Referenzcharaktere. Beispiele generierter Videos gibt es in der Webseite unter „Explore“.
Pixverse.ai
Bei Pixverse stehen neben der einfachen Generierung von Inhalte einige interessante Optionen zur Verfügung, die als Übergang und Fusion benannt sind. Bei „Übergang“ kann das erste und letzte Bild hochgeladen werden und Text angefügt werden, der mittels Sprachsynthese ausgegeben wird. Auch Soundeffekte können eingefügt werden. Mittels „Fusion“ können Bilder von Personen und Hintergründen zu Szenen kombiniert vorgegeben werden. Bei Pixverse gibt es Credits bei der Anmeldung und täglichen Login.
Runway
Runway gehört zu den Pionieren bei der Erstellung von Videos mittels künstlicher Intelligenz. Mittlerweile gibt es sogar unterschiedliche Methoden zur Video Generierung, u.a. Text to Video mittels Prompts. Beeindruckend ist die Option Vorlagen in Form eines Storyboards, Skizzen oder auch Fotos zu nutzen um Filme in cinematografischer Qualität zu erstellen. Mittels Reference Tags ist es zudem möglich konsistente Charaktere und Locations zu erstellen, also dieselben Charaktere an unterschiedlichen Orten darzustellen oder unterschiedliche Charaktere in denselben Locations. Unter Runway Studios werden einige mit dem System erstellte Filme vorgestellt.
Sora, OpenAI
Sora ist ein Text to Video Modell von OpenAI. Das System ist fähig komplexe Szenen zu generieren, z.B. mit mehreren Personen, Bewegungsabläufen und Hintergründen, auch mehrere Perspektiven derselben Szene sind möglich. Weitere nützliche Funktionen dienen der Korrektur innerhalb generierter Videos und eine Timeline um mehrere Videoclips miteinander zu verbinden.
Vidu
Video Generation mittels Text to Video, Image to Video und Reference to Video. Besonders letzteres ist interessant um eine konkrete Szene zu erstellen. Dazu können in Form von Skizzen oder Fotos Bilder von Personen, Gegenständen und Hintergründen hochgeladen werden. Über zusätzlichen Text kann die gewünschte Szene bzw. ein Ablauf beschrieben werden, was dann vom System erstellt wird. Vidu ist recht großzügig mit den Credits. Es gibt ein Startbudget und weitere Credits lassen sich durch tägliches Login und Erfüllung von Aufgaben verdienen. Neben der kostenlosen Version sind natürlich auch Abos verfügbar.
Adobe Firefly
Firefly ist ein AI Service von Adobe zur Generierung von Bildern, Vektorgrafiken und Videos. Dazu steht das eigene Firefly Modell zur Verfügung und es kann auf Google Veo zugegriffen werden. Für Video gibt es einige interessante Funktionen besonders für die Kameraführung. Hier können Perspektiven und Nähe ausgewählt werden. Firefly gibt es als Premium Services, dieser kann aber kostenlos getestet werden.
Midjourney
Midjourney, gestartet als Image Generation Service, hat nun auch Video Generation Services im Repertoire. Die erst im Juni 2025 vorgestellten Video Services besitzen bereits fortgeschrittene Funktionen. So können Personen und Hintergründe mit individuellen Prompts versehen und dann entsprechend kombiniert werden. Es ist also möglich unterschiedliche konsistente Figuren vor unterschiedlichen konsistenten Hintergründen agieren zu lassen. Eine kostenlose Version zum ausprobieren gibt es leider nicht.
Amazon Nova Creative
Auch Amazon Web Services (AWS) hat ein Angebot zur Generierung von Bilder und Videos, welches sich aber an versierte Nutzer richtet. Diese KI Modelle stehen offenbar zur Nutzung bereit, wohingegen Amazon Nova auch das Hosting und die Entwicklung bzw. das Training von KI Modellen für Unternehmen anbietet.