AI/KI Film und Video Services

Hast du KI Services schon genutzt, wie rund 80% der deutschen oder auch internationalen Internet Nutzer? Bei dem Grad der Penetration geht es kaum mehr anders, schon aufgrund der neu gestalteten Ergebnisseiten der Google Suche. Hier sind die Ergebnisse auch zutreffend und sollten doch mal Unsicherheiten auftreten, dann, so die eigene Erfahrung, gibt es kein KI-Ergebnis bei der Google Suche. Ansonsten können die Ergebnisse bei der gezielten Nutzung von KI Chats allgemein bereichernd oder aber auch ernüchternd sein. Das ist keine negative Kritik, die Sache sollte einfach objektiv betrachtet werden. Es gibt auch einen Fachbegriff für falsche Ergebnisse, Halluzination (der künstlichen Intelligenz).

Und wie verhält es sich nun mit AI/KI im Bereich von Film und Video? Dies ist der Auftakt zu einer Artikelserie über KI-Services im Bereich Film und Video. Der erste Artikel ist den AI/KI Video Generatoren gewidmet, die sich nunmehr zum Teil auch als Film Generatoren bezeichnen. Schlagwort dazu ist Reference to Video, was den für Filme notwendigen Kontext zwischen Szenen ermöglicht.

Hierzu habe ich eine aktuelle Recherche durchgeführt und mir eine Reihe von Services angesehen, die auf unterschiedlicher Grundlage Videos generieren (Für alle, die nur Tools suchen, eine kommentierte Übersicht gibt es unter AI/KI Video und Film Generatoren.). Und tatsächlich beschreiben sich einige Services mittlerweile nicht mehr nur als Video Generation sondern auch als Film Generation Services. Wo ist der Unterschied? Filminhalte haben zumeist einen Kontext, was bei kurzen Videoclips nicht unbedingt notwendig ist. Generierte Videoclips können auch für sich alleine stehen und Emotion oder Witz enthalten. Sogar die Halluzination einer KI kann amüsant sein. Mittlerweile ist es aber soweit, Video Generation Services können auch Kontext haben und gezielt Inhalte generieren, die im größeren Kontext eines Filmes integriert werden können und dies auch in der erforderlichen Qualität.

Als ich vor rund anderthalb Jahren das erste Mal Tools zur Erstellung von Filmen recherchiert hatte, war dies noch nicht möglich. Die Recherchen führten aber zu meinem ersten komplett mit AI/KI erstellten Kurzfilm. Ziel der Recherche war es zu ergründen, wie KI für einen Film genutzt werden kann. Für Dialoge hatte ich mit einem Chatbot experimentiert und es ergab sich zufällig, dass ich bemerkte das sich der Chatbot an ein voriges Gespräch erinnerte. Diese Erkenntnis ist die Essenz des Videos. Umgesetzt wurde der Kurzfilm dann mit Sprachsynthese und die gewonnenen Audiofiles waren dann Grundlage für die Animation mittels AI Avatar Software. Nachstehend das Video.

Hier klicken, um den Inhalt von YouTube anzuzeigen.
Erfahre mehr in der Datenschutzerklärung von YouTube.


Es schien naheliegend, zumindest für mich als Anwender, zu vermuten das sich AI Software dahingehend entwickelt Inhalte zu merken und das irgendwann ein Punkt erreicht wird, ab dem Filme auf der Grundlage von Texteingaben generiert werden können. Vielleicht kommt es auch dazu, momentan scheint dies noch wesentlich zu komplex. Damals allerdings hatte wohl ChatGPT bereits damit angefangen Prompts zur Erhaltung von Kontext zu nutzen. Letzteres, die Nutzung von Prompts für Kontexte, ist nun dato zum State of the Art der Generierung von filmischen Inhalten geworden.

Kürzlich erst hat Midjourney, ein Pionier der Generierung von Bildern, in einer E-Mail mitgeteilt nun auch Video Generation Services anzubieten und dies gleich in fortgeschrittener Form. Mittels selbst zu erstellenden Prompts können Inhalte wie Personen oder Hintergründe etc. definiert werden und dann in entsprechenden Kontext gebracht werden. Es können also z.B. Person A und Person B unabhängig voneinander vor demselben Hintergrund erscheinen oder eine bestimmte Person vor unterschiedlichen Hintergründen. Die Machbarkeit ist der State of the Art, die Methoden können variieren. Die fachliche Bezeichnung für diese Methode ist Reference to Video. Es wird also nicht nur eine Vorlage zum Clip (Text to Video, Image to Video) sondern es werden Bilder oder sonstige Medien als Referenzen definiert, welche dann an unterschiedlichen Stellen verwendet werden. AI Video Anbieter in diesem Bereich sind Google Deepmind mit Veo bzw. insbesondere Flow, Hailuo AI, Midjourney, Pixverse, Sora von OpenAI, Vidu und der AI Video Pionier Runway (eine weitergehende Beschreibung der einzelnen Features der Services gibt es im Verzeichnis unter AI/KI Video und Film Generatoren).

Nochmals hervorzuheben sind die Feature von Runway. Bei Runway können auch Skizzen oder Storyboards zur Generierung von Filminhalten verwendet werden. Das ist im Bereich Film natürlich immens nützlich, stehen diese zumeist ohnehin zur Verfügung. Dazu möchte ich an dieser Stelle aber anmerken, dass nicht alle Services vollumfänglich sondern sofern überhaupt möglich nur mehr oder weniger sporadisch getestet wurden. Das aber im übrigen immer mit einem realen Ergebnis. So kann an dieser Stelle nicht gesagt werden ob Image to Video denselben Effekt haben kann, wie die Nutzung von Storyboards bei Runway. Vermutlich eher nicht oder nur ähnlich, wobei die Übergänge fliessend sind, wie die Showcases nahelegen.

Weitere neuere Features sind das automatische Anfügen von Sprache, wozu ich im oben eingebetteten Video noch mehrere Services nutzen musste. Auch das Anfügen von Soundeffekten ist eine neuere Funktion. Das nachstehende Video gibt ein Beispiel für das automatische Anfügen von Sprache. Dieses wurde mittels Image to Video mit Pixverse erstellt (Das Startbild entspricht dem originalen Bild.), die Sprachsynthese erfolgte automatisch basierend auf einen eingegebenen Text. Es war der erste und einzige Versuch. Ein Abgleich der Farben zwischen der gehobenen Hand und der Grafik hätte mit einer besseren Beschreibung vermutlich korrigiert werden können, worauf aber mangels Zeit verzichtet wurde. (Avatar für das eprima – Verzeichnis für Online Unterhaltung.)


Letztlich noch ein Beispiel eines schnell erstellten Videos mit aber durchaus beeindruckenden Ergebnissen für Image to Video mit Vidu. Auch hier war die Zeit knapp und es blieb beim ersten Versuch und so hat das Video einige, wenngleich durchaus amüsante Fehler. Auch dies wäre mit einer besseren Beschreibung sicher vermeidbar.

Hier das Bild (aus BerlinNFTQuiz), welches als Vorlage für den ersten Clip diente. Die verwendete Beschreibung war (die Bewegung innerhalb eines Bildes ist mittels Text zu beschreiben. Auch interessant wäre ein Versuch ohne Beschreibung.): „Schalte die Ampel auf grün und lasse die Autos fahren und einen Passanten schnell laufend hinter den Autos die Straße überqueren.“. Offenbar problematisch war es für die KI die richtige Ampel unter den Lichtern im Bild zu finden und die Strasse als zweispurig zu erkennen. Der Passant erscheint offenbar als weiteres Fahrzeug, welches komplett generiert und nicht Bestandteil des Ausgangsbildes ist.



Das letzte Beispiel inspirierte gleichfalls zu einer Überlegung für einen dystopischen Science Fiction Film. Ist KI vernetzt? Ja, sie lernt ja von Vorlagen auch aus dem Internet. Und wie definiert KI einen Passanten oder eine Person? Womöglich über die Intelligenz? Zumindest in einigen Science Fiction Filmen wurde thematisiert, wie denn ethisch mit künstlichem Leben umzugehen ist. Darf eine vermeintlich fühlende künstliche Intelligenz abgeschaltet werden oder gehen wir ihr auf den Leim, gestehen wir ihr Gefühle zu und lassen uns von deren Eigenleben überzeugen? Worauf ich aber hinaus will ist die Frage des Selbstverständnisses von KI, betrachtet diese sich selbst als eine Einheit, eine Entität? Hat die KI für das Video dem selbst generierten Auto die Eigenschaften einer Entität, eines intelligenten Wesens zugeschrieben und Auto mit Passant gleichgesetzt? Was ist, wenn künstliche Intelligenz sich irgendwann selbst als Entität definiert und die Prämissen setzt?

Online Media und Video Konverter

Der Media Konverter online-convert.com stellt einen Service ohne jegliche Verpflichtungen zur Verfügung, d.h. ohne Erfordernis der Registrierung oder Angabe einer Email Adresse. Zur Konvertierung können Dateien hochgeladen oder über einen Link übermittelt werden.

online-convert.com ist zudem sehr komfortabel und bietet neben der Konvertierung von Audio und Video auch die Konvertierung von Ebook Formaten, Dokumenten oder Archiven, Bilder und weitere Services wie Hash Encryption. Komfortabel, da Audio und Video Dateien nicht nur eins zu eins konvertiert sondern zudem Qualitäten ausgewählt werden können. Mehr bei online-convert.com.

FMarket.de Verzeichnis: Video Bearbeitung, Video Converter

Screen Recording mit Video in HD

Das Thema ist so schräg wie oft ein Thema um Internet Video und Online Film bei FMarket.de, doch so sind die neuen Medien und das ist so faszinierend wie es Spass macht. Screen Recording, wer es nicht weiss, umschreibt das Aufzeichnen von Geschehnissen auf dem Computer Monitor. Eine typische Form der Nutzung ist die Vorbereitung von Präsentationen oder Tutorials, doch sind auch sonst viele Formen der Nutzung denkbar und möglich wie z.B. die Aufzeichnung von Video Interviews oder Szenen in Virtual Reality Welten. Und auch hierbei ist neben dem Nutzen Qualität gefragt, eben gerade auch wenn die Szene womöglich in einen Film eingearbeitet werden soll. Und genau das kann Screenpresso.

Screenpresso kann Screenshots aufnehmen und ganze Szenen vom Bildschirm als Video aufzeichen und das ganze in bester Qualität als HD Video. Die Anwendung ist als Software realisiert und hat als solche noch eine ganze Reihe komfortabler Funktionen. Diese kann Videos in diverse Formate exportieren, stellt Funktionen zur Bildbearbeitung bereit (und hier nicht für Video) und ermöglicht das direkte Sharing wie auch den Upload auf YouTube. Mehr bei Screenpresso.

FMarket.de Verzeichnis: Video Software

Video Editing mit künstlicher Intelligenz

Magisto ist nicht unbedingt die Anwendung für Ästheten und Cineasten, aber ein innovatives Tool um schnell einen fertigen Film zu erstellen. Die Anwendung automatisiert Schnitt und Editing von Filmen durch Algorithmen und künstliche Intelligenz. Um einen Film zu erstellen können mehrere Clips und Musik ausgewählt werden, alles andere macht die Software. Sicher besonders interessant sollte die Anwendung für Mobile Nutzer sein, wo es oft besonders schnell gehen muss, doch gibt es auch eine Web Version. Weitere Informationen gibt es bei Magisto.

FMarket.de Verzeichnis: Video Bearbeitung, Video Software

Open Source Video Editing Software

Kostenlos und Open Source sind für den einen oder anderen bereits grosse Vorteile. Ein noch grösserer Vorteil kann die Plattform Unabhängigkeit der Video Editing Software VLMC sein, die sowohl auf Mac, Windows oder Linux installiert werden kann und zwar dann wenn Teilnehmer an einem Projekt mit unterschiedlichen Systemen arbeiten. Auch sonst ist die Software flexibel, im- und exportiert diverse Video Formate und verfügt über eine integrierte Upload Funktion für YouTube.

Anbieter der Software ist die Non-Profit Organisation VideoLAN, die auch den ebenso kompatiblen VLC Media Player anbietet und weitere Projekte um Video und Media Software betreibt.

FMarket.de Verzeichnis: Video Bearbeitung, Video Software

Video Bearbeitung auf YouTube

YouTube hat abermals den innerhalb des Video Sharing Portals befindlichen YouTube Video Editor um weitere Funktionen erweitert. Die aktuelle Verbesserung betrifft die Video Bearbeitung und Optimierung, wenn es schnell gehen musste und schnell gehen muss. Verwackelte, zu dunkle oder zu helle Aufnahmen können nun mit nur einem Klick optimiert werden. Schon zuvor übrigens wurde die Online Bearbeitung bzw. Nachbearbeitung bereits frei geschalteter Videos ermöglicht, etwas was zuvor nur vor der Freischaltung möglich war.

FMarket.de Verzeichnis: Video Bearbeitung, Video Software

Offizieller Standard zur Indizierung von Internet Video, Live Streams und Online Medien

Das W3C, eine der Internet Organisationen verantwortlich für Internet Standards wie z.B. auch das HTML der Webseiten, hat einen Standard zur Indizierung von Online Medien wie Bilder und auch Videos oder Live Streams etc. veröffentlicht. Dieser Standard ermöglicht die eindeutige Indizierung von Online Medien mittels eines speziellen Metatag Systems. Das ganze ist hochinteressant und bietet neben der eindeutigeren Klassifizierung wie über den Titel eines Videos möglich auch weitere Möglichkeiten zur Entwicklung neuer Anwendungen.

Neue Anwendungen, das können z.B. Online Programmführer sein oder in naher Zukunft die Integration von Informationen z.B. über Live Events bzw. Streams in EPGs, Elektronische Programmführer, wie diese auf TV oder sonstigen Geräten installiert sind.

Erste derartige Programmführer für Online Medien gibt es bereits, wie die hier vorgestellten Services Clicker und Live Matrix. Bislang waren Ereignisse in derartige Verzeichnisse jedoch einzutragen oder wurden durch proprietäre Systeme erfasst. Mit dem nun veröffentlichten Standard können Medien mit einem offenen Standard beschrieben werden und Anwendungen diesen Standard nutzen um Informationen bereit zu stellen.

Nachstehend der Artikel aus dem Newsletter zur Publikation der Recommendation, so die Bezeichnung der veröffentlichten Standards beim W3C, sowie der Link zu der Recommendation. Weitere Informationen um derartige Aktivitäten des W3C gibt es in den Seiten Video on the Web und Media Annotations Working Group.

Ontology for Media Resources 1.0 is a W3C Recommendation

Ontology for Media Resources 1.0

FMarket.de Verzeichnis: FMarket News

Starke Neuerungen bei YouTube

YouTube hat einige starke Neuerungen und wesentliche Veränderungen eingeführt. Die wohl spektakulärste Neuerung ist ein Video Konverter, der mittels nur eines Klick 2D Videos in 3D Videos umwandelt. So einfach wie es sich schreibt, so sensationell ist diese Neuerung, die ob der Grösse von YouTube bahnbrechende Veränderungen der Sehgewohnheiten mit sich bringen kann.

Auch die zweite Neuerung ist weitreichend. So wird die maximale Video Länge von 15 Minuten aufgehoben und auch herkömmliche Nutzer können künftig lange Videos hochladen. Voraussetzung hierfür ist eine bisher reine Weste was das Urheberrecht betrifft und die Verifikation des YouTube Accounts.

Schliesslich gibt es zwei neue Video Editing Anwendungen, Vlix für Effekte und Magisto, eine Video Editing Anwendung zur automatisierten Erstellung kurzer, lustige Videos.

Hier der offizielle Blog Post zur Ankündigung der Neuerungen:
Additional Creator Tools from YouTube

FMarket.de Verzeichnis: Video Bearbeitung, Video Software