Obwohl es als viel leistungsfähiger als andere beworben wird, steckt die Text-zu-Video-Funktion noch in den Kinderschuhen. Geben Sie eine einfache Aufforderung wie „Mann geht durch den Wald“ und Sie erhalten eine ziemlich einfache Wiedergabe Ihrer Anfrage. Wenn Sie etwas Esoterischeres oder Unpräzises angeben, spuckt es ziemlich wilde Bilder aus. Um es klar zu sagen: Ich bevorzuge etwas stilistisch Seltsameres, aber dass sich Menschen ineinander verwandeln, ist nicht ganz das, was ich mit einer Aufforderung beabsichtigt habe.

22. Runway-Text zu VideoDer vielgepriesene Text-zu-Video-Generator von Runway.ML ist die beste Version, die Sie bekommen können, aber das zeigt eher, wie weit diese Generatoren gehen müssen, um etwas zu erstellen, das auch nur annähernd so leistungsfähig ist wie die meisten anderen KI-Bildgeneratoren.Die meisten Videos enthalten eine einfache Schwenk- oder Kamerafahrt, während die Motive auf dem Bildschirm umherschlendern oder in die Ferne starren. Die Bildqualität ist der von Runways Text-zu-Bild-Generator (dem Vorgänger von Stable Diffusion, falls Sie meinen, dass das obige Video auf verschiedenen Folien ähnlich aussieht) sehr ähnlich.
zeroscope_v2 XL, A watermark-free Modelscope-based video model capable of generating high quality video at 1024 x 576
Model on @huggingface : https://t.co/OK7IutQtE7
This model was trained with offset noise using 9,923 clips and 29,769 tagged frames at 24 frames, 1024×576… pic.twitter.com/K2jJS9N9KB
— AK (@_akhaliq) June 24, 2023
Der Vorteil des Modells von Runway besteht darin, dass das Video länger als 10 Sekunden laufen kann, während bei den anderen Modellen weitaus mehr Einschränkungen gelten. Den Benutzern stehen knapp über 100 Sekunden Videogenerierung zur Verfügung, bevor das Unternehmen sie auffordert, eines der kostenpflichtigen Abonnements des Unternehmens abzuschließen.
Obwohl Runway eine deutlich bessere Videoqualität als die anderen beiden Modelle produziert, handelt es sich dabei um nichts weiter als eine nette Spielerei. Einfach ausgedrückt: Text-to-Video ist cool und macht Spaß, aber es hat noch einen langen Weg vor sich.