Aus Gizmodos Testfahrt von ModelScope

Die KI Text-zu-Video-System namens ModelScope wurde am 18. März veröffentlicht und hat bereits für ein Aufsehen mit seinen manchmal ungeschickten und oft irren 2-Sekunden-Videoclips geworben. Das DAMO Vision Intelligence Lab, eine Forschungsabteilung des E-Commerce-Riesen Alibaba, hat das System als eine Art öffentlichen Testfall entwickelt. Laut den Unternehmensangaben verwendet das System ein ziemlich einfaches Diffusionsmodell zur Erstellung seiner Videos.
Seite Beschreibung seines KI-Modells.
23. ZeroskopAuf Basis des ModelScope-Prototyps werden einige neue Modelle erstellt, darunter zeroscope_v2, eine Familie von Open-Source-Modellen. Dies erzeugt Videos in höherer Qualität als ModelScope, und die XL-Version kann sie auf eine Auflösung von 1024 x 576 hochskalieren. Es ist verfügbar aufUmarmendes Gesicht.Das Generieren eines Videos aus dem Modell kann ziemlich lange dauern, wenn Sie den öffentlichen Raum einer anderen Person verwenden, aber die Ergebnisse sind schon für sich genommen ziemlich interessant.