Alibaba Cloud stellt KI-Modelle für Videogenerierung als Open Source bereit
26.02.2025
IT, NewMedia & Software

Die vier Modelle - T2V-14B, T2V-1.3B, I2V-14B-720P und I2V-14B-480P - generieren hochwertige Bilder und Videos aus Text- und Bildeingaben. Entwickler, Forscher und Unternehmen weltweit können sie über die KI-Modell-Community Model Scope von Alibaba Cloud sowie auf der Plattform Hugging Face herunterladen und direkt einsetzen.
Die Anfang des Jahres vorgestellte Wan2.1-Serie ist das erste Videogenerierungsmodell, das Texteffekte sowohl in Chinesisch als auch in Englisch unterstützt. Die Modelle überzeugen durch realistische Darstellungen, indem sie komplexe Bewegungen präzise erfassen die Pixelqualität steigern, physikalische Prinzipien einhalten und die Ausführung von Anweisungen optimieren. Diese Stärken haben Wan2.1 an die Spitze der VBench-Bestenliste katapultiert - einer Benchmark-Suite für Videogenerierungsmodelle. Es ist das einzige Open-Source-Modell unter den Top fünf der VBench-Bestenliste von Hugging Face für die Videogenerierung. Mit einer Gesamtbewertung von 86,22 Prozent übertrifft die Serie andere Modelle in zentralen Bereichen wie Dynamik, räumliche Beziehungen, Farbqualität und Interaktion zwischen mehreren Objekten.
Die Entwicklung von Video-Grundlagenmodellen erfordert enorme Rechenressourcen und große Mengen an hochwertigen Trainingsdaten. Durch die Veröffentlichung dieser Modelle als Open Source senkt Alibaba Cloud die Hürden für Unternehmen, um mit KI visuelle Inhalte kostengünstig auf hohem Niveau zu produzieren.
Das Modell T2V-14B eignet sich besonders für die Erstellung von Videos mit komplexen Bewegungsabläufen und hoher Bildqualität. Das T2V-1.3B-Modell bietet eine ausgewogene Kombination aus Rechenleistung und Generierungsqualität, was es ideal für Entwickler und akademische Forschungsprojekte macht. Mit einem Standard-Laptop lässt sich mit T2V-1.3B beispielsweise ein 5-sekündiges Video in 480p-Auflösung in rund vier Minuten erstellen.
Neben der Text-zu-Video-Funktionalität bieten die Modelle I2V-14B-720P und I2V-14B-480P auch Bild-zu-Video-Funktionen. Anwender müssen lediglich ein einzelnes Bild zusammen mit einer kurzen Beschreibung eingeben, um dynamische Videos zu generieren. Dabei akzeptiert die Plattform Bilder in normaler Größe und beliebigen Abmessungen.
Alibaba Cloud gehört zu den ersten großen internationalen Technologieunternehmen, die ihre selbst entwickelten, großskaligen KI-Modelle als Open Source zugänglich machen. Bereits im August 2023 veröffentlichte Alibaba sein erstes Open-Source-Modell Qwen (Qwen-7B). Seitdem führen Qwen-Modelle regelmäßig die Hugging Face Open LLM Leaderboards an und erzielen Leistungen auf Augenhöhe mit führenden KI-Modellen weltweit. Mittlerweile haben Entwickler auf Hugging Face über 100.000 abgeleitete Modelle auf Basis der Qwen-Modellfamilie erstellt - damit gehört sie zu den größten KI-Modellfamilien weltweit.
(Die Bildrechte liegen bei dem Verfasser der Mitteilung.)
Firmenkontakt:
Alibaba Cloud
Sendlinger Straße 42 A
80331 München
Deutschland
089 / 211 871 36
https://www.alibabacloud.com/
Pressekontakt:
Schwartz Public Relations
Sendlinger Straße 42 A
80331 München
089 / 211 871 59
https://www.schwartzpr.de
Diese Pressemitteilung wurde über PR-Gateway veröffentlicht.
Für den Inhalt der Pressemeldung/News ist allein der Verfasser verantwortlich. Newsfenster.de distanziert sich ausdrücklich von den Inhalten Dritter und macht sich diese nicht zu eigen.
Weitere Artikel von Alibaba Cloud
14.03.2025 | Alibaba Cloud
Hoher Energieverbrauch als Bremsklotz für nachhaltige Digitalisierung
Hoher Energieverbrauch als Bremsklotz für nachhaltige Digitalisierung
07.03.2025 | Alibaba Cloud
Alibaba Cloud bricht mit Datenbank PolarDB Weltrekord
Alibaba Cloud bricht mit Datenbank PolarDB Weltrekord
24.01.2025 | Alibaba Cloud
Neue KI-Modelle, Tools und Cloud-Infrastrukturen
Neue KI-Modelle, Tools und Cloud-Infrastrukturen
22.10.2024 | Alibaba Cloud
Nachholbedarf beim Tracking von Nachhaltigkeitszielen
Nachholbedarf beim Tracking von Nachhaltigkeitszielen
Weitere Artikel in dieser Kategorie
31.03.2025 | Fivetran
Fivetran erweitert die Integration in Microsoft Fabric: Mehr als 700 Konnektoren für KI-fähige Data Lakes
Fivetran erweitert die Integration in Microsoft Fabric: Mehr als 700 Konnektoren für KI-fähige Data Lakes
31.03.2025 | Consist Software Solutions GmbH
Positive Bilanz in 2024
Positive Bilanz in 2024
31.03.2025 | Objektkultur Software GmbH
IT-Unternehmen Objektkultur Software GmbH erweitert Standort in Freiburg
IT-Unternehmen Objektkultur Software GmbH erweitert Standort in Freiburg
30.03.2025 | Leon Wilkens
Fiori App: Die Revolution der Benutzererfahrung im SAP-Umfeld
Fiori App: Die Revolution der Benutzererfahrung im SAP-Umfeld
29.03.2025 | Leon Wilkens
Die Bedeutung von Fashion ERP für die Modeindustrie
Die Bedeutung von Fashion ERP für die Modeindustrie
