Alibaba Cloud stellt KI-Modelle für Videogenerierung als Open Source bereit
26.02.2025 / ID: 424967
IT, NewMedia & Software

Die vier Modelle - T2V-14B, T2V-1.3B, I2V-14B-720P und I2V-14B-480P - generieren hochwertige Bilder und Videos aus Text- und Bildeingaben. Entwickler, Forscher und Unternehmen weltweit können sie über die KI-Modell-Community Model Scope von Alibaba Cloud sowie auf der Plattform Hugging Face herunterladen und direkt einsetzen.
Die Anfang des Jahres vorgestellte Wan2.1-Serie ist das erste Videogenerierungsmodell, das Texteffekte sowohl in Chinesisch als auch in Englisch unterstützt. Die Modelle überzeugen durch realistische Darstellungen, indem sie komplexe Bewegungen präzise erfassen die Pixelqualität steigern, physikalische Prinzipien einhalten und die Ausführung von Anweisungen optimieren. Diese Stärken haben Wan2.1 an die Spitze der VBench-Bestenliste katapultiert - einer Benchmark-Suite für Videogenerierungsmodelle. Es ist das einzige Open-Source-Modell unter den Top fünf der VBench-Bestenliste von Hugging Face für die Videogenerierung. Mit einer Gesamtbewertung von 86,22 Prozent übertrifft die Serie andere Modelle in zentralen Bereichen wie Dynamik, räumliche Beziehungen, Farbqualität und Interaktion zwischen mehreren Objekten.
Die Entwicklung von Video-Grundlagenmodellen erfordert enorme Rechenressourcen und große Mengen an hochwertigen Trainingsdaten. Durch die Veröffentlichung dieser Modelle als Open Source senkt Alibaba Cloud die Hürden für Unternehmen, um mit KI visuelle Inhalte kostengünstig auf hohem Niveau zu produzieren.
Das Modell T2V-14B eignet sich besonders für die Erstellung von Videos mit komplexen Bewegungsabläufen und hoher Bildqualität. Das T2V-1.3B-Modell bietet eine ausgewogene Kombination aus Rechenleistung und Generierungsqualität, was es ideal für Entwickler und akademische Forschungsprojekte macht. Mit einem Standard-Laptop lässt sich mit T2V-1.3B beispielsweise ein 5-sekündiges Video in 480p-Auflösung in rund vier Minuten erstellen.
Neben der Text-zu-Video-Funktionalität bieten die Modelle I2V-14B-720P und I2V-14B-480P auch Bild-zu-Video-Funktionen. Anwender müssen lediglich ein einzelnes Bild zusammen mit einer kurzen Beschreibung eingeben, um dynamische Videos zu generieren. Dabei akzeptiert die Plattform Bilder in normaler Größe und beliebigen Abmessungen.
Alibaba Cloud gehört zu den ersten großen internationalen Technologieunternehmen, die ihre selbst entwickelten, großskaligen KI-Modelle als Open Source zugänglich machen. Bereits im August 2023 veröffentlichte Alibaba sein erstes Open-Source-Modell Qwen (Qwen-7B). Seitdem führen Qwen-Modelle regelmäßig die Hugging Face Open LLM Leaderboards an und erzielen Leistungen auf Augenhöhe mit führenden KI-Modellen weltweit. Mittlerweile haben Entwickler auf Hugging Face über 100.000 abgeleitete Modelle auf Basis der Qwen-Modellfamilie erstellt - damit gehört sie zu den größten KI-Modellfamilien weltweit.
(Die Bildrechte liegen bei dem Verfasser der Mitteilung.)
Firmenkontakt:
Alibaba Cloud
Sendlinger Straße 42 A
80331 München
Deutschland
089 / 211 871 36
https://www.alibabacloud.com/
Pressekontakt:
Schwartz Public Relations
Sendlinger Straße 42 A
80331 München
089 / 211 871 59
https://www.schwartzpr.de
Diese Pressemitteilung wurde über PR-Gateway veröffentlicht.
Für den Inhalt der Pressemeldung/News ist allein der Verfasser verantwortlich. Newsfenster.de distanziert sich ausdrücklich von den Inhalten Dritter und macht sich diese nicht zu eigen.
Weitere Artikel von Alibaba Cloud
30.06.2025 | Alibaba Cloud
Alibaba Cloud bringt KI+Cloud-Strategie nach Europa
Alibaba Cloud bringt KI+Cloud-Strategie nach Europa
26.05.2025 | Alibaba Cloud
Alibaba veröffentlicht Open-Source-Modell zur Videoproduktion
Alibaba veröffentlicht Open-Source-Modell zur Videoproduktion
10.04.2025 | Alibaba Cloud
Alibaba Cloud stärkt KI-Angebot für internationale Kunden
Alibaba Cloud stärkt KI-Angebot für internationale Kunden
14.03.2025 | Alibaba Cloud
Hoher Energieverbrauch als Bremsklotz für nachhaltige Digitalisierung
Hoher Energieverbrauch als Bremsklotz für nachhaltige Digitalisierung
07.03.2025 | Alibaba Cloud
Alibaba Cloud bricht mit Datenbank PolarDB Weltrekord
Alibaba Cloud bricht mit Datenbank PolarDB Weltrekord
Weitere Artikel in dieser Kategorie
11.07.2025 | b.telligent
Mit Daten gegen Artensterben & Klimakrise
Mit Daten gegen Artensterben & Klimakrise
11.07.2025 | devolo solutions GmbH
WLAN für Garage und Garten
WLAN für Garage und Garten
10.07.2025 | Quintauris GmbH
Quintauris gibt neue Partnerschaft mit WHIS bekannt
Quintauris gibt neue Partnerschaft mit WHIS bekannt
09.07.2025 | OneQrew GmbH
Sykasoft präsentiert innovative Terminplaner-App
Sykasoft präsentiert innovative Terminplaner-App
09.07.2025 | Reply Deutschland SE
Valorem Reply bringt KI-gestützte Bilderkennung auf die internationalen Kunstmessen von Art Basel
Valorem Reply bringt KI-gestützte Bilderkennung auf die internationalen Kunstmessen von Art Basel
