Alibaba Cloud stellt KI-Modelle für Videogenerierung als Open Source bereit
26.02.2025
IT, NewMedia & Software

Die vier Modelle - T2V-14B, T2V-1.3B, I2V-14B-720P und I2V-14B-480P - generieren hochwertige Bilder und Videos aus Text- und Bildeingaben. Entwickler, Forscher und Unternehmen weltweit können sie über die KI-Modell-Community Model Scope von Alibaba Cloud sowie auf der Plattform Hugging Face herunterladen und direkt einsetzen.
Die Anfang des Jahres vorgestellte Wan2.1-Serie ist das erste Videogenerierungsmodell, das Texteffekte sowohl in Chinesisch als auch in Englisch unterstützt. Die Modelle überzeugen durch realistische Darstellungen, indem sie komplexe Bewegungen präzise erfassen die Pixelqualität steigern, physikalische Prinzipien einhalten und die Ausführung von Anweisungen optimieren. Diese Stärken haben Wan2.1 an die Spitze der VBench-Bestenliste katapultiert - einer Benchmark-Suite für Videogenerierungsmodelle. Es ist das einzige Open-Source-Modell unter den Top fünf der VBench-Bestenliste von Hugging Face für die Videogenerierung. Mit einer Gesamtbewertung von 86,22 Prozent übertrifft die Serie andere Modelle in zentralen Bereichen wie Dynamik, räumliche Beziehungen, Farbqualität und Interaktion zwischen mehreren Objekten.
Die Entwicklung von Video-Grundlagenmodellen erfordert enorme Rechenressourcen und große Mengen an hochwertigen Trainingsdaten. Durch die Veröffentlichung dieser Modelle als Open Source senkt Alibaba Cloud die Hürden für Unternehmen, um mit KI visuelle Inhalte kostengünstig auf hohem Niveau zu produzieren.
Das Modell T2V-14B eignet sich besonders für die Erstellung von Videos mit komplexen Bewegungsabläufen und hoher Bildqualität. Das T2V-1.3B-Modell bietet eine ausgewogene Kombination aus Rechenleistung und Generierungsqualität, was es ideal für Entwickler und akademische Forschungsprojekte macht. Mit einem Standard-Laptop lässt sich mit T2V-1.3B beispielsweise ein 5-sekündiges Video in 480p-Auflösung in rund vier Minuten erstellen.
Neben der Text-zu-Video-Funktionalität bieten die Modelle I2V-14B-720P und I2V-14B-480P auch Bild-zu-Video-Funktionen. Anwender müssen lediglich ein einzelnes Bild zusammen mit einer kurzen Beschreibung eingeben, um dynamische Videos zu generieren. Dabei akzeptiert die Plattform Bilder in normaler Größe und beliebigen Abmessungen.
Alibaba Cloud gehört zu den ersten großen internationalen Technologieunternehmen, die ihre selbst entwickelten, großskaligen KI-Modelle als Open Source zugänglich machen. Bereits im August 2023 veröffentlichte Alibaba sein erstes Open-Source-Modell Qwen (Qwen-7B). Seitdem führen Qwen-Modelle regelmäßig die Hugging Face Open LLM Leaderboards an und erzielen Leistungen auf Augenhöhe mit führenden KI-Modellen weltweit. Mittlerweile haben Entwickler auf Hugging Face über 100.000 abgeleitete Modelle auf Basis der Qwen-Modellfamilie erstellt - damit gehört sie zu den größten KI-Modellfamilien weltweit.
(Die Bildrechte liegen bei dem Verfasser der Mitteilung.)
Firmenkontakt:
Alibaba Cloud
Sendlinger Straße 42 A
80331 München
Deutschland
089 / 211 871 36
https://www.alibabacloud.com/
Pressekontakt:
Schwartz Public Relations
Sendlinger Straße 42 A
80331 München
089 / 211 871 59
https://www.schwartzpr.de
Diese Pressemitteilung wurde über PR-Gateway veröffentlicht.
Für den Inhalt der Pressemeldung/News ist allein der Verfasser verantwortlich. Newsfenster.de distanziert sich ausdrücklich von den Inhalten Dritter und macht sich diese nicht zu eigen.
Weitere Artikel von Alibaba Cloud
24.01.2025 | Alibaba Cloud
Neue KI-Modelle, Tools und Cloud-Infrastrukturen
Neue KI-Modelle, Tools und Cloud-Infrastrukturen
22.10.2024 | Alibaba Cloud
Nachholbedarf beim Tracking von Nachhaltigkeitszielen
Nachholbedarf beim Tracking von Nachhaltigkeitszielen
Weitere Artikel in dieser Kategorie
26.02.2025 | DORA Protect GmbH
DORA Protect GmbH - Cyberangriffe: Deshalb müssen Unternehmen handeln
DORA Protect GmbH - Cyberangriffe: Deshalb müssen Unternehmen handeln
26.02.2025 | Vertex, Inc. Pressekontakt
Vertex erweitert die Kapazitäten für e-Invoicing zur Optimierung von Compliance & Reporting
Vertex erweitert die Kapazitäten für e-Invoicing zur Optimierung von Compliance & Reporting
26.02.2025 | Freshworks Inc.
Freshworks und Unisys bündeln ihre Kräfte, um das IT-Servicemanagement für mittelständische und große Unternehmen zu transformieren
Freshworks und Unisys bündeln ihre Kräfte, um das IT-Servicemanagement für mittelständische und große Unternehmen zu transformieren
26.02.2025 | Vitel GmbH
Neuerung beim MAX BR1 Mini 5G: Peplink-Router jetzt auch mit WLAN verfügbar
Neuerung beim MAX BR1 Mini 5G: Peplink-Router jetzt auch mit WLAN verfügbar
26.02.2025 | Insiders Technologies GmbH
Insiders Technologies treibt mit KI-gestützter Software die Digitalisierung im Gesundheitswesen voran
Insiders Technologies treibt mit KI-gestützter Software die Digitalisierung im Gesundheitswesen voran
