KI-Videosynthese Bytedance/TikTok zeigen aktuellen KI-Clipgenerator mit Bewegungskontrolle

// 12:12 Mo, 12. Feb 2024von Rudi Schmidts

Boximator ist ein KI-Modell von Bytedance Research - also aus dem geschäftlichen Umfeld von TikTok. Dieses neue Tool dient wie schon viele Vorgänger zur Generierung von realistischen und und zugleich kontrollierbaren Bewegungen in der KI-Videosynthese.

Traditionell wird die KI-Videosynthese durch einen Textprompt ("Text zu Video") gesteuert. Neuerdings lässt sich auch noch ein demonstratives Bild hinzufügen, welches als Ausgangsbild dienen soll. Aus diesem Input generiert ein KI-Modell dann einen bewegten Videoclip. Da man mit Text jedoch nicht immer alles exakt beschreiben kann, bzw. viele Möglichkeiten mehrdeutig bleiben, fällt das Ergebnis oft nicht nach den eigenen Erwartungen aus.

Bytedance/TikTok show current AI clip generator with motion control — Bytedance/TikTok zeigen aktuellen KI-Clipgenerator mit Bewegungskontrolle

Boximator geht dabei einen neuen Weg der Eingabe: Über Boxen oder Pfadangaben lässt sich dem Modell genauer zeigen, was man sich an Bewegung im Bild wünscht. Dies ist nicht bahnbrechend neu, jedoch wirken die Ergebnisse der erfundenen Bewegungen State of the Art. Beine von laufenden Personen scheinen oft schon sehr gut gelungen (was bei anderen aktuellen KI-Modellen meist noch problematisch ist). Das folgende Video gibt eine gute Übersicht über die Funktionsweise und die Qualität der Ergebnisse:

// Top-News auf einen Blick:

In 2-3 Monaten soll eine Demo-Webseite veröffentlicht werden, um Boximator mit eigenen Daten ausprobieren zu können. Wer dies nicht mehr abwarten kann, kann aber auch mit dem Team per Email in Kontakt treten, um das Tool sofort auszuprobieren. Genaueres findet sich (am unteren Ende der verlinkten Github-Projektseite). Das zugrunde liegende KI-Modell PixelDance findet sich übrigens hier.

Ein Arxiv-Paper steht ebenfalls schon bereit, allerdings gibt es noch keinen öffentlichen Code zu dem Projekt.

mehr Infos bei
boximator.github.io

Auf Socials teilen:

KI-Videosynthese Bytedance/TikTok zeigen aktuellen KI-Clipgenerator mit Bewegungskontrolle

// Top-News auf einen Blick:

Vertikal, horizontal, egal - TikTok will neues YouTube werden

Text-zu-Video KI jetzt auch von Google: Imagen Video

Erst Bilder, dann Sounds: Neue Google-KI generiert beliebige Musik nach ...

Qualitätssprung bei KI-Video-Konsistenz? MagicVideo-V2 mit TikTok-Nähe

Harte Schnitte und Konsistenz Ist TikToks neue Video-KI Seaweed der nächste Gamechanger?

Viele Verbesserungen Blackmagic DaVinci Resolve 20 Beta 2 bringt neue Funktionen und Bugfixes

E-Mount Zoom Sony stellt FE 50-150mm F2 GM Zoom für Pros vor: Lichtstark, leicht und hochpreisig

Universeller Speicher Neuer superschneller PoX Flash-Speicher könnte DRAM und SSDs ersetzen

Echte Cloud-Alternativen? Die beste Hardware für KI-Video - oder was man wirklich (nicht) braucht...

Die Stable Diffusion Revolution: Kostenlose Bildgenerierung per KI jetzt auch auf dem Heim-PC

KI-Video Upscaling Runway jetzt mit 4K- und Byte Dance mit Open Source KI-Scaling

Ultraweitwinkel-Zoom LK Samyang AF 14-24mm F2.8 FE bietet Filtergewinde und wiegt 445g

KI-Job von Gestern Das Berufsbild des KI-Prompt-Ingenieurs ist bereits wieder verschwunden

ARTIKEL

THEMEN