KI-Videos ab Nvidia GTX 3050! FramePack: Kostenlose Video-KI generiert 1-Minuten Videos mit nur 6 GB VRAM

// 13:16 So, 27. Apr 2025von Thomas Richter

Forschern der Stanford Universität ist etwas Erstaunliches gelungen – sie haben mit FramePack eine Video-KI als Open Source veröffentlicht, die es Dank einer neuartigen Architektur erstmals ermöglicht, KI-generierte Videos mit nur 6 GB Grafikkartenspeicher zu erstellen. Bislang waren für die Generierung von hochwertigen Videos per KI meist mindestens 12 GB VRAM nötig – nun reicht selbst eine Nvidia RTX 3050 oder vergleichbare Mittelklassen-GPU aus, um kostenlos auf dem eigenen PC Videos zu erzeugen. Zudem ermöglicht das neue Verfahren theoretisch eine Cliplänge von bis zu einer Minute, also weitaus mehr als aktuelle Video-KI-Modelle, die auf dem eigenen PC laufen und auch mehr als die meisten Online-Video-KIs.

FramePack: Kostenlose Video-KI generiert 1-Minuten Videos mit nur 6 GB VRAM

Was macht FramePack anders?

Traditionelle Video-Diffusionsmodelle betrachten für jeden neuen Frame eine wachsende Anzahl zuvor erzeugter, noch verrauschter Bilder. Dieser „temporale Kontext“ skaliert linear mit der Cliplänge und treibt den Speicherbedarf in die Höhe. Diese Methode stößt bei längeren Videos oft auf zwei Probleme: Sie neigen dazu, zu "vergessen", was am Anfang des Videos geschah, und die Bildqualität lässt durch die Anhäufung kleiner Fehler nach, was als "Abdriften" bezeichnet wird.

Congrats on Lvmin Zhang’s (github@lllyasviel) latest project FramePack and thank you for using and recommending HunyuanVideo.FramePack&s Brief Intro and Showcases Attached: FramePack is a… pic.twitter.com/xvKQ5wwwzK
— Hunyuan (@TencentHunyuan) April 17, 2025

FramePack begegnet diesen Herausforderungen, indem es die Videobilder je nach ihrer Wichtigkeit in eine fest definierte Kontextlänge komprimiert, wodurch der GPU-Speicherbedarf drastisch sinkt. Dadurch kann FramePack mehr Bilder verarbeiten, ohne dass die Berechnungen zu komplex werden, was dem "Vergessen" entgegenwirkt. Zusätzlich werden spezielle Techniken wie das "Anti-Drifting-Sampling" angewendet, die beispielsweise den Kontext des gesamten Videos besser erfassen, um das Abdriften zu minimieren und die visuelle Qualität zu steigern. Die für die Generierung von Videos notwendige Rechenpower soll vergleichbar sein mit der für die einzelnen Standbilder im Diffusions-Verfahren. Ein FramePack-Modell mit nur rund 13 Milliarden Parametern schafft es so, einen 60-Sekunden-Clip auf einer GPU mit lediglich 6 GB VRAM zu erzeugen.

Systemvoraussetzungen und Performance

FramePack läuft momentan auf Grafikkarten aus der Nvidia RTX-30/40/50-Serie mit mindestens 6 GB Grafikkartenspeicher, also auch auf den Mobilversionen der passenden GPUs. Eine Nvidia RTX 4090 generiert – optimiert per „teacache“ – rund 0.6 Frames pro Sekunde, wobei jedes Bild unmittelbar nach der Generierung angezeigt wird. Nvidia Turing- und ältere Generationen sind offiziell nicht verifiziert, AMD- oder Intel-GPUs oder Apples M-Chips werden derzeit nicht unterstützt. Man kann FramePack aber auch zum Beispiel per Hugging Face auf gemieteter Hardware nutzen, dann allerdings kostenpflichtig.

// Top-News auf einen Blick:

Installation auf dem eigenen PC

Die einfachste Installationsvariante auf dem lokalen PC bietet wohl der Pinokio Browser. Das gesamte FramePack-Paket ist allerdings satte 48.5 GB groß. FramePack bringt eine eigene Bedienoberfläche mit, in der ein Startbild sowie ein Prompts eingegeben wird. Letzteres beschreibt, welche Veränderungen das Bild dann im Video durchlaufen soll. Zudem kann die gewünschte Cliplänge eingegeben werden – idealerweise wird sie erst klein angesetzt und dann – bei einem guten Ergebnis – allmählich auf die volle Länge gesteigert. Analog erfolgt der Einsatz von teacache, denn damit wird die Generierung beschleunigt, aber manchmal auch fehlerhafter; er eignet sich so aber gut für eine schnelle Vorschau. Es können bis zu 1 Minute lange Videos mit 30 Bildern pro Sekunde erzeugt werden.

Qualität: Was kann FramPack und was nicht?

FramePack kann menschliche Bewegungen wie etwa Tanzen sehr gut darstellen (womit manche andere KI-Modelle Probleme haben), was man anhand der Demovideos auf der FramePack-Seite gut sehen kann. Gut ist auch die Objektkonsistenz - es ist kein Morphing zu sehen - auch in längeren Sequenzen. Allerdings scheint FramePack auf die Animation von Objekten eines vorgegebenen Bildes spezialisiert zu sein. Dynamische Kamerabewegungen wie zum Beispiel Tracking Shots, also große Änderungen am Bildhintergund, funktionieren nicht so gut (und sind auch auf den Demos kaum dargestellt). Zudem ist die Auflösung relativ gering - die Democlips sind nur 512 x 768 gross.

mehr Infos bei
github.com

Auf Socials teilen:

Leserkommentare // Neueste

medienonkel // 18:34 am 28.4.2025

Endlich habe ich mal pinokio installiert. Ganz großer Facepalm Moment. Hätte ich mal früher machen sollen. Plötzlich hört man wieder bis tief in die Nacht intensive...weiterlesen

Frank Glencairn // 17:20 am 25.4.2025

https://youtu.be/ZSe42iB9uRU https://youtu.be/XD90QhkfGaQ

Im Forum mitdiskutieren >>

Ähnliche News //

News

VRAM-Upgrade Nvidia RTX 4090 bekommt 96GB - per China-Modding

Dass Hersteller ihre Produkte künstlich beschränken, um einen maximalen Profit zu erzielen, ist nichts Neues – besonders gut funktioniert das über den integrierten Speicher, seien ...

// 15:41 Mi, 5. Mär 2025von Thomas Richter

News

Neue Nvidia RTX 4090: Doppelt so schnell wie RTX 3090 Ti - aber 1.949 Euro teuer

Nvidia hat die ersten zwei Modelle RTX 4090 und RTX 4080 seiner neuen Grafikkartengeneration vorgestellt, die interessante Verbesserungen für die Arbeit mit Video bringen. Viele .....

// 15:46 Mi, 21. Sep 2022von Thomas Richter

News

Kostenlose Konkurrenz CogVideoX: Neue Open Source Video-KI läuft auf Consumer-GPUs

Das gerade veröffentlichte, quelloffene Text-zu-Video-Modell CogVideoX hat das Potential, die Video-KI Revolution nochmals deutlich zu beschleunigen, denn der Code wurde nicht nur ...

// 13:18 Di, 3. Sep 2024von Thomas Richter

News

Editing per Prompt Google Veo am Start - neue Video-KI macht über 60 Sekunden lange Clips

Während das einstige Spitzenmodell OpenAIs Sora noch immer nicht öffentlich ist, geht der Kampf um die beste Video-KI unvermindert geht weiter - jetzt hat Google sein erstmals Mai ...

// 11:52 Fr, 6. Dez 2024von Thomas Richter

News

480p mit 30fps Genmo Mochi 1 - neue Open-Source Video-KI will mit Kling und Runway konkurrieren

Und wieder ist eine neue, vielversprechende Open-Source Video-KI veröffentlicht worden, und wieder kommt sie aus China: Mochi 1 heisst das neue Video-Modell des Startups Genmo, ...

// 16:59 Fr, 25. Okt 2024von Thomas Richter

zur Newsübersicht >

Viele Verbesserungen Blackmagic DaVinci Resolve 20 Beta 2 bringt neue Funktionen und Bugfixes

Kaum drei Wochen nach der Veröffentlichung der Version 20 von Resolve hat Blackmagic schon die zweite Beta seines kostenlosen Grading-, Schnitt-, Compositing- und Audio-Mastering-....

// 12:19 Mi, 23. Apr 2025von Thomas Richter

News

E-Mount Zoom Sony stellt FE 50-150mm F2 GM Zoom für Pros vor: Lichtstark, leicht und hochpreisig

Mit dem FE 50-150mm F2 stellt Sony ein bemerkenswert lichtstarkes Vollformat-Zoom vor, das für professionelle Anwender in den Bereichen Hochzeit, Porträt, Indoor-Sport usw. ...

// 08:00 Mi, 23. Apr 2025von Rob

News

Universeller Speicher Neuer superschneller PoX Flash-Speicher könnte DRAM und SSDs ersetzen

Forscher der Fudan-Universität in Shanghai haben einen neuen Geschwindigkeits-Weltrekord für Flash-Speicher aufgestellt. Der von ihnen in 10-jähriger Arbeit entwickelte "PoX" ...

// 10:05 Di, 22. Apr 2025von Thomas Richter

Ratgeber

Echte Cloud-Alternativen? Die beste Hardware für KI-Video - oder was man wirklich (nicht) braucht...

Wer die Entwicklung aktueller Video-KI-Modelle verfolgt, sieht fast jeden Tag neue Sensationen. Da liegt es nahe, auch einmal selbst Hand anzulegen, um eigene Erfahrungen mit der ...

// 11:35 Di, 15. Apr 2025von Rudi Schmidts

TOP THEMEN //

zum Forum >>

MEHR NEWS

zum Newsindex >

PASSENDE DISKUSSIONEN

zum Forum >>

Passende Artikel //

Aktuelles

Die Stable Diffusion Revolution: Kostenlose Bildgenerierung per KI jetzt auch auf dem Heim-PC

Seit ein paar Tagen ist es endlich soweit: die Text-zu-Bild KI Stable Diffusion wurde veröffentlicht und kann kostenlos auf dem eigenen Computer genutzt werden - damit ist jetzt ...

// 15:03 Di, 30. Aug 2022von Thomas Richter

Test

Perfect Match Nvidia Geforce RTX 5090 - Die beste Grafikkarte für Blackmagic DaVinci Resolve

Die RTX 5090 ist das neue Consumer Grafikkarten-Flaggschiff von Nvidia. Da müssen wir natürlich unbedingt mal schauen, wie sich die neue Karte unter Blackmagic DaVinci Resolve ...

// 14:57 Do, 23. Jan 2025von Rudi Schmidts

zur Artikelübersicht >

Aktuelle News //

News

Ultraweitwinkel-Zoom LK Samyang AF 14-24mm F2.8 FE bietet Filtergewinde und wiegt 445g

Das neu erscheinende Superweitwinkel-Zoomobjektiv AF 14-24mm F2.8 FE von LK Samyang kommt mit einigen interessanten Merkmalen. Das für spiegellose Sony-Vollformatkameras mit E-...

// 16:06 Mo, 28. Apr 2025von blip

News

KI-Job von Gestern Das Berufsbild des KI-Prompt-Ingenieurs ist bereits wieder verschwunden

Auch wenn KI-generierte Videos aktiven Filmemachern vielleicht zurzeit etwas unbehagliche Gefühle bereiten, zeigt sich, dass sich zukünftige Entwicklungen keinesfalls sicher ...

// 13:20 Mo, 28. Apr 2025von Rudi Schmidts

zur Newsübersicht >