Der Open Source KI-Bildgenerator Stable Diffusion XL ist seit kurzem in der offiziellen 1.0 Version frei verfügbar. Das neue Text-zu-Bild Modell soll - wie sich bereits bei der Vorversion 0.9 abzeichnete - deutliche Verbesserungen bei der Bildgenerierung aufweisen. SDXL arbeitet zweistufig mit einem Basismodell, welches auf 3,5 Mrd. Parametern beruht, und einem Refiner-Modell mit 6,6 Mrd. Parametern.


Die künstlich erzeugten, 1024x1024 großen Bilder sollen fotorealistischer aussehen und eine hohe visuelle Qualität bieten, mit ausgefeilteren Bildkompositionen. Laut Stability AI lassen sich mit SDXL 1.0 gute Resultate auch mit kürzeren Prompts erzielen. Das Modell sei auch besser darin, Text in die Bilder einzufügen. Auch wenn es weiterhin zu Fehlern kommt, sind die Worte vielfach kohärenter und lesbarer geworden.
Ebenso habe es Fortschritte bei der Darstellung von Menschen gemacht, unter anderem die Hände sollen weniger deformiert aussehen - letzteres können wir für das online verfügbare (limitierte) Basismodell nach einem schnellen Versuch jedoch nicht bestätigen (auch die Beschriftung der Kamera läßt zu wünschen übrig).
// Top-News auf einen Blick:
- Blackmagic DaVinci Resolve 20 Beta 2 bringt neue Funktionen und Bugfixes
- Blackmagic Camera for Android 2.1 bringt neue Features
- Neuer superschneller PoX Flash-Speicher könnte DRAM und SSDs ersetzen
- Achtung: Verpixelte Videos können wieder kenntlich gemacht werden
- KI-generierte Fake-Trailer: Wie Hollywood an der Irreführung der Zuschauer ...
- Beleuchtung für Foto und Video lernen mit kostenlosem Tool von Google

Stable Diffusion XL bietet mehrere Stile bei der Bildgenerierung an: No style, Enhance, Anime, Photographic, Digital Art, Comic book, Fantasy art, Analog film, Neon punk, Isomteric, Low poly, Origami, Line Art, Craft clay, Cinematic, 3D model und Pixel Art.

Das SDXL-Modell (Basis + Refiner) ist zum Download auf HuggingFace verfügbar unter einer CreativeML Open RAIL++-M Lizenz. Wer sich den Bildgenerator nicht selbst installieren will, kann online auf das Basismodell unter ClipDrop oder DreamStudio zugreifen. Stablity stellt Entwicklern sogar einen (kostenpflichtigen) ClipDrop API-Zugang zur Verfügung.