Weder DCT noch Wavelet - Neuronale Netze zur Bildkompression

// 15:34 Fr, 30. Sep 2016von Rudi Schmidts

Gated Recurrent Units (GRUs) sind der neueste Schrei im weiten Feld der künstlichen Intelligenz. Ähnlich den LSTMs (Long Short Term Memories) arbeiten sie jedoch ohne Output Gate und eigenen sich in rekurrenten Netz-Strukturen offensichtlich vorzüglich zur Bildkompression. Das wollen jetzt zumindest die KI-Forscher von Google belegt haben, die mit einem offen gelegten Tensorflow-Modell nun gezeigt haben, dass die Bildqualität gegenüber JPEGs bei gleichem Datenverbrauch deutlich "besser" sein kann.

Überfliegt man das Paper und den verlinkten Blogeintrag, so sieht man in erster Linie, dass tatsächlich die Macroblöcke bei Googles neuem Ansatz verschwinden. Kaum verwunderlich, weil die Neuronalen Netze in diesem Zusammenhang versuchen das gesamte Bild durch eine sehr komplexe Formel darzustellen, und nicht einzelne Teile. Dennoch gehen natürlich auch feine Details mit fallender Datenrate im Bild unter:

Aus etwas bescheidener eigener Erfahrung zu dem Thema wollen wir zwei Dinge zur Kompression mit Neuronalen Netzen anmerken:

// Top-News auf einen Blick:

- Erstens wird die benötige Kompressionszeit bis auf weiteres nicht mit heute gängigen Verfahren vergleichbar sein. Für Videoanwendungen wird diese Art der Kompression mit pragmatischem Zeitbudget definitiv bis auf weiteres nicht einsetzbar sein.

- Dafür sind diese Methoden und Ideen für das Upscaling von Bildern in der Regel höchst spannend und teilweise schon heute sehr erfolgreich. Da – einfach erklärt - Bildstrukturen durch Formeln ausgedrückt werden ist die Speicherung bis zu einem gewissen Teil auflösungsunabhängig. Gelernte Strukturen können somit auch in einer höheren Auflösung ausgeben werden, ähnlich einer Vektorgrafik. Somit könnte im Bereich Upscaling im 8K und 16K-Bereich hier die wirklich große Chance für neuronale Repräsentation liegen.

Und auch, wenn das jetzt alles wie ziemlich unrealistische Science Fiction klingt, sei euch allen versichert: Neuronale Netze werden in den nächsten Monaten und Jahren einiges im Filmumfeld umwerfen, was in den letzten Jahren als fest gemeißelt galt...

mehr Infos bei
research.googleblog.com

Auf Socials teilen:

Weder DCT noch Wavelet - Neuronale Netze zur Bildkompression

// Top-News auf einen Blick:

Google zeigt neue Bild-Kompression mit generativer KI

Der nächste Schritt ist da: KI trainiert KI (und braucht den Menschen nicht mehr)

Neue Plugin-Pakete für Final Cut Pro von Boris FX kosten 59 Dollar

Oscars 2023: Shortlist für 10 Kategorien veröffentlicht

Nicht nur 3D Animation Blender 4.2 LTS - kostenloses 3D-Softwarepaket jetzt mit GPU-Compositor

Viele Verbesserungen Blackmagic DaVinci Resolve 20 Beta 2 bringt neue Funktionen und Bugfixes

Universeller Speicher Neuer superschneller PoX Flash-Speicher könnte DRAM und SSDs ersetzen

Fliegendes Flutlicht Freefly Flying Sun 1000 - 300.000 Lumen helle Lichtdrohne macht die Nacht zum Tag

Echte Cloud-Alternativen? Die beste Hardware für KI-Video - oder was man wirklich (nicht) braucht...

Grundwissen KI Künstliche Intelligenz einfach erklärt - Perzeptron, Backpropagation und Loss

Weiteres RED Patent im Zusammenhang mit komprimiertem RAW

Social Media Video Adobe Express: App für Creators mit neuen KI-Tools für Animation und Video

Mit KI und XMEMS-Lautsprecher BleeqUp Ranger - 4-in-1 Actioncam-Brille macht POV-Videos

ARTIKEL

THEMEN