Gated Recurrent Units (GRUs) sind der neueste Schrei im weiten Feld der künstlichen Intelligenz. Ähnlich den LSTMs (Long Short Term Memories) arbeiten sie jedoch ohne Output Gate und eigenen sich in rekurrenten Netz-Strukturen offensichtlich vorzüglich zur Bildkompression. Das wollen jetzt zumindest die KI-Forscher von Google belegt haben, die mit einem offen gelegten Tensorflow-Modell nun gezeigt haben, dass die Bildqualität gegenüber JPEGs bei gleichem Datenverbrauch deutlich "besser" sein kann.
Überfliegt man das Paper und den verlinkten Blogeintrag, so sieht man in erster Linie, dass tatsächlich die Macroblöcke bei Googles neuem Ansatz verschwinden. Kaum verwunderlich, weil die Neuronalen Netze in diesem Zusammenhang versuchen das gesamte Bild durch eine sehr komplexe Formel darzustellen, und nicht einzelne Teile. Dennoch gehen natürlich auch feine Details mit fallender Datenrate im Bild unter:

Aus etwas bescheidener eigener Erfahrung zu dem Thema wollen wir zwei Dinge zur Kompression mit Neuronalen Netzen anmerken:
// Top-News auf einen Blick:
- Blackmagic DaVinci Resolve 20 Beta 2 bringt neue Funktionen und Bugfixes
- Blackmagic Camera for Android 2.1 bringt neue Features
- Neuer superschneller PoX Flash-Speicher könnte DRAM und SSDs ersetzen
- Achtung: Verpixelte Videos können wieder kenntlich gemacht werden
- KI-generierte Fake-Trailer: Wie Hollywood an der Irreführung der Zuschauer ...
- Beleuchtung für Foto und Video lernen mit kostenlosem Tool von Google
- Erstens wird die benötige Kompressionszeit bis auf weiteres nicht mit heute gängigen Verfahren vergleichbar sein. Für Videoanwendungen wird diese Art der Kompression mit pragmatischem Zeitbudget definitiv bis auf weiteres nicht einsetzbar sein.
- Dafür sind diese Methoden und Ideen für das Upscaling von Bildern in der Regel höchst spannend und teilweise schon heute sehr erfolgreich. Da – einfach erklärt - Bildstrukturen durch Formeln ausgedrückt werden ist die Speicherung bis zu einem gewissen Teil auflösungsunabhängig. Gelernte Strukturen können somit auch in einer höheren Auflösung ausgeben werden, ähnlich einer Vektorgrafik. Somit könnte im Bereich Upscaling im 8K und 16K-Bereich hier die wirklich große Chance für neuronale Repräsentation liegen.
Und auch, wenn das jetzt alles wie ziemlich unrealistische Science Fiction klingt, sei euch allen versichert: Neuronale Netze werden in den nächsten Monaten und Jahren einiges im Filmumfeld umwerfen, was in den letzten Jahren als fest gemeißelt galt...