Ein neuronale Netzwerk namens GauGAN wurde von Nvidias Forschern mit einer Million Flickr Photos von natürlichen Landschaften trainiert - gelernt hat es so auch die Beziehung zwischen mehr als 180 Objekten wie Schnee, Wiesen, Wasser, Steinen, Hügeln oder Bergen.
Deswegen ist es in der Lage, Landschaften interaktiv neu zu erzeugen. Dazu fertigt der User eine extrem grobe Skizze der gewünschten Landschaft an - wo im Bild sollen z.B. Felsen Wasser, Himmel, Bäume oder Schnee auftauchen - dann generiert es die gewünschte Landschaft photorealistisch. Diese kann auch nachträglich editiert werden, indem ihre Form oder einzelne Elemente geändert werden.

Durch das Lernen der Objekte und ihrer Beziehungen zueinander, reagiert GauGAN quasi-intelligent: wird ein Teich gezeichnet, erscheinen benachbarte Elemente wie etwa Bäume und Felsen als Spiegelungen auf dessen Oberfläche. Wird Gras in eine Schneefläche geändert, verwandelt das ganze Bild sich in eine Winterszene, bis dahin belaubte Bäume werden kahl.
Wie funktionieren GANs?
Grundlage ist allerdings keine echte Intelligenz, also das Verständnis der physischen Welt. GANs (Generative Adversarial Networks) können aber aufgrund ihrer Struktur als kooperierendes Paar von Netzwerken visuell überzeugende Ergebnisse liefern. Sie bestehen aus einem Generator und einen Diskriminator. Der Generator erzeugt Bilder, die er dem Diskriminator präsentiert. Trainiert mittels realer Bilder, gibt der Diskriminator dem Generator Pixel für Pixel Feedback, wie er den Realismus seiner synthetischen Bilder verbessern kann. Nach dem Training mit realen Bildern weiß der Diskriminator, dass echte Teiche und Seen Reflexionen enthalten - so lernt der Generator, eine überzeugende Nachahmung zu erzeugen.
// Top-News auf einen Blick:
- Blackmagic DaVinci Resolve 20 Beta 2 bringt neue Funktionen und Bugfixes
- Blackmagic Camera for Android 2.1 bringt neue Features
- Neuer superschneller PoX Flash-Speicher könnte DRAM und SSDs ersetzen
- Achtung: Verpixelte Videos können wieder kenntlich gemacht werden
- KI-generierte Fake-Trailer: Wie Hollywood an der Irreführung der Zuschauer ...
- Beleuchtung für Foto und Video lernen mit kostenlosem Tool von Google
Das Tool ermöglicht es Benutzern auch, einen Stilfilter hinzuzufügen, d.h. ein Bild kann dem Malstil eines bestimmten Malers angepasst oder eine Tagesszene kann in eine Sonnenuntergangsszene verwandelt werden. Während sich die GauGAN-App auf Naturelemente wie Land, Meer und Himmel konzentriert, ist das zugrunde liegende neuronale Netzwerk in der Lage, andere Landschaftselemente wie Gebäude, Straßen und Menschen zu ergänzen. Was aufgrund seiner Komplexität allerdings noch (lange) auf sich warten lässt: Ein ebensolches Tool auch für bewegte Bilder.
Nvidias Playground: Neue Deep Learning Tools selbst ausprobieren
In diesem Zusammenhang interessant ist auch Nvidias neu gestarteter Playground, der es ermöglicht, online einige der neuesten Deep Learning Tools auszuprobieren: Zwar gibt es hier noch nicht das GauGAN, dafür aber schon ein Tool zum Entfernen von Objekten aus Bildern und bald auch Tools zum Transfer von Stilen berühmter Maler auf eigene Photos und zum Generieren photorealistischer Gesichter.