Nachdem uns AMDs Auftritt mit der neuen GPU-Serie grundsätzlich nicht schlecht gefallen hat, jedoch von einigen Stolper-Hürden begleitet wurde, gingen wir eigentlich davon aus, dass der Test der neuen GTX 1070 ohne große Überraschungen über die Bühne gehen würde. Doch Karte aus der neuen Nvidia Pascal-Serie breitete uns ebenfalls ein paar Probleme und Kopfzerbrechen…
Warum 8GB RAM?
Für unseren Test stand uns eine Gainward GeForce GTX 1070, 8GB GDDR5 zur Verfügung, die nicht dem Referenzdesign (Founders Edition) von Nvidia entspricht. Sie gehört aktuell zu den günstigsten 1070-Karten (ab ca. 420 Euro).

Selbst die allerbilligsten 1070-Karten kosten aktuell (September 2016) kaum weniger als 400 Euro. Unter dieser Preisgrenze erhält man von Nvidia keine Grafikkarte mit 8 GB Speicher. Bei AMD gibt es dagegen schon 8GB-Karten für 240 Euro (RX470). Wir betonen dies deswegen, weil Resolve in seinem aktuellen Configuration Guide die GPU-Speicheranforderungen weiter erhöht hat:
"For Processing UHD or 4K-DCI images we recommend 8GB or more of GPU memory (RAM). For some operations 4GB will be sufficient, 2 GB is not recommended".
Wir sprachen auch auf der Photokina mit Peter Chamberlain, dem Product Manager von Resolve, der ebenfalls betonte, dass mehr GPU-RAM für die kommenden Resolve Versionen immer wichtiger werden wird, da die Zahl der integrierten GPU-Effekte immer weiter zunimmt. Mindestens 8GB seien somit für 4K-Bearbeitung unter Resolve definitiv empfehlenswert.
Einbau, Installation und Eindrücke
Nach dem Einbau der Karte funktionierte erst einmal alles wie gehabt. Die Treiber-Installation läuft absolut problemlos und die Karte ist bei wenig Last praktisch unhörbar. Auch unter Volllast bleibt die Karte noch relativ leise, auch wenn die Lüfter dann schon hörbar auf sich aufmerksam machen. Sowohl das Spulenrasseln als auch die Lüfterrauschen waren bei unserer RX480 AMD-Karte unter Vollast jedoch weitaus deutlicher zu vernehmen.
Bei den ersten Messungen unter CUDA fingen die “Seltsamkeiten” jedoch an. So konnte die Karte zwar bis zu 18 Nodes in unserem Test stapeln, jedoch waren deutliche Mikroruckler in der Vorschau zu sehen. Diese waren teilweise auch noch bei 14 Nodes zu bemerken, obwohl Davinci eine ruckelfreie Wiedergabe mit der grünen Ampel signalisierte. Dies deutet wohl darauf hin, dass sich hier bei den CUDA-Treibern unter der Haube etwas verändert hat.
Dies bestätigte uns indirekt auch Peter Chamberlain, der zwar Nvidia nicht beim Namen nennen wollte, jedoch deutlich zu verstehen gab, dass Blackmagic an der internen Ansprache der GPUs nichts verändert hat, sondern “jemand anders”. Dies betrifft nicht nur die Mikroruckler unter Last, sondern ein größeres Phänomen, das uns seit einigen Resolve Versionen in der Redaktion schon länger beschäftigt. Und zwar die beliebige Kombination von Nvidia GPUs. War es früher problemlos möglich bei uns eine NVidia Quadro K5200 und eine GTX 770 zusammen zu betreiben, so will dies seit einiger Zeit nicht mehr richtig rund funktionieren. So hatten wir schon vor dem Einbau der neuen Grafikkarten gemerkt, dass sich die Karten-Performance nicht mehr wie früher addierte. Und auch das Zusammenspiel der K5200 mit der GTX 1070 ist aktuell kaum sinnvoll, obwohl beide Karten 8GB Speicher besitzen. Denn die zu erwartende, zusätzliche Performance zeigt sich schlicht nicht.
Fairerweise muss man vorweg schicken, dass Blackmagic schon immer empfohlen hat, nur identische Karten zu poolen, jedoch war es früher immer problemlos möglich ältere Karten mitrechnen zu lassen. In unserem aktuellen Test-Setup ist nun die Quadro K5200 zur reinen GUI-GPU verdammt, was kaum mehr Performance bringt und längerfristig unnötig viel Strom kostet. Ein parallel-Betrieb unter CUDA, bei dem die Quadro mitrechnet will dagegen nicht klappen. Dies funktioniert jedoch interessanterweise, wenn man die Open CL-Treiber von Nvidia nutzt, bringt jedoch unterm Strich selbst in Summe weniger Performance.
Das führt uns dann auch mal direkt zu unseren Messergebnissen:
GTX 1070 Performance DaVinci Resolve 12.5 - CUDA und OpenCL
Wir haben die GTX 1070 jeweils solo, sowie im Dual-Betrieb mit der K5200 als GUI-GPU vermessen. Im letzteren Fall haben wir einmal die GUI-GPU mitrechnen lassen, und einmal nur zur GUI Ausgabe genutzt.
Max Num Curved Nodes Full 24p Playback | Motion Blur Better, Large, 30.0 | Spatial NR, small, 50, 50 | Spatial NR, small, 100, 100 | Temp NR 1 Faster Small 50 50 50 | Temp NR 2 better large 50 50 50 | ||
OpenCL | 1070 solo | 22 Nodes | 8 | 22 | 8 | 12,75 | 6,25 |
1070 + K5200 GUI | 17 Nodes | 8,25 | 23 | 8,5 | 13 | 6,5 | |
1070 + K5200 | 17 Nodes | 10 | 22 | 7 | 14,5 | 5 | |
CUDA | 1070 solo | 18 Nodes | 10,25 | 22 | 7,5 | 16,25 | 8 |
1070 + K5200 GUI | 17 Nodes | 10,5 | 24 | 7,75 | 16,5 | 8,25 | |
1070 + K5200 | crash | crash | crash | crash | crash | crash |
Alle Benchmarks mit Version 12 oder 12.5 DaVinci Resolve Studio
Alle Werte stellen die Wiedergabe in fps dar, bis auf "Max Num Curved Nodes" (= Anzahl der maximalen Nodes bei ruckelfreier 24p-Wiedergabe).
Da Resolve seit der letzten Version 12.5. auch die Möglichkeit bietet, Treiber und GPU-Kombinationsmöglichkeiten direkt im Programm zu konfigurieren, konnten wir erstmals auch die OpenCL-Leistung von NVidia Karten einschätzen. Wie zu erwarten liegt die OpenCL-Performance unter den CUDA-Treibern, da Nvidia OpenCL wahrscheinlich eher als notwendiges Übel aus Kompatibilitätsgründen implementiert. Das proprietäre CUDA von Nvida soll natürlich weiterhin -wo vorhanden-, vom Kunden präferiert werden. Interessant ist jedoch, dass unter dem OpenCL-Treiber mehr Nodes stapelbar waren (22 vs. 17-18 Nodes) und die erwähnten Mikroruckler nicht auftraten. Bei der Berechnung von intensiven Effekten lagen dagegen meistens die CUDA-Treiber vorne, in der temporalen Noise-Reduction sogar deutlich (über 20 Prozent schneller).
Auch unsere frühere These wird durch die neuen Werte ein weiteres mal bestätigt: Die Geschwindigkeit des angebundenen Speichers limitiert die Anzahl der stackbaren Nodes. Peter Chamberlain betätigte uns diesen Zusammenhang ebenfalls mündlich auf der Photokina. Der etwas höhere Wert unter OpenCL lässt dabei vielleicht ein besseres Speichermanagement unter OpenCL vermuten.
Beim 4,6K Debayering von URSA Mini Material fühlt sich die GTX 1070 definitiv besser an als die AMD RX480. Während die AMD Karte hier wirklich bei fast voller Auslastung (zwischen 85 und 98 Prozent) an ihren Reserven kratzt und kaum noch zusätzliche Farbkorrekturnodes ermöglicht, schnurrte hier unsere GTX 1070 mit 50-60 Prozent GPU-Auslastung vor sich hin und konnte auch noch 10 CC-Nodes wiedergeben, diese allerdings dann auch wieder mit den besagten Mikrorucklern.
GPU | TFlops ca. | Preis ca. (Oktober. 2016) | Max Num Curved Nodes Full 24p Playback | Motion Blur Better, Large, 30.0 | Spatial NR, small, 50, 50 | Spatial NR, small, 100, 100 | Temp NR 1 Faster Small 50 50 50 | Temp NR 2 better large 50 50 50 |
---|---|---|---|---|---|---|---|---|
K5200 8GB | 3 | 1800 Euro | 7 | 7,25 | 11,5 | 4 | 11 | 6 |
GTX 770 4GB | 3,3 | 250 Euro | 9 | 7,5 | 11 | 3,25 | 12,25 | 7 |
AMD RX480 8GB | 5,4 | 260 Euro | 17 | 7,5 | 22 | 7,75 | 11,75 | 6 |
AMD R9 290X 8GB | 5,9 | 320 Euro | 22 | 9,75 | 23,5 | 7,5 | 15,5 | 7,5 |
GTX1070 8GB | 6,5 | 400 Euro | 18 | 10,25 | 21 | 7,5 | 16,75 | 8 |
980Ti 6GB | 5,6 | 400 Euro | 23 | 13 | 24 | 9 | 20,5 | 10,25 |
AMD Fury 4GB | 7,3 | 350 Euro | 29 | 12,25 | 24 | 9,5 | 18,5 | 9,5 |
Alle Benchmarks mit Version 12 oder 12.5 DaVinci Resolve Studio
Alle Werte stellen die Wiedergabe in fps dar, bis auf "Max Num Curved Nodes" (= Anzahl der maximalen Nodes bei ruckelfreier 24p-Wiedergabe).
Insgesamt fällt jedoch auf, dass die GTX1070 trotzt etwas mehr TFlops unter Resolve nicht die Leistung einer bereits ausgelaufenen GTX 980 Ti erreicht. Letztere besitzt zwar nur 6 GB, ist dafür aber ebenfalls für 400 Euro zu bekommen. Auch AMDs Top-Grafikkarten des letzten Jahres (R9 390(X) und Fury-Modelle) sind schneller und teilweise sogar günstiger. Allerdings sind fast alle Karten aus dem letzten Jahr als Neuware bei den Händlern immer seltener zu bekommen und steigen schon langsam wieder im Preis. Auf dem Gebrauchtmarkt lassen sich hier jedoch aktuell gute Schnäppchen durch viele Umsteiger machen.
Premiere Pro
Die Leistung der Karte ist unter Premiere Pro ist sprichwörtlich "satt". Selbst für aufwendige 4K-Bearbeitung mit vielen Effekten reichen auch schon deutlich weniger leistungsstarke Grafikkarten in der Regel aus. Dafür funktionierte bei und die 4K-Hardware-Wiedergabe auf einem zweiten Display über die GTX 1070 nicht im Vollbildmodus. Wie es scheint, liegt bei Nvidia nicht gerade ein Treiber-Entwickler-Schwerpunkt auf den aktuellen Video Applikationen.
Fazit
Die GTX 1070 ist aktuell die günstigste Möglichkeit eine Nvidia-Karte mit 8GB zu erstehen. Die gebotene Rechenleistung liegt dabei in einem Rahmen, den wir persönlich als gesundes Minimum betrachten, wenn man unter Resolve mit nativem URSA 4,6K RAW-Material arbeiten will. Wer "nur" mit UHD/4K-ProRes oder weniger arbeitet, ist sowohl unter Resolve als auch unter Premiere Pro mit der AMD RX480 deutlich günstiger unterwegs - ohne einen subjektiven Unterschied in der Leistung zu spüren. Sogar im Gegenteil, denn aktuell (Oktober 2016) läuft die AMD-Karte unter diesen Applikationen sogar einen Tick runder. Wir gehen jedoch fest davon aus, dass diese Probleme nach ein paar (Treiber-)Updates verschwunden sein werden.
Wer noch mit älteren Nvidia-Karten aufwärts der GTX 970 arbeitet, wird den Performance-Unterschied zur Pascal-Generation kaum spüren, weshalb sich hier ein Upgrade nur empfiehlt, wenn man tatsächlich einen speziellen Performance-Engpass ausgemacht hat. Die GTX 1080 dürfte gegenüber der GTX 1070 in der Praxis noch einmal im besten Fall 20 Prozent zulegen, was uns bei den aktuellen Preisen schlichtweg zu teuer vorkommt (ab ca. 650 Euro). Wirklich spürbar dürfte dagegen der Sprung zur neuen Pascal GTX Titan X sein. Allerdings kostet diese Karte mit 1.300 Euro mehr als drei GTX 1070. Es ist jedoch zu erwarten, dass es auch von der Titan X einen günstigeren Ableger geben wird (alá GTX 1080 Ti). Sollte diese Karte noch zum Weihnachtsgeschäft kommen wird sie wohl mangels Konkurrenz sehr wahrscheinlich auch nicht unter 800 Euro erhältlich sein. Neu gemischt werden die “Karten” erst Anfang 2017 wenn AMD in diesen Leistungs-Gefilden mit den Vega-Prozessoren auch etwas entgegensetzen kann.