Test Gemischte Gefühle - Nvidia GeForce GTX 1070

Gemischte Gefühle - Nvidia GeForce GTX 1070

Die GTX 1070 von Nvidia verspricht mit einer Leistung von über 6 TFlops und einem Preis von rund 400 Euro einen gesunden Mix aus Leistung und akzeptablen Preis für Videoschnittapplikationen. Doch noch läuft mit den neuen Pascal-Chips nicht alles rund...

// 13:50 Mi, 28. Sep 2016von

Nachdem uns AMDs Auftritt mit der neuen GPU-Serie grundsätzlich nicht schlecht gefallen hat, jedoch von einigen Stolper-Hürden begleitet wurde, gingen wir eigentlich davon aus, dass der Test der neuen GTX 1070 ohne große Überraschungen über die Bühne gehen würde. Doch Karte aus der neuen Nvidia Pascal-Serie breitete uns ebenfalls ein paar Probleme und Kopfzerbrechen…




Warum 8GB RAM?

Für unseren Test stand uns eine Gainward GeForce GTX 1070, 8GB GDDR5 zur Verfügung, die nicht dem Referenzdesign (Founders Edition) von Nvidia entspricht. Sie gehört aktuell zu den günstigsten 1070-Karten (ab ca. 420 Euro).



Die Nvidia GTX 1070 von Gainward gehört zu den günstigsten Custom-Designs auf dem Markt
Die Nvidia GTX 1070 von Gainward gehört zu den günstigsten Custom-Designs auf dem Markt


Selbst die allerbilligsten 1070-Karten kosten aktuell (September 2016) kaum weniger als 400 Euro. Unter dieser Preisgrenze erhält man von Nvidia keine Grafikkarte mit 8 GB Speicher. Bei AMD gibt es dagegen schon 8GB-Karten für 240 Euro (RX470). Wir betonen dies deswegen, weil Resolve in seinem aktuellen Configuration Guide die GPU-Speicheranforderungen weiter erhöht hat:



"For Processing UHD or 4K-DCI images we recommend 8GB or more of GPU memory (RAM). For some operations 4GB will be sufficient, 2 GB is not recommended".



Wir sprachen auch auf der Photokina mit Peter Chamberlain, dem Product Manager von Resolve, der ebenfalls betonte, dass mehr GPU-RAM für die kommenden Resolve Versionen immer wichtiger werden wird, da die Zahl der integrierten GPU-Effekte immer weiter zunimmt. Mindestens 8GB seien somit für 4K-Bearbeitung unter Resolve definitiv empfehlenswert.





Einbau, Installation und Eindrücke

Nach dem Einbau der Karte funktionierte erst einmal alles wie gehabt. Die Treiber-Installation läuft absolut problemlos und die Karte ist bei wenig Last praktisch unhörbar. Auch unter Volllast bleibt die Karte noch relativ leise, auch wenn die Lüfter dann schon hörbar auf sich aufmerksam machen. Sowohl das Spulenrasseln als auch die Lüfterrauschen waren bei unserer RX480 AMD-Karte unter Vollast jedoch weitaus deutlicher zu vernehmen.



Bei den ersten Messungen unter CUDA fingen die “Seltsamkeiten” jedoch an. So konnte die Karte zwar bis zu 18 Nodes in unserem Test stapeln, jedoch waren deutliche Mikroruckler in der Vorschau zu sehen. Diese waren teilweise auch noch bei 14 Nodes zu bemerken, obwohl Davinci eine ruckelfreie Wiedergabe mit der grünen Ampel signalisierte. Dies deutet wohl darauf hin, dass sich hier bei den CUDA-Treibern unter der Haube etwas verändert hat.



Dies bestätigte uns indirekt auch Peter Chamberlain, der zwar Nvidia nicht beim Namen nennen wollte, jedoch deutlich zu verstehen gab, dass Blackmagic an der internen Ansprache der GPUs nichts verändert hat, sondern “jemand anders”. Dies betrifft nicht nur die Mikroruckler unter Last, sondern ein größeres Phänomen, das uns seit einigen Resolve Versionen in der Redaktion schon länger beschäftigt. Und zwar die beliebige Kombination von Nvidia GPUs. War es früher problemlos möglich bei uns eine NVidia Quadro K5200 und eine GTX 770 zusammen zu betreiben, so will dies seit einiger Zeit nicht mehr richtig rund funktionieren. So hatten wir schon vor dem Einbau der neuen Grafikkarten gemerkt, dass sich die Karten-Performance nicht mehr wie früher addierte. Und auch das Zusammenspiel der K5200 mit der GTX 1070 ist aktuell kaum sinnvoll, obwohl beide Karten 8GB Speicher besitzen. Denn die zu erwartende, zusätzliche Performance zeigt sich schlicht nicht.



Fairerweise muss man vorweg schicken, dass Blackmagic schon immer empfohlen hat, nur identische Karten zu poolen, jedoch war es früher immer problemlos möglich ältere Karten mitrechnen zu lassen. In unserem aktuellen Test-Setup ist nun die Quadro K5200 zur reinen GUI-GPU verdammt, was kaum mehr Performance bringt und längerfristig unnötig viel Strom kostet. Ein parallel-Betrieb unter CUDA, bei dem die Quadro mitrechnet will dagegen nicht klappen. Dies funktioniert jedoch interessanterweise, wenn man die Open CL-Treiber von Nvidia nutzt, bringt jedoch unterm Strich selbst in Summe weniger Performance.





Das führt uns dann auch mal direkt zu unseren Messergebnissen:





GTX 1070 Performance DaVinci Resolve 12.5 - CUDA und OpenCL

Wir haben die GTX 1070 jeweils solo, sowie im Dual-Betrieb mit der K5200 als GUI-GPU vermessen. Im letzteren Fall haben wir einmal die GUI-GPU mitrechnen lassen, und einmal nur zur GUI Ausgabe genutzt.



  Max Num Curved Nodes Full 24p PlaybackMotion Blur Better, Large, 30.0Spatial NR, small, 50, 50Spatial NR, small, 100, 100Temp NR 1 Faster Small 50 50 50Temp NR 2 better large 50 50 50
OpenCL1070 solo22 Nodes822812,756,25
 1070 + K5200 GUI17 Nodes8,25238,5136,5
 1070 + K520017 Nodes1022714,55
        
CUDA1070 solo18 Nodes10,25227,516,258
 1070 + K5200 GUI17 Nodes10,5247,7516,58,25
 1070 + K5200crashcrashcrashcrashcrashcrash


Alle Benchmarks mit Version 12 oder 12.5 DaVinci Resolve Studio

Alle Werte stellen die Wiedergabe in fps dar, bis auf "Max Num Curved Nodes" (= Anzahl der maximalen Nodes bei ruckelfreier 24p-Wiedergabe).



Da Resolve seit der letzten Version 12.5. auch die Möglichkeit bietet, Treiber und GPU-Kombinationsmöglichkeiten direkt im Programm zu konfigurieren, konnten wir erstmals auch die OpenCL-Leistung von NVidia Karten einschätzen. Wie zu erwarten liegt die OpenCL-Performance unter den CUDA-Treibern, da Nvidia OpenCL wahrscheinlich eher als notwendiges Übel aus Kompatibilitätsgründen implementiert. Das proprietäre CUDA von Nvida soll natürlich weiterhin -wo vorhanden-, vom Kunden präferiert werden. Interessant ist jedoch, dass unter dem OpenCL-Treiber mehr Nodes stapelbar waren (22 vs. 17-18 Nodes) und die erwähnten Mikroruckler nicht auftraten. Bei der Berechnung von intensiven Effekten lagen dagegen meistens die CUDA-Treiber vorne, in der temporalen Noise-Reduction sogar deutlich (über 20 Prozent schneller).



Auch unsere frühere These wird durch die neuen Werte ein weiteres mal bestätigt: Die Geschwindigkeit des angebundenen Speichers limitiert die Anzahl der stackbaren Nodes. Peter Chamberlain betätigte uns diesen Zusammenhang ebenfalls mündlich auf der Photokina. Der etwas höhere Wert unter OpenCL lässt dabei vielleicht ein besseres Speichermanagement unter OpenCL vermuten.



Beim 4,6K Debayering von URSA Mini Material fühlt sich die GTX 1070 definitiv besser an als die AMD RX480. Während die AMD Karte hier wirklich bei fast voller Auslastung (zwischen 85 und 98 Prozent) an ihren Reserven kratzt und kaum noch zusätzliche Farbkorrekturnodes ermöglicht, schnurrte hier unsere GTX 1070 mit 50-60 Prozent GPU-Auslastung vor sich hin und konnte auch noch 10 CC-Nodes wiedergeben, diese allerdings dann auch wieder mit den besagten Mikrorucklern.



GPUTFlops ca.Preis ca. (Oktober. 2016)Max Num Curved Nodes Full 24p PlaybackMotion Blur Better, Large, 30.0Spatial NR, small, 50, 50Spatial NR, small, 100, 100Temp NR 1 Faster Small 50 50 50Temp NR 2 better large 50 50 50
K5200 8GB31800 Euro77,2511,54116
GTX 770 4GB3,3250 Euro97,5113,2512,257
AMD RX480 8GB5,4260 Euro177,5227,7511,756
AMD R9 290X 8GB5,9320 Euro229,7523,57,515,57,5
GTX1070 8GB6,5400 Euro1810,25217,516,758
980Ti 6GB5,6400 Euro231324920,510,25
AMD Fury 4GB7,3350 Euro2912,25249,518,59,5


Alle Benchmarks mit Version 12 oder 12.5 DaVinci Resolve Studio

Alle Werte stellen die Wiedergabe in fps dar, bis auf "Max Num Curved Nodes" (= Anzahl der maximalen Nodes bei ruckelfreier 24p-Wiedergabe).



Insgesamt fällt jedoch auf, dass die GTX1070 trotzt etwas mehr TFlops unter Resolve nicht die Leistung einer bereits ausgelaufenen GTX 980 Ti erreicht. Letztere besitzt zwar nur 6 GB, ist dafür aber ebenfalls für 400 Euro zu bekommen. Auch AMDs Top-Grafikkarten des letzten Jahres (R9 390(X) und Fury-Modelle) sind schneller und teilweise sogar günstiger. Allerdings sind fast alle Karten aus dem letzten Jahr als Neuware bei den Händlern immer seltener zu bekommen und steigen schon langsam wieder im Preis. Auf dem Gebrauchtmarkt lassen sich hier jedoch aktuell gute Schnäppchen durch viele Umsteiger machen.





Premiere Pro

Die Leistung der Karte ist unter Premiere Pro ist sprichwörtlich "satt". Selbst für aufwendige 4K-Bearbeitung mit vielen Effekten reichen auch schon deutlich weniger leistungsstarke Grafikkarten in der Regel aus. Dafür funktionierte bei und die 4K-Hardware-Wiedergabe auf einem zweiten Display über die GTX 1070 nicht im Vollbildmodus. Wie es scheint, liegt bei Nvidia nicht gerade ein Treiber-Entwickler-Schwerpunkt auf den aktuellen Video Applikationen.







Fazit

Die GTX 1070 ist aktuell die günstigste Möglichkeit eine Nvidia-Karte mit 8GB zu erstehen. Die gebotene Rechenleistung liegt dabei in einem Rahmen, den wir persönlich als gesundes Minimum betrachten, wenn man unter Resolve mit nativem URSA 4,6K RAW-Material arbeiten will. Wer "nur" mit UHD/4K-ProRes oder weniger arbeitet, ist sowohl unter Resolve als auch unter Premiere Pro mit der AMD RX480 deutlich günstiger unterwegs - ohne einen subjektiven Unterschied in der Leistung zu spüren. Sogar im Gegenteil, denn aktuell (Oktober 2016) läuft die AMD-Karte unter diesen Applikationen sogar einen Tick runder. Wir gehen jedoch fest davon aus, dass diese Probleme nach ein paar (Treiber-)Updates verschwunden sein werden.



Wer noch mit älteren Nvidia-Karten aufwärts der GTX 970 arbeitet, wird den Performance-Unterschied zur Pascal-Generation kaum spüren, weshalb sich hier ein Upgrade nur empfiehlt, wenn man tatsächlich einen speziellen Performance-Engpass ausgemacht hat. Die GTX 1080 dürfte gegenüber der GTX 1070 in der Praxis noch einmal im besten Fall 20 Prozent zulegen, was uns bei den aktuellen Preisen schlichtweg zu teuer vorkommt (ab ca. 650 Euro). Wirklich spürbar dürfte dagegen der Sprung zur neuen Pascal GTX Titan X sein. Allerdings kostet diese Karte mit 1.300 Euro mehr als drei GTX 1070. Es ist jedoch zu erwarten, dass es auch von der Titan X einen günstigeren Ableger geben wird (alá GTX 1080 Ti). Sollte diese Karte noch zum Weihnachtsgeschäft kommen wird sie wohl mangels Konkurrenz sehr wahrscheinlich auch nicht unter 800 Euro erhältlich sein. Neu gemischt werden die “Karten” erst Anfang 2017 wenn AMD in diesen Leistungs-Gefilden mit den Vega-Prozessoren auch etwas entgegensetzen kann.



Ähnliche Artikel //
Umfrage
    Welche Streaming-Dienste nutzt Du?













    Ergebnis ansehen

slashCAM nutzt Cookies zur Optimierung des Angebots, auch Cookies Dritter. Die Speicherung von Cookies kann in den Browsereinstellungen unterbunden werden. Mehr Informationen erhalten Sie in unserer Datenschutzerklärung. Mehr Infos Verstanden!
RSS Suche YouTube Facebook Twitter slashCAM-Slash