Multi GPU: Beschleunigung durch mehrere Grafikkarten
Programme, die dezidiert die Leistung der Grafikkarte nutzen, können oft mit einer oder mehreren zusätzlichen Karten die Rechenleistung noch weiter beschleunigen. So kann das Grading-Tool DaVinci Resolve zum Beispiel mehrere Grafikkarten zur reinen Berechnung von Effekten nutzen (zusätzlich zu einer Grafikkarte für die Darstellung der Bedienoberfläche) - ebenso wie die neuen Versionen Adobe Premiere CC (zum Teil) und After Effects CC. Anstatt zwei Grafikkarten einzusetzen, gibt es auch Grafikkarten, die 2 GPUs (Graphics Processing Units - also Grafikprozessoren) auf einer Karte vereinen (wie z.B. die Nvidia GTX 690 oder AMD Radeon HD 7990) - bei diesen ist allerdings zu beachten, dass ihr effektiver Speicher pro GPU nur die Hälfte des VRAM-Gesamtspeichers ausmacht - was bei manchen Programmen (wie z.B. DaVinci Resolve) einen Unterschied ausmachen kann.

Die Anbindung per PCIe Lanes
Voraussetzung für den Einsatz mehrerer Grafikkarten sind natürlich auch die zur Verfügung stehenden PCIe 2.0/3.0 Slots und deren Größe und Beschaltung (x4, x8 oder x16) - von CPU, Chipsatz und dem Mainboardhersteller (Layout) hängt dann, ab wieviele Karten wie schnell genutzt werden können - selbst bei besseren Chipsätzen wie dem X87 können nicht alle x16 Slots auch mit x16 Geschwindigkeit betrieben werden. Bestimmend dafür ist die Anzahl der zur Verfügung stehenden PCIe Lanes und deren Anbindung (direkt zur CPU oder über den Chipsatz) und die ist abhängig vom Chipsatz: Sandy Bridge/LGA 1155 besitzt 16 primäre (d.h. direkt an die CPU angebundene) PCIe 2.0 Lanes für GPUs, Ivy Bridge/LGA 1155 16 PCIe 3.0 Lanes und Sandy Bridge-Extreme/Ivy Bridge-Extreme/LGA 2011 besitzt 32 PCIe 3.0 Lanes. Dazu kommen noch die sekundären PCIe Lanes, die per Chipsatz angebunden sind (meist 8 PCIe Lanes). Deswegen bieten LGA 2011/Z79 Mainboards die schnellste Anbindung für Multi-GPU Konfigurationen.
(Dual)-Workstation Mainboards wie etwa das Asus Z9PE-D8 WS bieten sogar 88 Lanes (davon 2 x 40 primär) in Form von 4x PCIe 3.0 x16 und 3x PCIe 3.0 x16 (elektrisch nur x8) - also Platz und Geschwindigkeit genug für mehrere GPUs. Ein Beispiel für die so mögliche extreme Erweiterbarkeit eines GPU-Systems zeigt die FASTRA II Workstation auf, die mit 13 GPUs (auf 7 Grafikkarten) bestückt ist und ein für GPU/CUDA-Aufgaben spezialisiertes Asus Mainboard verwendet, das 7 PCIe 2.0 x16 Slots bietet, von denen 4 gleichzeitig als x16 bzw 8 als x8 angesprochen werden können.
Um bei PCs über die vorhandenen Anschlussmöglichkeiten (die Anzahl der PCIe x16 Slots) hinaus zu gehen, gibt es sogenannte PCIe Expander, wie zum Beispiel den GPU-Xpander, mit deren Hilfe der PCIe-Bus um mehrere Slots erweitert werden kann und so zusätzlichen GPUs (oder auch I/O-Erweiterungskarten) Platz bietet. Das ist jedoch sehr teuer (ab 3000 Dollar) und nur für High-End Systeme mit höchsten Leistungsanforderungen relevant, denen die vorhandenen PCIe-Slots auf dem Mainboard nicht mehr ausreichen.
Bei der Konfiguration eines Mehr-GPU-Systems ist zu beachten, daß die Arbeit mit mehreren Hochleistungsgrafikkarten unter Last einen sehr hohen Stromverbrauch verursacht, das System sollte also auf gute Lüftung und ausreichend Stromzufuhr (ein großes Netzteil) ausgelegt sein. Und: durch die Grafikkarten-Lüfter wird eine High-End Karte auch oft so "dick", dass sie zwei Slots belegt - man sollte also darauf achten, dass das Layout des Mainboards dies zuläßt, d.h. das der Lüfter der einen Grafikkarte nicht den x16 Slot für die andere verdeckt - oder dass es sogar die Möglichkeit bietet, 3 Grafikkarten einzusetzen.
Auch zu beachten ist beim Einsatz von DaVinci Resolve, dass eine GPU nur zum Rendern der GUI benötigt – diese wird dann aber nicht zur zusätzlichen Berechnung eingesetzt, es reicht dafür also eine simple Grafikkarte. Resolve spricht jede Karte einzeln an und nicht beide zusammen per SLI/CrossFire.
Links:
Benchmarks Mac Pro mit bis zu 5 GPUs per Cubix GPU PCIe Xpander