Haswell: Intels neue Core i7-4770 und i5-4670 Prozessoren im Test

Prozessoren | 01.06.2013, 16:00 | Seite 11

Bessere Ausführungseinheiten: Endlich FMA (AVX2)


Wie schon erwähnt hat Intel jedoch nicht nur die Anzahl der Ausführungseinheiten erhöht, sondern diese auch stark verbessert. Insbesondere ist hierbei die Gleitkommaeinheit zu nennen. Diese unterstützt nun (endlich) FMA-Befehle (Fused-Multiply-Add). Dank diesen kann nun die Operation a*x + y mit einem einzigen Rundungsvorgang (statt zwei) berechnet werden, was genauere Ergebnisse zur Folge hat. Zur besseren Vermarktung verpackt Intel die neuen Befehle dabei unter dem Namen AVX2, also dem Nachfolger der Advanced Vector Extensions (AVX) die mit Sandy Bridge eingeführt wurden. Neu ist FMA in der x86-Welt allerdings nicht, denn AMD unterstützt diese Befehle bereits seit Einführung der Bulldozer-Prozessoren.

Darüber hinaus verdoppelt die Nutzung von FMA-Befehlen den Durchsatz gegenüber der herkömmlichen Verwendung von je einer Multiplikation und einer Addition. Bei einem angenommen Takt von 3 GHz kann ein Haswell-Kern somit dank AVX und FMA 96 GFlops bei einfacher Genauigkeit erreichen, ein Vierkern-Modell also 384 GFlops. Zum Vergleich: "Ivy Bridge" bzw. "Sandy Bridge" muss mit 192 GFlops auskommen, Nehalem gar mit 96 GFlops.

Bild: Haswell: Intels neue Core i7-4770 und i5-4670 Prozessoren im Test


Gleichzeitig zur Verdoppelung des Durchsatzes hat Intel überdies auch die Latenzen für die Abarbeitung gesenkt. Eine Multiply-Add oder FMA-Instruktion benötigt nun nur noch 5 Zyklen statt 8. All diese Vorteile kann man allerdings nur nutzen, wenn der Programmcode bereits FMA unterstützt, was aktuell bei nur wenigen Applikationen der Fall ist. Alte Programme werden daher nicht von FMA profitieren und erst in einiger Zeit wird sich FMA als Standard etabliert haben. Weiterhin sollte man nicht übersehen, dass es wie bisher nur eine Einheit für klassische FADD-Operationen – also Additionen – gibt. Ein Leistungsplus wird es also nur dann geben, wenn Programme Multiply-Add-Konstrukte verwenden.

Neben der Unterstützung von FMA beherrschen die Einheiten nun auch Vektor-Operationen für Integeroperanden mit einer Länge von maximal 256 Bit, sowie einige Gather- und Permutationsbefehle (weitere Details auf dem Bild oben). Auch hier gilt allerdings dass ein Nutzen erst in einigen Monaten zu erwarten sein wird. Neben synthetischen Benchmarks und dem hochoptimierten Linpack ist uns aktuell nur der x264-Encoder bekannt, der bereits von AVX2 (inkl. FMA) gebraucht macht.

Bild: Haswell: Intels neue Core i7-4770 und i5-4670 Prozessoren im Test
Bild: Haswell: Intels neue Core i7-4770 und i5-4670 Prozessoren im Test


In einem ersten Test zeigt sich, dass Haswell dank FMA bzw. AVX2 im erwähnten Linpack-Benchmark um mehr als 70 Prozent an Leistung zulegt. In synthetischen Benchmarks wie SiSoft Sandra liegen die Zugewinne teilweise sogar bei über 75 Prozent. Leider war es uns in der Kürze der Zeit nicht möglich einen praxisnahen Test – ähnlich dem C-Ray-Test zum Bulldozer-Launch – durchzuführen. Wir hoffen dies schnellstmöglich nachholen zu können.

AVX2 – FMA
Intel Linpack [Quelle: Heise Online]
SiSoft Sandra – Multimedia Integer
SiSoft Sandra – Multimedia FP32
SiSoft Sandra – Multimedia FP64
SiSoft Sandra – Multimedia FP32/64
Intel Core i7 4770K
[3,5 GHz, Turbo, HTT]
177,1
404,3
396,5
228,1
300,7
Intel Core i7 3770K
[3,5 GHz, Turbo, HTT]
104,3
228,3
312,0
175,0
233,7
GFlop/s [mehr ist besser]



 

Inhalt dieses Testberichtes