Nachrichten

AMD enthüllt Zen - zumindest ein bisschen

Prozessoren | 29.08.2016, 20:23
Vor rund 13 Jahren – die Älteren unter uns werden sich noch erinnern – startete AMD mit dem Athlon 64 durch. Lange hatte Intel dieser sehr effizienten und schnellen Prozessorgeneration wenig entgegenzusetzen, bis man selbst mit der Core-Plattform nachlegte. Seitdem müht sich AMD um den Anschluss, doch egal, ob Barcelona alias Phenom oder Bulldozer aka FX: sie konnten nicht wirklich helfen. Nun jedoch, so scheint es, gibt es wieder positive Signale aus Sunnyvale, die auf den Namen "Zen" lauten.

Zen ist AMDs neueste Prozessor-Architektur, oder besser gesagt Mikroarchitektur, mit der sich der Hersteller von den Ansätzen der Bulldozer-Architektur abwendet und eher einen Intel-ähnlichen Ansatz verfolgt. Damit, so wirbt AMD, gibt es eine um 40 Prozent bessere Leistung pro Taktzyklus bei ähnlicher Leistungsaufnahme im Vergleich zum direkten Vorgänger, der letzten Bulldozer-Version namens Excavator. Ermöglichen sollen dies zahlreiche tiefgreifenden Architekturänderungen sowie Globalfoundries' neuer 14-nm-FinFET-Fertigungsprozess.

Bild: AMD enthüllt Zen – zumindest ein bisschen



Die neue Mikroarchitektur

Doch der Reihe nach. Mit Zen beerdigt AMD den mit Bulldozer eingeführten Ansatz des Core-Multithreadings (CMT), der weit weniger gebracht hat, als erhofft. Stattdessen nutzt AMD bei Zen zweifaches Simultaneous Multithreading (SMT), was bei Intel als HyperThreading bekannt ist. Die Idee dahinter ist, zwei Threads auf einem einzigen Kern auszuführen und dabei so wenig Hardware wie möglich zu duplizieren. Damit erhofft sich AMD eine bessere Auslastung der Ausführungseinheiten und damit einhergehend eine bessere Leistung und Energieeffizienz.

Ebenfalls ähnlich zu Intel gibt es bei Zen einen speziellen Cache für dekodierte Instruktionen, einen sogenannten Microop-Cache. Dies erlaubt bei bereits dekodierten Instruktionen, Teile des Pipeline-Frontends abzuschalten und damit Energie zu sparen. Gleichzeitig kann bei hoher Trefferquote die Leistung steigen. Wie bei den alten AMD-Architekturen K8/K10 nehmen anschließend Integer- und Gleitkommabefehle unterschiedliche Wege, was eine gesonderte Optimierung erlaubt. Dabei kann der Dispatcher sechs Integer- und vier Gleitkomma-Befehle pro Takt verteilen, die auf 168 physische Integer- bzw. 160 Gleitkommaregister zurückgreifen können. Um die Effizienz weiter zu steigern, kann Zen ähnlich wie die neuen Skylake-Prozessoren von Intel Verschiebebefehle (MOV) direkt durch einfache Registerumbenennung abarbeiten. Clever. Insgesamt können sich bei einem Zen-Kern 192 Befehle in der Out-of-Order-Ausführungsphase befinden. Bei Skylake sind es 224.

Bild: AMD enthüllt Zen – zumindest ein bisschen



Auch bei den Ausführungseinheiten hat AMD Hand angelegt, wenn auch etwas weniger, als manch einer vielleicht erwartet hat. So gibt es vier parallele Integer-ALUs sowie zwei Addressberechnungseinheiten (AGUs). Für Gleitkommabefehle gibt es jedoch nur zwei 128-Bit-Addierer bzw. -Multiplizierer. Kommt also 256-Bit-AVX2-Code zum Einsatz, müssen diese Einheiten zusammengeschaltet werden. Im Gegensatz dazu kommen seit der Haswell-Architektur bei Intel zwei vollwertige 256-Bit-Einheiten zum Einsatz. Bei starker Nutzung von 256-Bit-AVX2-Operationen dürfte Zen also eher nur das Niveau von "Sandy Bridge" (2. Core-Generation) bzw. "Ivy Bridge" (3. Core-Generation) erreichen.

Neues gibt es auch bei den Caches, wobei sich AMD auch hier von dem mit Bulldozer eingeführten Konzept verabschiedet. Bei Bulldozer hat man den L1-Datencache als Write-through-Cache ausgelegt, so dass bei jedem Schreibzugriff die zugehörigen Daten auch automatisch in den dahinter liegenden L2-Cache geschrieben wurden. Da dies jedoch – zumindest teilweise – für eine schwache Performance gesorgt hat, wechselt AMD bei Zen wieder zurück zum Write-back-Ansatz, bei dem Daten nur dann in den L2-Cache wandern, wenn im L1-Cache kein Platz mehr ist. Die Größe des achtfach assoziativen Datencaches liegt weiterhin bei 32 KByte, wie bei der letzten Bulldozer-Inkarnation alias Excavator (Steamroller hatte nur 16 KByte). Der L1-Instruktionscache ist nun 64 KByte groß (und damit doppelt so groß wie bei Intel) und vierfach assoziativ). Der L2-Cache pro Kern ist 512 KByte groß und ebenfalls achtfach assoziativ. Weiterhin sollen laut AMD alle Caches deutlich geringere Latenzen haben als noch bei den Bulldozer-Modellen, welche extrem langsam waren. Die L1-/L2-Bandbreite soll sich um das Zweifache verbessern, die des 8 MByte großen L3-Caches gar um das Fünffache. Apropos L3-Cache: Dieser ist in acht 1-MByte-Blöcke unterteilt, wobei jedem Kern zwei dieser Blöcke zugeordnet sind. Die Zugriffszeiten von unterschiedlichen Kernen auf unterschiedliche L3-Segmente sind dabei durchaus variabel, und lediglich die durchschnittliche Zugriffsdauer ist für alle Kerne gleich.

Weiterhin hat AMD noch an zahlreichen weiteren Detailschrauben gedreht, um die Leistungsfähigkeit zu verbessern. So gibt es eine verbesserte Sprungvorhersage oder größere Puffer für Lade- und Speicherbefehle (72 für Ladebefehle, 44 für Speicheroperationen), und einige neue Befehle werden ebenfalls unterstützt. Details können dabei der eingebetten Bilderreihe entnommen werden.

Bild: AMD enthüllt Zen – zumindest ein bisschen




Die neue Fertigung

Darüber hinaus kommt mit Zen auch eine neue Fertigungstechnologie zum Einsatz. AMD wird dabei auf Globalfoundries als Fertiger zurückgreifen und dessen 14-nm-FinFET-Technologie verwenden. Gegenüber der aktuell eingesetzten 28-nm-Fertigung ist dies natürlich eine gewaltige Verbesserung, die deutliche Spielräume bei Taktfrequenz, Zahl der Kerne oder Leistungsaufnahme eröffnet. Gleichzeitig zeigen AMDs neue Grafikkarten jedoch auch, dass das 14-nm-Verfahren von Globalfoundries noch einiges an Verbesserungspotenzial besitzt, insbesondere fallen die hohen Leckströme negativ auf. Hier muss sich also erst noch zeigen, ob die neue Fertigungstechnologie wirklich das halten kann, was man sich verspricht und sich AMD erhofft.

Bild: AMD enthüllt Zen – zumindest ein bisschen


Erste Tests

Erste von AMD gezeigte Benchmark-Ergebnisse zeigen jedoch vielversprechende Resultate und machen Hoffnung auf mehr. AMD hat dabei einen Zen-Prozessor mit acht Kernen und SMT (also 16 Threads) alias "Summit Ridge" sowie DDR4-Speicher gegen einen vergleichbaren Intel Core i7-6900K (Broadwell-E) gestellt. Beide Prozessoren liefen dabei mit dem gleichen Basistakt von 3 GHz und unbekannten Turbo-Taktfrequenzen. Ebenfalls unbekannt ist, ob 256-Bit-AVX2-Instruktionen zum Einsatz kamen. Als Ergebnis lagen damit beide Prozessoren im Gleitkomma-lastigen Blender-Benchmark gleichauf, während Bulldozer-basierte Prozessoren hier üblicherweise große Probleme haben. Wenn AMD diese Prozessoren also mit deutlich über 3 GHz bereits nächstes Jahr ausliefern kann, könnte es einen spannenden Kampf um die absolute Leistungskrone geben.


[fo]







Stichworte zur Meldung: Amd Zen Prozessor Cpu Erste Informationen Technik