Beiträge anzeigen

Diese Sektion erlaubt es ihnen alle Beiträge dieses Mitglieds zu sehen. Beachten sie, dass sie nur solche Beiträge sehen können, zu denen sie auch Zugriffsrechte haben.

Nachrichten - mczak

Seiten: [1] 2 3 ... 9
1
Bei den Sparkle-Karten sind die Zeilen wohl aufgrund des fehlenden Boost-Clocks etwas durcheinandergeraten. "Speicherdurchsatz   1 x 6 Pin PCI-Express" etc. liest sich da etwas komisch :-)

2
Scheint mir auch nicht so der Hammer zu sein. Das ist weder Fisch noch Vogel, Performance immer noch relativ nahe bei der "alten" 7750, aber Stromverbrauch nahe bei der 7770 (dank der unnötig hohen Spannungen, ausser man will übertakten - immerhin erreicht man da natürlich in etwa dieselben OC-Taktraten wie bei einer 7770). Der Preis der 7770 und langsamen 7750 war ja auch nicht so weit auseinander.

Ach ja auf Seite 3 hat sich ein Fehler eingeschlichen, 1120Mhz GPU-Takt bei der alten 7750 sind doch etwas viel :-)

3
hmpf, war natürlich auf die integrierte Grafik bezogen ^^
Das macht trotzdem keinen Sinn auch die Grafik ist natürlich wie der Rest der APU in 32nm gefertigt. Richtig ist hingegen dass die trotz HD7xxx Namen eine "alte" VLIW-4 Architektur besitzt (aber solche Namen-Upgrades sind ja nichts neues).

4
Aber einen Exynos 4212 in 45nm gibt es eben nicht. Der heisst 4210. Würde mich doch sehr überraschen wenn Samsung den plötzlich umbenannt hat (auszuschliessen ist sowas natürlich nie...)

5
Die Vergleichsangaben zum Exynos 4212 stimmen nicht. Der 4212 wurde auch schon in 32nm HKMG gefertigt (aka Exynos 4 Dual 32nm), und hat sogar einen leicht höheren Referenztakt (1.5Ghz vs. 1.4Ghz). Mir ist allerdings kein Gerät bekannt in dem der verwendet wird, das Galaxy SII und andere benutzen den Exynos 4210 (aka Exynos 4 Dual 45nm) der erreicht dann tatsächlich nur 1.2Ghz.

6
Könnte es auch nicht sein, daß AMD bewußt die GCn außen vor läßt, um den Absatz der eigenen Graphikkarten nicht zu gefährden? Wer eine schnelle CPU sucht, greift in den meisten Fällen auch zur schnellen Graphikkarte. Und in beiden Fallen ist eine diskrete Intel-AMD-Lösung vorzuziehen.
Nein das hat damit sicher nichts zu tun. Die Entwicklungszyklen der CPUs (und damit auch APUs) sind nun mal deutlich länger als bei GPUs. Das Tapeout von Trinity war wahrscheinlich vor dem Tapeout der SI-Chips (genau Daten sind nirgends zu finden) aber auch davor dauert das länger.
Sowas wie "GCN als APU zu schnell" macht nun wirklich gar keinen Sinn, erstens wird der dank der halben Speicherbandbreite sowieso langsamer, und zweitens wäre es überhaupt kein Problem den Chip einfach noch weiter runterzuskalieren, das spart dann auch noch Chipfläche und somit Kosten... Kaveri soll ja dann einen minim reduzierten Cape Verde enthalten (mit 8 statt 10CUs, also wie HD7750, aufgrund der Speicherbandbreite wird der aber trotzdem langsamer sein, es sei denn AMD lässt sich noch ein paar Tricks einfallen um den Bandbreitenhunger zu begrenzen wie z.B. intelligente Mitnutzung eines L3 cpu cache).

7
Für einen derart kleinen Chip (212mm²) ziemlich beeindruckend, auch die Stromverbrauchswerte sind gut.
Bei den Preisen scheint mir da ist noch reichlich Luft nach unten (ausser dem Chip und den 2GB Speicher selbst ist die Karte ja wohl kaum teurer in der Herstellung als HD68xx), aber AMD will wohl auch wieder mal etwas verdienen, und da sind die Preise wohl erst mal konkurrenzfähig genug.

btw bei den Formel 1 2010 Benchmarks fehlt etwas Entscheidendes, jedenfalls bei denen auf Seite 23 :-)

8
Kleine Frage zum Stromverbrauch bei der BluRay Messung: waren da die Bildverbesserungsoptionen wie Deblocking etc. aktiv? pcgh behauptet nämlich die benötigen die Shader-ALUs und bei Abschalten dieser Optionen würden die Taktraten abgesenkt.

9
Also unter Schiebebefehl verstehe ich ein shift und kein mov das wäre wohl eher ein "Verschiebebefehl".
Die Unterschiede der Kerne zwischen Trinity und Vishera scheinen aber kleiner zu sein als zwischen Zambezi und Trinity.

10
Bei den Preisen geht AMD ja in die vollen. Da brauch nVidia ja gar keine Pre-Launch-Hysterie ausloesen, wer bei den Preisen kauft hat es entweder noetig, oder ist selber schuold :O
Naja ich würde sagen die Preise sind halt so um den maximalen Profit zu erzielen. Die HD7950 mit 1.5GB ist ja immer noch etwas schneller als eine GTX580, so gesehen geht der Preis in Ordnung. High-End Grafikkarten kauft nun mal längst nicht jeder, der Markt dafür ist begrenzt. Man hört ja zwar Wunderdinge vom nvidia GK104 Chip aber das sind alles Gerüchte, solange der nicht da ist kann AMD die Preise der HD79xx fast nach Belieben diktieren.
Ist vielleicht auch eine Frage der Stückzahlen die man überhaupt fertigen kann. Laut dem TSMC-Plan sollte die Kapazität zur Zeit 10k 28nm Wafer pro Monat sein, aber AMD ist natürlich längst nicht der einzige Kunde (erst in Q3 sollen 28k Wafer erreicht werden, 50k Wafer Ende Jahr und im Endausbau nächstes Jahr 100k Wafer). Da würde auch der doch spätere Launch der anderen Chips (Pitcairn/Cape Verde) Sinn machen - die sind zwar kleiner aber die benötigten Stückzahlen sind doch deutlich höher.

11
Ich will zwar nicht abstreiten, dass ich (ebenfalls) von Zambezi im Desktopbereich mehr erwartet hätte (absichtlich sehr allgemein gehalten), doch muss man schon bedenken, dass die Bulldozerarchitektur schon ein paar Features mitbringt, die K10 ganz einfach nicht bieten kann, wie SSSE3, SSE4.1, SSE4.2, AVX, FMA4, AES. Und so liegt auch noch einiges der potentiellen Leistung brach, die somit Fläche kostet aber derzeit noch kaum in Mehrleistung umgesetzt werden kann, was bedeutet, dass K10 derzeit im Vergleich ziemlich gut da steht, was die Flächeneffizienz betrifft.
Naja also die neuen SSE Versionen sollten nicht viel Chipfläche kosten, dasselbe gilt wohl auch für AES. Anders würde sich das bei AVX verhalten, nur AMD hat ja eine rein decoder-only basierte Lösung die die 256bit breiten Befehle einfach in 2x128bit splittet, das sollte auch sehr billig sein (imho hätten also all diese Features einen Husky-Kern nur unwesentlich vergrössert). FMA hingegen kostet sicher etwas, auch allgemein wurde die FPU ziemlich deutlich aufgerüstet (2 fma pipes), nur aufgrund der Tatsache dass man ja bloss eine FPU hat pro Modul müsste die Fläche trotzdem deutlich kleiner sein.

Zitat
Weiters hätte ich bisher für Zambezi gesagt, dass dieser noch einiges an Flächenoptimierungspotential birgt, da man evt. für den neuen 32nm Prozess keine all zu großen Risiken eingehen wollte. Andererseits sollte Trinity dann schon ein paar Quadradmillimeter gegenüber Zambezi (pro Modul) einsparen...
Nicht unbedingt wenn die CPU stattdessen ein paar Verbesserungen hat (z.B. eine höhere L1I-Assoziativität steht auf dem Wunschzettel vieler Spekulanten, sowas ist nicht gratis). AMD hat ja gesagt dass sie die IPC bei jedem auf Bulldozer folgenden Chip etwas steigern wollen, wenn sie das hinkriegen bei gleicher Fläche ist das auch etwas.

12
Dass der Zuwachs der Die-Fläche aufgrund der Piledriver-Kerne ist stimmt eindeutig nicht, die CPU-Kerne dürften im Gegenteil leicht kleiner sein (beim Vergleich mit Llano ist zu beachten dass ein i/o Block der bei Llano im GPU-Bereich lag nun im CPU-Bereich Platz wegnimmt, ausserdem hat's da noch einen weiteren Grafik-Block der in den CPU-Bereich hineinragt). Ich bin allerdings zu faul zum Pixel zählen, aber so über den Daumen gepeilt ist der Platz für die CPU-Kerne etwa 5% kleiner, derjenige für die GPU 10% grösser.
(Das ist allerdings trotzdem enttäuschend war doch der Hauptgrund für CMT dass es den Chip kaum vergrössert, aber 4 K10.5 mit je 1MB L2 Cache sind trotzdem bloss minim grösser als 2 Piledriver-Module mit je 2MB L2 - über Performance und Perf/W sage ich jetzt lieber nichts das hängt zu stark vom erreichbaren Takt und den Verbesserungen von Piledriver gegenüber BD ab).

Die folgende Frage ist ernst gemeint, ich weiß das wirklich nicht :) :
Könnte mir jemand die sechs Shadercluster einzeichnen?! Ich finde da nirgends sechs (optisch) gleichwertige Blöcke...
Die sind doch leicht zu finden. Der semiaccurate Schriftzug befindet sich genau zwischen Cluster 2 und 3 (von oben gezählt), der sich wiederholende Bereich beginnt beim "s" von semiaccurate und hört auf beim "o" von .com.

13
Ich verstehe auch nicht, warum AMD dieses enorme Einsparpotenzial nicht nutzt. 4 Kerne mit 3 GHz und integrierter GPU bei 53 Watt Verbrauch sind meiner Meinung nach ein sehr guter Wert und sind absoluten angemessen gegenüber dem, was man dafür bekommt.
Naja also derart gross ist das Einsparpotential auch wieder nicht. Man braucht schon noch etwas Spielraum bei der Spannung um das verkaufen zu können - ist ja nicht nur vom jeweiligen Chip abhängig ob's bei einer bestimmten Spannung noch stabil läuft sondern auch z.B. von der Temperatur. Aber irgendwo so in der Mitte zwischen dem wie AMD die Chips ausliefert und dem was in der Praxis offenbar noch funktioniert sollte eigentlich möglich sein.

14
Sehr interessant dass AMD die Spannung immer noch relativ hoch ansetzt (bzw. die Taktrate etwas tief...)
Die praktisch lineare Frequenz/-Spannungskennlinie der verschiedenen p-states finde ich auch sehr bemerkenswert, ich hätte eigentlich eher einen leicht exponentiellen Verlauf erwartet (gemessene Werte würden Aufschluss darüber geben ob da AMD's Modell wirklich realistisch ist, ist aber leider wohl zu viel Aufwand).
Mir scheint allerdings der A6-3670K wäre die interessantere CPU wenn man Uebertakten will - das Uebertaktungspotenzial dürfte nahezu identisch sein, und mit identischen Taktraten bleibt nur der Nachteil der 320 gegenüber 400 SIMD, was aber in der Praxis nur etwa 10% bei den IGP Spielebenchmarks ausmachen dürfte.

15
Von wegen keine Anzeichen - bin wohl nicht der einzige der Q2 im Auge hat:
http://vr-zone.com/articles/sandy-bridge-xeons-dual-socket-2011-designs-coming-in-2012/13989.html

Na gut, so richtig sicher klingt deren Spekulation auch nicht, aber immerhin bin ich nicht der Einzige, der die Situation so einschaetzt.
Scheint mir reichlich spekulativ (wenn mich nicht alles täuscht gab's zumindest bei Westmere-EP nie ein neues Stepping das höhere Frequenzen erlaubte, jedenfalls nicht bei der Desktop-Version). intel hätte ja dank Turbo problemlos den Grundtakt senken können um 8 Kerne zu ermöglichen, der könnte trotzdem falls nur 6 Kerne gebraucht werden denselben Takt erreichen.
Aussschliessen kann man das aber natürlich nicht...

Seiten: [1] 2 3 ... 9