Forum: FPGA, VHDL & Co. Direktvergleich der Resourcen bei FPGAs unterschiedl. Herst.


von Edi M. (Gast)


Lesenswert?

Hat sich jemand bereits mit einem Direktvergleich der unterschiedlichen 
Resourcen bei FPGAs vor allem von unterschiedlichen Herstellern befasst?

Die Slices-Struktur bei Xilinx z.B. führt dazu, dass ich 2 
Resourcen-Limiter beachten muss, nämlich die Zahl der Slices selber und 
die FFs.

Bei Vergleichen mit Altera-LEs kann daher nicht einfach 1:1 gerechnet 
werden, 2:1 stimmt aber wiederum auch nicht. LEs kommen gegenüber den 
CLBs auch mit anderer Funktionalität / LUT-Breite.

Ähnlich verhält es sich bei den DSPs: Xilinx baut z.B. DSP48-Elementen 
mit integriertem Akku und Register-FFs, während Altera "nur" embedded 
Multiplier 9x9 / 18x18 anbietet.

Bei einem Direktvergleich wäre dann auch noch die Geschwindigkeit 
wichtig, die nur erreicht werden kann, wenn vernüftig registriert wird. 
Da stelle ich mir oft die Frage, ob eine direktes Register hinter den 
DSPs das Wahre ist und ob nicht ein Register, das geometrisch zwischen 
den DSPs und der nächsten Stufe besser sein sollte.

von Bernhard R. (barnyhh)


Lesenswert?

Das ist doch beim Vergleich zwischen Computern unterschiedlicher 
Architektur - z.B. Intel I32 und Motorola M68000 - genau das Gleiche: Je 
nach zu bewältigender Aufgabe und (nicht zu vergessen!) Erfahrung des 
Entwicklers ist das eine Mal das eine FPGA / die eine CPU "besser", das 
andere Mal umgekehrt. Ich denke, daß der Gesamtaufwand für ein System 
sich mit dem Wechsel dieser Low-Level-Bauteile kaum ändert.

Bernhard

von Lothar M. (Firma: Titel) (lkmiller) (Moderator) Benutzerseite


Lesenswert?

E. M. schrieb:
> Die Slices-Struktur bei Xilinx z.B. führt dazu, dass ich 2
> Resourcen-Limiter beachten muss, nämlich die Zahl der Slices selber und
> die FFs.
Weder das eine noch das andere ist letztlich beschränkend. Meist liegt 
das Problem darin, dass die übrigen FFs+LUTs nicht mehr verdrahtet 
werden können und deshalb das FPGA "zu klein" ist. Und die 
Verdrahtungsarchitektur und -strategie kannst du nicht vergleichen, du 
findest keine belastbaren Daten.

von Georg A. (Gast)


Lesenswert?

So kurz vor 2000 gab es mal einen Ansatz, dafür Mikrobenchmarks zu 
machen, hab den Namen aber schon wieder vergessen. Hat nur jeder 
Hersteller die Zahlen so gedreht, wie er sie gebraucht hat. Damit war 
dem System nur ein sehr kurzes Marketingleben beschieden...

von J. S. (engineer) Benutzerseite


Lesenswert?

Das einzige, waas verlässlich ist, ist das Synthetisieren von 
Zielapplikationen auf verschiedenen FPGAs und der direkte Vergleich. 
Dann bekommt man so langsam ein Gefühl.

Für eine grobe Einschätzung reicht es meistens, die Resourcen in etwa 
abzuzählen.

> DSP48-Elementen mit integriertem Akku und Register-FFs,
> während Altera "nur" embedded Multiplier.
Die paar Register-FlipFlops könnte man von den freien im konnkurrenten 
Chip abziehen.

Bei den Luts kann einen Mittelweg gehen und den Vorteil zu 50% 
berücksichtigen: 6:5 (=1,2) wären denn 10% Vorteil.

von Heinrich H. (Firma: Ich.AG) (hhanff)


Lesenswert?


von Lothar M. (Firma: Titel) (lkmiller) (Moderator) Benutzerseite


Lesenswert?

Heinrich H. schrieb:
> http://www.wikifpga.com/index.php?title=Performance_Analysis
Dort kann ich insbesondere die Werte für den MachXO nicht 
nachvollziehen. Denn mit dem richtigen Design ist das Ding sauschnell...

von Georg A. (Gast)


Lesenswert?

Jetzt weiss ichs wieder, das waren die PREP Benchmarks. Google findet 
noch Überreste davon:

http://www.cs.wustl.edu/~jain/cse567-08/ftp/fpga/#PREP_Benchmark_Suite

Die eigentliche Website (www.prep.org) gibts schon gar nicht mehr.

von Edi M. (Gast)


Lesenswert?

Danke für die links! Das hilft mir schon mal weiter!

Ein paar Effekte sind freilich seltsam. Schaut mal die FFT-Ergebnisse. 
Altera und Xilinx verhalten sich bezüglich LUTs und FFs gespiegelt: Die 
einen brauchen da mehr die anderen dort. Jemand eine Idee, warum?

von abc (Gast)


Lesenswert?

Relativ simpel: distributed memory.

Der braucht LUTs dafür fallen dann aber FF weg.

Ist vor allem bei Cyclone <-> S3 ziemlich deutlich weil der C3 leider 
gar kein Distributed Ram kennt.

von Ben (Gast)


Lesenswert?

Seit wann kennt der Cyclone III keine distributed RAM mehr ?

Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.