Befehl in zwei Takten Ausführen

von Yaro (Gast)

15.01.2014 21:50

Lesenswert?

•

Hallo Leute,

ich möchte in einem synchronen Prozess einen Befehl in einem und einen 
in zwei Takten ausführen Lassen, z.B. hier:

    ALU : process(CLK, reset)
    begin
        if reset = '1' then
            F <= (others => '0');
        elsif rising_edge(CLK) then
            case Cmd is
                when "0000" => F <= A + B;
                when "0001" => F <= A * B; --Zwei Takte lang Zeit lassen
                when others => F <= (others => '-');
            end case;
        end if;
    end process;


Da würde ich der Multiplikation gerne zwei Takte Zeit gaben (ohne 
Pipeline). Mit welcher Methode kann ich das machen?

Ich habe schon überlegt, in einer FSM den Takt für diesen Prozess zu 
erzeugen, aber das wäre dann ja clock gateing und würde zu Taktversatz 
führen.
Auf Gatterebene würde ich am liebsten das enable Signal der FlipFlops 
für einen Takt lang ausschalten. Dass die Xilinx toolchain aber versteht 
was ich da mache und den kürzesten Pfad entsprechend berechnet wage ich 
zu bezweifeln.

Was ist der Standard Weg für solche Vorhaben?

Gruß, Yaro

Beitrag melden Bearbeiten Thread verschieben Thread sperren Anmeldepflicht aktivieren Anpinnen Thread löschen Thread mit anderem zusammenführen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Befehl in zwei Takten Ausführen

von Gustl B. (-gb-)

15.01.2014 22:16

Lesenswert?

•

▲
▼

Also sowas wie

if Cmd = "0001" then
   if BIT = '0' then
      F <= A * B;
      BIT <= '1';
      BIT <= '0';


Kann halt passieren, dass gerade keine Multiplikationsanfrage 
entgegengenommen wird weil die alte noch läuft. Du aknnst auch das 
Ergebnis erst nach 2 Takten abfragen, dazu muss man natürlich in jedem 
Takt einen anderen Ergebnisspeicher haben, also

if Cmd = "0001" then
   if BIT = '0' then
      F <= A * B;
      BIT <= '1';
      BIT <= '0';
      G <= A * B;


Dann kannst du abwechseln F und G abfragen.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Befehl in zwei Takten Ausführen

von user (Gast)

15.01.2014 22:30

Lesenswert?

•

▲
▼

Du kannst das F signal einmal extra registerieren und dann das 
synthesetool das optimieren lassen

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Befehl in zwei Takten Ausführen

von daniel__m (Gast)

15.01.2014 22:49

Lesenswert?

•

▲
▼

hi,

Yaro schrieb:
> (ohne
> Pipeline)

warum?

Der hier sicherlich empfohlene Weg ist kein Multicycle, sondern 
tatsächlich eine Pipelinestufe. Diese hat vor F zu erfolgen, gemäß:

Yaro schrieb:

ALU : process(CLK, reset)
    begin
        if reset = '1' then
            F <= (others => '0');
            P <= (others => '-');
        elsif rising_edge(CLK) then
            P <= A * B;
            case Cmd is
                when "0000" => F <= A + B;
                when "0001" => F <= P;
                when others => F <= (others => '-');
            end case;
        end if;
    end process;

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Befehl in zwei Takten Ausführen

von Lothar M. (Firma: Titel) (lkmiller) (Moderator)

15.01.2014 22:56

Lesenswert?

•

▲
▼

Yaro schrieb:
> Da würde ich der Multiplikation gerne zwei Takte Zeit gaben (ohne
> Pipeline).
Wozu? Der Multiplizierer ist doch auf jeden Fall schnell genug. Und wenn 
du hinterher noch eine Registerebene schaltest, dann kostet dich der 
eine Takt Latency gar nichts, weil einfach die Register verwendet 
werden, die eh' schon im Multiplizierer drin sind...

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Befehl in zwei Takten Ausführen

von daniel__m (Gast)

15.01.2014 22:58

Lesenswert?

•

▲
▼

hi,

Lothar Miller schrieb:
> Und wenn
> du hinterher noch eine Registerebene schaltest

Das Register sollte/muss vor dem Muxer sein, damit er je nach Bit-Breite 
in ein DSP gezogen werden kann.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Befehl in zwei Takten Ausführen

von Yaro (Gast)

16.01.2014 00:42

Lesenswert?

•

▲
▼

Ersteinmal vielen Dank für die schnellen Antworten.

Ohne Pipeline habe ich geschrieben, weil ich sowieso einen Takt lang 
warten muss und eine Pipeline nicht verwenden könnte. Wenns umsonst ist, 
habe ich natürlich nichts dagegen.

Ich bin neu bei FPGAs, deswegen erlaubt mir bitte einige Fragen:
Zunächst die Voraussetzung: Ich programmiere für einen Spartan3E


Wenn ich es richtig verstehe steht hier:

Mentor synthesis features a pipeline multiplier that involves putting 
levels of registers in
the logic to introduce parallelism and, as a result, use CLB resources 
instead of the
dedicated multipliers. A certain construct in the input RTL source code 
description is
required to allow the pipelined multiplier feature to take effect. See 
the Synthesis and
Simulation Design Guide for more information.
The following VHDL example will infer the MULT18X18SIO with the PREG 
output
register:

library ieee;
use ieee.std_logic_1164.all;
use ieee.std_logic_arith.all;
use ieee.std_logic_unsigned.all;
entity mult18x18sio is
    port(a    : in  std_logic_vector(7 downto 0);
         b    : in  std_logic_vector(7 downto 0);
         clk  : in  std_logic;
         prod : out std_logic_vector(15 downto 0));
end mult18x18sio;
architecture arch_mult18x18sio of mult18x18sio is
    process(clk) is
    begin
        if clk ’ event and clk = ’ 1 ’ then prod <= a * b;
    end if;
end process;
end arch_mult18x18sio;
The following is a Synchronous Multiplier VHDL example coded for Mentor:
library ieee;
use ieee.std_logic_1164.all;
use ieee.std_logic_arith.all;
use ieee.std_logic_unsigned.all;
entity mult18x18sio is
    port(clk  : in  std_logic;
         a    : in  std_logic_vector(7 downto 0);
         b    : in  std_logic_vector(7 downto 0);
         prod : out std_logic_vector(15 downto 0));
end mult18x18sio;
architecture arch_mult18x18sio of mult18x18sio is
    signal reg_prod : std_logic_vector(15 downto 0);
    process(clk)
    begin
        if (rising_edge(clk)) then
            reg_prod <= a * b;
            prod     <= reg_prod;
        end if;
    end process;
end arch_mult18x18sio;

(Quelle: 
http://www.xilinx.com/support/documentation/user_guides/ug331.pdf)

Dass der zweite Multiplizierer (mit der Pipelinestufe) nicht einen 
hartverdrahteten Multiplizierer, sondern einen selbstgebauten nutzt. Ist 
das richtig?



Wenn ich folgendes baue:

Gustl Buheitel schrieb im Beitrag #3489444:
> if Cmd = "0001" then
>    if BIT = '0' then
>       F <= A * B;
>       BIT <= '1';
>    else
>       BIT <= '0';
> end if;

Packe ich ja einfach nur eine Registerstufe hinter Die Multiplikation. 
Wird der Compiler erkennen, dass er sie auch in den Multiplizierer 
ziehen kann?


Wenn ich folgendes baue:

daniel__m schrieb im Beitrag #3489512:
> ALU : process(CLK, reset)
>     begin
>         if reset = '1' then
>             F <= (others => '0');
>             P <= (others => '-');
>         elsif rising_edge(CLK) then
>             P <= A * B;
>             case Cmd is
>                 when "0000" => F <= A + B;
>                 when "0001" => F <= P;
>                 when others => F <= (others => '-');
>             end case;
>         end if;
>     end process;

Ist das ja equivalent zum zweiten Beispiel. Nehmen wir mal an, da wird 
kein hartverdrateter Multiplizierer genommen (vielleicht auch, weil 
keiner mehr übrig ist). Versteht der Compiler, dass er die Pipeline 
Stufe irgendwo in die Mitte des Multiplizierers packen soll, oder packt 
er sie am Ende hin, was für die Ausführungszeit ja garkeinen Gewinn 
bringen würde.


Ich habe bisher nur von hartverdrahteten Multiplizierern gelesen. Gibts 
auch Hartverdrahtete Addierer, oder lohnt sich das nicht?

Wieviel "Intelligenz" kann man vom VHDL Compiler erwarten? Lohnt es 
sich, ihm Strukturen vorzukauen?


Mit besten Grüßen,
Yaro

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Befehl in zwei Takten Ausführen

von Christoph Z. (christophz)

16.01.2014 08:00

Lesenswert?

•

▲
▼

Yaro schrieb:
> Dass die Xilinx toolchain aber versteht
> was ich da mache und den kürzesten Pfad entsprechend berechnet wage ich
> zu bezweifeln.

Ja, der Synthesizer und das Place&Route finden das nicht automatisch 
heraus.
Den betreffenden Pfad muss du mit einer Multicycle Constraint versehen.

Bei Synplify sieht das etwa so aus:

define_multicycle_path  -from {{i:<Name des Quellsignals>}}  -to {{i:<Name des Ergebnissignals>}}  2


Lattice Par will das so:

MULTICYCLE FROM CELL "<Name des Quellsignals>" TO CELL "<Name des Ergebnissignals>" 2.000000 X ;


Die Mentor und Xilinx Tools müssen das auch können, die Dokumentation 
gibt sicher Beispiele dazu.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Forum: FPGA, VHDL & Co. Befehl in zwei Takten Ausführen