Multiplizierer einsparen

von Tom (Gast)

19.08.2013 12:26

Lesenswert?

•

Guten Tag,
ich habe ein IIR-Filter programmiert und versuche jetzt Multiplikationen 
zusammenzufassen, um die Anzahl benötigter Multiplizierer zu reduzieren.
Der Code einer Stufe sieht folgendermaßen aus:

entity section_1 is
  generic
    (  PG:  integer :=  890;       
      PB0: integer :=    1;     
      PB1: integer :=  648;    
      PB2: integer :=    1;      
      PA0: integer :=    1;    
      PA1: integer :=  360;    
      PA2: integer := 1964);     
    (  CLK: in std_logic;   
      RESET: in std_logic;
      XN1: in std_logic_vector(11 downto 0);   
      YN1: out std_logic_vector(17 downto 0));
end section_1;
architecture Behavioral of section_1 is
constant G : signed(11 downto 0) := to_signed(PG,12);
constant B1 : signed(11 downto 0) := to_signed(PB1,12);
constant A1 : signed(11 downto 0) := to_signed(PA1,12);
constant A2 : signed(11 downto 0) := to_signed(PA2,12);
signal X   : signed(17 downto 0)                   ;
signal XB0 : signed(29 downto 0) := (others => '0');
signal XB1 : signed(29 downto 0) := (others => '0');
signal XB2 : signed(29 downto 0) := (others => '0');
signal Y  : signed(29 downto 0) := (others => '0'); 
signal YA1: signed(29 downto 0) := (others => '0');
signal YA2: signed(29 downto 0) := (others => '0');
signal SUMB2A2    : signed(29 downto 0) := (others => '0');
signal SUMB2A2V   : signed(29 downto 0) := (others => '0');
signal SUMB2A2V_2 : signed(29 downto 0) := (others => '0');
signal SUMB2A2V_3 : signed(29 downto 0) := (others => '0');
signal SUMB2A2V2  : signed(29 downto 0) := (others => '0');
XB0 <= G * X;
XB1 <= B1 * XB0(28 downto 11);
XB2 <= XB0;
Y <= SUMB2A2V2 + XB0; 
YA1 <= A1 * Y(28 downto 11);
YA2 <= A2 * Y(28 downto 11);
SUMB2A2 <= XB2 - YA2;
SUMB2A2V_2 <= XB1 + SUMB2A2V;
SUMB2A2V_3 <= SUMB2A2V_2 - YA1;
Delay: process(CLK)
variable YHilf: signed(29 downto 0);
  if CLK='1' and CLK'event then
    if RESET = '1' then
      SUMB2A2V <= (others => '0');
      SUMB2A2V2 <= (others => '0');
      YN1 <= (others => '0');
     else
      SUMB2A2V <= SUMB2A2;
      SUMB2A2V2 <= SUMB2A2V_3;
      if Y(29) = '1' then
        YHilf := not(Y - 1);
        YN1 <= std_logic_vector(not(YHilf(28 downto 11)-1));
      else
        YN1 <= std_logic_vector(Y(28 downto 11));
      end if;
    end if;
  end if;  
end process Delay;


Der CLK beträgt 80MHz und liefert mit jedem Takt einen neuen 
Eingangswert bzw. einen neuen Ausgangswert.
Gibt es eine Möglichkeit, die die Multiplikationen A1 * Y(28 downto 11) 
und A2 * Y(28 downto 11) so zusammenfasst, dass anstelle von zwei 
Multiplizierer nur einer verwendet wird. Habe mit Hilfe eines Prozesses 
versucht YA1 auf die steigende Flanke des CLKs zu berechnen und YA2 auf 
die fallende Flanke. Jedoch war dieser Versuch nicht von Erfolg gekrönt.
Ein weiterer Punkt ist, dass ich in dieser Stufe 4 Multiplikationen 
durchführe, jedoch laut Xilinx 5 Multiplizierer benötigt werden.  Meine 
Feststellung dazu ist, dass die Multiplikation XB1 <= B1 * XB0(28 downto 
11) zwei Multiplizierer benötigt, jedoch ist mir der Grund dafür nicht 
ersichtlich.

Grüße
Tom

Beitrag melden Bearbeiten Thread verschieben Thread sperren Anmeldepflicht aktivieren Anpinnen Thread löschen Thread mit anderem zusammenführen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Multiplizierer einsparen

von Lothar M. (Firma: Titel) (lkmiller) (Moderator)

19.08.2013 12:33

Lesenswert?

•

▲
▼

Tom schrieb:
> Habe mit Hilfe eines Prozesses versucht YA1 auf die steigende Flanke
> des CLKs zu berechnen und YA2 auf die fallende Flanke. Jedoch war dieser
> Versuch nicht von Erfolg gekrönt.
Ja, überleg mal, warum. Du wirst fürs Leben lernen...
Als Tipp: wie ist so ein Multiplizierer aufgebaut? Woher kommen die 
Faktoren am Eingang und wohin geht das Ergebnis? Wie wird das 
umgeschaltet?

Denn es geht um das Umschalten (aka. Multiplexen): du willst 1 
Komponente mehrfach verwenden...

> Der CLK beträgt 80MHz und liefert mit jedem Takt einen neuen
> Eingangswert bzw. einen neuen Ausgangswert.
> Gibt es eine Möglichkeit, die die Multiplikationen A1 * Y(28 downto 11)
> und A2 * Y(28 downto 11) so zusammenfasst, dass anstelle von zwei
> Multiplizierer nur einer verwendet wird.
Du musst mit der doppelten Frequenz (das ist auch deine 
Zwei-Flankengeschichte) durch einen Multiplexer zwischen den vier 
Faktoren und den beiden Ergebnissen umschalten. Im Fall von YA1 und YA2 
wäre sogar nur 1 Faktor zu multiplexen...

Tom schrieb:
> Ein weiterer Punkt ist, dass ich in dieser Stufe 4 Multiplikationen
> durchführe, jedoch laut Xilinx 5 Multiplizierer benötigt werden.
Sieh doch einfach mal den RTL-Schaltplan an. Evtl. kannst du dann 
erkennen, was da passiert. Ich vermute sowas wie Register-Doubling (nur 
hier eben Multiplier-Doubling)...

BTW: bitte VHDL-Code in die Tags [ vhdl] und [ /vhdl] ohne Leerzeichen 
einschließen.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Multiplizierer einsparen

von Ralle (Gast)

19.08.2013 15:25

Lesenswert?

•

▲
▼

Tom schrieb:
> YA1 <= A1 * Y(28 downto 11);
> YA2 <= A2 * Y(28 downto 11);

> SUMB2A2 <= XB2 - YA2;
> SUMB2A2V_2 <= XB1 + SUMB2A2V;
> SUMB2A2V_3 <= SUMB2A2V_2 - YA1;

Geht es um das hier?
Du solltest das mathematisch etwas umformulieren, dann fällt eine 
Multiplikation später an und es entsteht weiter vorne ein Addierer.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Multiplizierer einsparen

von Tom (Gast)

19.08.2013 15:34

Lesenswert?

•

▲
▼

Danke für den Hinweis mit dem RTL Schaltplan. Der „Überschüssige“ 
Multiplizierer resultiert aus der doppelten Negation im Prozess Delay 
und kann somit nicht eingespart werden. Für die Signale YA1 und YA2 ist 
es mir mit Hilfe der case-Anweisung  gelungen einen Multiplizierer 
einzusparen.

library IEEE;
use IEEE.STD_LOGIC_1164.ALL;
use IEEE.NUMERIC_STD.ALL;
entity section_1 is
  generic
    (  PG:  integer :=  890;            
      PB1: integer :=  648;    
      PB2: integer :=    1;    
      PA0: integer :=    1;    
      PA1: integer :=  360;    
      PA2: integer := 1964);     
    (  CLK: in std_logic;   
       CLK160MHz: in std_logic;
      RESET: in std_logic;
      XN1: in std_logic_vector(11 downto 0);   
      YN1: out std_logic_vector(17 downto 0));
end section_1;
architecture Behavioral of section_1 is
constant G : signed(11 downto 0) := to_signed(PG,12);
constant B1 : signed(11 downto 0) := to_signed(PB1,12);
constant A1 : signed(11 downto 0) := to_signed(PA1,12);
constant A2 : signed(11 downto 0) := to_signed(PA2,12);
signal X   : signed(17 downto 0)                   ;
signal A: signed(11 downto 0);
signal XB0 : signed(29 downto 0) := (others => '0');
signal XB1 : signed(29 downto 0) := (others => '0');
signal XB2 : signed(29 downto 0) := (others => '0');
signal Y  : signed(29 downto 0) := (others => '0'); 
signal YA1: signed(29 downto 0) := (others => '0');
signal YA2: signed(29 downto 0) := (others => '0');
signal YA: signed(29 downto 0) := (others => '0');
signal SUMB2A2    : signed(29 downto 0) := (others => '0');
signal SUMB2A2V   : signed(29 downto 0) := (others => '0');
signal SUMB2A2V_2 : signed(29 downto 0) := (others => '0');
signal SUMB2A2V_3 : signed(29 downto 0) := (others => '0');
signal SUMB2A2V2  : signed(29 downto 0) := (others => '0');
process(XN1)
  if XN1(11) = '1' then
    X <= signed('1' & XN1 & "00000");
    X <= signed('0' & XN1 & "00000");
  end if;
end process;
XB0 <= G * X;
XB1 <= B1 * XB0(28 downto 11);
XB2 <= XB0;
Y <= SUMB2A2V2 + XB0; 
YA <= A * Y(28 downto 11);
process(CLK160MHz,YA)
  case CLK160MHz is
    when '0' => A <= A1 ;
    when others => A <= A2;
  end case;  
  case CLK160MHz is
    when '0' => YA1 <= YA ;
    when others => YA2 <= YA;
  end case;  
end process;
SUMB2A2 <= XB2 - YA2;
SUMB2A2V_2 <= XB1 + SUMB2A2V;
SUMB2A2V_3 <= SUMB2A2V_2 - YA1;
Delay: process(CLK)
variable YHilf: signed(29 downto 0);
  if CLK='1' and CLK'event then
    if RESET = '1' then
      SUMB2A2V <= (others => '0');
      SUMB2A2V2 <= (others => '0');
      YN1 <= (others => '0');
     else
      SUMB2A2V <= SUMB2A2;
      SUMB2A2V2 <= SUMB2A2V_3;
      if Y(29) = '1' then
        YHilf := not(Y - 1);
        YN1 <= std_logic_vector(not(YHilf(28 downto 11)-1));
      else
        YN1 <= std_logic_vector(Y(28 downto 11));
      end if;
    end if;
  end if;  
end process Delay;
end Behavioral;



Jedoch bekomme ich jetzt immer folgende Warnung:
Found 1-bit latch for signal <YA1<28>>. Latches may be generated from 
incomplete case or if statements. We do not recommend the use of latches 
in FPGA/CPLD designs, as they may lead to timing problems
So wie ich das verstehe, stimmt irgendwas mit der case-Anweisung nicht?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Multiplizierer einsparen

von Tom (Gast)

19.08.2013 15:37

Lesenswert?

•

▲
▼

@Ralle
Wie soll den die Umformulierung aussehen?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Multiplizierer einsparen

von Lothar M. (Firma: Titel) (lkmiller) (Moderator)

19.08.2013 15:42

Lesenswert?

•

▲
▼

Tom schrieb:
> process(CLK160MHz,YA)
Die Sensitivliste ist unvollständig. Es fehlen A1 und A2.

> begin
>   case CLK160MHz is
>     when '0' => A <= A1 ;
>     when others => A <= A2;
>   end case;
>
>   case CLK160MHz is
>     when '0' => YA1 <= YA ;
>     when others => YA2 <= YA;
>   end case;
> end process;
Ein Takt ist ein Takt und keine Quelle für kombinatorisches 
Umschalten...

>     when '0' => YA1 <= YA ;
>     when others => YA2 <= YA;
Daher kommt die Latch-Warnung:
Was soll YA2 sein, wenn CLK160MHz mal '0' ist?
Und was Ya1, wenn der "Takt" '1' ist?


Wie hast du die 160MHz erzeugt?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Multiplizierer einsparen

von Ralle (Gast)

19.08.2013 16:41

Lesenswert?

•

▲
▼

Lothar Miller schrieb:
> Tom schrieb:
>> process(CLK160MHz,YA)
> Die Sensitivliste ist unvollständig. Es fehlen A1 und A2.
>
>> begin
>>   case CLK160MHz is
>>     when '0' => A <= A1 ;
>>     when others => A <= A2;
>>   end case;
>>
>>   case CLK160MHz is
>>     when '0' => YA1 <= YA ;
>>     when others => YA2 <= YA;
>>   end case;
>> end process;
> Ein Takt ist ein Takt und keine Quelle für kombinatorisches
> Umschalten...

Ich finde die Klasse, darauf wäre ich nicht gekommen.


>Wie soll den die Umformulierung aussehen?
Du verwendest beide Terme in derselben Gleichung, nur über 
Zwischensignale. Die kannst du anders zusammenfassen.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Multiplizierer einsparen

von Tom (Gast)

20.08.2013 14:04

Lesenswert?

•

▲
▼

Also ich habe jetzt eine Lösung, die statt 5 Multiplizierer noch 3 
verwendet. Jedoch funktioniert das Filter mit den 160 MHz nicht. Wird 
der Takt auf 320 MHz erhöht, läuft es ohne Probleme und ich erziele 
dieselben Ergenisse, wie mit 5 Multiplizierer.

library IEEE;
use IEEE.STD_LOGIC_1164.ALL;
use IEEE.NUMERIC_STD.ALL;
entity section_1 is
  generic
    (  PG:  integer :=  890;       
      PB0: integer :=    1;    
      PB1: integer :=  648;    
      PB2: integer :=    1;    
      PA0: integer :=    1;    
      PA1: integer :=  360;    
      PA2: integer := 1964);     
    (  CLK: in std_logic; 
      CLK160MHz: in std_logic;    
      RESET: in std_logic;
      XN1: in std_logic_vector(11 downto 0);   
      YN1: out std_logic_vector(17 downto 0));
end section_1;
architecture Behavioral of section_1 is
constant G : signed(11 downto 0) := to_signed(PG,12);
constant B1 : signed(11 downto 0) := to_signed(PB1,12);
constant A1 : signed(11 downto 0) := to_signed(PA1,12);
constant A2 : signed(11 downto 0) := to_signed(PA2,12);
signal A: signed(11 downto 0) := (others => '0');
signal K: signed(11 downto 0) := (others => '0');
signal X   : signed(17 downto 0)                   ;
signal Z   : signed(17 downto 0)                   ;
signal XB0 : signed(29 downto 0) := (others => '0');
signal XB1 : signed(29 downto 0) := (others => '0');
signal XB2 : signed(29 downto 0) := (others => '0');
signal XB : signed(29 downto 0) := (others => '0');
signal Y  : signed(29 downto 0) := (others => '0'); 
signal YA : signed(29 downto 0) := (others => '0');
signal YA1: signed(29 downto 0) := (others => '0');
signal YA2: signed(29 downto 0) := (others => '0');
signal SUMB2A2    : signed(29 downto 0) := (others => '0');
signal SUMB2A2V   : signed(29 downto 0) := (others => '0');
signal SUMB2A2V_2 : signed(29 downto 0) := (others => '0');
signal SUMB2A2V_3 : signed(29 downto 0) := (others => '0');
signal SUMB2A2V2  : signed(29 downto 0) := (others => '0');
signal SEL: std_logic := '0';
process(XN1)
  if XN1(11) = '1' then
    X <= signed('1' & XN1 & "00000");
    X <= signed('0' & XN1 & "00000");
  end if;
end process;
XB <= K * Z;
XB2 <= XB0;
Y <= SUMB2A2V2 + XB0; 
YA <= A * Y(28 downto 11);
SUMB2A2 <= XB2 - YA2;
SUMB2A2V_2 <= XB1 + SUMB2A2V;
SUMB2A2V_3 <= SUMB2A2V_2 - YA1;
process(SEL,X,XB0)
  case SEL is
    when '0' => A <= "000101101000";     -- A1
    when others => A <="011110101100";   -- A2
  end case;
  case SEL is
    when '0' => K <= "001101111010";     -- G
    when others => K <= "001010001000";  -- B1
  end case;
  case SEL is
    when '0' => Z <= X;
    when others => Z <=XB0(28 downto 11);
   end case;
end process;
process(CLK160MHz,YA)
  if CLK160MHz = '1' and CLK160MHz'event then
    SEL <= not(SEL);
    if SEL = '0' then
      YA1 <= YA;
      XB0 <= XB;
    else
      YA2 <= YA;
      XB1 <= XB;
      end if;
  end if;
end process;
Delay: process(CLK)
variable YHilf: signed(29 downto 0);
  if CLK='1' and CLK'event then
    if RESET = '1' then
      SUMB2A2V <= (others => '0');
      SUMB2A2V2 <= (others => '0');
      YN1 <= (others => '0');
     else
      SUMB2A2V <= SUMB2A2;
      SUMB2A2V2 <= SUMB2A2V_3;
      if Y(29) = '1' then
        YHilf := not(Y - 1);
        YN1 <= std_logic_vector(not(YHilf(28 downto 11)-1));
      else
        YN1 <= std_logic_vector(Y(28 downto 11));
      end if;
    end if;
  end if;  
end process Delay;
end Behavioral;

Hat jemand eine Idee, wie ich den Takt reduziert bekomme?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Multiplizierer einsparen

von Lothar M. (Firma: Titel) (lkmiller) (Moderator)

20.08.2013 14:08

Lesenswert?

•

▲
▼

Tom schrieb:
> Jedoch funktioniert das Filter mit den 160 MHz nicht.
Wie stellst du das fest?
Was sagt die Simulation?
Hast du ein Constraint auf den Takt gesetzt?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Multiplizierer einsparen

von Tom (Gast)

20.08.2013 14:25

Lesenswert?

•

▲
▼

Das Filter arbeitet bei einer Mittenfrequenz von 20 MHz und meine 
Abtastfrequenz liegt bei 80 MHz. Also lasse ich in der Simulation meine 
Eingangswerte so variieren, dass sie einem Sinussignal mit 20 MHz 
entsprechen. Funktioniert mein Programm, so muss mein Ausgangssignal 
ungefiltert vorliegen und mit der Simulation mit 5 Multiplizierer 
übereinstimmen. Dies tut sie aber nur, wenn ich die Frequenz auf 320 MHz 
einstelle.
Ich musste mich bisher noch gar nicht mit timing constraints 
beschäftigen, deswegen weiß ich nicht was du mit "Constraint auf den 
Takt setzen" meinst!

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Multiplizierer einsparen

von Lothar M. (Firma: Titel) (lkmiller) (Moderator)

20.08.2013 15:32

Lesenswert?

•

▲
▼

Wenn du bisher "nur" simulierst und da was nicht passt, dann kannst du 
ja recht komfortabel den Fehler suchen.

Tom schrieb:
> Dies tut sie aber nur, wenn ich die Frequenz auf 320 MHz einstelle.
In der Simulation? Machst du eine Timingsimulation?

> Ich musste mich bisher noch gar nicht mit timing constraints beschäftigen,
Das wird kommen, wenn du aufs FPGA gehst...

> weiß ich nicht was du mit "Constraint auf den Takt setzen" meinst!
Damit teilst du der Toolchain mit, wie schnell du das FPGA takten wirst. 
Und 320MHz sind schon sportlich...

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Forum: FPGA, VHDL & Co. Multiplizierer einsparen