Forum: Offtopic Effizient Maske für höchstes gesetzes Bit berechnen?

Effizient Maske für höchstes gesetzes Bit berechnen?

von Johann L. (gjlayde)

Benutzerseite

14.06.2012 22:09

Lesenswert?

•

▲
▼

Hi, die Maske für das niedrigste gesetze Bits eines Werts ungleich 0 
kann man bekanntlich so ausrechnen:

> mask_lobit (x) = x EOR (x AND (x-1))

Beispiel: Für den 8-Bit Wert 010110 ergibt sich

> mask_lobit (010110) = 000010

Weiß jemand ein entsprechendes, effizientes Verfahren für mask_hibit? 
Die Eingabe kann als ungleich 0 vorausgesetzt werden. Für das Beispiel 
ist

> mask_hibit (010110) = 010000

Steh leider grad aufm Schlauch :-(

Beitrag melden Bearbeiten Thread verschieben Thread sperren Anmeldepflicht aktivieren Anpinnen Thread löschen Thread mit anderem zusammenführen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Effizient Maske für höchstes gesetzes Bit berechnen?

von Mike M. (mikeii)

14.06.2012 22:28

Lesenswert?

•

▲
▼

Ganzzahliger zweierlogarithmus?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Effizient Maske für höchstes gesetzes Bit berechnen?

von Johann L. (gjlayde)

Benutzerseite

14.06.2012 22:39

Lesenswert?

•

▲
▼

Mike Mike schrieb:
> Ganzzahliger zweierlogarithmus?

Ok, und wie geht der effizient, d.h. ohne Schleife?
Zudem, selbst wenn man den kennt muss man noch 1 um die entsprechende 
Anzahl nach links schieben, und das ist teuer ohen Barrel-Shifter.

"Billige" Operationen sind: AND, OR, XOR, PLUS, MINUS, Bit-Test, Shift 
um 1, und Komplement, evtl. auch Multiplikation.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Effizient Maske für höchstes gesetzes Bit berechnen?

von Mike M. (mikeii)

14.06.2012 22:45

Lesenswert?

•

▲
▼

Oh, hab das Wort Effizienz überlesen, war grad in Eile.

Ohne Schleife wüsste ich leider auch keine Lösung

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Effizient Maske für höchstes gesetzes Bit berechnen?

von (prx) A. K. (prx)

14.06.2012 23:08

Lesenswert?

•

▲
▼

Vielleicht bei 8 Bits nicht besser, aber immerhin ohne Schleife:

   if (i & (i-1)) {
       --i;
       i |= i >> 1;
       i |= i >> 2;
       i |= i >> 4;
       ++i;
       i >>= 1;

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Effizient Maske für höchstes gesetzes Bit berechnen?

von Mike M. (mikeii)

14.06.2012 23:19

Lesenswert?

•

▲
▼

Wenn ich das richtig sehe, willst du alle Bits die niedrigwertiger sind, 
auf 1 Setzten, und danach eins Addieren und um eins wieder nach links 
shiften?

Sieht gut aus, aber ich nehme an, dass führt zu Problemen, wenn man nur 
8 Bit Speicherplatz hat? Da dürfte man doch, wenn das höchste Bit 
gesetzt ist, 0 rauskommen?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Effizient Maske für höchstes gesetzes Bit berechnen?

von (prx) A. K. (prx)

14.06.2012 23:24

Lesenswert?

•

▲
▼

Mike Mike schrieb:

> Sieht gut aus, aber ich nehme an, dass führt zu Problemen, wenn man nur
> 8 Bit Speicherplatz hat? Da dürfte man doch, wenn das höchste Bit
> gesetzt ist, 0 rauskommen?

Kein Problem in Assembler. Überlaufen kann nur ++i und dessen Carry kann 
man gleich danach wieder reinschieben. Aus
       ++i;
       i >>= 1;
wird daher sowas wie
       adc r, #1
       rcr r     -- rotate thru carry
In C klappt das weniger gut, da braucht man ein Bit mehr.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Effizient Maske für höchstes gesetzes Bit berechnen?

von Mike M. (mikeii)

14.06.2012 23:26

Lesenswert?

•

▲
▼

Stimmt auch wieder :)

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Effizient Maske für höchstes gesetzes Bit berechnen?

von Timm T. (Gast)

14.06.2012 23:40

Lesenswert?

•

▲
▼

Häh? Ich verstehs trotzdem grad nicht...

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Effizient Maske für höchstes gesetzes Bit berechnen?

von Jörg W. (dl8dtl) (Moderator)

Benutzerseite

14.06.2012 23:41

Lesenswert?

•

▲
▼

Hacker's Delight (ISBN 0201914654) enthält zumindest einige Algorithmen
für "nlz" (number of leading zeros), würde dir das was helfen?

Eine Möglichkeit ist:

int nlz(unsigned x) {
  if (x == 0) return (32);
  if ((x >> 16) == 0) {n = n +16; x = x <<16;}
  if ((x >> 24) == 0) {n = n + 8; x = x << 8;}
  if ((x >> 28) == 0) {n = n + 4; x = x << 4;}
  if ((x >> 30) == 0) {n = n + 4; x = x << 2;}
  n = n - (x >> 31);
  return n;


Gibt noch ein paar Varianten davon.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Effizient Maske für höchstes gesetzes Bit berechnen?

von (prx) A. K. (prx)

14.06.2012 23:49

Lesenswert?

•

▲
▼

Ohne Barrelshifter hast du nur eine Schleife durch eine andere ersetzt.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Effizient Maske für höchstes gesetzes Bit berechnen?

von (prx) A. K. (prx)

14.06.2012 23:54

Lesenswert?

•

▲
▼

Kürzer, das --i ist hier überflüssig:

    if (i & (i-1)) {    // wenn mehr als 1 Bit gesetzt
        i |= i >> 1;    // untere Bits setzen
        i |= i >> 2;    // ...
        i |= i >> 4;    // ...
        ++i;            // gibt nächsthöhere Zweierpotenz
        i >>= 1;

oder ohne Überlauf:

    if (i & (i-1)) {    // wenn mehr als 1 Bit gesetzt
        i |= i >> 1;    // untere Bits setzen
        i |= i >> 2;    // ...
        i |= i >> 4;    // ...
        ++i;            // gibt nächsthöhere Zweierpotenz
        i >>= 1;
        if (i == 0) i = 128;

Für 16/32/64 Bits müssen nur 1/2/3 entsprechende
 i |= i >> N;
Schritte hinzugefügt werden.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Effizient Maske für höchstes gesetzes Bit berechnen?

von Frank M. (ukw) (Moderator)

Benutzerseite

15.06.2012 00:26

Lesenswert?

•

▲
▼

Eine Möglichkeit, die nur mit XOR, AND, SHIFT und MINUS auskommt (ohne 
Schleife und if), wäre diese:

unsigned char  mask_highbit (unsigned char x)
    unsigned char h;
    x = ((x >> 4) & 0x0F) | ((x << 4) & 0xF0);
    x = ((x >> 2) & 0x33) | ((x << 2) & 0xCC);
    x = ((x >> 1) & 0x55) | ((x << 1) & 0xAA);
    h = x ^ (x & (x - 1));
    h = ((h >> 4) & 0x0F) | ((h << 4) & 0xF0);
    h = ((h >> 2) & 0x33) | ((h << 2) & 0xCC);
    h = ((h >> 1) & 0x55) | ((h << 1) & 0xAA);
    return h;


Aber ob das wirklich effizient ist?!? Eher weniger.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Effizient Maske für höchstes gesetzes Bit berechnen?

von Johann L. (gjlayde)

Benutzerseite

15.06.2012 00:51

Lesenswert?

•

▲
▼

A. K. schrieb:
> Vielleicht bei 8 Bits nicht besser, aber immerhin ohne Schleife:

   if (i & (i-1)) {
       --i;
       i |= i >> 1;
       i |= i >> 2;
       i |= i >> 4;
       ++i;
       i >>= 1;


Das sieht schon mal seht gut aus :-)

Tatsächlich geht's um avr-gas Code. Momentan hab ich

                        ldi     MASK, 1 << 0
    sbrc    VAL, 1  $   ldi     MASK, 1 << 1
    sbrc    VAL, 2  $   ldi     MASK, 1 << 2
    sbrc    VAL, 3  $   ldi     MASK, 1 << 3
    sbrc    VAL, 4  $   ldi     MASK, 1 << 4
    sbrc    VAL, 5  $   ldi     MASK, 1 << 5
    sbrc    VAL, 6  $   ldi     MASK, 1 << 6
    sbrc    VAL, 7  $   ldi     MASK, 1 << 7


Nach obiger Methode werden aus den 15 Ticks/Instruktionen 13:

    mov     MASK,   VAL
    lsr     MASK
    or      MASK,   VAL
    mov     TMP,    MASK
    lsr     MASK
    lsr     MASK
    or      MASK,   TMP
    mov     TMP,    MASK
    swap    MASK
    andi    MASK,   0xf
    or      MASK,   TMP
    lsr     MASK
    adc     MASK,   ZERO


Zumindest siehts beeindruckender aus :-)

Oder doch den Logarithmus? 1 << n braucht 7 Ticks auf AVR, der log 
müsste also in weniger als 6 Ticks gehen, um besser zu sein...

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Effizient Maske für höchstes gesetzes Bit berechnen?

von Yalu X. (yalu) (Moderator)

15.06.2012 08:50

Lesenswert?

•

▲
▼

Folgende Routine braucht 10 Zyklen (der Vergleichbarkeit halber ohne die
RETs):

; input:    val
; output:   msk
; destroys: -
mask_hibit:
   mov  msk, val
   andi msk, 0xf0
   brne 2f
   mov  msk, val
   andi msk, 0x0c
   brne 1f
   mov  msk, val
   andi msk, 0x02
   brne 4f
   ldi  msk, 0x01
1: andi msk, 0x08
   brne 4f
   ldi  msk, 0x04
2: andi msk, 0xc0
   brne 3f
   mov  msk, val
   andi msk, 0x20
   brne 4f
   ldi  msk, 0x10
3: andi msk, 0x80
   brne 4f
   ldi  msk, 0x40


Falls der Algorithmus nicht als Unterprogramm, sondern inline ausgeführt
werden soll, entfällt der letzte RET, und alle anderen müssen durch
einen RJMP ans Ende ersetzt werden. Wenn der Algorithmus über einen der
RMPs beendet wird, braucht er 2 Zyklen mehr, also 12 Zyklen. In diesem
Fall ist folgende Routine günstiger, da sie keine Ausstiegspunkte in der
Mitte hat. Sie braucht 11 Zyklen ohne den RET ist auch deutlich
kürzer und vor allem cooler:

; input:    val
; output:   val
; destroys: tmp
mask_hibit:
   cpi  val, 0x10
   brcs 1f
   andi val, 0xf0
1: mov  tmp, val
   andi tmp, 0xcc
   brne 2f
   mov  tmp, val
2: mov val, tmp
   andi val, 0xaa
   brne 3f
   mov val, tmp


Zu beachten ist allerdings, dass das Input-Register mit dem Ergebnis
überschrieben wird. Will man das vermeiden, kostet das einen zusätzlich
Zyklus, so dass man wieder bei den 12 ist.

Übrigens sollte die mask_lobit-Routine nicht in der naheliegenden Weise
so implementiert werden (4 Zyklen):

; input:    val
; output:   msk
; destroys: -
mask_lobit:
   mov  msk, val
   dec  msk
   and  msk, val
   eor  msk, val


Scheller (3 Zyklen) und kürzer geht es so:

; input:    val
; output:   msk
; destroys: -
mask_lobit:
   mov  msk, val
   neg  msk
   and  msk, val


Es ist nicht auf den ersten Blick zu erkennen, dass beide Routinen exakt
dasselbe tun. Der GCC hat aber einen sehr scharfen Blick und übersetzt

  x ^ (x & (x - 1));

entsprechend der zweiten Variante. Das haut mich total aus den Socken
und ist ein gutes Beispiel dafür, dass der GCC mitunter Optimierungen
vornimmt, auf die 99,9% der Assemblerprogrammierer nicht kommen würden.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Effizient Maske für höchstes gesetzes Bit berechnen?

von Paul B. (paul_baumann)

15.06.2012 09:57

Lesenswert?

•

▲
▼

Yalu schrob:
>....dass der GCC mitunter Optimierungen
>vornimmt, auf die 99,9% der Assemblerprogrammierer nicht kommen würden.

Ich denke eher, daß die 0,1% in Deiner Rechnung fehlenden Leute zu 100%
hier im Forum vertreten sind.

;-)

MfG Paul

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Effizient Maske für höchstes gesetzes Bit berechnen?

von Markus W. (Firma: guloshop.de) (m-w)

16.06.2012 00:41

Lesenswert?

•

▲
▼

Johann L. schrieb:
> Weiß jemand ein entsprechendes, effizientes Verfahren für mask_hibit?

Als "Joker-Verfahren", wenn man sonst kein ausreichend performantes 
findet, gibt es immer die Lösung mit dem Array:

static unsigned char mask_hibit[256]= {0b00000000,0b00000001,0b00000010,0b00000010, usw. };

(Natürlich in Hex-Darstellung schreiben, falls der Compiler 0b nicht 
kennt.)

Zwar braucht das etwas Speicherplatz, aber es ist sehr schnell...

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Effizient Maske für höchstes gesetzes Bit berechnen?

von Johann L. (gjlayde)

Benutzerseite

16.06.2012 09:21

Lesenswert?

•

▲
▼

Markus W. schrieb:
> Johann L. schrieb:
>> Weiß jemand ein entsprechendes, effizientes Verfahren für mask_hibit?
>
> Als "Joker-Verfahren", wenn man sonst kein ausreichend performantes
> findet, gibt es immer die Lösung mit dem Array: [...]
>
> Zwar braucht das etwas Speicherplatz, aber es ist sehr schnell...

Joker braucht 12 Ticks:

    subi    30,     lo8(-(mask_hibit))  ; 1
    sbci    31,     hi8(-(mask_hibit))  ; 1
    lpm     MASK,   Z                   ; 3


Die Zeiger-Register werden noch gebraucht und müssen daher gesichert 
werden.  Damit ist Joker langsamer und etwas spreicherfressender als 
Yalus Vorschlag:

Yalu X. schrieb:
> Folgende Routine braucht 10 Zyklen (der Vergleichbarkeit halber ohne
> die RETs): [...]
>
> Falls der Algorithmus nicht als Unterprogramm, sondern inline ausgeführt
> werden soll, [...]  ist folgende Routine günstiger, da sie keine
> Ausstiegspunkte in der Mitte hat. Sie braucht 11 Zyklen ohne den
> RET ist auch deutlich kürzer und vor allem cooler:

Brain gegen Design-Pattern "Joker" = 1 : 0

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Effizient Maske für höchstes gesetzes Bit berechnen?

von (prx) A. K. (prx)

16.06.2012 10:21

Lesenswert?

•

▲
▼

Johann L. schrieb:

> Joker braucht 12 Ticks:

Nicht wenn man die Tabelle auf 256 Bytes aligned:

    mov     ZL,     MASK                ; 1
    mov     ZH,     hi8(mask_hibit)     ; 1
    lpm     MASK,   Z                   ; 3


Nun sind es 10. Wenn TMP nicht 0 sein muss, dann 9.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Effizient Maske für höchstes gesetzes Bit berechnen?

von Winfried J. (Firma: Nisch-Aufzüge) (winne)

Benutzerseite

16.06.2012 10:52

Lesenswert?

•

▲
▼

Johann L. schrieb:
>
> Weiß jemand ein entsprechendes, effizientes Verfahren für mask_hibit?

Bleibt die Frag welchem kriterium das Verfahren entsprechen soll.

Laufzeit~ vs. Speichereffizienz

;-)

auf ein schönes WE

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Effizient Maske für höchstes gesetzes Bit berechnen?

von Markus W. (Firma: guloshop.de) (m-w)

16.06.2012 23:02

Lesenswert?

•

▲
▼

A. K. schrieb:
> Nicht wenn man die Tabelle auf 256 Bytes aligned:
>
>

>     movw    TMP,    30                  ; 2
>     mov     ZL,     MASK                ; 1
>     mov     ZH,     hi8(mask_hibit)     ; 1
>     lpm     MASK,   Z                   ; 3
>     movw    30,     TMP                 ; 2

>
> Nun sind es 10. Wenn TMP nicht 0 sein muss, dann 9.

Und wenn du jetzt noch lds statt lpm verwendest, sind es 7 Takte. 
Natürlich muss man dann vorher das Feld im RAM aufgebaut haben.

Winfried J. schrieb:
> Bleibt die Frag welchem kriterium das Verfahren entsprechen soll.
>
> Laufzeit~ vs. Speichereffizienz

Richtig! Nach beiden Kriterien gleichzeitig zu optimieren, gelingt 
selten.

> auf ein schönes WE

Dem schließe ich mich an. :-)

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Effizient Maske für höchstes gesetzes Bit berechnen?

von Timm T. (Gast)

17.06.2012 10:19

Lesenswert?

•

▲
▼

Ihr kennt den Witz von dem Feuer im Hotel, dem Ingenieur und dem 
Mathematiker?

Der Mathematiker reduziert das Problem auf eine bekannte Lösung. Bekannt 
ist eine einfache Lösung für lobit. Um die auf hibit anzuwenden, muss 
einfach das Byte gespiegelt werden:

  lsl val
  ror mval
  lsl val
  ror mval
  lsl val
  ror mval
  lsl val
  ror mval
  lsl val
  ror mval
  lsl val
  ror mval
  lsl val
  ror mval
  lsl val
  ror mval
  mov  mmsk, mval
  neg  mmsk
  and  mmsk, mval
  lsl mmsk
  ror msk
  lsl mmsk
  ror msk
  lsl mmsk
  ror msk
  lsl mmsk
  ror msk
  lsl mmsk
  ror msk
  lsl mmsk
  ror msk
  lsl mmsk
  ror msk
  lsl mmsk
  ror msk


Ok, das sieht jetzt noch nicht so effizient aus. Aber:

  out  PortB, val
  in   PortD, mval
  mov  mmsk, mval
  neg  mmsk
  and  mmsk, mval
  out  PortD, mmsk
  in   PortB, msk


Das sieht doch schon sehr schön aus, braucht nur 7 Takte und keinen 
weiteren Flash oder Sram. Die korrekte Portinitialisierung muss sowieso 
gemacht werden.

Ok, es hat einen kleinen Nachteil: PortB und D müssen gespiegelt 
verbunden werden, also Pin 0 auf 7, 1 auf 6, 2 auf 5 usw.

Aber das ist dann Sache des Ings, der die Leiterplatte entwirft... ;-)

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Effizient Maske für höchstes gesetzes Bit berechnen?

von Winfried J. (Firma: Nisch-Aufzüge) (winne)

Benutzerseite

17.06.2012 10:40

Lesenswert?

•

▲
▼

Ist doch eigentlich ein alltägliches Problem, ein Byte zu spiegeln

Das über 2 Ports HW zu verdrahten erscheint etwas spiky, aber im 
Prozessor selbst? Gibt es da keinen Opcode?
Die Frage schwebt mir schon durch den Kopf seit ich den Titel des 
Threads gelesen habe.

???

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Effizient Maske für höchstes gesetzes Bit berechnen?

von (prx) A. K. (prx)

17.06.2012 11:19

Lesenswert?

•

▲
▼

Datasheet ATmega16: "When reading back a software assigned pin value, a 
nop instruction must be inserted as indicated in Figure 25. The out 
instruction sets the “SYNC LATCH” signal at the positive edge of the 
clock. In this case, the delay tpd through the synchronizer is one 
system clock period."

Ergebnis:

  out  PortB, val
  in   PortD, mval
  mov  mmsk, mval
  neg  mmsk
  and  mmsk, mval
  out  PortD, mmsk
  in   PortB, msk

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Effizient Maske für höchstes gesetzes Bit berechnen?

von Frank M. (ukw) (Moderator)

Benutzerseite

17.06.2012 12:34

Lesenswert?

•

▲
▼

Timm Thaler schrieb:
> Der Mathematiker reduziert das Problem auf eine bekannte Lösung. Bekannt
> ist eine einfache Lösung für lobit. Um die auf hibit anzuwenden, muss
> einfach das Byte gespiegelt werden:

Rate mal, was Beitrag "Re: Effizient Maske für höchstes gesetzes Bit berechnen?" macht 
;-)

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Effizient Maske für höchstes gesetzes Bit berechnen?

von Sam .. (sam1994)

17.06.2012 13:29

Lesenswert?

•

▲
▼

Mit SREG-Register könnte man noch ein bisschen tricksen:

    out SREG, val
    bris 1
    ;evtl sei
    brts 2
    brhs 3
    brss 4
    brvs 5
    brns 6
    rjmp 7
1:  ;evtl cli
    ldi val, 1<<7
    rjmp 8
2:  ldi val, 1<<6
    rjmp 8
3:  ldi val, 1<<5
    rjmp 8
4:  ldi val, 1<<4
    rjmp 8
5:  andi val, 0b1000
6:  andi val, 0b1100
7:  andi val, 0b1110

6/7 - 10/9 Takte - abhängig davon, ob das I-Flag gesetzt sein soll.

Der Nachteil dabei ist, dass das I-Flag für ein paar Takte verändert 
werden kann.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Effizient Maske für höchstes gesetzes Bit berechnen?

von Sam .. (sam1994)

17.06.2012 13:48

Lesenswert?

•

▲
▼

Hier ohne Fehler:

    out SREG, val
    bris 1
    ;evtl sei
    brts 2
    brhs 3
    brss 4
    brvs 5
    brns 6
    brzs 7
    rjmp 8
1:  ;evtl cli
    ldi val, 1<<7
    rjmp 8
2:  ldi val, 1<<6
    rjmp 8
3:  ldi val, 1<<5
    rjmp 8
4:  ldi val, 1<<4
    rjmp 8
5:  andi val, 0b1000
6:  andi val, 0b1100
7:  andi val, 0b1110

6/7 - 11/10 Takte

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Effizient Maske für höchstes gesetzes Bit berechnen?

von Yalu X. (yalu) (Moderator)

17.06.2012 14:20

Lesenswert?

•

▲
▼

Winfried J. schrieb:
> Das über 2 Ports HW zu verdrahten erscheint etwas spiky, aber im
> Prozessor selbst? Gibt es da keinen Opcode?

Beim AVR nicht. Der T800 von Inmos hatte einen Befehl, mit dem man die 
Bitreihenfolge eines Wortes oder auch nur eines Teils davon umkehren 
konnte. Dieser Befehl war vorgesehen für die Verwendung in 
FFT-Implementierungen. Leider brauchte er für jedes zu bearbeitende Bit 
einen Taktzyklus.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Effizient Maske für höchstes gesetzes Bit berechnen?

von (prx) A. K. (prx)

17.06.2012 14:29

Lesenswert?

•

▲
▼

Gibts beisielsweise auch in XMOS (wen wunderts), Propeller, ARMv7, 
AVR32.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Effizient Maske für höchstes gesetzes Bit berechnen?

von Winfried J. (Firma: Nisch-Aufzüge) (winne)

Benutzerseite

17.06.2012 15:02

Lesenswert?

•

▲
▼

naja

Risk ist halt auch ein reduced concept

;-)

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Effizient Maske für höchstes gesetzes Bit berechnen?

von Simon K. (simon)

Benutzerseite

17.06.2012 15:04

Lesenswert?

•

▲
▼

Winfried J. schrieb:
> naja
>
> Risk ist halt auch ein reduced concept
>
> ;-)

RISC?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Effizient Maske für höchstes gesetzes Bit berechnen?

von Winfried J. (Firma: Nisch-Aufzüge) (winne)

Benutzerseite

17.06.2012 15:24

Lesenswert?

•

▲
▼

öhhhm, ja

freud hat mir wohl mal wieder einen wink geben wollen ;-)

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Effizient Maske für höchstes gesetzes Bit berechnen?

von Timm T. (Gast)

17.06.2012 22:22

Lesenswert?

•

▲
▼

Frank M. schrieb:
> Rate mal, was Beitrag "Re: Effizient Maske für höchstes gesetzes Bit berechnen?" 
macht

Aber nicht so schön über externe Verdrahtung.

A. K. schrieb:
> Datasheet ATmega16: "When reading back a software assigned pin value, a
> nop instruction must be inserted

Musst ja keinen Mega16 nehmen, ein Tiny25 tuts auch... für 2 Bit.

Winfried J. schrieb:
> Ist doch eigentlich ein alltägliches Problem, ein Byte zu spiegeln

Zum Beispiel, wenn man den Bus zwischen Controller und externen ADC 
falschrum verbindet. Der betreffende Elektoniker hat dann die 
Leiterbahnen weggekratzt und neu verbunden. Die Bits im AVR zu tauschen 
erschien ihm wohl zu "quick and dirty". ;-)

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Effizient Maske für höchstes gesetzes Bit berechnen?

von Winfried J. (Firma: Nisch-Aufzüge) (winne)

Benutzerseite

17.06.2012 22:31

Lesenswert?

•

▲
▼

Da wäre es ja noch einfach, aber mach den mal mit TX RX 
atmega128<->max232
Da bist mit Skalpell und Brutzelstift schneller im Prototyp, weiß ich. 
;-)
Namaste

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Effizient Maske für höchstes gesetzes Bit berechnen?

von Johann L. (gjlayde)

Benutzerseite

18.06.2012 00:33

Lesenswert?

•

▲
▼

Winfried J. schrieb:
> Johann L. schrieb:
>>
>> Weiß jemand ein entsprechendes, effizientes Verfahren für mask_hibit?
>
> Bleibt die Frag welchem kriterium das Verfahren entsprechen soll.
>
> Laufzeit~ vs. Speichereffizienz

Natürlich allen :o)

• Laufzeit
• Speicherplatz (Flash, Stack, RAM)
• Eleganz

Der Fokus liegt eher auf Speed, aber für 1 oder 2 Ticks weniger würd ich 
keine 256 Bytes oder noch mehr an RAM oder Flash verbraten. Das ist 
einfach nicht mehr verhältnismässig.

Wie auch immer, eine schnellere Implementierung schlägt mit rund 0.2 
Promille an Speedup zu Buche, so daß ich mich für eine einfach und 
naheliegende Lösung entschieden habe anstatt eine schwer 
nachvollziehbare zu nehmen.

Und da nach über 30 Posts noch nix gefunden wurde, das annähernd so 
elegant ist wie x & -x for lomask, ist da wohl nix zu wollen...

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Effizient Maske für höchstes gesetzes Bit berechnen?

von Falk B. (falk)

18.06.2012 08:30

Lesenswert?

•

▲
▼

@  Johann L. (gjlayde) Benutzerseite

>• Laufzeit
>• Speicherplatz (Flash, Stack, RAM)
>• Eleganz

Die Ansprüche steigen.

>Der Fokus liegt eher auf Speed, aber für 1 oder 2 Ticks weniger würd ich
>keine 256 Bytes oder noch mehr an RAM oder Flash verbraten.

RAM sicher nicht, Flash kann man da schon eher verschmerzen. Eine 
Schleife mit diversen Befehlen kostet auch Flash.

>Wie auch immer, eine schnellere Implementierung schlägt mit rund 0.2
>Promille an Speedup zu Buche,

Da lohnt es sich nicht, auch nur ansatzweise drüber nachzudenken. Alles 
rein philosophisch.

>Und da nach über 30 Posts noch nix gefunden wurde, das annähernd so
>elegant ist wie x & -x for lomask, ist da wohl nix zu wollen...

Naja, man könnte ja ma spasseshalber die vollständige Logikgleichung in 
einen KV-Diagramm eintragen und optimieren, vielleicht kommt da direkt 
was sinnvolles raus?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Thread beobachten |

Seitenaufteilung abschalten

Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.

Bestehender Account

Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen

Noch kein Account? Hier anmelden.

Kontakt/Impressum – Datenschutzerklärung – Nutzungsbedingungen – Werbung auf Mikrocontroller.net