AVR - CRC8 asm-optimierung

von Armin O. (armino)

09.05.2012 23:37

Lesenswert?

•

Auf der Suche nach einem schnellen CRC8 Algorithmus hab ich mir den in 
der avr libc mal angeschaut und mich gewundert. Warum wird bei manchen 
CRC Berechnungen nicht immer gleich ein komplettes Byte verarbeitet 
sonder mit Schleife die einzelnen Bits durchgeschoben.

Wenn man sich den Algorithmus als eine Black-Box vorstellt und eben nur 
aus den Bits im Eingangsbyte ein neuer CRC Wert berechnet kann man eine 
Matrix aufstellen, welche dann eben mit asm-Befehlen optimiert werden 
kann.

So sieht die Matrix zum beispiel für den CRC8 (x^8 + x^5 + x^4 + 1) für 
Maxim/Dallas 1-Wire Geräte aus:

  76543210
0   xx x
1  xx x  x
2 xx x  xx
3 x  x  xx
4    x  xx
5   x  xx
6  x  xx x
7 x  xx x

Somit setzt sich das AusgabeBit 0 aus dem XOR von Eingangsbit 5, 4 und 2 
zusammen, usw.

Daraus hab ich also folgenden Assembler-Code generiert:

; zuerst das XOR von dem vorherigen CRC mit dem Datenbyte
  eor  24, 22
; dann brauchen wir 2 Kopien
  mov  22, 24
  mov  23, 24
  bst  22, 0
  lsr  22
  eor  24, 22
  swap 24
  andi 23, 0xF0
  bld  23, 1
  eor  24, 23
  andi 22, 0x07
  bld  22, 7
  lsr  22
  brcc skip
  sbr  22, 0x80
  sbrc 24, 4
  sbr  22, 0x0C
  eor  24, 22


Damit ist man mit 18 Instruktionen schon wesentlich schneller als die 
Schleife die in der avr-libc drin ist, welche 50 Zyklen für einen 
Durchlauf braucht (dafür aber auch 10 Befehle weniger Platz braucht).

Vielleicht hab ich noch was übersehen was man noch eleganter, kürzer 
schreiben könnte?

Je nach Generatorpolynom gelingt das umsetzen auf byteweise Verarbeitung 
unterschiedlich gut, so ist der CRC-8 (ITU-T) mit x^8 + x^2 + x + 1 um 
einiges kürzer.

  01234567
0 012
1  123
2   234
3    345
4 0   456
5  1   567
6  1    67
7 01     7

; zuerst das XOR von dem vorherigen CRC mit dem Datenbyte
  eor  24, 22
; dann brauchen wir eine Kopie
  mov  22, 24
  clr  23
  lsr  22
  eor  24, 22
  brcc no_bit_0
  sbr  23, 0x10
no_bit_0:
  ror  22
  eor  24, 22
  brcc no_bit_1
  sbr  23, 0xE0
no_bit_1:
  eor  24, 23


Manche werden jetzt einwenden das ein richtig schneller CRC nur mit 
einer Look-Up Tabelle geht, jedoch benötigt auch das Pointer berechnen 
und nachschauen in der (meist im PGM liegenden) Tabelle nicht 
unerheblich viel Zeit (auch immerhin 8 Zyklen):

; zuerst das XOR von dem vorherigen CRC mit dem Datenbyte
  eor  24, 22
  mov  ZL, 24
  clr  ZH
  subi ZL, lo8(-(LUT))
  sbci ZH, hi8(-(LUT))
  lpm  24, Z



Grüße
armino

Beitrag melden Bearbeiten Thread verschieben Thread sperren Anmeldepflicht aktivieren Anpinnen Thread löschen Thread mit anderem zusammenführen Markierten Text zitieren Antwort Antwort mit Zitat

Re: AVR - CRC8 asm-optimierung

von Ale (Gast)

11.05.2012 15:33

Lesenswert?

•

▲
▼

Dallas hat immer crc mit einer Tabelle gerechnet... vielleicht wäre es 
eine Idee

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: AVR - CRC8 asm-optimierung and corrected buggy routines

von eProfi (Gast)

03.01.2013 19:59

Lesenswert?

•

▲
▼

Habe mir das ganze angeschaut: Dein Vorgehen ist korrekt,
eine ähnlich kurze Routinen ohne Tabelle ist folgende:

/*----------------------------------------------------------------------------------------
| util/crc8
|-----------------------------------------------------------------------------------------
| this file implements some crc8 routines
| - based on code by peter danegger
| - ..._rev0x07 is used by mca25 mux protocol! <-- NOT REALLY TESTED! THERE MIGHT BE A HIDDEN BUG!
| Author   : Simon Schulz / avr{AT}auctionant.de
|-----------------------------------------------------------------------------------------
| License:
| This program is free software; you can redistribute it and/or modify it under
| the terms of the GNU General Public License as published by the Free Software
| Foundation; either version 2 of the License, or (at your option) any later
| version.
| This program is distributed in the hope that it will be useful, but
| WITHOUT ANY WARRANTY;
| without even the implied warranty of MERCHANTABILITY or FITNESS FOR A PARTICULAR
| PURPOSE. See the GNU General Public License for more details.
| You should have received a copy of the GNU General Public License along with
| this program; if not, write to the Free Software Foundation, Inc., 51
| Franklin St, Fifth Floor, Boston, MA 02110, USA
| http://www.gnu.de/gpl-ger.html
`-----------------------------------------------------------------------------------------*/
#include "crc8.h"
unsigned char crc8_calc(unsigned char *data, unsigned char crc_start, unsigned int len){
  unsigned int i;
  unsigned char crc = crc_start;
  for(i=0; i<len; i++){
    crc = crc8_calc_byte(crc,data[i]);
//  pgm_read_byte(&crc8_lookuptable[crc ^ data[i]]);
  return crc;
//crc8, reversed, poly 0x07
unsigned char crc8_calc_byte_rev0x07(unsigned char crc, unsigned char data){
  data ^= crc;
  crc = 0;
  if( data & 0x01 ) crc  = 0x91;
  if( data & 0x02 ) crc ^= 0xE3;
  if( data & 0x04 ) crc ^= 0x07;
  if( data & 0x08 ) crc ^= 0x0E;
  if( data & 0x10 ) crc ^= 0x1C;
  if( data & 0x20 ) crc ^= 0x38;
  if( data & 0x40 ) crc ^= 0x70;
  if( data & 0x80 ) crc ^= 0xE0;
  return crc;
unsigned char crc8_calc_byte(unsigned char crc, unsigned char data){
  data ^= crc;
  crc = 0;
  if( data & 0x01 ) crc  = 0x5E;
  if( data & 0x02 ) crc ^= 0xBC;
  if( data & 0x04 ) crc ^= 0x61;
  if( data & 0x08 ) crc ^= 0xC2;
  if( data & 0x10 ) crc ^= 0x9D;
  if( data & 0x20 ) crc ^= 0x23;
  if( data & 0x40 ) crc ^= 0x46;
  if( data & 0x80 ) crc ^= 0x8C;
  return crc;



Wenn man das nicht als Subroutine, sondern mittels eines #define 
inlined, sind das ebenfalls 18 Cycles.


Im original-File avreth1\util\crc8.c von Simon Schulz ist ein dicker 
Bug:
    crc8_calc_byte(crc,data[len]);
//  pgm_read_byte(&crc8_lookuptable[crc ^ data[len]]);
richtig ist:
    crc8_calc_byte(crc,data[ i ]);
//  pgm_read_byte(&crc8_lookuptable[crc ^ data[ i ]]);

Den selben Bug habe ich auch in einer crc16-Version gesehen:
unsigned short OneWireCRC::crc16(unsigned short* data, unsigned short 
len)
{
  unsigned short i;
  unsigned short crc = 0;

  for ( i = 0; i < len; i++){
//  unsigned short cdata = data[len];  //Bug: len --> i
    unsigned short cdata = data[ i ];

//  cdata = (cdata ^ (crc & 0xff)) & 0xff; //sollte auch einfacher 
gehen:
    cdata = (cdata ^  crc        ) & 0xff;
    crc >>= 8;

    if (oddparity[cdata & 0xf] ^ oddparity[cdata >> 4]) crc ^= 0xc001;

    cdata <<= 6;  //alles sehr umständlich
    crc ^= cdata;
    cdata <<= 1;
    crc ^= cdata;
    }
    return crc;
}

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: AVR - CRC8 asm-optimierung

von maria c. (czerny)

23.12.2013 14:58

Lesenswert?

•

▲
▼

Armin Otterstätter schrieb:
> So sieht die Matrix zum beispiel für den CRC8 (x^8 + x^5 + x^4 + 1) für
> Maxim/Dallas 1-Wire Geräte aus:
>
>   76543210
> 0   xx x
> 1  xx x  x
> 2 xx x  xx
> 3 x  x  xx
> 4    x  xx
> 5   x  xx
> 6  x  xx x
> 7 x  xx x
>
> Somit setzt sich das AusgabeBit 0 aus dem XOR von Eingangsbit 5, 4 und 2
> zusammen, usw.

Ich sitze da jetzt schon eine ganze Weile drüber und krieg einfach nicht 
raus, wie Du auf die Tabelle kommst. Könntest Du ein Beispiel posten?

Gruß, Maria

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: AVR - CRC8 asm-optimierung

von Armin O. (armino)

23.12.2013 20:37

Lesenswert?

•

▲
▼

Hmm also im als einfachsten Fall durch stupides ausprobieren.

Letzendlich bildet der CRC einen Eingangwert auf einen Ausgangswert ab. 
Dabei ist der Eingangswert und der Ausgangswert immer gleich breit 
(Bit-Breitemäßig gesehen) und zwar so breit wie der CRC der am Ende 
rauskommen soll.

Betrachte ich also den CRC als eine Black-Box, dann kann diese doch für 
z.B. 8-Bit CRC maximal 256 verschiedene Eingangswerte sehen. Für jeden 
dieser Eingangswerte bekomme ich nun einen Ausgangswert. Da die 
CRC-Berechnung auf XOR beruht kann man sich also überlegen welche Bits 
des Eingangswerts XOR-Verknüpft werden müssen damit sich der vorgegebene 
Ausgangswert ergibt.

Ich hab dazu mal ein Gnumeric-Sheet (OpenSource-Excel) gemacht, wenn 
dich das interessiert kann ich es dir gerne schicken (allerdings im 
Moment noch alles undokumentiert). Damit lässt sich die Matrix durch 
"ausprobieren" relativ leicht erstellen, da es falls Fehler vorhanden 
sind, diese anzeigt.

Grüße,
armino

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: AVR - CRC8 asm-optimierung

von maria c. (czerny)

24.12.2013 21:21

Lesenswert?

•

▲
▼

Armin Otterstätter schrieb:

> Ich hab dazu mal ein Gnumeric-Sheet (OpenSource-Excel) gemacht, wenn
> dich das interessiert kann ich es dir gerne schicken (allerdings im
> Moment noch alles undokumentiert). Damit lässt sich die Matrix durch
> "ausprobieren" relativ leicht erstellen, da es falls Fehler vorhanden
> sind, diese anzeigt.
>
> Grüße,
> armino

Das wäre nett!

Aber ich denke, da ist noch ein Mißverständnis. Ich habe mal für einen 
Beispiel-Input 10101010 den CRC berechnet, ungespiegeltes und 
gespiegeltes Polynom. Aber Deine Tabelle reproduziert weder den einen, 
noch den anderen Wert:

---------
  ---------
   ---------
     ---------
      ---------
       ---------
---------
  ---------
     ---------
       ---------


Ist der Startwert <> 0? Oder was ist der Fehler?

Gruß, Maria

24.12.2013 21:22: Bearbeitet durch User

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: AVR - CRC8 asm-optimierung

von Armin O. (armino)

25.12.2013 13:36

Angehängte Dateien:

crc8.gnumeric (2,36 MB)

Lesenswert?

•

▲
▼

Korrekt, da hab ich meinen asm-Code oben nicht so genau beschrieben.

Es steht zwar in der ersten Zeile das wir ein XOR des Datenbytes mit dem 
vorherigen CRC machen, dieser Schritt wird sonst aber nirgends 
erläutert.

Daher hier nochmal genauer dokumentiert:

; zuerst das XOR von dem vorherigen CRC mit dem Datenbyte
  eor  24, 22
; dann brauchen wir 2 Kopien
  mov  22, 24
  mov  23, 24
; aller Code ab hier wurde mithilfe der Tabelle generiert
  bst  22, 0
  lsr  22
  eor  24, 22
  swap 24
  andi 23, 0xF0
  bld  23, 1
  eor  24, 23
  andi 22, 0x07
  bld  22, 7
  lsr  22
  brcc skip
  sbr  22, 0x80
  sbrc 24, 4
  sbr  22, 0x0C
  eor  24, 22


In deinem Fall hätte die Blackbox ja zwei Eingangswerte einmal das 
Datenbyte und den CRC.

Das gnumeric-file hab ich mal angehängt.

Grüße,
armino

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: AVR - CRC8 asm-optimierung

von (prx) A. K. (prx)

25.12.2013 13:44

Lesenswert?

•

▲
▼

Armin Otterstätter schrieb:
> Warum wird bei manchen
> CRC Berechnungen nicht immer gleich ein komplettes Byte verarbeitet
> sonder mit Schleife die einzelnen Bits durchgeschoben.

Vielleicht weil bei der häufigsten Anwendung von CRC8 - nämlich den 
Dallas-Sensoren - sich kaum jemand darüber Gedanken macht, wie man pro 
Sekunde wenige Mikrosekunden einsparen kann.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: AVR - CRC8 asm-optimierung

von maria c. (czerny)

25.12.2013 21:08

Lesenswert?

•

▲
▼

Armin Otterstätter schrieb:
> Korrekt, da hab ich meinen asm-Code oben nicht so genau beschrieben.
>
> Es steht zwar in der ersten Zeile das wir ein XOR des Datenbytes mit dem
> vorherigen CRC machen, dieser Schritt wird sonst aber nirgends
> erläutert.
>
> Daher hier nochmal genauer dokumentiert:
>
>

> ; zuerst das XOR von dem vorherigen CRC mit dem Datenbyte
>   eor  24, 22


Hier wird aber auch nicht geklärt, mit welchem Wert crc initialisiert 
wird!
0x00 oder 0xff oder was?

> Das gnumeric-file hab ich mal angehängt.

Danke schön! Das werde ich mal studieren.

Gruß, Maria

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: AVR - CRC8 asm-optimierung

von Armin O. (armino)

25.12.2013 23:05

Lesenswert?

•

▲
▼

A. K. schrieb:
> Vielleicht weil bei der häufigsten Anwendung von CRC8 - nämlich den
> Dallas-Sensoren - sich kaum jemand darüber Gedanken macht, wie man pro
> Sekunde wenige Mikrosekunden einsparen kann.

Das kommt wie du ja schon schreibt ganz auf die Anwendung an. In meinem 
Fall soll der CRC8 ein Bus-Protokoll absichern. Da der Bus-Master dabei 
pro Sekunde für bis zu 250 Devices mehrere CRC berechnen muss macht es 
schon Sinn auf die Geschwindigkeit zu achten. Eine Tabellenlösung wollte 
ich vermeiden um nicht soviel Flashspeicher zu verschenken.
Ich hab mich gefreut eine Lösung zwischen Tabelle und stupider Schleife 
gefunden zu haben und wollte es für andere zur Verfügung stellen. Wer's 
nicht brauch muss es ja nicht verwenden.

maria czerny schrieb:
> Hier wird aber auch nicht geklärt, mit welchem Wert crc initialisiert
> wird!
> 0x00 oder 0xff oder was?

Die von mir vorgeschlagene Black-Box Ansicht auf die CRC Implementierung 
hat nichts mit der Initialisierung des CRC zu tun. Das kann als je nach 
Gusto (bzw. Vorgabe des CRC) gewählt werden.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: AVR - CRC8 asm-optimierung

von maria c. (czerny)

27.12.2013 10:10

Lesenswert?

•

▲
▼

Hallo Armin,

Du hast auf Deinem ersten Tabellenblatt (CRC-8 Dallas/Maxim) in der 
ersten Spalte die Input-Bytes und in der zweiten die zugehörigen CRCs, 
stimmts?

In meinem Beispiel oben entspricht bei LSB-first dem Input-Byte der Wert 
0x55 (85) und bei MSB-first der Wert 0xAA (170). Dies entspricht bei 
normalem Polynom der CRC 0x27 und bei reflektiertem Polynom der CRC 
0xDD.

In Deiner Tabelle ist aber weder an der Position 85 noch an der Position 
170 einer der beiden CRCs zu finden.

Was also ist der Fehler?

Gruß, Maria

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: AVR - CRC8 asm-optimierung

von Armin O. (armino)

27.12.2013 21:23

Lesenswert?

•

▲
▼

maria czerny schrieb:
> Du hast auf Deinem ersten Tabellenblatt (CRC-8 Dallas/Maxim) in der
> ersten Spalte die Input-Bytes und in der zweiten die zugehörigen CRCs,
> stimmts?

Stimmt soweit.

maria czerny schrieb:
> Was also ist der Fehler?

Keine Ahnung ich denk mal mit deinem Beispiel stimmt was nicht. Ich hab 
die Werte mit der crc-Funktion die mit der Avr-Libc mitgeliefert wird 
generiert. Und wenn ich diesen Online-Calculator 
(http://www.datastat.com/sysadminjournal/maximcrc.cgi) nehme und z.B. 55 
eingebe dann stimmt das ja auch...

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: AVR - CRC8 asm-optimierung

von maria c. (czerny)

30.12.2013 12:32

Lesenswert?

•

▲
▼

Ich hab's. Der CRC muß anschließend gespiegelt werden.

Gruß, Maria

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Forum: Projekte & Code AVR - CRC8 asm-optimierung