Forum: Mikrocontroller und Digitale Elektronik CRC16 - schnellere Implementierung möglich?

CRC16 - schnellere Implementierung möglich?

von Adam P. (adamap)

27.07.2017 13:17

Angehängte Dateien:

crc16.c (2,6 KB) | Codeansicht

Lesenswert?

•

▲
▼

Hallo zusammen,

ich verwende für meine CRC16 Berechnung eine Lockup-Tabelle (siehe 
Anhang).
Mein µC läuft mit 64MHz und benötigt für ein 64Byte Datenpaket 60µs,
verschiebe ich die Tabelle aus dem Flash in den RAM, spare ich mir 5µs 
ein.

Frage: Gibt es schnellere Berchnungen einer CRC16 oder vllt. ein ganz 
anderes Verfahren?

Gruß

Beitrag melden Bearbeiten Thread verschieben Thread sperren Anmeldepflicht aktivieren Anpinnen Thread löschen Thread mit anderem zusammenführen Markierten Text zitieren Antwort Antwort mit Zitat

Re: CRC16 - schnellere Implementierung möglich?

von Guest (Gast)

27.07.2017 13:22

Lesenswert?

•

▲
▼

Für privat oder kommerziell?
Falls letzteres kann ich das hier empfehlen:
https://www.segger.com/products/security-iot/emlib/variations/crc/

Und falls privat kannst du da ja vielleicht ein bisschen abschauen ;-).

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: CRC16 - schnellere Implementierung möglich?

von dummschwaetzer (Gast)

27.07.2017 13:27

Lesenswert?

•

▲
▼

Nimm halt einen µC der CRC in Hardware machen kann.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: CRC16 - schnellere Implementierung möglich?

von Adam P. (adamap)

27.07.2017 13:37

Lesenswert?

•

▲
▼

Guest schrieb:
> Für privat oder kommerziell?

Kommerziell - jedoch nicht für 500/800€.

dummschwaetzer schrieb:
> Nimm halt einen µC der CRC in Hardware machen kann.

Das ist nicht möglich.


Dachte es gäbe vllt. eine andere Herangehensweise, die etwas schneller 
wäre.
Ich muss jetz auch nicht auf 5µs für 64Byte kommen, aber schneller wäre 
schon nett.

Zur Not ist es halt so :-) Bereitet im mom. auch keine Probleme, ist mir 
nur aufgefallen und da kam mir die Idee mit der Optimierung.

27.07.2017 13:39: Bearbeitet durch User

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: CRC16 - schnellere Implementierung möglich?

von Peter II (Gast)

27.07.2017 13:41

Lesenswert?

•

▲
▼

Adam P. schrieb:
> Dachte es gäbe vllt. eine andere Herangehensweise, die etwas schneller
> wäre.

das kommt auf das Programm an. Wenn du z.b. die Byte am ende eh in einer 
schleife versendest, könnte man auch dort die CRC berechnen. Genauso bei 
empfangen, einfach wenn ein Byte reinkommt, gleich die CRC mitführen.

Das ist zwar dann immer noch nicht "schneller" aber die Zeit fällt nicht 
auf einmal an.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: CRC16 - schnellere Implementierung möglich?

von Pandur S. (jetztnicht)

27.07.2017 13:42

Lesenswert?

•

▲
▼

>  .. oder vllt. ein ganz anderes Verfahren?

Ja, gibt es. Der Tabellen CRC mit den 256 Eintraegen ist der Schnellste.

Aber, .. man kann den CRC, welcher ueblicherweise am Ende der Nachricht 
angehaengt wird, auch waehrend des Rausschiebens durch das UART 
berechnen. Also einfach im UART Sende-Interrupt den CRC mitrechnen.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: CRC16 - schnellere Implementierung möglich?

von Adam P. (adamap)

27.07.2017 13:42

Lesenswert?

•

▲
▼

Ja das wäre zwar eine Idee, jdeoch werden die 64Byte Pakete per DMA(PDC) 
versendet/empfangen.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: CRC16 - schnellere Implementierung möglich?

von dummschwaetzer (Gast)

27.07.2017 13:43

Lesenswert?

•

▲
▼

Dann berechne doch den CRC erst beim Senden der einzelnen Zeichen und 
nicht am Stück voe oder nach dem senden:
alt:
berechne_crc(string)
sende(string)

neu:
for(position=0;position<sizeof(string);position++)
{
  crc=berechne_crc(zeichen an positon)
  sende(zeichen an positon)
}

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: CRC16 - schnellere Implementierung möglich?

von Adam P. (adamap)

27.07.2017 13:45

Lesenswert?

•

▲
▼

Hat sich grad wohl alles überschnitten!

Adam P. schrieb:
> Ja das wäre zwar eine Idee, jdeoch werden die 64Byte Pakete per DMA(PDC)
> versendet/empfangen.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: CRC16 - schnellere Implementierung möglich?

von Dergute W. (derguteweka)

27.07.2017 13:50

Lesenswert?

•

▲
▼

Moin,

Haste schonmal ins Assemblerlisting geguckt, was der Compiler aus deinem 
Code macht? Je nach Prozessor oder Compiler kann man da vielleicht noch 
bissl drehen. Aber ich hab' wenig Hoffnung.

Gruss
WK

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: CRC16 - schnellere Implementierung möglich?

von Adam P. (adamap)

27.07.2017 13:55

Lesenswert?

•

▲
▼

Dergute W. schrieb:
> Haste schonmal ins Assemblerlisting geguckt

Nein habe ich noch nicht, denn der erste Gedanke war:
Der Compiler bekommt das mit Assembler bestimmt besser hin wie ich :)

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: CRC16 - schnellere Implementierung möglich?

von Adam P. (adamap)

27.07.2017 13:57

Lesenswert?

•

▲
▼

Aber dann wird es erstmal so bleiben.

Mit 3Mbit läufts ohne Probleme, bei 6Mbit hab ich halt zwischen den 
Paketen kleine Pausen, da die Paketgenerierung nicht hinterherkommt.

Aber wenn Segger was hat, dann weiß ich ja worauf man zurückgreifen 
könnte.

...falls jmnd noch etwas einfällt, gern bescheid sagen.
Danke!

27.07.2017 13:58: Bearbeitet durch User

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: CRC16 - schnellere Implementierung möglich?

von Dergute W. (derguteweka)

27.07.2017 14:09

Lesenswert?

•

▲
▼

Moin,

Adam P. schrieb:
> Der Compiler bekommt das mit Assembler bestimmt besser hin wie ich :)

Ja, stimmt auch meistens. Aber: Vertrauen ist gut - Kontrolle ist besser 
:-)
Manchmal kriegen Compiler irgendwas in den falschen Hals, oder muessen 
mit sanfter Gewalt ueberzeugt werden, was anders zu machen.

Gruss
WK

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: CRC16 - schnellere Implementierung möglich?

von Der Siebenschläfer (Gast)

27.07.2017 14:15

Lesenswert?

•

▲
▼

Malzeit,

was für einen uC hast du? 8/16/32 bit?

im code sind ggf ein paar unschönheiten drin, die ggf rechenleistung 
kosten könnten. ggf gibt es je nach platform schnellere 
implementierungen.


was sagen deine Compiler flags? schon auf speed gestellt?
Hast du caches? sind die aktiv?
Was sagen die flash configuration (wait states) geht da noch was?
Wie sieht das aligment aus? 8  16  32 bit? bzw an welcher adresse 
startet die lookup tabelle. passt das zu deiner architektur?

Wenn ram 5us schneller ist bei den 64 lookup zugriffen, ...
ggf die ganze routine in den RAM copieren und von dort ausführen.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: CRC16 - schnellere Implementierung möglich?

von Adam P. (adamap)

27.07.2017 14:30

Lesenswert?

•

▲
▼

µC: Atmel SAM4E Cortex-M4

Aber:
SCHANDE über mein Haupt :-D


Ja es waren die Projekt-Konfigs.

Nun hab ich beides probiert (Flash & RAM), macht nun kein unterschied.

Fazit: 64Byte = max. 25µs

Bei diesem Ergebnis braucht man keine Lib. kaufen :)

DANKE.

(manchmal sieht man die einfachsten "Fehler/Gründe" nicht) - aber dass 
kennt wohl jeder.

27.07.2017 14:31: Bearbeitet durch User

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: CRC16 - schnellere Implementierung möglich?

von Falk B. (falk)

27.07.2017 14:37

Lesenswert?

•

▲
▼

@ Adam P. (adamap)

>µC: Atmel SAM4E Cortex-M4

Also 32 Bit.

>Ja es waren die Projekt-Konfigs.

Keine Optimierung eingestellt?

>Fazit: 64Byte = max. 25µs

Geht so.

Ich würde da möglichst große, natrliche Datenbreiten nutzen, mal sehen 
wie sich das auswirkt. Außerdem sieht der Algorithmus komisch aus.

http://www.ross.net/crc/download/crc_v3.txt

   while (len--)
      byte t = (r >> 24) & 0xFF;
      r = (r << 8) | *p++;
      r^=table[t];

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: CRC16 - schnellere Implementierung möglich?

von Adam P. (adamap)

27.07.2017 14:44

Lesenswert?

•

▲
▼

Ja, Optimierung war bei der einen Konfig aus.

Komisch?
Also ich hatte mehrere Tests durchgeführt und die CRC stimmte mit 
fertigen CRC-Tools überein.

Ist das "CRC-16 (Modbus)".

Aber werde mir deinen Link mal durchlesen und dein Code-Schnippsel mal 
laufen lassen.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: CRC16 - schnellere Implementierung möglich?

von Dergute W. (derguteweka)

27.07.2017 14:46

Lesenswert?

•

▲
▼

Moin,

Bei einem 32bit Prozessor ist's nicht turbo-performant, 16bit Variablen 
zu nehmen. Koennt' sein, dass das langsamer wird (weil der Compiler dann 
ggf. noch extra 16 bit ausmaskieren/setzen muss) als mit 32bit.

Gruss
WK

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: CRC16 - schnellere Implementierung möglich?

von ABC (Gast)

27.07.2017 14:50

Lesenswert?

•

▲
▼

I-cash ist eingeschaltet? Der flash Schaft nur 24mhz.

Die mcu hat noch etwas Luft nach oben 120 MHz wenn ich's richtig gesehen 
hab.

Ggf Mal die Takte für die Busse und RAM kontrollieren.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: CRC16 - schnellere Implementierung möglich?

von Adam P. (adamap)

27.07.2017 14:56

Lesenswert?

•

▲
▼

ABC schrieb:
> I-cash ist eingeschaltet?

Nein ist es nicht, hab die Lockup aber auch im RAM getestet, macht kein 
unterschied.

Ja ich takte mit 64MHz (geringere Stromaufnahme).

Aber ich werde das mal mit den 32bit Variablen testen (bzw. bin bei, 
jedoch stimmt die CRC nun nicht mehr)

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: CRC16 - schnellere Implementierung möglich?

von Adam P. (adamap)

27.07.2017 15:02

Lesenswert?

•

▲
▼

Falk B. schrieb:
> r=0;
>    while (len--)
>      {
>       byte t = (r >> 24) & 0xFF;
>       r = (r << 8) | *p++;
>       r^=table[t];
>      }

Welche CRC soll das sein?
Sieht bei der evtl. die lockup anders aus?

Ich vergleich immer mit:
https://www.lammertbies.nl/comm/info/crc-calculation.html

Bin zwar nun bei 20µs, aber stimmt mit keiner dort aufgelisteten überein 
:-/
(Habe auch nicht so die Ahnung von CRC, Polynomen usw.)

27.07.2017 15:04: Bearbeitet durch User

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: CRC16 - schnellere Implementierung möglich?

von Guest (Gast)

27.07.2017 15:11

Lesenswert?

•

▲
▼

Lass dir doch von SEGGER einfach mal emLib CRC geben und teste, ob deren 
Implementierung schneller ist. Falls ja, könnten sich die Lizenzkosten 
ja schnell rechnen, wenn man sie gegen deine Arbeitszeit rechnet.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: CRC16 - schnellere Implementierung möglich?

von Adam P. (adamap)

27.07.2017 15:16

Lesenswert?

•

▲
▼

Guest schrieb:
> Lass dir doch von SEGGER einfach mal emLib CRC geben und teste

Ja ich belasse es nun auch bei meinem Stand, erfüllt nun erstmal die 
Anforderung.

War auch eher für mich gedacht, dazu lernen ist nie verkehrt.

27.07.2017 15:20: Bearbeitet durch User

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: CRC16 - schnellere Implementierung möglich?

von Johannes S. (Gast)

27.07.2017 15:22

Lesenswert?

•

▲
▼

Wenn der µC mit angezogener Handbremse läuft (64 statt 120 MHz) könnte 
es sein man mit den wait states für das flash heruntergehen kann. 
'Könnte' weil ich den Sam nicht kenne.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: CRC16 - schnellere Implementierung möglich?

von Adam P. (adamap)

27.07.2017 15:37

Lesenswert?

•

▲
▼

Johannes S. schrieb:
> mit den wait states für das flash heruntergehen

Waren auf 4, mit 3 läufts auch noch & den Zugriff hab ich mal von 64 auf 
128bit geändert.

Jetz sinds 17-19µs. Das ist vollkommen ok (würde ich sagen).

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: CRC16 - schnellere Implementierung möglich?

von Dr. Sommer (Gast)

27.07.2017 15:46

Lesenswert?

•

▲
▼

Kennst du das hier schon? Da gibt es so eine Technik für 
"Multi-Level-LUT's" welche das nochmal beschleunigen können:
http://create.stephan-brumme.com/crc32/
Ist u.U. etwas Hirnverknoten nötig um das an den eigenen Anwendungsfall 
anzupassen.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: CRC16 - schnellere Implementierung möglich?

von Adam P. (adamap)

27.07.2017 16:05

Lesenswert?

•

▲
▼

Dr. Sommer schrieb:
> Da gibt es so eine Technik für
> "Multi-Level-LUT's"

Ah OK, vielen dank!
Hab schon mal sowas gesehen, wo in einem Zyklus direkt mehrere Werte 
berechnet werden.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: CRC16 - schnellere Implementierung möglich?

von Hans (Gast)

27.07.2017 16:16

Lesenswert?

•

▲
▼

Sliceing-by-8 bringts...btdt

https://de.wikipedia.org/wiki/Slicing_by_Eight (oder eben auch im link 
oben...)

73

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: CRC16 - schnellere Implementierung möglich?

von Der Siebenschläfer (Gast)

27.07.2017 16:37

Lesenswert?

•

▲
▼

Nabend.

Schau dir das mit den wait states noch mal im datenblatt an. Falsche 
wert machen das system ggf instabil oder langsam. Das gilt nicht nur für 
die CRC berechnung sondern für die ganze FW.

Beschäftige dich mit dem Cash. mit angezogener handbremse bringen dir 
die 64mhz auch nichts. kanst gleich mit 24 Mhz takten (mit 
entsprechenden Wait States) macht vermutlich keinen grossen unterschied. 
der Flash schaft ja nur 24Mhz. nur mit dem I cash reizt man die 64mhz 
und mehr auch wirklich aus. Der I Cash läuft mit voller Core frequenz 
anstelle der 24Mhz

Beim D-Cash und DMA aufpassen! Was vom Core schreibt und liest, muss 
nicht gleich dem im RAM sein. der DMA läuft ja paralell, und erwischt 
alte daten, ... gilt natürlich auch umgekehrt.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: CRC16 - schnellere Implementierung möglich?

von Falk B. (falk)

27.07.2017 19:08

Lesenswert?

•

▲
▼

@ Adam P. (adamap)

>> r=0;
>>    while (len--)
>>      {
>>       byte t = (r >> 24) & 0xFF;
>>       r = (r << 8) | *p++;
>>       r^=table[t];
>>      }

>Welche CRC soll das sein?

Die aus dem Link.

>Sieht bei der evtl. die lockup anders aus?

Kann sein, denn da gibt es mehrer Versionen. Einmal mit links und einmal 
mit rechts schieben. Darauf muss die Tabelle angepaßt sein. Logo.

Deine CRC schiebt die Daten nach rechts, der Schnipsel oben nach links!

>Bin zwar nun bei 20µs, aber stimmt mit keiner dort aufgelisteten überein
>:-/

Ist doch super! Also nur noch die CRC-Tabelle neu berechnen.

>(Habe auch nicht so die Ahnung von CRC, Polynomen usw.)

Ich auch nicht, aber mit ein wenig experimentieren kommt man da hin. Die 
Tabelle kann man selber berechnen. Das schafft man, indem man die Werte 
0-255 durch den bitweisen CRC jagt. Dort kann man je nach CRC-Typ das 
Links/Recht schieben und den Startwert variieren. Steht alles in meinem 
Link.

Probier das mal. Das rausgeschobene Byte wird vor dem Schieben zum Index 
der Tabelle.

uint16_t crc16_calc(const uint8_t *data, size_t length)
  uint16_t temp;
  uint16_t crc_word = CRC16_PRELOAD;
  while(length--)
    temp      = crc_word & 0xFF;
    crc_word  = (crc_word >> 8) | ((uint16_t)*data++ << 8);
    crc_word ^= crc_table[temp];
  return crc_word;

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: CRC16 - schnellere Implementierung möglich?

von Martin (Gast)

28.07.2017 12:36

Lesenswert?

•

▲
▼

Beitrag "CRC16 Berechnung mit Tabelle"

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: CRC16 - schnellere Implementierung möglich?

von Thomas (kosmos)

28.07.2017 20:51

Lesenswert?

•

▲
▼

ich hatte vor Jahren das ganze mal versucht und einen Wiki Beitrag dazu 
erstellt.

https://www.mikrocontroller.net/wikisoftware/index.php?title=CAN_CRC_Berechnung&redirect=no

Hier sind jetzt nur die XOR Verknüpfungen dabei, mann müsste mal die 
Schiebebefehle mit dazuzählen.

Das sollte schon etwas schneller als 60 µSek gehen. Denke das es nicht 
mehr wie 200 Takte sind bei einem AVR mit 16 MHz sollte das in 13µSek 
erledigt sein.

28.07.2017 20:52: Bearbeitet durch User

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: CRC16 - schnellere Implementierung möglich?

von Georg (Gast)

29.07.2017 18:33

Lesenswert?

•

▲
▼

Martin schrieb:
> Beitrag "CRC16 Berechnung mit Tabelle"

Was man so findet beruht i.A. auf byteweiser Berechnung. Rein 
theoretisch könnte man auch 16bit-weise rechnen, aber dann braucht man 
statt 256 Tabelleneinträgen 65536 und hätte etwa die doppelte 
Geschwindigkeit - ganz ausgeschlossen ist das ja nicht.

Hardware wie in USARTs funktioniert dagegen bitweise.

Georg

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: CRC16 - schnellere Implementierung möglich?

von Falk B. (falk)

29.07.2017 18:50

Lesenswert?

•

▲
▼

Ich hab das mal spaßenshalber auf dem TMS320F28027 probiert, der läuft 
mit 60 MHz. Braucht ca. 1300 Takte für 64 Bytes, macht ~22us. Viel 
schneller wird das glaub ich nicht.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Thread beobachten |

Seitenaufteilung abschalten

Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.

Bestehender Account

Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen

Noch kein Account? Hier anmelden.

Kontakt/Impressum – Datenschutzerklärung – Nutzungsbedingungen – Werbung auf Mikrocontroller.net