AX25 @KS         de:DC4OX  13.08.89 13:19   5   3642 Bytes
ERKLAERUNG CRC 1/10
*** Bulletin-ID: 315803DK0MAV ***

de DB8AS @ DB8AS

CRC                                                              Teil 1 von 10


CRC Cyclic Redundancy Check / FCS Frame Check Sequence


"Vorwort"

Ich will mich bemuehen, da anscheinend doch das Interesse besteht, einiges
ueber den benutzten CRC bei Packet-Radio zu schreiben. Ich will aber nicht
nur mal eben einen schnellen Algorithmus angeben, wie man das Ding denn
nun berechnen kann, ich moechte vielmehr versuchen die Sache so darzustellen,
dass wenigstens der Weg zu den verschiedenen Algorithmen begreifbar und
nachvollziehbar wird. Was den Rahmen der Box weit sprengen wuerde, das waere
die mathematische Herleitung der Eigenschaften zyklischer Codes, da um
dies verstehen zu koennen tiefergehende mathematische Kenntnisse erforderlich
sind, tiefergehende als zum Beispiel Grundvorlesungen fuer Ingenieure in
Mathematik. Wer dennoch soooo tief in die Materie eindringen will, dem kann
ich bei Bedarf einige Literaturstellen (zur Abschreckung, hi) angeben.

Natuerlich ist das, was ich ueber CRC-Berechnung so von mir geben will, nicht
alles auf meinem Mist gewachsen, sondern ein Resultat des Lesens einiger
Literatur. Diese Literatur sollte man in normalen UNI-Bibliotheken leicht
finden koennen.

Ich gebe diese Literatur hier erst einmal an, erstens koennen sich dann
ganz Wissbegierige darauf stuerzen ohne meine Erguesse abwarten zu muessen,
zweitens bin ich gar nicht sicher, ob meine Erguesse zu diesem Thema
ueberhaupt fertig werden, hi.



Liste (sicher nicht vollstaendig, dafuer aber bei mir vorhanden ... ) :


Byte, September 1986,                  Sehr zu empfehlen und wohl am
Seiten 115-124,                        einfachsten zu bekommen. Es werden
Greg Morse,                            schrittweise und nachvollziehbar
"Calculating CRCs by Bits and Bytes"   CRC-Berechnungen und Algorithmen
                                       vorgefuehrt. Sehr ausfuehrlich.


IEEE Micro, August 1985,               Beschreibt die kuerzeste und schnellste
To the Editor, Seiten 4, 99,           Loesung fuer gewisse Prozessoren,
Ivar Kjelberg,                         8086 als Beispiel.
"CRC-16 flies better in Assembler"


IEEE Micro, April 1985,                Hier beschreibt der Autor der oft
Letters to the Editor, Seiten 6-8      kopierten Software-Loesung fuer Z80
Leserbrief von Robert M. Richardson    (TRS80, GLB), von wem er die
(Software Approach to Packet           CRC-Berechnung adaptiert hat, mit
Communications)                        Source fuer Z80. Auch die Apple- und
                                       C64-Softwareloesung benutzt genau
                                       dieses Verfahren, wenn auch die Tabelle
                                       bei Programmstart erst berechnet wird.


IEEE Micro, Juni 1983,                 Der Grundlagenartikel zur parallelen
Seiten 40-50,                          CRC-Berechnung (Tabellenmethode), auf
Aram Perez,                            den sich alle juengeren Artikel
"Byte-wise CRC Calculations"           beziehen. Mit Fortran-Sources zur
                                       Tabellenerstellung.


Computer Design, September 1975,       Ein Artikel, den Perez empfiehlt.
Seiten 87-91,                          Lediglich zur Vollstaendigkeit
A. K. Pandeya, T. J. Cassa             angefuehrt.
"Parallel CRC Lets Many Lines
Use One Circuit"



NORD><LINK Infoservice, 73, Michael, DC4OX @ DK0MAV






AX25 @KS         de:DC4OX  13.08.89 13:21   5   5678 Bytes
ERKLAERUNG CRC 2/10
*** Bulletin-ID: 315804DK0MAV ***

de DB8AS @ DB8AS

CRC                                                              Teil 2 von 10

Was ist CRC ? - Gucke ich also zunaechst mal in meine AX.25 Protokoll-
beschreibung. Da steht :

"Frame Check Sequenz
"Die Frame-Check-Sequenz (FCS) ist eine 16-Bit-Zahl, die sowohl vom Sender als
"auch vom Empfaenger eines Paketes berechnet wird. Sie wird benutzt, um
"sicherzustellen, dass das Paket nicht von dem Medieum gestoert wird, welches
"benutzt wird, um das Paket vom Sender zum Empfaenger zu bekommen. Sie wird
"berechnet in Uebereinstimmung mit den ISO 3309 (HDLC) Empfehlungen.

Aha. Nun bin ich fast so schlau wie vorher. Also her mit der ISO 3309
Empfehlung. Aber dann muss ich fauler Mensch ja wieder alles aus dem
Englischen uebersetzen. Hmmmm ...
Aber gibt es nicht zu den ISO-Normen auch entsprechende deutsche DIN-Normen
(schliesslich sind die Deutschen ja fuer ihre Gruendlichkeit bekannt) ?
Und siehe da, es gibt sie. In der DIN 66221, Teil 1, steht ganz hinten in
den Erlaeuterungen : "Die erste Stufe ISO 3309 - Ausgabe 1979,
HDLC-Frame-Structure, beschreibt das Format aller HDLC-Uebertragungen
(Aufbau des DUE-Blocks). Die vorliegende Norm stimmt mit dieser
Internationalen Norm in Sachverhalt und Gliederung ueberein".
Nun sind DIN-Normen nicht jedermanns Sache, was das Drankommen betrifft.
Gluecklicherweise stehen aber so ziemlich dieselben Wortlaute auch noch
in dem Buch "Datenpaketvermitllung - Internationale Standards, Uebersetzung
der CCITT Empfehlungen X.3, X.25, X.28, X.29, bearbeitet von Walter Tietz,
R. v. Decker's Verlag". Aber auch da kommt nicht jeder dran (nicht gerade
unteuer). Fuer den, der das aber nun unbedingt nachlesen will, es steht auch
im Datex-P-Handbuch der Deutschen Bundespost. Auch selber Wortlaut.

So, und fuer die, die jetzt gleich nicht losgerannt sind zur naechsten
Poststelle oder Bibliothek, bringe ich den Wortlaut der Sache ueber die
FCS und ihre Berechnung hier auch :


"
Blockpruefzeichenfolge (frame checking sequence - FCS)

Die Blockpruefzeichenfolge besteht aus 16 Bits. Sie ist der invertierte Rest,
der sich aus der Division (modulo 2) folgender Polynome durch das
Generatorpolynom ergibt :

1. Der  D i v i d e n d  ist die Summe (modulo 2) der beiden Polynome :
   Blockinhalt B(X) multipliziert mit X^16, und X^K * (X^15 + X^14 + ...
   + X^2 + X + 1), wobei K die Anzahl der Bits des Blockinhaltes ist. X steht
   fuer die Betrachtung als Dualziffer und bedeutet Basis 2.
   Der Blockinhalt beginnt nach dem letzten Bit der Blockbegrenzung und endet
   vor dem erstem Bit der Blockpruefzeichenfolge am Ende des DUE-Blocks.
   Ausgeschlossen sind dabei alle Binaerzeichen 0, die zur Sicherstellung
   der Bitfolgeunabhaengigkeit eingefuegt worden sind.

2. Der  D i v i s o r  ist das Generatorpolynom X^16 + X^12 + X^5 + 1.
   Das zweite Polynom (X^K ... ) entspricht in der technischen Ausfuehrung
   dem Vorladen des Codierwerks mit Binaerzeichen 1.

Als zweckmaessige Ausfuehrung werden beim Sender alle Registerzellen des
Codierwerks vor Beginn der Bildung der Blockpruefzeichenfolge in den
Zustand Binaerzeichen 1 gebracht (Vorladen des Registers). Danach werden
die Bitfolgen im Adress-, Steuer- und, falls vorhanden, Datenfeld in der
Reihenfolge, in der sie ausgesendet werden, in das Codierwerk eingegeben.
Das entspricht der oben beschriebenen Division. Nachdem das letzte Bit
eingegeben ist, steht der Divisionsrest in den Registerzellen.
Dieser wird in invertierter Form als Blockpruefzeichenfolge ausgesendet.

Auch beim Empfaenger wird das Codierwerk mit Binaerzeichen 1 vorgeladen.
Anschliessend werden die empfangenen Bitfolgen des Adressfeldes, Steuerfeldes
und, falls vorhanden, des Datenfeldes sowie die 16 Bits der
Blockpruefzeichenfolge in das Codierwerk eingegeben. Der Divisionsrest steht
nach Eingabe des letzten Bits der empfangenen Blockpruefzeichenfolge im
Codierwerk. Bei fehlerfreier Uebertragung wird als Rest die Bitfolge
0001110100001111 (Dualziffern X^15 bis X^0) erwartet.

Im Empfaenger wird vor der Eingabe in das Codierwerk jedes Binaerzeichen 0
entfernt, das unmittelbar nach fuenf aufeinanderfolgenden Binaerzeichen 1
auftritt.
"


Schluck. Alle Klarheiten beseitigt ? - Wie gut, dass im TNC eine SIO sitzt,
die weiss, worums geht und alles fuer mich erledigt. Was aber macht der
Mensch mit SIO-losem Rechner ?

Dieses und vieles andere mehr (oder auch nicht) erfaehrt der
nicht eingeschlafene Leser in den naechsten Texten dieser endlosen
Geschichte ...

(Fortsetzung folgt)                                              (hoffentlich)



Nachsatz :

Fuer diejenigen, die meinen, dass Lehrbuchinhalte nicht in Amateurfunk-
Mailboxen gehoeren - die hier und im folgenden gebrachten Sachen befinden
sich leider nicht zusammenhaengend in einem Lehrbuch, schon gar nicht in einem
Amateurfunk-Lehrbuch, die meisten nicht einmal in einem Buch.
Zumindest nicht in denen, die ich nach ausfuehrlicher Suche fand. Und wo doch
immer geklagt wird, dass die modernen Uebertragungsarten den Amateur
ueberfordern, was das Verstaendnis angeht, moechte ich wenigstens die Chance
geben, etwas verstehen zu koennen, wenn man sich damit beschaeftigen will.
Und genau dieses Anliegen sehe ich als ein Experiment im Sinne des
Experimentalfunks mit genau demselben Recht wie auch das Benutzen einer
2m-FM-Relaisfunkstelle schliesslich Experimentalfunk sein muss.


NORD><LINK Infoservice, 73, Michael, DC4OX @ DK0MAV






AX25 @KS         de:DC4OX  13.08.89 13:24   5   5729 Bytes
ERKLAERUNG CRC 3/10
*** Bulletin-ID: 315805DK0MAV ***

de DB8AS @ DB8AS

CRC                                                              Teil 3 von 10

Wieso eigentlich nimmt man eine so schwer zu verstehende Pruefsequenz, die
dann auch noch vermeintlich schwer zu berechnen ist ?

Und was leistet diese Pruefsequenz ueberhaupt ?

Zum ersten Punkt kann man zeigen, dass die verwendeten speziellen zyklischen
Codes zur Berechnung der Sequenz (es gibt deren mehrere) das Optimum fuer
das Erkennen von Fehlern in dem gesamten Paket darstellen, bezueglich der
Laenge von 16 Bit der Pruefsequenz. Das heisst bei Verwendung der zyklischen
Blockpruefung ist die Wahrscheinlichkeit einen Fehler zu erkennen von
allen bekannten Verfahren zur Fehlererkennung (immer bezogen auf die
zugelassenen 16 Bit fuer die Sequenz) am groessten.


Zum zweiten Punkt :

   -  es werden alle Einbitfehler erkannt

   -  es werden alle ungeraden Anzahlen von Bitfehlern erkannt

   -  es werden alle Fehlerbuendel kleiner gleich 16 Bit erkannt

   -  99,9969% aller 17 Bit Fehlerbuendel werden erkannt

   -  99,9984% aller moeglichen laengeren Fehlerbuendel werden erkannt


Um effiziente und schnelle Algorithmen zur Berechnung der Pruefsequenz zu
entwickeln, muss man zunaechst wissen, wie die Berechnung grundsaetzlich
ablaeuft.


Die reine Spezifikation laut Norm ist :

"Die Blockpruefzeichenfolge besteht aus 16 Bits. Sie ist der invertierte Rest,
der sich aus der Division (modulo 2) folgender Polynome ergibt :

1. Der  D i v i d e n d  ist die Summe (modulo 2) der beiden Polynome :
   Blockinhalt B(X) multipliziert mit X^16, und X^K * (X^15 + X^14 + ...
   + X^2 + X + 1), wobei K die Anzahl der Bits des Blockinhaltes ist. X steht
   fuer die Betrachtung als Dualziffer und bedeutet Basis 2.

2. Der  D i v i s o r  ist das Generatorpolynom X^16 + X^12 + X^5 + 1."


"modulo 2", "Polynom", "Basis 2", "B(X)", ...   -   schwitz.

Was zunaechst den Begriffen nach wie eine ziemlich komplizierte Form einer
Division aussieht, ist bei naeherem Betrachten eigentlich ziemlich einfach.
Man muss dazu allerdings die Bedeutung der Begriffe kennen. Also :


"Basis 2"  :  Ich rechne im Dualsystem. Also nur mit 0 und mit 1. Im
              Zusammenhang mit "Polynom" heisst es, dass ich die Koeffizienten
              eines Polynoms (X^..., ^ = "hoch") als Binaerzahlen darstellen
              kann. Also
                          X^16 + X^12 + X^5 + 1 ->
                          2^16 + 2^12 + 2^5 + 1 =  1 0001 0000 0010 0001


"modulo 2" :  Wenn ich im Dualsystem modulo 2 rechne, muss ich mich nicht um
              Ueberlaeufe kuemmern. Dadurch ist es egal, ob ich 2 Bits
              addiere, subtrahiere, oder Exklusiv-Oder, im folgenden als (+)
              geschrieben, verknuepfe.

              Ohne "modulo 2" wuerde ich im Dualsystem rechnen :

              0 + 0 = 0     1 + 0 = 1     0 + 1 =  1     1 + 1 = 10 (2)
              0 - 0 = 0     1 - 0 = 1     0 - 1 = -1     1 - 1 =  0

              Mit "modulo 2" rechne ich im Dualsystem :

              0 + 0 = 0     1 + 0 = 1     0 + 1 =  1     1 + 1 = 0
              0 - 0 = 0     1 - 0 = 1     0 - 1 =  1     1 - 1 = 0

              Das aber entspricht genau der Exklusiv-Oder-Funktion :

              0 (+) 0 = 0   1 (+) 0 = 1   0 (+) 1 =  1   1 (+) 1 = 0


Polynome   :  In Zusammenhang mit "modulo 2" bedeutet es fuer mich, dass ich
              alle Rechnungen komponentenweise (stellenweise) ausfuehren kann.

              Normal addiere ich :        111       7
                                      +  1110    + 14
                                      -------    ----
                                      = 10101    = 21

              d.h. ich muss auf Uebertraege achten und diese durch die
              einzelnen Stellen durchschleppen.

              Komponentenweise und wegen "modulo 2" verknuepfe ich nun
              einfach die Bits stellenweise mit Exklusiv-Oder :

                                        00111
                                    (+) 01110
                                    ---------
                                      = 01001

              Das ist nun ziemlich einfach, viel einfacher als wenn ich
              "normal" rechnen muesste.

              (Fuer Mathematiker, die ob meiner schlampigen Erklaerungen
              in diesem Zusammenhang sich bereits schwebend in gefaehrlicher
              Naehe der Zimmerdecke befinden, eigentlich haette es heissen
              muessen :  "Gemeint sind binaere Gruppencodes, d.h. Untergruppen
              der additiven Gruppe aller binaeren Tupel, die als Koeffizienten
              eines Polynoms ueber dem endlichen Koerper GF(2) der Restklassen
              der ganzen Zahlen mod 2 aufgefasst werden koennen."  -
              Nur wuerde  d a s  keinem weiterhelfen.)


B(X)       :  Blockinhalt. Meint einfach alle Bytes des Pakets ausser der
              FCS und ohne Flags hintereinander ohne Punkt und Komma bitweise
              aufgeschrieben. Ist eigentlich der Paketinhalt betrachtet als
              eine einzige, ziemlich lange Dualzahl. Aber Vorsicht, gemeint
              ist die Bitreihenfolge der Aussendung (ohne Bitstuffing), d.h.
              das LSB (Least Significant Bit = das Bit mit der niedrigsten
              Wertigkeit, ganz rechts) eines Bytes wird zuerst gesendet.



(Fortsetzung folgt)                                              (hoffentlich)

NORD><LINK Infoservice, 73, Michael, DC4OX @ DK0MAV






AX25 @KS         de:DC4OX  13.08.89 13:26   5   3919 Bytes
ERKLAERUNG CRC 4/10
*** Bulletin-ID: 315806DK0MAV ***

de DB8AS @ DB8AS

CRC                                                              Teil 4 von 10

Ein Beispiel. Bestehe der ganze Blockinhalt B(X) lediglich aus einem einzigen
Byte, naemlich dem ASCII-Zeichen "T".

T = 54 hexadezimal = 01010100 dual = 84 dezimal

01010100 wird gesendet als 00101010
MSB  LSB                   LSB  MSB


Zunaechst rechne ich "Blockinhalt B(X) multipliziert mit X^16" aus,
"und X^K * (X^15 + X^14 + ..." lasse ich erst einmal des Ueberblicks wegen weg
und erlaeutere es spaeter.

Also,      0010 1010 * X^16
         = 0010 1010 * 2^16
         = 0010 1010 * 1 0000 0000 0000 0000
         = 0010 1010 0000 0000 0000 0000

Die Multiplikation mit X^16 ist einfach ein Linksschieben um 16 Bits,
allgemein ist das Multiplizieren mit X^K das Linksschieben um K Bits.
Das waere also schon einmal der Dividend. Der Divisor "ist das
Generatorpolynom  X^16 + X^12 + X^5 + 1."

X^16 + X^12 + X^5 + 1 = 2^16 + 2^12 + 2^5 + 1 =  1 0001 0000 0010 0001

Dieses spezielle Polynom wird auch "CCITT-Polynom" genannt.

Jetzt muss ich nur noch diese Dinger dividieren, wie man halt so schriftlich
dividiert. Aber ich habe es viel einfacher, weil jede Subtraktion ja
simplerweise nur ein stellenweises Exklusiv-Oder ist, ausserdem ist es eine
Polynomdivision, da muss ich lediglich immer auf das erste Bit des
Divisors gucken um festzustellen, ob ich subtrahieren kann oder nicht, im
Gegensatz zur "normalen" Division, wo ich gucken muss, ob man den Divisor
insgesamt abziehen kann, ohne ins Minus zu geraten.
Und dann ist noch etwas schoen, ich brauche wegen "Sie ist der invertierte
Rest, ... " ja gar nicht das Ergebnis, sondern nur den Rest. Na denn.


  001010100000000000000000  :  10001000000100001  =  ...

  001010100000000000000000   geht nicht
- 10001000000100001

  001010100000000000000000   geht nicht
-  10001000000100001

  001010100000000000000000   geht
-   10001000000100001
=   0010000000010000100000

    0010000000010000100000   geht nicht
-   10001000000100001

    0010000000010000100000   geht nicht
-    10001000000100001

    0010000000010000100000   geht
-     10001000000100001
=     00001000010100101000

      00001000010100101000   geht nicht
-     10001000000100001

      00001000010100101000   geht nicht
-      10001000000100001

      00001000010100101000   geht nicht
-       10001000000100001

      00001000010100101000   geht nicht
-        10001000000100001

Rest = 00001000010100101000
     =     1000010100101000  das ist die FCS fuer "T", in der Reihenfolge, wie
           LSB          MSB  sie gesendet wird


Oder Kurzform :

  001010100000000000000000  :  10001000000100001  =  ...
    10001000000100001
    -----------------
      10000000010000100
      10001000000100001
      -----------------
Rest  00001000010100101000  =  1000 0101 0010 1000


Aus dem bisher Gezeigten muesste man jetzt auch leicht selbst erkennen, wo
und wie das "und X^K * (X^15 + X^14 + ... + X^2 + X + 1), wobei K die Anzahl
der Bits des Blockinhaltes ist" mit in die Rechnung eingeht. Baut man das ein
und invertiert den Rest, dann hat man eine CCITT-CRC-Berechnung, wie sie fuer
Packet-Radio benutzt wird, ausgefuehrt.

So - jetzt weiss ich zwar, was man grundsaetzlich auszufuehren hat, wie man
die Division ausfuehrt. Allerdings - bei einem Paket mit 100 Bytes oder so
sitze ich da doch an ziemlich langen Zahlenkolonnen. Weil es nicht jedermanns
Sache ist, mal so eben 816 Bits nebeneinander hinzuschreiben und dann damit
zu rechnen, muss man sich etwas einfallen lassen.



(Fortsetzung folgt)                                              (hoffentlich)

NORD><LINK Infoservice, 73, Michael, DC4OX @
DK0MAV






AX25 @KS         de:DC4OX  13.08.89 13:28   5   6444 Bytes
ERKLAERUNG CRC 5/10
*** Bulletin-ID: 315807DK0MAV ***

de DB8AS @ DB8AS

CRC                                                              Teil 5 von 10

Mal sehen, wie man durch scharfes Hinsehen einen ersten vernuenftigen
Algorithmus zur CRC-Berechnung ableiten kann. Zunaechst kann ich den Rest
auch so berechnen, dass ich fuer jede Stelle einzeln den Rest der
Division durch das Generatorpolynom berechne und dann am Ende die einzelnen
Reste zum Gesamtrest modulo 2 addiere :

    001010100000000000000000 : 10001000000100001 =

    001000000000000000000000 : 10001000000100001
(+) 000010000000000000000000 : 10001000000100001
(+) 000000100000000000000000 : 10001000000100001

->  001000000000000000000000
      10001000000100001
      -----------------
          10000001000010000
          10001000000100001
          -----------------
              10010001100010 ---------+
                                      !
    000010000000000000000000          !
        10001000000100001             !
        -----------------             !
            1000000100001000 ------+  !
                                   !  +--------->       10010001100010
    000000100000000000000000       +------------> (+) 1000000100001000
          10001000000100001     +---------------> (+)   10000001000010
          -----------------     !                 --------------------
              10000001000010 ---+                     1000010100101000


Auch, wenn ich jede Stelle nur einmal durch das Generatorpolynome teile,
die Zwischenergebnisse modulo 2 addiere und dann am Ende nochmal durch
das Generatorpolynom teile, aendert das nichts am Ergebnis (man erinnere
sich an schriftliche Division) :

->  001000000000000000000000
      10001000000100001
      -----------------
          100000010000100000 ---------+
                                      !
    000010000000000000000000          !
        10001000000100001             !
        -----------------             !
            1000000100001000 ------+  !
                                   !  +--------->     100000010000100000
    000000100000000000000000       +------------> (+)   1000000100001000
          10001000000100001     +---------------> (+)     10000001000010
          -----------------     !                 ----------------------
              10000001000010 ---+                     101010010101101010
                                                      10001000000100001
                                                  ----------------------
                                                        1000010100101000


Noch eine weitere Betrachtung.

Erster Fall. Bestehe die ganze Nachricht aus einem Bit, und das ist 0.
Also 16 mal linksschieben, durch das Generatorpolynom (im folgenden auch G(X)
genannt) teilen :

   00000000000000000
   10001000000100001
   -----------------
   00000000000000000 1. Rest


Zweiter Fall. Die gesamte Nachricht bestehe aus 01.

   010000000000000000
 ( 10001000000100001  ) geht nicht ->
   -----------------
    10000000000000000 1. Rest
    10001000000100001 geht ->
    -----------------
    00001000000100001 2. Rest

Was man sich merken soll, ist, dass der 1. Rest im zweiten Fall gleich dem
1. Rest im ersten Fall ist, LSB ge-exklusiv-odert mit dem 2. Datenbit. Dies
ist immer der Fall, wenn man die Beispiele ganz oben daraufhin durchsieht,
wird man es auch bemerken.

Betrachtet man den Rest, dann wird jeweils bei einem neu kommenden Datenbit 0
am rechten Ende eine 0 angehaengt, d.h. das Ergebnis wird linksgeschoben (das
ist wie bei der Division der Uebergang zur naechsten Stelle von oben, gleich
0 immer, weil jedes Bit neu ja eine ganze Stelle mit Wertigkeit darstellt, wie
z.B. 200 bei 4235 die 2. Stelle darstellt). Kommt eine 1, dann muss diese
erst einmal zum bestehenden Ergebnis mit Wertigkeit dazuaddiert werden.
Modulo 2 ist dies das Exklusiv-Oder. Danach muss wegen der Wertigkeit der
Stelle auch eine 0 rechts angefuegt werden.

Jetzt ist genug Praxis vorhanden, um aus den gemachten Beobachtungen
einen bitweise arbeitenden Algorithmus aufzuschreiben. Bitweise heisst, dass
ich jedes Datenbit so wie es kommt verarbeiten moechte, hintereinander.

1. Ich fange an mit 16 0en, das erste Datenbit fuege ich links an.
2. Dann dividiere ich durch G(X) falls moeglich (d.h. wenn das erste Datenbit
   1 war) und merke mir den Rest, denn der ist der CRC.
3. Ich hole das naechste Datenbit und fuehre ein Exklusiv-Oder mit dem LSB
   (= "linkstem" Bit) des Restes (= CRC) aus. Jetzt ist der CRC 16 Bit lang,
   nach Teilen durch G(X) ist der CRC immer hoechstens 16 Bit lang.
4. Ich fuege eine 0 am rechten Ende des CRC an (ein Bit linksschieben), es
   sind jetzt 17 Bit.
5. Falls das "linkste" Bit 1 ist, dividiere ich durch G(X)
   (= komponentenweises Exklusiv-Oder).
6. Ich wiederhole die Schritte 3. bis 5. solange, bis keine Datenbits mehr
   vorhanden sind.


Dumm ist, dass ich 17-Bit-Register benoetige. Aber eigentlich tun es bei
geschickter Formulierung auch 16 Bit. Denn entweder ist das "linkste", das
17. Bit, gleich 0, oder, falls es 1 ist, wird es nach der Division durch G(X)
gleich Null. Zugleich dividiere ich ja nur, wenn das 17. Bit gleich 1 ist.
Also reicht es erstens, wenn ich nach dem Linksschieben nur mit 16 Bit des
Generatorpolynoms = 1021 hex Exklusiv-Odere (dividiere ...) und zweitens
dies nur mache, wenn vor dem Linksschieben das hoechste ("linkste") Bit 1 war.
Programmiert man in Maschinensprache, dann wird es noch einfacher, weil das
"linkste" Bit nach einem Linksschieben im leicht abtestbaren Carry-Flag des
Prozessors steht, dabei kann ich schieben, abtesten, und dann je nach
Ergebnis Exklusiv-Odern oder nichts weiter tun.

Man muss beachten, dass das LSB des CRC am Ende nach dem Algorithmus ganz
links steht, dies ist das zuerst zu sendende Bit. Man kann den CRC natuerlich
auch genau andersrum berechnen, d.h. dass am Ende das MSB links steht, wie es
eigentlich normal ist. Aus Linksschiebungen werden dann Rechtsschiebungen, aus
dem Exklusiv-Oder mit 1021 hex wird das Exklusiv-Oder mit 8408 hex.



(Fortsetzung folgt)                                              (hoffentlich)

NORD><LINK Infoservice, 73, Michael, DC4OX @
DK0MAV






AX25 @KS         de:DC4OX  13.08.89 13:30   5   4649 Bytes
ERKLAERUNG CRC 6/10
*** Bulletin-ID: 315808DK0MAV ***

de DB8AS @ DB8AS

CRC                                                              Teil 6 von 10

Zurueck zur Norm. Dort steht, dass die Blockpruefzeichenfolge "der
invertierte" Rest ist, dass der Dividend die Summe des um 16 Bit
linksgeschobenen Blockinhaltes und "X^K * (X^15 + X^14 + ... + X^2 + X + 1),
wobei K die Anzahl der Bits des Blockinhaltes ist" ist. Also muss, um der
Norm zu genuegen, der CRC am Ende des Algorithmus vor der Aussendung noch
invertiert werden und vor Beginn der Berechnung muss noch X^K * ...
addiert werden. Wie berechnet man dieses X^K * ... und wie geht es in
den bitweisen Algorithmus ein ?

Beruecksichtung von X^K * ... im Beispiel der langen Division :

                                   B(X) = 0010 1010
                                   X^16 = 1 0000 0000 0000 0000
                                      K = Laenge von B(X) = 8
                                    X^K = X^8 = 1 0000 0000
        X^15 + X^14 + ... + X^2 + X + 1 = 1111 1111 1111 1111
X^K * (X^15 + X^14 + ... + X^2 + X + 1) = 1 0000 0000 * 1111 1111 1111 1111
                                        = 1111 1111 1111 1111 0000 0000
                            B(X) * X^16 = 0010 1010 * 1 0000 0000 0000 0000 0000
                                        = 0010 1010 0000 0000 0000 0000
 B(X) * X^16 (+) X^K * (X^15 + ... + 1) =     1111 1111 1111 1111 0000 0000
                                          (+) 0010 1010 0000 0000 0000 0000
                                        =     1101 0101 1111 1111 0000 0000

Also im Grunde bedeutet dieses Addieren von X^K * ... nichts weiter, als dass
die 16 "linksten" Bits der Nachricht zur CRC-Berechnung invertiert werden
(Invertieren = mit Einsen Exklusiv-Odern, Einsen modulo 2 komponentenweise
addieren ... ).

Also wenn ich keinerlei Datenbits haette, waere der Dividend
1111111111111111  (+) 0000000000000000  = 1111111111111111,
bei einem einzigen Datenbit 0 waere der Dividend
11111111111111110 (+) 00000000000000000 = 11111111111111110,
usw.


Jetzt ist klar, wie dieser Teil der Norm in den bitweisen Algorithmus eingeht,
naemlich simplerweise durch Vorladen des CRC-Registers mit 16 Einsen. Der
der Norm entsprechende zusammengefasste bitweise Algorithmus lautet dann :

1. Lade CRC-Register mit 1111111111111111.
2. Hole naechstes Datenbit (naechstes Bit eines neuen Bytes waere das
   niedrigste, also das rechte) und fuehre ein Exklusiv-Oder mit dem LSB
   (linkstem) Bit des CRC aus.
3. Wenn LSB des CRC = 1 schiebe CRC ein Bit links und fuehre dann ein
   Exklusiv-Oder mit 1021 hex aus, wenn nicht, schiebe CRC ein Bit links.
4. Wiederhole die Schritte 2. und 3. solange, bis keine Datenbits mehr
   vorhanden sind.
5. Invertiere den CRC.


Dieser Algorithmus in Hardware, dann bestehend aus einem D-Flipflop fuer
jedes Datenbit und XOR-Gattern fuer das Generatorpolynom, genannt
"rueckgekoppeltes Schieberegister" ist weit verbreitet. Oftmals wird gesagt,
dass der Algorithmus die softwaremaessige Nachbildung des rueckgekoppelten
Schieberegisters ist. Auch in den "fertigen" HDLC-Bausteinen (SIO, SCC, etc.)
ist das aehnlich gemacht.

Berechnen kann ich den CRC jetzt, auch fuer quasi beliebig lange Nachrichten.
Aber optimal ist das ganze gerade fuer sehr zeitkritische Anwendungen noch
nicht. Man bekommt in den meisten Anwendungen die Daten nicht bitweise,
sondern byteweise "angeliefert". Das hiesse, man muesste fuer ein Byte die
Schleife im Algorithmus 8mal durchlaufen. Auch kann man beim Decodieren noch
verschieden vorgehen, nach dem einfachen Verfahren ist es ein wenig muehsam,
da man erst weiss, was der CRC am Paketende war, wenn man das Paketendeflag
empfangen hat.

Wer immer noch interessiert ist (Hallo Du da - aufwachen !), der kann dann in
weiteren Teilen dieser Rubrik noch byteweise Algorithmen kennenlernen
sowie einige weitere Infos zur FCS (sofern ich nicht die Schreiblust
verliere oder man mir eine Million fuer meinen TNC bietet).
Wer irgendwelche Fehler in meinen Erklaerungsversuchen entdeckt,
der soll sich bitte melden, es ist ja kein Lehrbuch. Wer meint, irgendetwas
erklaeren zu koennen, was das Begreifen einfacher macht, soll sich auch
melden. Wer das alles oede findet, soll seine Meinung fuer sich behalten und
um Himmels willen nicht die naechsten Texte lesen ...



(Fortsetzung folgt)                                              (hoffentlich)

NORD><LINK Infoservice, 73, Michael, DC4OX @
DK0MAV






AX25 @KS         de:DC4OX  13.08.89 13:34   5   7513 Bytes
ERKLAERUNG CRC 7/10
*** Bulletin-ID: 315809DK0MAV ***

de DB8AS @ DB8AS

CRC                                                              Teil 7 von 10

Na ? - immer noch nicht genug ?

Zunaechst kann man ein empfangenes Paket standardmaessig so auf Korrektheit
pruefen, dass man ueber den Inhalt ohne CRC die Pruefsequenz wie beschrieben
bildet und diese dann mit den 16 Bits der empfangenen Pruefsequenz vergleicht.
Sind beide Sequenzen, die errechnete und die empfangene, gleich, dann ist das
Paket korrekt empfangen worden (ggf., bei CCITT-CRC, noch einmal invertieren).
Aber wie schon beschrieben weiss man erst am Paketende nach Empfang des
Paketendeflags, welche 16 Bit die Pruefsequenz sind. Man kann auch ein wenig
anders die Richtigkeit eines Paketes feststellen, dazu ein wenig simple
Mathematik.

Was passiert, mathematisch gesehen, wenn ich eine Checksumme berechne und dann
an das Ende einer Nachricht anhaenge ?

Sei B(X) der gesamte Paketinhalt ohne Flags und ohne FCS, G(X) das
Generatorpolynom. Vorladen des CRC-Registers und Invertieren der FCS
lasse ich fuer die folgende Betrachtung erst einmal weg.

Ich berechne modulo 2 :   B(X) * X^16 / G(X)   =   Q(X) + R(X) / G(X)

Ich erhalte als Ergebnis einen Qotienten Q(X) (das ganzzahlige Ergebnis der
Divison) sowie einen Rest R(X) (Rest der nicht ganzzahlig aufgehenden
Division). Damit die Formel stimmt, schreibe ich den Rest geteilt durch G(X)
hin. Zum besseren Verstaendnis, was gemeint ist, gebe ich ein Beispiel
in normaler Dezimalrechnung :
                               24 * 10 / 11   =  21 + 9 / 11

R(X) ist der CRC, den ich berechne. Durch Umformen bekomme ich :

     B(X) * X^16 / G(X)   =   Q(X) + R(X) / G(X)     ! * G(X)
->   B(X) * X^16          =   Q(X) * G(X) + R(X)     ! - R(X)
->   B(X) * X^16 - R(X)   =   Q(X) * G(X)

Aus frueher beschriebenen Gruenden (Polynomrechung/Modulo-2-Arithmetik) ist
hier aber Subtraktion gleich Addition, und ich bekomme :

->   B(X) * X^16 + R(X)   =   Q(X) * G(X)

Jetzt weiss ich aber, dass R(X) hoechstens 16 Bit lang ist, und B(X) * X^16
ist gerade B(X) 16 Bit linksgeschoben. Somit "passt" der CRC genau in das
Ende von B(X) * X^16 und die linke Seite der Gleichung entspricht genau dem,
was ich als Paket aussende, naemlich dem reinen Blockinhalt mit angehaengter
16 Bit Framechecksequenz FCS.
Die rechte Seite der Gleichung sagt mir, dass diese ganze Aussendung,
aufgefasst als eine einzige Zahl, durch das Generatorpolynom teilbar sein
muss. Also teile ich die gesamte Aussendung durch G(X) (Polynom, modulo 2),
und nur dann, wenn sich kein einziger Fehler beim Empfang eingeschlichen hat,
geht die Rechnung auf und ich erhalte 0 als Rest. Das ist die Fehlersicherung.

Nun weiss ich auch, wieso man laut Norm mal X^16 nimmt, nur dann entspricht
die linke Seite obiger Gleichung dem simplen Anhaengen der FCS an den
Blockinhalt.

Ich kann auch das empfangene Paket mit demselben Algorithmus, also auch mit
Malnehmen mit X^16, behandeln wie bei der Sendung, denn an der Teilbarkeit
aendert das Malnehmen mit X^16 nichts. Zu beachten ist bei dieser Methode,
dass ich die angehaengte FCS nicht irgendwie extra behandle, sondern einfach
durch den Algorithmus (das Teilen) mit durchlaufen lasse. Wenn also im
CRC-Register bei Empfang des Paketendeflags 0 steht, habe ich das Paket
richtig empfangen.


Im Falle der CCITT-Berechnung, die wir bei Packet-Radio ja benutzen, wird
allerdings noch mehr gemacht, das Invertieren des CRC und am Anfang das
Vorladen des Registers mit 1. Auch hier waere es zweckmaessig den CRC genauso
"durchzurechnen" wie bei der Sendung. Was passiert, wenn ich auch hier
genauso durchrechne wie bei der Sendung ?

Das Vorladen mit Einsen des CRC-Registers, also das Invertieren der "linksten"
16 Bit der Nachricht * X^16, wirkt sich nicht weiter aus, da ich dies sowohl
bei der Sendung als auch beim Empfang mache. Deshalb lasse ich das in der
folgenden Betrachtung der Uebersichtlichkeit wegen weg, am Ergebnis aendert
sich deswegen nichts. Die obige Formel lautet :

B(X) * X^16 + R(X) = Q(X) * G(X)

Das heisst, dass B(X) * X^16 + R(X) ganzzahlig ohne Rest durch G(X) teilbar
ist, empfangen habe ich aber die linke Seite mit invertiertem R(X).
Ein Invertieren der FCS kann ich als Addition modulo 2 mit 1111111111111111
auffassen :

( B(X) * X^16 + R(X) ) + 1111111111111111

Desweiteren muss ich jetzt in dieser Rechnung das Linksschieben um 16 Bit
beim Empfangsalgorithmus beachten, denn ich habe ja jetzt einen zusaetzlichen
additiven Faktor zu beruecksichtigen :

   ( B(X) * X^16 + R(X) + 1111111111111111 ) * X^16
=  ( B(X) * X^16 + R(X) ) * X^16   +   1111111111111111 * X^16

Jetzt teile ich wie gehabt im Algorithmus durch G(X) :

( B(X) * X^16 + R(X) ) * X^16 / G(X)   +   1111111111111111 * X^16 / G(X)

Nach wie vor interessiert mich aber nur der Rest der Rechnung, denn diesen
spuckt mein Algorithmus ja aus. Da B(X) * X^16 + R(X) durch G(X) teilbar ist,
ist sicher auch dieses Polynom mal X^16 durch G(X) teilbar, wie oben schon
angesprochen. Bleibt 1111111111111111 * X^16 / G(X), der Rest dieses Terms
ist der Rest, der am Ende uebrigbleibt. Also ran an die Bleistifte und
tief Luft holen :

  1111111111111111 * X^16              : G(X)

= 1111111111111111 * 10000000000000000 : 10001000000100001

= 11111111111111110000000000000000     : 10001000000100001

-> 11111111111111110000000000000000
   10001000000100001
   ------------------
    11101111110111110
    10001000000100001
    ------------------
     11001111100111110
     10001000000100001
     ------------------
      10001111000111110
      10001000000100001
      ----------------------
           11100001111100000
           10001000000100001
           ------------------
            11010011110000010
            10001000000100001
            ------------------
             10110111101000110
             10001000000100001
             -------------------
               11111110110011100
               10001000000100001
               ------------------
                11101101101111010
                10001000000100001
                ------------------
                 11001011010110110
                 10001000000100001
                 ------------------
                  10000110100101110
                  10001000000100001
                  -----------------
                   0001110100001111  (aechz - man reiche mir eine Erfrischung)

0001110100001111 ? - Hmmm. Irgendwo hab ich diese Bitfolge doch schon mal
gesehen ... - Richtig, was stand doch gleich in der Norm, "Bei fehlerfreier
Uebertragung wird als Rest die Bitfolge 0001110100001111 erwartet". Also
waere jetzt auch dieser Punkt der Norm geklaert. Beachten muss man dabei,
dass im Gegensatz zum Sender dieser Rest nicht invertiert ist. Wozu auch,
wenn ich eh auf eine Konstante hin abtesten muss. Also, wenn ich den
Blockinhalt einschliesslich FCS beim Empfang bis auf Invertieren am Ende
genauso behandle wie den Blockinhalt allein beim Senden, dann muss ich, wenn
die Uebertragung ohne Fehler ablief, den "CRC" F0B8 hex (= Darstellung MSB
links, bei Rechnung kam ja LSB links heraus) erhalten.



(Fortsetzung folgt)                                              (hoffentlich)

NORD><LINK Infoservice, 73, Michael, DC4OX @ DK0MAV






AX25 @KS         de:DC4OX  13.08.89 13:36   5   2993 Bytes
ERKLAERUNG CRC 8/10
*** Bulletin-ID: 31580ADK0MAV ***

de DB8AS @ DB8AS

CRC                                                              Teil 8 von 10

Wieso eigentlich laed man das CRC-Register beim CCITT-CRC, also dem bei
Packet-Radio benutzten, mit Einsen vor, bzw. nimmt man mit
X^K * (X^15 + X^14 + ... + X^2 + X + 1) mal ?

Zunaechst nehme ich mal an, ich mache das nicht. Dann betrachte ich
Nachrichten, die am Anfang aus 0en bestehen, und am Ende gleich sind. Also
z.B. 00001011 oder 1011 oder 00000000000000000000000000001011. Mit diesen
berechne ich den CRC ohne Vorladen des Registers mit Einsen. Und bekomme
jedesmal denselben CRC heraus. Das sieht man schon, wenn man sich den Anfang
der Berechnung anguckt, da sind Nullen am Anfang ohne jede Bedeutung, da ist
es egal, ob da eine Null oder 100 Nullen am Anfang stehen. Das aber heisst
im Klartext, dass man ueber diese CRC-Berechnung nicht feststellen kann bei
Nachrichten mit Nullen am Anfang, ob Nullen verschluckt werden durch die
Uebertragung oder hinzugefuegt werden. Nimmt man eine Nachricht mit vielen
Nullen am Anfang an und zwei Stationen, die nicht mit exakt demselben Takt
arbeiten, dann ist es sogar sehr wahrscheinlich, dass von den vielen Nullen
am Anfang eine verlorengeht oder zuviel ist, weil das Auswertefenster im
Laufe eines Paketes sich um ein ganzes Bit verschiebt. Das koennte man dann
nicht erkennen. Wohl aber, wenn man das CRC-Register vorlaed. Denn dann
werden auch solche (nicht gerade unwahrscheinlichen) Fehler erkannt.
Fehlende oder zuviele Einsen am Anfang werden natuerlich nach wie vor
entdeckt.


Auch das Invertieren des CRC vor der Aussendung ist gedacht zur Entdeckung
eines weiteren moeglichen Fehlers bei der Uebertragung. Zyklische Codes, wie
auch der bei Packet-Radio benutzte CRC, sind, wie der Name schon sagt,
zyklisch. Das bedeutet, dass gewisse "zyklische" Fehler nicht erkannt werden
koennen. Zyklisch bedeutet, dass gewisse Eigenschaften erhalten bleiben, wenn
ich ein Codewort rotiere, also am z.B. am Anfang ein Bit wegnehme und es am
Ende wieder anfuege (mit Codewort ist hier der Nachrichteninhalt plus FCS
gemeint). Wenn am Anfang eines Paketinhaltes ein 0-Bit verschluckt wird und am
Ende des Paketes hinter dem CRC wieder auftaucht, dann wird das nicht erkannt.
Sende ich aber die FCS invertiert aus, dann werden auch solche Fehler (durch
Taktfehler moeglich) erkannt.


Nach diesem taktischen Theorieluftholen bleibt immer noch die Herleitung von
schnellen byteorientierten Algorithmen zur CRC-Berechnung. Wenn sich meine
Tastatur wieder abgekuehlt hat, werde ich mich damit in einer der naechsten
Folgen beschaeftigen (nein - keine Bange, werden dann wohl die letzten
Folgen ... ).



(Fortsetzung folgt)                                              (hoffentlich)

NORD><LINK Infoservice, 73, Michael, DC4OX @ DK0MAV






AX25 @KS         de:DC4OX  13.08.89 13:37   5   7700 Bytes
ERKLAERUNG CRC 9/10
*** Bulletin-ID: 31580BDK0MAV ***

de DB8AS @ DB8AS

CRC                                                              Teil 9 von 10

Immer noch dabei ? (Ich kann's nicht fassen)

Im Normalfall bekomme ich die Nachricht, die ich mit einer Pruefsequenz zu
versehen habe, byteweise, oder diese Nachricht "liegt" byteweise im Speicher.
Nach dem vorhandenen Algorithmus muss ich mir nun ein Byte holen und dann
bitweise in der Schleife des Verfahrens "durchschieben". Das kostet Zeit.
Selbst fuer einen schnellen Prozessor kostet es Zeit, wenn die CRC-Berechnung
innerhalb derjenigen Interruptroutinen durchgefuehrt wird, die fuer das
bitweise Senden und Empfangen zustaendig sind. Und genau die laengste
Laufzeit einer solchen Routine bestimmt in erster Linie, wie "schnell" das
Programm senden und empfangen kann, welche Baudrate es "schafft".

Na gut. So weit, so schlecht. Wenn ich den Paketinhalt byteweise bekomme,
dann will ich ihn auch byteweise verarbeiten. Ohne Schleifen. Also
gucke ich, was denn eigentlich passiert, wenn ich ein Byte durch den
vorhandenen bitweisen Algorithmus schiebe. Das Verfahren dabei ist,
dass ich anstatt konkreter Werte fuer CRC und Byte "Platzhalter" einsetze
und mit diesen den bitweisen Algorithmus fuer genau ein Byte durchrechne.
Am Ende habe ich dann eine (vermutlich) ziemlich komplizierte Verknuepfung
der Platzhalter, die ich aber (hoffentlich) leicht anstatt 8-mal die
einzelnen Bits irgendwo durchzuschieben direkt ausfuehren kann, ohne
Schleifen.

Ich numeriere das CRC-Register durch, das niedrigwertigste Bit (LSB) nenne
ich R0, das naechste R1, bis hin zum MSB R15. Das zu behandelnde Datenbyte
wird vom LSB aufwaerts zum MSB als D0 bis D7 bezeichnet. Im folgenden
Diagramm bedeutet eine Spalte von oben nach unten eine Exklusiv-Oder-
Verknuepfung. Wenn gleichnumerierte Bits mit Nummer n ge-eklusiv-odert werden,
dann wird diese Verknuepfung verkurzend als Xn bezeichnet, Beispiele
R0 (+) D0 = X0, R4 (+) D4 = X4, etc. Zur Erleichterung sind die Einserstellen
des CCITT-Generator-Polynoms (ohne X^16) gekennzeichnet.

Zunaechst sei das CRC-Register gegeben, mitten im Verfahren vor Beginn der
Verarbeitung eines neuen Bytes :

------------------*---------------------------*-------------------*----
 0.   R0  R1  R2  R3  R4  R5  R6  R7  R8  R9  R10 R11 R12 R13 R14 R15
------------------*---------------------------*-------------------*----

Nun schiebe ich zunaechst dieses Register um ein Bit links,
R0 merke ich mir :

------------------*---------------------------*-------------------*----
 1.   R1  R2  R3  R4  R5  R6  R7  R8  R9  R10 R11 R12 R13 R14 R15 0
------------------*---------------------------*-------------------*----

Als naechstes, immer noch im ersten Schritt, bilde ich R0 (+) D0.
War dieses Ergebnis 1, dann muss ich mit dem Generatorpolynom
exklusiv-odern. Dies wird im Diagramm so dargestellt, dass ich
grundsaetzlich das Exklusiv-Oder ausfuehre, aber nicht fest mit
Einsen, sondern mit der Verknuepfung R0 (+) D0 = X0. Denn ist X0 = 1,
dann ist das im Endeffekt ein Exklusiv-Oder mit dem Generatorpolynom.
Ist X0 = 0, dann passiert gar nichts, denn ein Exklusiv-Oder mit 0
veraendert nichts. Also erhalte ich in jedem Fall das gewuenschte
Ergebnis.

------------------*---------------------------*-------------------*----
 1.   R1  R2  R3  R4  R5  R6  R7  R8  R9  R10 R11 R12 R13 R14 R15 X0
                  X0                          X0
------------------*---------------------------*-------------------*----

Die naechsten Schritte lasse ich unkommentiert, denn es passiert immer
dasselbe und inzwischen sollten es alle aufmerksamen Leser der Rubrik
leicht nachvollziehen koennen.

------------------*---------------------------*-------------------*----
 2.   R2  R3  R4  R5  R6  R7  R8  R9  R10 R11 R12 R13 R14 R15 X0  X1
              X0  X1                      X0  X1
------------------*---------------------------*-------------------*----
 3.   R3  R4  R5  R6  R7  R8  R9  R10 R11 R12 R13 R14 R15 X0  X1  X2
          X0  X1  X2                  X0  X1  X2
------------------*---------------------------*-------------------*----
 4.   R4  R5  R6  R7  R8  R9  R10 R11 R12 R13 R14 R15 X0  X1  X2  X3
      X0  X1  X2  X3              X0  X1  X2  X3
------------------*---------------------------*-------------------*----

Achtung, aufpassen, im naechsten Schritt muss ich mir R4 (+) X0 vor
dem Schieben merken und dann mit D4 zu X4 (+) X0 verknuepfen, und
dann mit X4 (+) X0 an den entsprechenden Stellen des Generatorpolynoms
exklusiv-odern.

------------------*---------------------------*-------------------*----
 5.   R5  R6  R7  R8  R9  R10 R11 R12 R13 R14 R15 X0  X1  X2  X3  X4
      X1  X2  X3  X4          X0  X1  X2  X3  X4                  X0
                  X0                          X0
------------------*---------------------------*-------------------*----
 6.   R6  R7  R8  R9  R10 R11 R12 R13 R14 R15 X0  X1  X2  X3  X4  X5
      X2  X3  X4  X5      X0  X1  X2  X3  X4  X5              X0  X1
              X0  X1                      X0  X1
------------------*---------------------------*-------------------*----
 7.   R7  R8  R9  R10 R11 R12 R13 R14 R15 X0  X1  X2  X3  X4  X5  X6
      X3  X4  X5  X6  X0  X1  X2  X3  X4  X5  X6          X0  X1  X2
          X0  X1  X2                  X0  X1  X2
------------------*---------------------------*-------------------*----
 8.   R8  R9  R10 R11 R12 R13 R14 R15 X0  X1  X2  X3  X4  X5  X6  X7
      X4  X5  X6  X0  X1  X2  X3  X4  X5  X6  X7      X0  X1  X2  X3
      X0  X1  X2  X7              X0  X1  X2  X3
                  X3
------------------*---------------------------*-------------------*----


Alles klar bis hierher ? - Wenn nicht, Pause machen und dann irgendwann
in Ruhe begucken.


So - das Ergebnis des letzten Schrittes ist Grundlage fuer alle weiteren
Ideen. Ich schreibe das Ergebnis noch einmal hin in der gebraeuchlicheren
Form mit dem MSB links und dem LSB rechts :

             high Byte             !          low Byte
   --------------------------------+--------------------------------
   X7  X6  X5  X4  X3  X2  X1  X0  !  R15 R14 R13 R12 R11 R10 R9  R8
                       X7  X6  X5  !  X4  X3  X2  X1  X0
   X3  X2  X1  X0                  !                  X7  X6  X5  X4
                       X3  X2  X1  !  X0              X3  X2  X1  X0


Diese Darstellung jetzt mal eine Weile wirken lassen. Ideen ? - Falls ja, den
naechsten Teil des Textes ueberspringen und ran ans Hacken. Ansonsten
weiterlesen. Nach laengerem Hinsehen (ich weiss, dass  i c h  eine lange
Leitung habe) fallen einige Sachen auf :

   a) das high Byte des CRC berechnet sich lediglich aus Verknuepfungen
      des Datenbytes sowie des low Bytes des anfaenglichen CRC-Registers

   b) das low Byte des CRC berechnet sich lediglich aus Verknuepfungen
      des high Bytes des anfaenglichen CRC-Registers mit Verknuepfungen
      wie unter a)


Es gibt nun 2 moegliche Vorgehensweisen. Eine sehr kurze Loesung, die das
obige Ergebnis aus dem Datenbyte und dem aktuellen CRC-Register direkt
mit Prozessorbefehlen errechnet, ziemlich abhaengig vom CRC und dem benutzten
Prozessor. Und eine etwas laengere Loesung mit Tabelle, die aber relativ
Prozessor- und CRC-unabhaengig ist und in jedem Fall auf verschiedenen
Rechnern die schnellste ist.



(Fortsetzung folgt)                                              (hoffentlich)

NORD><LINK Infoservice, 73, Michael, DC4OX @ DK0MAV






AX25 @KS         de:DC4OX  13.08.89 13:39   5   8887 Bytes
ERKLAERUNG CRC 10/10
*** Bulletin-ID: 31580CDK0MAV ***

de DB8AS @ DB8AS

CRC                                                             Teil 10 von 10

Zunaechst die Tabellenloesung. Die Idee ist, dass, wenn ich im low Byte
R15 R14 R13 R12 R11 R10 R9 R8 weglasse, der gesamte CRC nur von den Werten
X0, X1, X2, X3, X4, X5, X6, X7 abhaengt. Das aber heisst nichts anderes, dass
es ohne Beruecksichtigung von R15-R8 hoechstens 256 verschiedene
16-Bit-CRC-Werte gibt, "angewaehlt" durch X0-X7. Diese 256 Werte kann ich nun
einmal ausrechnen und in eine Tabelle packen. Der eigentliche Algorithmus
lautet dann ziemlich simpel :

1. Lade das CRC-Register mit Einsen vor (andere als CCITT-CRC mit Nullen).
2. Hole das naechste Datenbyte und fuehre ein Exklusiv-Oder mit dem low Byte
   des CRC-Registers durch. Das erhaltene Byte ist der Tabellenindex.
3. Schiebe das CRC-Register 8 Bit nach rechts (bei vielen Prozessoren kann
   man das high Byte direkt mit einem Befehl an das low Byte setzen) und
   loesche dabei das high Byte.
4. Fuehre ein Exklusiv-Oder des durch 1. angewaehlten Tabelleneintrags
   mit dem CRC-Register aus.
5. Wiederhole 2. bis 4. fuer alle Bytes im Paket (Sender alle
   Nachrichtenbytes, Empfaenger Nachrichtenbytes plus CRC-Bytes).
6. Sender     :  Invertiere CRC und sende ihn, LSB zuerst.
   Empfaenger :  Vergleiche CRC mit F0B8 hex.

F0B8 ist die im vorigen Text angesprochene Konstante 0001110100001111
aufgeschrieben mit MSB links. Dieser byteweise Algorithmus ist rund viermal
schneller als der bitweise - das ist schon was. Ein weiterer Vorteil der
Tabellenmethode ist ausser der relativen Portabilitaet auch, dass man auf
andere CRC-Polynome durch einfaches Aendern der Tabelle kommt, z.B. fuer
CRC-16. Auch ist es nicht notwendig, die Tabelle fertig als Code im
Programm zu haben, es ist sicher kuerzer, stattdessen eine Routine zur
Tabellenerzeugung einmal bei Programmstart aufzurufen.


Man kann die Tabellenmethode auch anders interpretieren. Bei der langen
Division stehen Byte und CRC-Inhalt mit LSB links (die "Sendereihenfolge" der
Bits). Wenn ich ein Byte weiterrechne, heisst das ja, dass der bis jetzt
erhaltene Rest, R0-R15, um ein Byte, d.h. 8 Bit, linksgeschoben werden muss.
Das neue Datenbyte muss ich wie gehabt mal X^16 nehmen, dann kann ich den
alten CRC-Inhalt mit dem neuen Datenbyte (+)-verknuepfen :

R0 R1 R2 R3 R4 R5 R6 R7 R8 R9 R10 R11 R12 R13 R14 R15 0  0  0  0  0  0  0  0
D0 D1 D2 D3 D4 D5 D6 D7 0  0  0   0   0   0   0   0   0  0  0  0  0  0  0  0

Das ganze muss ich jetzt durch das Generatorpolynom teilen, dies mache ich
aber mit folgenden zwei einzelnen Faktoren :

1) R8 R9 R10 R11 R12 R13 R14 R15 0 0 0 0 0 0 0 0 : 10001000000100001

   = 0, Rest R8 R9 R10 R11 R12 R13 R14 R15 0 0 0 0 0 0 0 0

   oder besser, mit MSB links stehend, Rest = R15 R14 R13 R12 R11 R10 R9 R8

2) R0 R1 R2 R3 R4 R5 R6 R7
   D0 D1 D2 D3 D4 D5 D6 D7 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 : 10001000000100001

 = X0 X1 X2 X3 X4 X5 X6 X7  *  X^16  :  10001000000100001

Jetzt muss ich 2) ausrechnen (Ergebnis dann zweckmaessigerweise mit MSB links)
und dann mit 1) exklusiv-odern. Jetzt kann man aber sehen, dass das Vorgehen
genau dasselbe wie beim Tabellenalgorithmus angegeben ist. Nun ist auch klar,
was die Tabelle mathematisch darstellt, naemlich alle Moeglichkeiten der Reste
von X0 X1 X2 X3 X4 X5 X6 X7 * X^16 geteilt durch G(X) :

   Rest von (   0 * X^16   :   X^16 + X^12 + X^5 + 1 )
   Rest von (   1 * X^16   :   X^16 + X^12 + X^5 + 1 )

            .
            .

   Rest von ( 254 * X^16   :   X^16 + X^12 + X^5 + 1 )
   Rest von ( 255 * X^16   :   X^16 + X^12 + X^5 + 1 )


Schliesslich, wie berechnet man so eine Tabelle am zweckmaessigsten ?
Eine oft benutzte Methode ist, dass ich zunaechst einmal den Rest der
Divisionen fuer jedes einzelne Bit errechne, also fuer 10000000 * X^16,
fuer 01000000 * X^16, ... , fuer 00000001 * X^16. Diese Berechnung erfolgt
einmal, ausserhalb des Programms. Die sich ergebenden 8 16-Bit-Werte lege ich
als Konstanten ab im Packet-Radio-Programm, und zwar MSB des Restes links,
LSB rechts, so wie ich es fuer den Algorithmus brauche. Die Reste aller 256
Werte, naemlich die eigentliche Tabelle, errechne ich dann, indem ich die
Reste der einzelnen Bits jedes der 256 Werte kombiniere, d.h. mit
Exklusiv-Oder verknuepfe. Fuer den, der zu faul zum Berechnen der Konstanten
ist :

           LSB                    MSB                       MSB LSB

 Rest von ( 100000000000000000000000 : 10001000000100001 ) = 1189 hex mod 2
 Rest von ( 010000000000000000000000 : 10001000000100001 ) = 2312 hex mod 2
 Rest von ( 001000000000000000000000 : 10001000000100001 ) = 4624 hex mod 2
 Rest von ( 000100000000000000000000 : 10001000000100001 ) = 8C48 hex mod 2
 Rest von ( 000010000000000000000000 : 10001000000100001 ) = 1081 hex mod 2
 Rest von ( 000001000000000000000000 : 10001000000100001 ) = 2102 hex mod 2
 Rest von ( 000000100000000000000000 : 10001000000100001 ) = 4204 hex mod 2
 Rest von ( 000000010000000000000000 : 10001000000100001 ) = 8408 hex mod 2

Vielleicht ist der eine oder andere schon mal ueber diese Zahlen oder die
gesamte Tabelle beim Rumsuchen in einer Softwareloesung "gestolpert", ...



Als letztes bringe ich als Beispiel zur Aufforderung zum Selbstprobieren
den sehr wenig Platz beanspruchenden byteweise arbeitenden Algorithmus
zur direkten Berechnung des CCITT-CRC. Im Beispiel als 8086-Code,
aber anhand des Kommentars sehr leicht auf andere Prozessoren uebertragbar.
Dieser und aehnliche Algorithmen ergeben sich durch geschicktes Programmieren
direkt aus der Tabelle des Inhaltes des CRC-Registers nach 8 Bits.
Initialisierung des CRC-Registers sowie weiteres "Drumrum" lasse ich weg :

CRC (R15-R0) in DX, Datenbyte in AL (D7-D0).

XOR AL,DL ;AX = ?   ?   ?   ?   ?   ?   ?   ?   X7  X6  X5  X4  X3  X2  X1  X0
MOV DL,DH ;DX = R15 R14 R13 R12 R11 R10 R9  R8  R15 R14 R13 R12 R11 R10 R9  R8
MOV DH,AL ;DX = X7  X6  X5  X4  X3  X2  X1  X0  R15 R14 R13 R12 R11 R10 R9  R8
MOV BH,AL ;BX = X7  X6  X5  X4  X3  X2  X1  X0  ?   ?   ?   ?   ?   ?   ?   ?
XOR BL,BL ;BX = X7  X6  X5  X4  X3  X2  X1  X0  0   0   0   0   0   0   0   0
ROR BX    ;BX = 0   X7  X6  X5  X4  X3  X2  X1  X0  0   0   0   0   0   0   0
XOR BL,AL ;BX = 0   X7  X6  X5  X4  X3  X2  X1  X0  0   0   0   0   0   0   0
          ;                                     X7  X6  X5  X4  X3  X2  X1  X0
ROR BX    ;
ROR BX    ;
ROR BX    ;BX = X2  X1  X0  0   X7  X6  X5  X4  X3  X2  X1  X0  X6  X5  X4  X3
          ;                                                 X7
AND AL,0F ;AX = ?   ?   ?   ?   ?   ?   ?   ?   0   0   0   0   X3  X2  X1  X0
XOR BH,AL ;BX = X2  X1  X0  0   X7  X6  X5  X4  X3  X2  X1  X0  X6  X5  X4  X3
          ;                     X3  X2  X1  X0              X7
ROR BX    ;BX = X3  X2  X1  X0  0   X7  X6  X5  X4  X3  X2  X1  X0  X6  X5  X4
          ;                         X3  X2  X1  X0              X7
XOR BL,AL ;BX = X3  X2  X1  X0  0   X7  X6  X5  X4  X3  X2  X1  X0  X6  X5  X4
          ;                         X3  X2  X1  X0              X7
          ;                                                     X3  X2  X1  X0
XOR DX,BX ;DX = X7  X6  X5  X4  X3  X2  X1  X0  R15 R14 R13 R12 R11 R10 R9  R8
          ;     X3  X2  X1  X0  0   X7  X6  X5  X4  X3  X2  X1  X0  X6  X5  X4
          ;                         X3  X2  X1  X0              X7
          ;                                                     X3  X2  X1  X0

Immerhin - diese Routine braucht nur 30 Bytes und ist in 38 Clockzyklen
durchlaufen, das ist gerade ein Zyklus mehr als der die relativ grosse
Tabelle benoetigende Tabellenalgorithmus auf dem 8086. Beim CRC-16 ist
der direkte Algorithmus auf dem 8086 sogar schneller als der
Tabellenalgorithmus. Auf anderen Prozessoren kann je nach Geschick
des Programmierers auch durchaus der direkte Algorithmus fuer den CCITT-CRC
schneller als die Tabellenmethode sein ...


Uebrigens ist das gezeigte Vorgehen, allerdings mit hoeherem Aufwand,
auch wortweise moeglich. Dies als Anregung fuer Prozessoren mit
32-Bit-Registern/Arithmetik.



(Fortsetzung folgt) - Quatsch. Das war's !

Oder doch nicht, Fragen und Briefe zum Thema werden natuerlich beantwortet,
diverse Korrekturfiles entstehen nach aller Erfahrung sicherlich auch noch.
Und verbessert werden kann die Darstellung des Themas vielleicht auch.
Obwohl schon jetzt der Rahmen eines Seminarvortrages fast ueberschritten ist.
Aber haette irgendjemand mehr davon gehabt, wenn ich den letzten Algorithmus
einfach nur kurz und knapp ohne jede Erklaerungen hingeschrieben haette ?


NORD><LINK Infoservice, 73, Michael, DC4OX @ DK0MAV