"Geister"-Takte am LPC1114?

von Markus H. (traumflug)

25.07.2015 14:22

Lesenswert?

•

Derzeit bin ich dabei, das von den AVRs bekannte FastIO auf ARM zu 
portieren. Genauer, erst mal auf einen LPC1114, also ein Cortex-M0 mit 
48 MHz. FastIO ist eine Reihe Makros, die einzelne I/O Pins schalten und 
die dafür benötigten Werte zur Kompilierzeit berechnen, so dass man zur 
Laufzeit mit nur noch einem Load und einem Store auskommt. Der ATmega 
schafft es entsprechend, Pulse von nur 2 CPU Clocks Dauer zu erzeugen.

Code für AVR und ARM sieht dann so aus:

  SET_OUTPUT(PIO0_1);
  while (1) {
    WRITE(PIO0_1, 0);
    WRITE(PIO0_1, 1);


Nach dem Precompiler für ARM:

  do { LPC_IOCON_TypeDef *ioreg = (LPC_IOCON_TypeDef *)((0x40000000UL) + 0x44000); LPC_GPIO_TypeDef *port = (LPC_GPIO_TypeDef *)((0x50000000UL) + 0x00000); port->DIR |= (1 << 1); } while (0);
  while (1) {
    do { LPC_GPIO_TypeDef *port = (LPC_GPIO_TypeDef *)((0x50000000UL) + 0x00000); if (0) { port->MASKED_ACCESS[1 + 1] = (1 << 1); } else { port->MASKED_ACCESS[1 + 1] = 0; } } while (0);
    do { LPC_GPIO_TypeDef *port = (LPC_GPIO_TypeDef *)((0x50000000UL) + 0x00000); if (1) { port->MASKED_ACCESS[1 + 1] = (1 << 1); } else { port->MASKED_ACCESS[1 + 1] = 0; } } while (0);


Und im Assembler dann so:

 23a0        movs  r3, #160  ; 0xa0
 2180        movs  r1, #128  ; 0x80
 2002        movs  r0, #2
 05db        lsls  r3, r3, #23
 0209        lsls  r1, r1, #8
 44a:  585a        ldr  r2, [r3, r1]
 44c:  4302        orrs  r2, r0
 44e:  505a        str  r2, [r3, r1]
 2200        movs  r2, #0
 609a        str  r2, [r3, #8]
 3202        adds  r2, #2
 609a        str  r2, [r3, #8]
 e7fa        b.n  450 <main+0x178>


... wenn man Glück hat. Denn der Optimierer bring recht unterschiedliche 
Ergebnisse, je nachdem, wie der Code genau aussieht. Oft wird das laden 
von r3 (Zieladresse) nicht aus der Schleife heraus gezogen, wodurch die 
natürlich langsamer wird.

So wie angegeben läuft diese Schleife mit 9 CPU-Zyklen ( = 5,3 MHz), der 
negative Puls hat 3 Zyklen ( = 63 ns). Auf dem 'Skop gemessen.

Jetzt kommt's: spreche ich vor der Schleife noch das zum Pin gehörige 
IOCON-Register an, wird diese Schleife lansamer, sie braucht dann 13 
Clocks. Die Pulsbreite bleibt gleich. Ansprechen des Registers genügt, 
z.B. indem man den vom booten schon vorhandenen Wert zurück schreibt:

  SET_OUTPUT(PIO0_1);
  *(volatile uint32_t *)(LPC_IOCON_BASE + 0x10) = *(volatile uint32_t *)(LPC_IOCON_BASE + 0x10);
  while (1) {
    WRITE(PIO0_1, 0);
    WRITE(PIO0_1, 1);


Der generierte Assembler der Schleife ist bis auf's Byte genau gleich 
und die 9 Takte passen auch gut zu den Laufzeitangaben der einzelnen 
Befehle im User Manual, daher kann ich mir diese Verzögerung um 4 Takte 
nicht erklären. Hat jemand eine Idee, wo diese Extratakte her kommen 
könnten?


P.S.: wer diese Frage zu akademisch findet: bitte cool bleiben.

Beitrag melden Bearbeiten Thread verschieben Thread sperren Anmeldepflicht aktivieren Anpinnen Thread löschen Thread mit anderem zusammenführen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Der lustige arm-none-eabi-gcc am LPC1114

von Programmierer (Gast)

25.07.2015 14:27

Lesenswert?