GCC 11.2.0, unterschiedliche Optimierung size_t/uint32_t

von Vincent H. (vinci)

20.08.2021 12:51

Lesenswert?

•

Ich bin gerade dabei kritschen Interrupt-Code für einen Cortex M4 zu 
optimieren und da fiel mir auf, dass GCC 11.2.0 (-Os) unterschiedlichen 
Code für size_t/uint32_t erzeugt.

Das Disassembly im IRQ ist ein Pattern wo Loop-Unrolling forciert wird 
sieht folgendermaßen aus:

// static size_t cnt_
// uint16_t ccr_
    if (cnt_ < ccr_) {
 8003b16:  8812        ldrh  r2, [r2, #0]
 8003b18:  4293        cmp  r3, r2
 8003b1a:  f04f 4290   mov.w  r2, #1207959552  ; 0x48000000
 8003b1e:  bf34        ite  cc
 8003b20:  2010        movcc  r0, #16
 8003b22:  f44f 1080   movcs.w  r0, #1048576  ; 0x100000
 8003b26:  f8c2 0c18   str.w  r0, [r2, #3096]  ; 0xc18


Dieser Teil wird dabei etwa ein dutzend Mal wiederholt.

Ersetze ich den size_t Zähler durch einen uint32_t Zähler, dann erzeugt 
der Compiler plötzlich ein zusätzliches Load für jeden 
"Schleifendurchlauf".

// static uint32_t cnt_
// uint16_t ccr_
    if (cnt_ < ccr_) {
 8003b28:  6819        ldr  r1, [r3, #0]
 8003b2a:  8812        ldrh  r2, [r2, #0]
 8003b2c:  4291        cmp  r1, r2
 8003b2e:  f04f 4290   mov.w  r2, #1207959552  ; 0x48000000
 8003b32:  bf34        ite  cc
 8003b34:  2110        movcc  r1, #16
 8003b36:  f44f 1180   movcs.w  r1, #1048576  ; 0x100000
 8003b3a:  f8c2 1c18   str.w  r1, [r2, #3096]  ; 0xc18


Ich versteh nicht so ganz welche Optimierung für size_t in Frage kommt 
die für uint32_t nicht greift? Beide Typen sind unsigned integer mit 32 
Bit Breite. Irgendwer eine Idee woran das liegen könnte?

Ich werf in der Zwischenzeit mal Clang an...

Beitrag melden Bearbeiten Thread verschieben Thread sperren Anmeldepflicht aktivieren Anpinnen Thread löschen Thread mit anderem zusammenführen Markierten Text zitieren Antwort Antwort mit Zitat

Re: GCC 11.2.0, unterschiedliche Optimierung size_t/uint32_t

von Programmierer (Gast)

20.08.2021 12:54

Lesenswert?

•

▲
▼

Hat es vielleicht was mit Aliasing zu tun (dann hilft restrict)? Zeig 
doch mal den Code...

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: GCC 11.2.0, unterschiedliche Optimierung size_t/uint32_t

von Vincent H. (vinci)

20.08.2021 13:03

Lesenswert?

•

▲
▼

Der gesamte Code besteht aus einer Methode die unrolled wird. cnt_ und 
ccr_ sind Member der Klasse.

  void setClear() const {
    if (cnt_ < ccr_)
      // Pin setzen
      // Pin löschen


Clang fügt sowohl das 1. load ein, als auch ein weiteres am Schluss. 
Sehr spannend.

;     if (cnt_ < ccr_) {
 800d4d0: dc f8 00 10    ldr.w  r1, [r12]
 800d4d4: be f8 14 20    ldrh.w  r2, [lr, #20]
 800d4d8: 4f f0 00 43    mov.w  r3, #2147483648
 800d4dc: 91 42          cmp  r1, r2
 800d4de: 38 bf          it  lo
 800d4e0: 4f f4 00 43    movlo.w  r3, #32768
 800d4e4: c0 f8 00 3c    str.w  r3, [r0, #3072]
 800d4e8: d0 f8 00 1c    ldr.w  r1, [r0, #3072]

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: GCC 11.2.0, unterschiedliche Optimierung size_t/uint32_t

von Programmierer (Gast)

20.08.2021 13:04

Lesenswert?

•

▲
▼

Vincent H. schrieb:
> void setClear() const {
>     if (cnt_ < ccr_)

Ohne den ganzen Code und Definition von cnt_ und ccr_ kann man da nichts 
zu sagen...

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: GCC 11.2.0, unterschiedliche Optimierung size_t/uint32_t

von Vincent H. (vinci)

20.08.2021 13:06

Lesenswert?

•

▲
▼

Programmierer schrieb:
> Vincent H. schrieb:
>> void setClear() const {
>>     if (cnt_ < ccr_)
>
> Ohne den ganzen Code und Definition von cnt_ und ccr_ kann man da nichts
> zu sagen...

Was cnt_ und ccr_ is steht bereits oben.

struct S {
  static inline uint32_t cnt_{};
  uint16_t ccr_{};

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: GCC 11.2.0, unterschiedliche Optimierung size_t/uint32_t

von Oliver S. (oliverso)

20.08.2021 13:09

Lesenswert?

•

▲
▼

Vincent H. schrieb:
> Beide Typen sind unsigned integer mit 32
> Bit Breite.

Es müssten sogar beide typedefs auf unsigned sein, also nicht nur das 
gleiche, sondern das selbe.

Oliver

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: GCC 11.2.0, unterschiedliche Optimierung size_t/uint32_t

von Vincent H. (vinci)

20.08.2021 13:11

Lesenswert?

•

▲
▼

Oliver S. schrieb:
> Vincent H. schrieb:
>> Beide Typen sind unsigned integer mit 32
>> Bit Breite.
>
> Es müssten sogar beide typedefs auf unsigned sein, also nicht nur das
> gleiche, sondern das selbe.
>
> Oliver

Folgendes schlägt allerdings fehl

static_assert(std::same_as<uint32_t, size_t>);

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: GCC 11.2.0, unterschiedliche Optimierung size_t/uint32_t

von Programmierer (Gast)

20.08.2021 13:13

Lesenswert?

•

▲
▼

IMO riecht das stark nach Aliasing. Wenn "cnt_" und dein Counter beide 
den selben Typ haben (size_t), wird der Compiler annehmen dass beide auf 
der selben Speicherstelle liegen können. Versuche es mal mit

1	__restrict__

 (ist eine GCC/Clang-Erweiterung).

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: GCC 11.2.0, unterschiedliche Optimierung size_t/uint32_t

von Oliver S. (oliverso)

20.08.2021 13:14

Lesenswert?

•

▲
▼

Vincent H. schrieb:
> Oliver S. schrieb:
>> Vincent H. schrieb:
>>> Beide Typen sind unsigned integer mit 32
>>> Bit Breite.
>>
>> Es müssten sogar beide typedefs auf unsigned sein, also nicht nur das
>> gleiche, sondern das selbe.
>>
>> Oliver
>
> Folgendes schlägt allerdings fehl
> static_assert(std::same_as<uint32_t, size_t>);

Dann drück halt auf die Taste deiner IDE, die dich zur jeweiligen 
typedef- Deklaration bringt, und schau nach, was da steht.

Oliver

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: GCC 11.2.0, unterschiedliche Optimierung size_t/uint32_t

von Vincent H. (vinci)

20.08.2021 13:22

Lesenswert?

•

▲
▼

uint32_t entspricht long unsigned int
size_t entspricht unsigned int

_restrict_ brachte keinerlei Veränderung

Ich glaub eher dass für einen Typ irgendeine Optimierung im Register 
Allocator greift und für den andern eben nicht... oder irgendwie sowas?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: GCC 11.2.0, unterschiedliche Optimierung size_t/uint32_t

von Programmierer (Gast)

20.08.2021 13:26

Lesenswert?

•

▲
▼

Ohne kompletten Code (reduziertes Minimalbeispiel) ist das alles 
Kaffeesatzlesen. restrict ist etwas diffizil und muss richtig eingesetzt 
werden.

Vincent H. schrieb:
> Ich glaub eher dass für einen Typ irgendeine Optimierung im Register
> Allocator greift und für den andern eben nicht... oder irgendwie sowas?

Nein, die Compiler behandeln "effektiv gleiche" Typen (wie long und int 
wenn beide 32bit sind) im Backend (Optimierung) identisch (Pointer sind 
aber natürlich nicht kompatibel).

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: GCC 11.2.0, unterschiedliche Optimierung size_t/uint32_t

von Oliver S. (oliverso)

20.08.2021 13:36

Lesenswert?

•

▲
▼

Vincent H. schrieb:
> Folgendes schlägt allerdings fehl
> static_assert(std::same_as<uint32_t, size_t>);

arm-gcc 11.2 kennt godbolt noch nicht, aber mit arm-gcc 11.1 im 32-Bit 
Mode hält das static_assert, im 64-Bit Mode nicht. Was allerdings so zu 
erwarten war.

Oliver

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: GCC 11.2.0, unterschiedliche Optimierung size_t/uint32_t

von Oliver S. (oliverso)

20.08.2021 14:06

Lesenswert?

•

▲
▼

Vincent H. schrieb:
> uint32_t entspricht long unsigned int
> size_t entspricht unsigned int

Selbst wenn das bei deinem gcc beides 32 bit unsigned Typen sind und 
auch sein sollen (was man nachschauen müsste), sieht das doch seltsam 
aus. Ich hätte das, wenn schon mit long, umgekehrt erwartet.

Oliver

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: GCC 11.2.0, unterschiedliche Optimierung size_t/uint32_t

von Vincent H. (vinci)

20.08.2021 14:08

Lesenswert?

•

▲
▼

Ja find ich auch, sieht fast so aus als hätten sich die Package Manager 
(Arch Repo) bei den Predefines vertan oder so...

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Forum: Compiler & IDEs GCC 11.2.0, unterschiedliche Optimierung size_t/uint32_t