direkter Zugriff auf Low/High Byte von 16bit-Werten

von Karl F. (kafido)

09.09.2011 19:20

Lesenswert?

•

Hallo Leute,

sagt mal, gibt's eigentlich eine einfache Variante/Schreibweise um dem 
GCC zu erklären, *direkt/effizient* auf das High/Low-Byte eines 
16-Bit-Wertes zuzugreifen?

uint16_t word;
uint8_t lo;
uint8_t hi;

hi = word >> 8;
lo = word & 0xff;

das ist klar - wird aber (soweit ich bisher gesehen habe) vom Compiler 
leider nicht auf die wirklichen Hi-/Lo-Byte-Zugriffe optimiert ...

Die Kombination aus

typedef union whl {
  uint16_t word;
  struct {
    uint8_t lo;
    uint8_t hi;
  };
};

ist so umständlich zu schreiben (bla.word, bla.lo, bla.hi) und man muß 
die Werte bei der Zuweisung auch noch typecasten ...

Gibt's noch was einfacheres?
Vielleicht ein geschicktes Macro?
Ich steh irgendwie grad auf'm Schlauch ...

- Karl

Beitrag melden Bearbeiten Thread verschieben Thread sperren Anmeldepflicht aktivieren Anpinnen Thread löschen Thread mit anderem zusammenführen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Johann L. (gjlayde)

09.09.2011 19:45

Lesenswert?

•

▲
▼

Karl F. schrieb:

> das ist klar - wird aber (soweit ich bisher gesehen habe) vom Compiler
> leider nicht auf die wirklichen Hi-/Lo-Byte-Zugriffe optimiert ...

Der GCC Bug-Report ist
http://gcc.gnu.org/PR41076

Könntest du (oder jemand, der sich dazu berufen fühlt), weitere 
Beispiele zusammenstellen und dort hochladen? Und bitte ohne Includes. 
Danke :-).

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Karl F. (kafido)

09.09.2011 20:13

Lesenswert?

•

▲
▼

argh

das ist ja wiedermal typisch ich. Voll in die Falle getreten.
Und dann auch noch ein Bug, der schon vor zwei Jahren
reported wurde und immernoch nicht gefixed ist ...
Ich glaub, ich brauch den nicht nochmal submitten, oder?
Das will scheinbar nicht verstanden werden ...

seufz

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Johann L. (gjlayde)

09.09.2011 20:21

Lesenswert?

•

▲
▼

Karl F. schrieb:

> Ich glaub, ich brauch den nicht nochmal submitten, oder?

Nein. Es gibt doch schon einen Eintrag. Du kannst auch einen neuen 
öffnen, der dann als DUPLICATE gekennzeichnet wird. In dem Falle beachte 
aber auch, daß gcc 4.3 nicht mehr unterstützt wird. Da es sich bei dem 
"Bug" lediglich um ein Optimierungsproblem handelt, sollte ein möglichst 
neuer Compiler verwendet werden (z.b. 4.6.1) um sicherzustellen, daß der 
Fehler nicht bereits behoben wurde und man nur warme Luft produziert.

Einen avr-gcc 4.6.1 für Win32 gibt's in 
http://www.avrfreaks.net/index.php?name=PNphpBB2&file=viewtopic&p=841595#841595

> Das will scheinbar nicht verstanden werden ...

Was wird nicht verstanden?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Karl F. (kafido)

09.09.2011 20:30

Lesenswert?

•

▲
▼

jau - ich hab nicht richtig gelesen - inzwischen ist der Bug ja gefixed.
Hat ja nur fast zwei Jahre gedauert ...

Hmm ... selbst das relativ neue AVR studio 5 verwendet nur gcc 4.5.1
und die Ardiono-IDE bringt gcc 4.3.2 mit ...

Kriegt man den neuen da ohne Probleme reingeflickt oder geht dann
wieder irgendwas anderes nicht? Hast Du den schon im Einsatz?
Ich kann grad keine unnötige Arbeit und Fehlersuche gebrauchen ...

Danke
- Karl

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von (prx) A. K. (prx)

09.09.2011 20:31

Lesenswert?

•

▲
▼

Karl F. schrieb:

> Hat ja nur fast zwei Jahre gedauert ...

Fehlende Optimierung eines Spezialfalls hat nicht grad oberste 
Priorität.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Karl F. (kafido)

09.09.2011 20:52

Lesenswert?

•

▲
▼

A. K. schrieb:
> Karl F. schrieb:
>
>> Hat ja nur fast zwei Jahre gedauert ...
>
> Fehlende Optimierung eines Spezialfalls hat nicht grad oberste
> Priorität.

naja, 8-bittiger Zugriff auf Daten ist in einem 8-Bit uC IMHO nicht 
gerade ein Spezialfall. Naja, es gibt ja immernoch Assembler ...

- Karl

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von J.-u. G. (juwe)

09.09.2011 21:17

Lesenswert?

•

▲
▼

Karl F. schrieb:
> naja, 8-bittiger Zugriff auf Daten ist in einem 8-Bit uC IMHO nicht
> gerade ein Spezialfall.

Das mag sein, aber 8Bit µc gehören nun mal nicht zu den primären 
Zielplattformen des GCC, und dementsprechend sind derartige 
Optimierungen doch ein Spezialfall.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Johann L. (gjlayde)

09.09.2011 22:31

Lesenswert?

•

▲
▼

Karl F. schrieb:
> Kriegt man den neuen da ohne Probleme reingeflickt oder geht dann
> wieder irgendwas anderes nicht? Hast Du den schon im Einsatz?

Bitte von Anfang an lesen!
http://www.avrfreaks.net/index.php?name=PNphpBB2&file=viewtopic&t=108357&start=all&postdays=0&postorder=asc

Karl F. schrieb:
> Das will scheinbar nicht verstanden werden ...

Karl F. schrieb:
> Hat ja nur fast zwei Jahre gedauert ...

Mich wundert immer die Ansprüchlichkeit, die einer freien Software wie 
GCC entgegengebracht wird, siehe. 
Beitrag "GCC: Arg unzulängliche Optimierungen?"

Jeder kann sich avr-gcc Distributionen herunterladen oder nach Gusto 
selbst erzeugen, ohne auch nur einen Groschen dafür hinzulegen. Und das 
für einen Compiler (GCC), der mit vielen kommerziellen Compilern 
mitziehen kann oder sogar weit in den Schatten stellt, etwa was 
Verfügbarkeit sowie Plattform- und Architekturabdeckung oder 
Erweiterbarkeit (Plugins) angeht. Und obendrauf gibt's auch noch die 
Quellen! Ditto für binutils, avr-libc, avrdude, ...

Und was die PRs angeht, so gibt es für viele noch nicht einmal 
vernünftige Bugreports und/oder man muss solche Kommentare lesen:
http://gcc.gnu.org/bugzilla/show_bug.cgi?id=49764#c3

> inzwischen ist der Bug ja gefixed
Nein, ist er nicht. Er steht auf UNCONFIRMED.

Es gibt viele Möglichkeiten mit so einem Bug umzugehen:

0. Man ignoriert das Problem und geht zur Tagesordnung über.
1. Man behebt ihn selbst. Immerhin hat man die Quelle.
2. Man wartet, bis irgendjemand ihn behebt.
3. Man versucht zumindest andere Entwickler bei der Entwicklung zu
   unterstützen; etwa durch aussagekräftige Bugreports, Benchmarks,
   Vorabversionen (Release-Candidates) um mehr Fehler vor einer
   Release zu erkennen, etc.
4. Man bezahlt einen Entwickler, ihn zu beheben bzw. kauft sich
   einen professionellen avr-gcc Support (keine Ahnung ob's sowas
   gibt).
5. Man kauft einen kommerziellen Compiler mit Support.

0. und 2. sind bei weitem am beliebtesten, also der Herde nach!
4. und 5. dürften für viele nach Aufräumen der Portokasse ausscheiden.

1. ist nicht wirklich populär und der aktuelle Trend geht dahin, daß die 
AVR-Unterstützung in GCC immer mehr versandet und irgendwann nicht mehr 
nutzbar ist und daher ganz aus GCC entfernt wird, weil sich niemand 
darum kümmert. Dann gibt's auch keine Fehler mehr und vor allem keine, 
bei denen man 2 Jahre rumsitzen muss, bis sich jemand erbarmt für den 
trivialen Bugfix.

Gerade im Feld von Compileranwendern dürfte es einige Entwickler geben, 
die mächtig was auf dem Kasten haben an Erfahrung, Abstraktionsvermögen, 
Hardwarekenntnissen und anderen Skills, die sich vortrefflich für die 
Mitarbeit in einem Open-Source Projekt wie GCC eignen. An Baustellen und 
Herausforderungen mangelt is dort und in anderen Teilen wie binutils 
oder avr-libc nun wirklich nicht. Und sei es nur, Testprogramme für die 
avr-gcc Testsuite beizutragen. Dazu muss man keine Zeiler der 
Compilerquelle gesehen haben oder anfassen.

> Ich kann grad keine unnötige Arbeit und Fehlersuche gebrauchen ...
Wer kann schon unnötige Arbeit oder Fehlersuche gebrauchen? Sag ich auch 
beim nächsten avr-gcc Bugreport...

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Karl F. (kafido)

09.09.2011 23:43

Lesenswert?

•

▲
▼

Johann L. schrieb:
> Mich wundert immer die Ansprüchlichkeit, die einer freien Software wie
> GCC entgegengebracht wird

Sorry, Du hast ja vollkomen Recht! Das vergisst man nur viel zu oft.
Normalerweise bin ich derjenige, der das sagt!
... manche Dinge werden mit der Zeit wohl zu selbstverständlich ...

Zu Deiner 6-Punkte-Liste:
0. Das Problem ignorieren kann ich nicht, da es grade zu sehr stört.
1. Selber fixen kann ich es aber auch nicht - dazu kenn ich mich viel 
zuwenig mit compilern aus. Und wenn dann brauch ich dafür Zeit zum 
probieren, die ich im Moment grad echt nicht habe ...

Aber mit dem Wissen dass das so ist, kann ich mir zumindest einen 
geeigneten Workaround basteln - zur Not ein Assembler-Macro.

Punkt 3 hat sich in diesem Fall erübrigt und 4+5 kommen - wie Du bereits 
richtig vermutet hast - gerade nicht in Frage.

Bleibt (MIR) in diesem Fall eigentlich nur Punkt 2.
Compilerbau ist nunmal nicht gerade meine Stärke - da gibt es andere.
Und dort wo ich kann, tu ich auch gern was für andere!

Off-Topic:
Da ATmel selbst den AVR-GCC im AVR-Studio einsetzt hätte ich eigentlich 
erwartet, dass die den irgendwie subventionieren!? Der Erfolg der 
Prozessorfamilie liegt ja schließlich nicht zuletzt an der freien 
Verfügbarkeit der Entwicklungstools.

- Karl

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Karl F. (kafido)

10.09.2011 00:07

Lesenswert?

•

▲
▼

trotzdem nochmal zurück zur urprünglichen Frage:
(ganz unabhängig von compiler bug oder nicht)

gibt es nun noch eine andere, möglichst elegante Variante um direkt
auf das HIGH oder LOW Byte eines 16bit-Wertes zuzugreifen oder nicht?

irgendwas nach dem Muster

hi = _HI(word)
lo = _LO(word)

Ich kann gut damit leben, dass der Compiler bestimmte Dinge nicht 
vollautomatisch 100%ig optimieren kann - dafür gibt es viel zu viele 
Möglichkeiten, ganz klar.
Aber dann würde ich mir wünschen entsprechende Statements zu haben,
mit denen ich selber den Code nach Wunsch optimieren kann bzw. dem
Compiler ganz genau mitteilen, was ich möchte.

Gruß
- Karl

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Rufus Τ. F. (rufus)

10.09.2011 00:14

Lesenswert?

•

▲
▼

lo = _LO(word)

entspricht

lo = word & 0xFF;

hi = _HI(word)

enspricht

hi = *(((uint8_t *) &word) + 1);

Je nach Byte-Order kann das natürlich auch genau andersherum sein.


Wie der daraus erzeugte Code Deines Compilers aussieht, müsstest Du 
allerdings selbst untersuchen, weder nutze ich avr-gcc noch habe ich den 
hier irgendwo installiert.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Karl F. (kafido)

10.09.2011 00:26

Lesenswert?

•

▲
▼

Rufus Τ. Firefly schrieb:
> lo = _LO(word)
>
> entspricht
>
> lo = word & 0xFF;

das hab ich probiert und was bei mir herauskam war genau das was da 
steht:
1. laden eines 16-bit Wertes in ein Registerpaar
2. and mit 0x00ff

natürlich funktioniert das - ist aber nicht effizient.


> hi = *(((uint8_t *) &word) + 1);

dsa typecasting muss ich nochmal versuchen.
Analog müßte dann ja auch ein:

lo = *((uint8_t *) &word);

oder gleich ein

lo = (uint8_t) word;

funktionieren - werd ich nochmal testen.

Ich wollte ja auch nur wissen, ob es evtl. noch ein tolles Kommando 
gibt, dass ich in meiner grenzelosen Unwissenheit nicht kenne. Ich hab 
nämlich schon mehr als einmal das Rad neu erfunden und hinterher 
festgestellt, dass es das schon gibt ... ärgerlich.

Wenn es nichts dergleichen gibt, fein. Damit kann ich auch leben.

Vielen Dank für die Antworten.

Gruß
- Karl

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Johann L. (gjlayde)

10.09.2011 00:45

Lesenswert?

•

▲
▼

Karl F. schrieb:
> Da Atmel selbst den AVR-GCC im AVR-Studio einsetzt hätte ich eigentlich
> erwartet, dass die den irgendwie subventionieren!? Der Erfolg der
> Prozessorfamilie liegt ja schließlich nicht zuletzt an der freien
> Verfügbarkeit der Entwicklungstools.

Das verstehen eben nicht alle Hardwarehersteller, insbesondere auch im 
Bezug auf GCC, der hier IMO unterschätzt wurde/wird, vor allem auch im 
Hinblick auf sein Potential. Vergleicht man den Aufwand, den in PowerPC, 
x86, Sparc, ARM und wie sie alle heissen reingesteckt wird (und 
natürlich auch die Ergebnisse, die dabei herauskommen), dann wird klar, 
daß avr-gcc ein absolutes Waisenkind ist.

Die Atmel-Policy ist mir nicht bekannt; aktive avr-gcc Entwickler von 
seiten Atmels sind mir nicht bekannt – ausser Eric, der aber in binutils 
und avr-libc unterwegs ist und WinAVR releast. Von Anitha hab ich länger 
nix mehr gehört. Atmel scheint eher darauf konzentriert, private 
Änderungen in seinem avr-gcc Fork zu pflegen (ATXmega, ATwinzig, 
FixedPoint, ...) und bringt diese aber nicht ins offizielle Repository 
ein — sei es aus lizenzrechtlichen Gründen oder aus technischen 
Widerständen.

Gerüchteweise hat Atmel GCC-Entwickler gesucht aber keine gefunden, was 
mir durchaus glaubhaft plausibel erscheint. Momentan liegt die 
offizielle Toolchain brach, und nur hin und wieder verirrt sich jemand 
dahin. Die Atmel-Entwicklung dürfte i.W. damit beschäftigt sein, die 
ganzen Patches up to date zu halten.

Karl F. schrieb:
> gibt es nun noch eine andere, möglichst elegante Variante um direkt
> auf das HIGH oder LOW Byte eines 16bit-Wertes zuzugreifen oder nicht?

Am elegentesten ist der Weg ohne Verrenkung über die Operationen in 
deinem OP.

Ansonsten ... kommt drauf an

· Soll es leserlich sein?
· Soll es effizient sein?
· Bezieht es sich auf Register oder Speicher?
· Soll nur lesend und/oder schreibend zugegriffen werden?
· Welcher C-Standard?
· Ist (Inline-)Asm ok?
· Spielt Portabilität eine Rolle (Endianess)
· Wie sieht's mit Type Punning/Strict Aliasing aus?
· Wozu brauchst du es überhaupt?
· Gibt es ein übersetzbares Beispiel?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Karl F. (kafido)

10.09.2011 01:36

Lesenswert?

•

▲
▼

Johann L. schrieb:
>
> Ansonsten ... kommt drauf an
>
> · Soll es leserlich sein?
> · Soll es effizient sein?
> · Bezieht es sich auf Register oder Speicher?
> · Soll nur lesend und/oder schreibend zugegriffen werden?
> · Welcher C-Standard?
> · Ist (Inline-)Asm ok?
> · Spielt Portabilität eine Rolle (Endianess)
> · Wie sieht's mit Type Punning/Strict Aliasing aus?
> · Wozu brauchst du es überhaupt?
> · Gibt es ein übersetzbares Beispiel?

Nun, in erster Linie soll es effizient sein.
Die meisten Zugriffe, um die es geht, sind lesend.

Inline-ASM ist vollkommen ok, Portabilität ist nicht gefragt.
(wenn ich die Zeit hätte, würde ich vermutlich das ganze Programm in ASM 
schreiben, aber in C geht das halt doch ein ganzes Stückchen schneller)

"Type Punning/Strict Aliasing":
Hab ich nicht grade unter http://gcc.gnu.org/bugs/#known gelesen, dass 
man das nicht utn soll?

Beispiele wofür das gebraucht wird:

Ich übergebe einen uint16_t an eine Funktion und möchte in dieser 
Funktion z.B. (zunächst) nur wissen, ob die Zahl gerade ist. Dafür 
reicht es, das lo-Byte zu testen ...
Oder ich möchte wissen, ob der Wert größer als 1024 ist - dafür reicht 
ein Test des hi-bytes. Bzw. zum Vorzeichen testen reicht auch das 
Hi-Byte.

Weiterhin war es die unsägliche immer wiederkehrende Division durch 10, 
z.B. wenn man eine Zahl zur Ausgabe vorbereitet (Display, Seriell):

Dazu hatte ich mit Routinen wie dieser experimentiert:
Q: http://www.cs.uiowa.edu/~jones/bcd/decimal.html

    void putdec( int16_t n )
        uint8_t d4, d3, d2, d1, d0, q;
        if (n < 0) {
            putchar( '-' );
            n = -n;
        d1 = (n>>4)  & 0xF;
        d2 = (n>>8)  & 0xF;
        d3 = (n>>12) & 0xF;
        d0 = 6*(d3 + d2 + d1) + (n & 0xF);
        q = (d0 * 0xCD) >> 11;
        d0 = d0 - 10*q;
        d1 = q + 9*d3 + 5*d2 + d1;
        q = (d1 * 0xCD) >> 11;
        d1 = d1 - 10*q;
        d2 = q + 2*d2;
        q = (d2 * 0x1A) >> 8;
        d2 = d2 - 10*q;
        d3 = q + 4*d3;
        d4 = (d3 * 0x1A) >> 8;
        d3 = d3 - 10*d4;
        putchar( d4 + '0' );
        putchar( d3 + '0' );
        putchar( d2 + '0' );
        putchar( d1 + '0' );
        putchar( d0 + '0' );


Dabei war mir aufgefallen, dass die anfängliche Aufteilung:

        d1 = (n>>4)  & 0xF;
        d2 = (n>>8)  & 0xF;
        d3 = (n>>12) & 0xF;

nicht besonders elegant übersetzt wird.
Auch bei Dingen wie:

q = (d1 * 0xCD) >> 11;

wäre es effizienter sagen zu können:

q = _HI((d1 * 0xCD)) >> 3;

denn auch hier reicht das hi-Byte ...
Außerdem sind hier beide Werte - sowohl d1 als auch 0xCD nur Bytes 
(uint8_t), aber ich glaube (bin mir nicht mehr ganz sicher) der Compiler 
hatte die erst mal bedie in 16bit gewandelt und dann erst eine 16bit-
Multiplikation gemacht, obwohl eine 8bit-Multiplikation vollkommen 
gereicht hätte ...

Langer Rede kurzer Sinn:
An manchen Stellen - wenn man optimieren möchte - wäre es schön, dem 
Compiler durch irgendwelche Flags, typecasting, _atribute_ oder sonst 
was genau sagen zu können, was er tun soll, statt vom Compiler 
Optimierungswunder zu erwarten. Letztendlich weiß doch nur der 
Programmierer, was er bezwecken will ...

Gruß
- Karl

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Johann L. (gjlayde)

10.09.2011 01:44

Lesenswert?

•

▲
▼

Hast du versucht

void putdec (int16_t sn)
    uint16_t n;
    uint8_t d4, d3, d2, d1, d0, q;
    if (sn < 0) 
        putchar( '-' );
        sn = -sn;
    n = sn;


Vorzeichen machen nur das Leben schwer. Ausserdem kommt's in der Ausgabe 
doch nicht wirklich auf Geschwindigkeit an (es sei denn, du malst auf ne 
Kathodenstrahlröhre ;-)).

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Jörg W. (dl8dtl) (Moderator)

10.09.2011 08:45

Lesenswert?

•

▲
▼

Johann L. schrieb:
> Atmel scheint eher darauf konzentriert, private
> Änderungen in seinem avr-gcc Fork zu pflegen (ATXmega, ATwinzig,
> FixedPoint, ...) und bringt diese aber nicht ins offizielle Repository
> ein — sei es aus lizenzrechtlichen Gründen oder aus technischen
> Widerständen.

Eher aufgrund fehlender Kapazität.  Der Xmega-Patch wäre wohl in einem
Stadium, dass man ihn tatsächlich einbringen könnte, der Lizenzkram
ist mittlerweile ja wohl in Sack und Tüten.  Keine Ahnung, ob dies nun
auf Erics Tisch liegt, vermutlich.  Der Tiny-Kram ist nach letzten
Erfahrungen wohl noch reichlich buggy, und wenn sie überhaupt jemanden
im Moment haben, der irgendwas am GCC entwickelt (ich glaube mich zu
erinnern, da mal einen indisch klingenden Namen gelesen zu haben, aber
nicht Anitha, die macht eher avr-libc), dann wird der wohl damit zu
tun haben, die Tiny10-Familie da in Gang zu bekommen.  Von fixed point
weiß ich gerade nichts.  Wenn sie da interne Patches haben, dann ist
es irgendwas, was mal bei avrfreaks gepostet worden war, nichts
eigenes.

> Gerüchteweise hat Atmel GCC-Entwickler gesucht aber keine gefunden, was
> mir durchaus glaubhaft plausibel erscheint.

GCC-Interna sind leider nicht gerade ein einfaches Feld.  Da genügt
es nicht nur, einen Willen zu haben, etwas beizusteuern, sondern man
muss sich schon mächtig in RMS' Denkweise reinfühlen können.  Ich tu'
mir vieles im Opensource-Bereich an, aber da muss ich leider auch
passen.  So wird es (leider) auch einigen anderen gehen, es genügt
also für einen CPU-Hersteller nicht, nur überhaupt bereit zu sein,
jemanden zu bezahlen dafür, sondern man muss erstmal jemanden finden,
der es überhaupt kann (und dann muss der auch noch bezahlbar sein ;).

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Karl F. (kafido)

10.09.2011 10:34

Lesenswert?

•

▲
▼

Wow ... da hab ich ja eine Lawine losgetreten ...

Eigentlich hab ich ja nur gefragt, ob es eine Funktion oder ein Makro 
gibt,
die/das ich evtl. nicht kenne - sowas wie die _BV() Makros z.Beispiel.
Makro macht natürlich nur dann Sinn wenn es was ist, was dann vom 
Compiler auch wirklich effizient übersetzt wird, so wie z.B. ein

PORTB |= 0x40
oder
PORTB |= _BV(6)

wirklich in ein

sbi PORTB, 6

übersetzt wird.


Johann L. schrieb:
>
> Vorzeichen machen nur das Leben schwer. Ausserdem kommt's in der Ausgabe
> doch nicht wirklich auf Geschwindigkeit an (es sei denn, du malst auf ne
> Kathodenstrahlröhre ;-)).

Den Spruch hab ich jetzt schon mehrfach zu hören bekommen.
Das mit dem putchar() ist ja auch nur ein Beispiel.
MIR kommt es bei meiner Programmieraufgabe sehr wohl auf Geschwindigkeit
an, wobei die Erläuterung der Gründe hier eigentlich off-topic ist.

Nur so viel:
Es passiert alles in Interrupt-Routinen, die ja bekanntlich so kurz wie 
möglich sein sollten.

Ich erhalte z.B. Messwerte in einer Interrupt-Routine und Display bzw. 
Serialport wird in einer anderen Interrupt-Routine behandelt.
Wenn ich jetzt die Werte erst mal ans main() übergeben muss, um sie dort 
"langsam" zu behandeln, muss ich die entsprechenden Variablen alle als 
volatile deklarieren was die Sache auch nicht unbedingt schneller macht.
Bleibt die Behandlung vollständig in Interrupte (die sich gegenseitig 
nicht unterbrechen) kann ich mir das sparen.

Gruß
- Karl


Ich kann

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Johann L. (gjlayde)

10.09.2011 14:46

Lesenswert?

•

▲
▼

Jörg Wunsch schrieb:
> Johann L. schrieb:
>> Atmel scheint eher darauf konzentriert, private
>> Änderungen in seinem avr-gcc Fork zu pflegen (ATXmega, ATwinzig,
>> FixedPoint, ...) und bringt diese aber nicht ins offizielle Repository
>> ein — sei es aus lizenzrechtlichen Gründen oder aus technischen
>> Widerständen.
>
> Eher aufgrund fehlender Kapazität.  Der Xmega-Patch wäre wohl in einem
> Stadium, dass man ihn tatsächlich einbringen könnte, der Lizenzkram
> ist mittlerweile ja wohl in Sack und Tüten.  Keine Ahnung, ob dies nun
> auf Erics Tisch liegt, vermutlich.

So wie ich ihn verstanden habe, ja. Ich wundere mich allerdings, daß es 
nicht längst committed oder zumindest im Review ist – wobei Eric 
letzteres ja garnicht braucht. Sooo viel Zeit ist nicht mehr, 
angepeiltes Ende von 4.7 Stage 1 ist Ende Oktober. Ich kann mir aber gut 
vorstellen, daß er ziemlich mit WinAVR 4.6.2 beschäftigt ist.

> Der Tiny-Kram ist nach letzten Erfahrungen wohl noch reichlich buggy,

Von mir aus kann das Tiny-Zeugs bei Atmel bleiben. Ich versteh immer 
noch nicht, was sie mit diesem Silizium wirklich wollen, bzw. was 
sie/jemand mit diesem Silizium + GCC will.

> und wenn sie überhaupt jemanden
> im Moment haben, der irgendwas am GCC entwickelt (ich glaube mich zu
> erinnern, da mal einen indisch klingenden Namen gelesen zu haben, aber
> nicht Anitha, die macht eher avr-libc), dann wird der wohl damit zu
> tun haben, die Tiny10-Familie da in Gang zu bekommen.

Abnikant Singh?

> Von fixed point weiß ich gerade nichts.
> Wenn sie da interne Patches haben, dann ist es irgendwas, was mal
> bei avrfreaks gepostet worden war, nichts eigenes.

AFAIK von Sean D'Epagnier aka. geckosenator (mit FSF-CA).

>> Gerüchteweise hat Atmel GCC-Entwickler gesucht aber keine gefunden, was
>> mir durchaus glaubhaft und plausibel erscheint.
>
> GCC-Interna sind leider nicht gerade ein einfaches Feld.  Da genügt
> es nicht nur, einen Willen zu haben, etwas beizusteuern, sondern man
> muss sich schon mächtig in RMS' Denkweise reinfühlen können.

RMS ist da schon lange nicht mehr unterwegs, und ich denke, daß sich in 
jedem Compiler dieser Liga ähnliche Strukturen, Probleme und 
Problemlösungen ergeben: Rumtanzen auf SSA-Trees, Data- und Code-Flow 
Analyse, PRE, CSE, DSE, CIM, LCM, Registerallocation, Instruction 
Combining, Scheduling und weiß-der-Teudel-was-noch für Optimierungen und 
Algorithmen.

Der Teufel im Detail sieht dagegen überall anders aus, und bei den 
vielen Details in GCC gibt's auch ensprechend viele Teufelchen.

Wenn man damit anfängt, kann es schon frustrieren sein, sich an einer 
"trivialen" Aufgabe wie den hier angesprochenen 
Byte-Operationen/-Optimierungen die Zähne auszubeissen um nach 
Tagen/Wochen frustriert aufzugeben – abgesehen von sonstigen Schikanen 
wie Regression-Tests, Reviews und zu schauen, daß nicht anderer Code 
schlechter wird.

> Ich tu' mir vieles im Opensource-Bereich an, aber da muss ich
> leider auch passen.  So wird es (leider) auch einigen anderen gehen,

Schade eigentlich. Aber bei dir denk ich daß du ansonsten schon genug 
Projekte am Bein hast. Wenn man allerdings die Hacks, Würgarounds und 
Verwünschungen und fruchtlosen Forendiskussionen in einen Topf wirft, 
könnte man locker 10 AVR-Backends chic machen oder komplett neu 
hochziehen ;-)

> es genügt also für einen CPU-Hersteller nicht, nur überhaupt bereit
> zu sein, jemanden zu bezahlen dafür, sondern man muss erstmal
> jemanden finden, der es überhaupt kann (und dann muss der auch
> noch bezahlbar sein ;).

An der nächsten Straßenecke wird man einen Richard Guenther, Ian L. 
Taylor, Joseph S. Myers oder Michael Meissner garantiert nicht finden.
Die Arbeitgeber lesen sich wie ein who-is-who: Google, IBM, SuSE, ARM, 
Codesourcery, Redhead, ... Ich möchte garnicht wissen, was so jemand 
kostet, und Geld alleine macht's da bestimmt nicht. So jemand will auch 
ein entsprechendes Arbeits- und Lebensumfeld, Team, kreative Freiheit 
usw. vorfinden und nicht als lone Hacker in einem Konzern untergehen, wo 
er hier und da ein paar Tweaks oder Erweiterungen an einem ferner-liefen 
Backend machen darf.

Atmel macht hier vermutlich den Fehler zu glauben, einen Entwickler 
einfach einkaufen zu können. Stattdessen muss hier auch kontinuerlich 
daran gearbeitet werden, ein eigenes Compilerteam aufzubauen und eine 
Mindestmaß an kritischer Masse zu erreichen, um 
Compilerentwicklung/anpassung sinnvoll zu machen. Arbeit gibt's da 
genug, und ich weiß auch nicht, wie Atmel den AVR32-Port gestemmt hat.

Ansonsten ist das AVR-Backend quasi tot. Anatoly ist nicht mehr aktiv 
und Andy Hutchinson seit Jahren nicht mehr gesehen. Eric fügt 
bestenfalls neue copy-paste Derivate ein und Denis beschränkt sich aufs 
Review der spärlichen Patches (immerhin!).

Karl F. schrieb:
> Eigentlich hab ich ja nur gefragt, ob es eine Funktion oder ein Makro
> gibt, die/das ich evtl. nicht kenne -
> sowas wie die _BV() Makros z.Beispiel.
> Makro macht natürlich nur dann Sinn wenn es was ist, was dann vom
> Compiler auch wirklich effizient übersetzt wird, so wie z.B. ein
>
> PORTB |= 0x40
> oder
> PORTB |= _BV(6)
>
> wirklich in ein
>    sbi PORTB, 6
> übersetzt wird.

_BV mach aber nix ausser Textersatz und hilft die Quelle zu obfuskieren 
;-) Die Abbildung auf SBI et al. macht der Compiler auch ohne dieses 
tolle Makro.

> Johann L. schrieb:
>>
>> Vorzeichen machen nur das Leben schwer. Ausserdem kommt's in der Ausgabe
>> doch nicht wirklich auf Geschwindigkeit an (es sei denn, du malst auf ne
>> Kathodenstrahlröhre ;-)).
>
> Den Spruch hab ich jetzt schon mehrfach zu hören bekommen.
> Das mit dem putchar() ist ja auch nur ein Beispiel.
> MIR kommt es bei meiner Programmieraufgabe sehr wohl auf Geschwindigkeit
> an, wobei die Erläuterung der Gründe hier eigentlich off-topic ist.

Naja, man darf einen Blick über den Tellerrand wagen.

> Nur so viel:
> Es passiert alles in Interrupt-Routinen, die ja bekanntlich so kurz wie
> möglich sein sollten.
>
> Ich erhalte z.B. Messwerte in einer Interrupt-Routine und Display bzw.
> Serialport wird in einer anderen Interrupt-Routine behandelt.

Standardansart ist dann mit zwei atomaren volatile-Variablen V1 und V2:

ISR1 → V1 → V2 → ISR2

wobei die Applikation die Umwandlungsroutine V1 → V2 ausführt. Und 
natürlich reduziert man die Zugriffe auf V1/V2 auf ein Minimum d.h. der 
Algorithmus operiert nicht auf diesen Variablen sondern mach sich lokale 
Kopien.

> Wenn ich jetzt die Werte erst mal ans main() übergeben muss, um sie dort
> "langsam" zu behandeln, muss ich die entsprechenden Variablen alle als
> volatile deklarieren was die Sache auch nicht unbedingt schneller macht.

S.o.

> Bleibt die Behandlung vollständig in Interrupte (die sich gegenseitig
> nicht unterbrechen) kann ich mir das sparen.

Zurück zu Thema :-)

Der verlinkte Artikel ist interessante Lekture und es kommt ein Punkt 
hinzu:

· Gibt es einen Hardware-Multiplier?

Ohne diesen nimmt man die Subtraktion von 10000/1000/100/10 wie im 
Artikel ganz oben beschrieben.

Mit MUL kommt einem die C-Semantik quer denn 6·char wird gemäß dieser 
auf 16-Bit Ebene ausgeführt. Um die Arithmetik wirklich auf 8 Bits zu 
drücken und den Algorithmus optimal umzusetzen fürht also kein Weg an 
Assembler vorbei. Bei avr-gcc kommt hinzu, daß nach jedem MUL das 
0-Register gelöscht werden muss und kein Multiply-Add auf R0/R1 
ausgeführt wird [1], d.h. das Multiplikationsergebnis muss immer aus 
R0/R1 herausbefördert werden.

Auf C-Ebene bekommt man das nicht so gut hin wie mit Assembler und der 
Code wird zunehmend unleserlich. Bei uint8_t

a + b + c

werden also mindestens erweiternde Additionen ausgeführt anststt das auf 
8-Bit-Ebene zu tun.

unsigned char t = a + b;

kann sich da anbieten, was teilweise Casts überlegen ist.

Ähnlich sieht es mit Multiplikationen aus, die immer auf 16 Bits 
erweitern. Erschwerend kommt da hinzu, daß erst in 4.7 erweiternde 
Multiplikationen besser implementiert sind: http://gcc.gnu.org/PR49687
Das allerdings nur wenn es ein MUL gibt, der Wolf, den man sich ohne MUL 
machen muss, war mir echt zu viel...

Zur Extraktion der Nippel kann man sich erst mal die Bytes besorgen:

uint16_t n = ...;
uint8_t hi, lo;
uint8_t n3, n2, n1, n0;
hi = n >> 8;
n3 = hi >> 4;
n2 = hi & 0xf;
n1 = lo >> 4;
n0 = lo & 0xf;


Dann wie beschrieben häppchenweise weiter.
Oder eben tabula rasa und mit Assembler anfangen.

[1] Da würde sich auch ne Riesen-Baustelle auftun:

int madd (int i, char a, char b)
    return i + a*b;

wird von avr-gcc 4.6 übersetzt zu

    muls r22,r20
    movw r20,r0
    clr __zero_reg__
    add r20,r24
    adc r21,r25
    movw r24,r20

Aber es ginge auch

    muls r22,r20
    add r24, r0
    adc r25, r1
    clr __zero_reg__

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Karl F. (kafido)

11.09.2011 17:02

Lesenswert?

•

▲
▼

Schweinkram - mein letzter Antwortpost ist wohl irgendie in /dev/null 
verlorengegangen. Naja, vermutlich sitzt das Problem - wie fast immer - 
vor der Tastatur ...


Johann L. schrieb:
>>
>> wirklich in ein
>>    sbi PORTB, 6
>> übersetzt wird.
>
> _BV mach aber nix ausser Textersatz und hilft die Quelle zu obfuskieren
> ;-) Die Abbildung auf SBI et al. macht der Compiler auch ohne dieses
> tolle Makro.

klar - deswegen hatte ich ja auch "PORTB |= 0x40" oder "PORTB |= 
_BV(6)" geschrieben.


> Der verlinkte Artikel ist interessante Lekture ...
... das fand ich auch ;-)
Besonders die ASCII-Arithmetik hatte es mir angetan:
(http://www.cs.uiowa.edu/~jones/bcd/bcd.html#ascii)
Aber das ist ein ganz anderes Thema ...

Nun denn, dann werde ich wohl dort, wo es darauf ankommt,
mit inline-Assembler arbeiten.


Zurück zur Compiler-Optimierung:
Manche Compiler erkennen doch auch Dinge wie "x /= 2 und ersetzen diese 
durch "x >>= 1" u.ä. Da wäre es doch naheliegend, auch "x /= 10" durch 
eine effizientere Divisionsroutine zu ersetzen als die normale Division. 
Immerhin ist 10 (nach 2) mit an Sicherheit grenzender Wahrscheinlichkeit 
die am häufigsten verwendete Divisor-Konstante überhaupt ...

Aber ich weiß: wir sind hier nicht bei "wünsch Dir was" ;-)

Nun denn, nochmal vielen Dank Johann für die Erläuterungen.
Und - wie mein Boss jetzt sagen würde - keep up the good work!

Gruß
- Karl

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Johann L. (gjlayde)

11.09.2011 18:41

Lesenswert?

•

▲
▼

Karl F. schrieb:

> Zurück zur Compiler-Optimierung:
> Manche Compiler erkennen doch auch Dinge wie "x /= 2 und ersetzen diese
> durch "x >>= 1" u.ä. Da wäre es doch naheliegend, auch "x /= 10" durch
> eine effizientere Divisionsroutine zu ersetzen als die normale Division.

Sofern wir von avr-gcc reden musst du dafür auf avr-gcc 4.7 warten (oder 
dir nen Snapshot selber generieren).

Für eine Speed-optimierte Division durch 10 sieht der Code aus wie

unsigned char udiv10_speed (unsigned char n)
    return high (205*n) >> 3;

Frag mich jetzt nicht, wie der Code für /5 oder /3 oder signed aussieht. 
Das ist alles GCC-Magie, die es schon längt gibt. Man muss lediglich in 
der avr-Beschreibung im richtigen Loch rumstochern um sie zu bekommen 
;-)

Für Size-optimierten Code wird wie bisher eine Division ausgeführt weil 
Code aus der libgcc wiederverwendet werden kann.

> Immerhin ist 10 (nach 2) mit an Sicherheit grenzender Wahrscheinlichkeit
> die am häufigsten verwendete Divisor-Konstante überhaupt ...

Ich würd tippen daß 256 häufiger vorkommt als 10.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Karl F. (kafido)

11.09.2011 18:56

Lesenswert?

•

▲
▼

Johann L. schrieb:
>
> Für eine Speed-optimierte Division durch 10 sieht der Code aus wie
>

> unsigned char udiv10_speed (unsigned char n)
>     return high (205*n) >> 3;


klar, reziproke Multiplikation ...
Nur bei Werten größer 8 Bit ist das leider nicht mehr ganz so einfach 
...

ABER:

return high (205*n) >> 3;
       ^^^^

DAS ist doch genau das, wonach ich suche!
Wie komme ich direkt an das high (oder low) Byte eines uint16_t ???
Und damit meine ich jetzt eben nicht ein ">> 8" bzw. "& 0xff"


> Frag mich jetzt nicht, wie der Code für /5 oder /3 oder signed aussieht.

findet sich übrigens alles auch in dem Artikel:
http://www.cs.uiowa.edu/~jones/bcd/divide.html


>> Immerhin ist 10 (nach 2) mit an Sicherheit grenzender Wahrscheinlichkeit
>> die am häufigsten verwendete Divisor-Konstante überhaupt ...
>
> Ich würd tippen daß 256 häufiger vorkommt als 10.

Ja, klar, ich meinte ja auch alle 2er-Potenzen.
Genauso wie ich mit 10 nicht nur 10, sondern auch 100, 1000, 10000 usw.
gemeint hab.

Gruß
- Karl

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Johann L. (gjlayde)

11.09.2011 21:48

Angehängte Dateien:

data-types.h (479 Bytes) | Codeansicht

Lesenswert?

•

▲
▼

Karl F. schrieb:
> Johann L. schrieb:
>>
>> Für eine Speed-optimierte Division durch 10 sieht der Code aus wie
>>

>> unsigned char udiv10_speed (unsigned char n)
>>     return high (205*n) >> 3;

>
> klar, reziproke Multiplikation ...
> Nur bei Werten größer 8 Bit ist das leider nicht mehr ganz so einfach

So klar finde ich das nicht. Das Pronzip ist klar aber nicht, warum 
man es für eine gegebene Konstante für alle Dividenden ohne Fehler 
machen kann. Aber darüber haben sich schon genug Jungs den Kopf 
zerbrochen und ich brauch's zum Glück nicht. Für das obige Beispiel hab 
ich einfach geschaut, was avr-gcc 4.7 ausspuckt.

Übrigens macht er es auch für 16-Bit Divisionen mit bekanntem Divisor.

> ABER:
>

> return high (205*n) >> 3;
>        ^^^^

> DAS ist doch genau das, wonach ich suche!

Nö, das ist nur Pseudo-Code um zu veranschaulichen, wie GCC es macht. 
Der liefert es natürlich als Assembler-Code.

> Wie komme ich direkt an das high (oder low) Byte eines uint16_t ???
> Und damit meine ich jetzt eben nicht ein ">> 8" bzw. "& 0xff"

Die Werte durch eine Union durchzuschleusen (s. Anhang) gibt bestimmt 
fürchterlich unleserlichen Code.

Ok... hab's mit mal im Detail angeschaut für folgenden Code (modulo 
Tippfehler):

#include <stdint.h>
#define put_digit(X) *s++ = (X)
#define umul_hi(a,b) \
 ({ uint8_t _c; \
    asm ("mul %1, %2"  "\n\t"\
         "mov %0, R1"  "\n\t"\
         "clr __zero_reg__"\
         : "=r" (_c) : "r" ((char) a), "r" ((char) b));\
         _c;})
#define umul_hi(a,b) \
 ({ uint8_t _a=a, _b=b; \
    uint8_t _c=_a*_b; _c;})
void putdec (uint16_t n, char *s)
    uint8_t d4, d3, d2, d1, d0, q;
    if (n >= 0x8000)
        put_digit ('-');
        n = -n;
    d0 = n;
    d1 = d0 >> 4;
    d0 &= 0xf;
    d2 = n >> 8;
    d3 = d2 >> 4;
    d2 &= 0xf;
    d0 += 6 * (d3 + d2 + d1);
    q = umul_hi (d0, 0xCD);
    q >>= 3;
    d0 -= 10*q;
    d1 = q + 9*d3 + 5*d2 + d1;
    q = umul_hi (d1, 0xCD);
    q >>= 3;
    d1 -= 10*q;
    d2 = q + 2*d2;
    q = umul_hi (d2, 0x1A);
    d2 -= 10*q;
    d3 = q + 4*d3;
    d4 = umul_hi (d3, 0x1A);
    d3 -= 10*d4;
    put_digit (d4 + '0');
    put_digit (d3 + '0');
    put_digit (d2 + '0');
    put_digit (d1 + '0');
    put_digit (d0 + '0');
    put_digit (0);

Die Funktion macht keine Ausgabe, sondern schreibt lediglich 7 Zeichen 
in den Übergebenen char*. Dadurch spart man Funktionsaufrufe und die 
Funktion wird zum Blatt. Sie nimmt ein unsigned int entgegen.

avr-gcc -Os -mmcu=atmega8 (Größe in Bytes)

         Asm    ohne Asm

Für 4.6 gibt es ausser dem n=-n am Anfang keine 16-Bit Operationen mehr 
im Code, d.h. auf C-Ebene dürfte bei ca. 180 Bytes Ende der Fahnenstange 
sein – zumindest für 4.6.

"Asm" bezieht sich auf den Inline-Asm für den High-Teil einer 
8*8-Multiplikation. Als einziger gewinnt dadurch 4.2.

Fazit

Der Code ist ausser dem kurzen Stückchen am Anfang linear. Gehen wir 
großzügigerweise davon aus, daß die eigentliche Routine ohne den String 
zu schreiben 160 Ticks braucht, dann landen wir bei 40 Ticks pro 
Ziffer!!! (mit 4 Ziffern veranschlagt)

Da ist ein simples Abziehen von 10000, 1000, 100, 10 wesentlich 
einfacher zu implementieren und zu lesen und im Mittel womöglich sogar 
schneller, zumal du wahrscheinlich nicht avr-gcc 4.6 im Einsatz hast! 
Oben habe ich mit 4 Ziffern verglichen, weil man bei der Abzieh-Methode 
Ziffer 0 für lau bekommt.

Bei mir sieht eine Abzieh-Methode so aus, wobei dort keine führenden 
Nullen ausgegeben werden. Die Funktion ist i.W. auf Größe optimiert (62 
Bytes):

static const uint16_t pows10[] PROGMEM = 
// Wandelt N in eine ASCII-Dezimalzahl um. Die Darstellung wird
// mit abschliessender '\0' als Stringende nach STR geschrieben.
// Return: Adresse der abschliessenden '\0'.
char * u16_to_string (char * str, uint16_t n)
    register const uint16_t * p asm ("r30") = pows10;
    uint16_t pow10;
    uint8_t not0 = 0;
        pow10 = pgm_read_word_inc (p);
        char c = '0';
        while (n >= pow10)
            not0 = 1, n -= pow10, c++;
        if (not0)
            *str++ = c;
    } while (! (pow10 & 2)); // pow10 != 10
    // Einer
    *str++ = n+'0';
    *str   = '\0';
    return str;


Um 12345 auszugeben messe ich da 165 Ticks und für eine 1 nur 81. Für 
9999 allerdings ≈300.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Abdul K. (ehydra)

11.09.2011 23:53

Lesenswert?

•

▲
▼

Kleine Zahlen kommen statistisch viel häufiger vor als große Zahlen. Ja, 
das ist wohl eine Binsenweisheit. Das gilt aber auch erstaunlicherweise 
für Ziffern!!

Daher bekommt durchschnittlich eine Subtraktionsmethode sogar nochmals 
Schub...

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Johann L. (gjlayde)

11.09.2011 23:55

Lesenswert?

•

▲
▼

Abdul K. schrieb:
> Kleine Zahlen kommen statistisch viel häufiger vor als große Zahlen. Ja,
> das ist wohl eine Binsenweisheit. Das gilt aber auch erstaunlicherweise
> für Ziffern!!

Nicht von Binsen, sondern von Benford ;-)

http://de.wikipedia.org/wiki/Benfordsches_Gesetz

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Karl F. (kafido)

12.09.2011 01:00

Lesenswert?

•

▲
▼

Johann L. schrieb:
> Um 12345 auszugeben messe ich da 165 Ticks und für eine 1 nur 81. Für
> 9999 allerdings ≈300.

Danke Johann, dass Du Dir die Zeit genommen hast.

Mir ist ein definiertes Zeitverhalten lieber als ein variables.
d.h. immer 200 Ticks sind mir lieber als durchschnittlich 160
die aber manchmal auch 300 sein koennen.
Sowas fuehrt naemlich zu den schoenen race-conditions, bei denen 
irgendwas irgendwann mal an die Wand läuft und kein Schwein weiss warum.
Am liebsten ist mir also eine Routine, die ganz ohne "if" auskommt.

- Karl

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Jörg W. (dl8dtl) (Moderator)

12.09.2011 11:13

Lesenswert?

•

▲
▼

Johann L. schrieb:

(Xmega)

>> Keine Ahnung, ob dies nun
>> auf Erics Tisch liegt, vermutlich.
>
> So wie ich ihn verstanden habe, ja. Ich wundere mich allerdings, daß es
> nicht längst committed oder zumindest im Review ist – wobei Eric
> letzteres ja garnicht braucht. Sooo viel Zeit ist nicht mehr,
> angepeiltes Ende von 4.7 Stage 1 ist Ende Oktober. Ich kann mir aber gut
> vorstellen, daß er ziemlich mit WinAVR 4.6.2 beschäftigt ist.

Ja, vermute ich auch, ich müsste ihn mal fragen.

>> Der Tiny-Kram ist nach letzten Erfahrungen wohl noch reichlich buggy,

> Von mir aus kann das Tiny-Zeugs bei Atmel bleiben. Ich versteh immer
> noch nicht, was sie mit diesem Silizium wirklich wollen,

Verkaufen. ;-)

Ganz ehrlich: wenn da nicht irgendwelche Millionenstückzahlen dahinter
stecken würden, hätte sowas sicher niemand dort angefangen.  Es ist ja
letztlich eine recht umfangreiche Produktentwicklung mit einem neuen
Core, nicht nur das 125. Derivat eines bereits existierenden AVRs, bei
dem man "nur" die Funktionsblöcke mal neu sortieren und anordnen muss.
Wenn du nun siehst, dass man die Teile bei Digikey für 44 Cent bekommt
(Stückpreis bei Abnahme einer Rolle) und Digikey auch noch was
verdienen will dabei, dann werden die Teile vielleicht 10 oder 15 Cent
Gewinn abwerfen.  Nun halt' das mal gegen eine Produktentwicklung mit
Kosten von (grob geraten) vielleicht 10 Millionen, dann sollte klar
werden, um welche Stückzahlen es hier geht — und dass die paar
Hobbyisten in dieser Rechnung ganz gewiss keine Rolle spielen.

> bzw. was
> sie/jemand mit diesem Silizium + GCC will.

Naja, auch dort hast du bei einer Produktentwicklung in C eine bessere
Kosteneffizienz, nicht nur bei der Erstellung, sondern auch bei der
Pflege.  (Außerdem soll's die Teile ja am Ende wohl bis zu einem
ATiny40 geben.)

Was ich mir bei derart kleinen Controllern gut vorstellen kann ist,
dass sie einen Markt im sicherheitstechnischen Bereich haben: eine
Firmware dieser Dimension lässt sich mit brauchbarem Aufwand noch
komplett testen, mit all ihren Eventualitäten.

>> (ich glaube mich zu
>> erinnern, da mal einen indisch klingenden Namen gelesen zu haben, aber
>> nicht Anitha, die macht eher avr-libc)

> Abnikant Singh?

Ja, Abnikant.

>> Ich tu' mir vieles im Opensource-Bereich an, aber da muss ich
>> leider auch passen.  So wird es (leider) auch einigen anderen gehen,
>
> Schade eigentlich. Aber bei dir denk ich daß du ansonsten schon genug
> Projekte am Bein hast.

Ja, das ohnehin.  Außerdem darfst du nicht vergessen: ich bein kein
Informatiker, ich bin Elektronikingenieur (eigentlich Elektronik-
technologe).  Ich habe nur während meines Studiums halt auch
programmieren gelernt, weil mir schon damals klar war, dass die
fachspezifischen Computeraufgaben nur von den Fachleuten selbst gelöst
werden können, nicht etwa von Informatikern.  Von denen kann man nur
Hilfe bei Algorithmen und Werkzeugen (Compilern ;-) erwarten.

Insofern fehlen mir einfach mal einige wesentliche Grundlagen im
Hinblick auf Compiler-Architektur, und ich habe weder Zeit noch
Nerven, das nachzuholen.

> Atmel macht hier vermutlich den Fehler zu glauben, einen Entwickler
> einfach einkaufen zu können. Stattdessen muss hier auch kontinuerlich
> daran gearbeitet werden, ein eigenes Compilerteam aufzubauen und eine
> Mindestmaß an kritischer Masse zu erreichen, um
> Compilerentwicklung/anpassung sinnvoll zu machen.

Es ist wohl in einer Firma, die sich als Hardwarehersteller sieht,
nicht ganz einfach, in der Chefetage die Notwendigkeit von Kompetenz
im Softwarebereich ins Blickfeld zu rücken.  Kommt hinzu, dass AVR
historisch ja überhaupt nicht in Richtung GCC geguckt hat, sondern
sich erstmal voll auf IAR stützen wollte.  Der AVR-GCC ist eine reine
Community-Entwicklung, und es hat einige Jahre gedauert, bis Atmel
dann erkannt hat, wie viel ihnen dieses Teil an Reputation und damit
perspektivisch auch an Gewinn wirklich bringt.

> Ansonsten ist das AVR-Backend quasi tot. Anatoly ist nicht mehr aktiv
> und Andy Hutchinson seit Jahren nicht mehr gesehen. Eric fügt
> bestenfalls neue copy-paste Derivate ein und Denis beschränkt sich aufs
> Review der spärlichen Patches (immerhin!).

Denis als ursprünglicher Autor hatte sich von AVR eigentlich komplett
zurückgezogen und mittlerweile andere GCC-Backends gebastelt
(möglicherweise bezahlt, keine Ahnung).  Anatoly ist dieses Jahr Vater
geworden, und da es sein erstes Kind ist (und nicht das dritte wie bei
Eric und mir, und die gehen nun auch schon alle in die Schule ;),
schränkt das verständlicherweise sein Freizeitbudget erst einmal
kräftig ein.  Aber es soll ja da noch einen Johann-Georg geben, der
mittlerweile sehr aktiv ist. :-)  So wechseln halt die Gesichter über
die Jahre, und das ist meines Erachtens das beste Zeichen dafür, dass
es durchaus am Leben ist.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von dummy (Gast)

12.09.2011 20:50

Lesenswert?

•

▲
▼

typedef union tBuffer16 {
  uint16_t _w;
  uint8_t _a[2];
#define _HI8(w) (((tBuffer16*)(&w))->_a[1])
#define _LO8(w) (((tBuffer16*)(&w))->_a[0])


so, gehts eigentlich in allen meinen Projekten ...

Gruss

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Jörg W. (dl8dtl) (Moderator)

12.09.2011 21:00

Lesenswert?

•

▲
▼

dummy schrieb:

> #define _HI8(w) (((tBuffer16*)(&w))->_a[1])
> #define _LO8(w) (((tBuffer16*)(&w))->_a[0])

> so, gehts eigentlich in allen meinen Projekten ...

Glück gehabt.  Bezeichner, die mit einem Unterstrich, gefolgt von
einem Großbuchstaben beginnen, sind "reserved for the implementation".

Lass den Unterstrich lieber weg, auch wenn er dir vielleicht den
Code "professioneller" aussehen lassen mag. ;-)

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Frank M. (ukw) (Moderator)

13.09.2011 12:03

Lesenswert?

•

▲
▼

dummy schrieb:
>

> typedef union tBuffer16 {
>   uint16_t _w;
>   uint8_t _a[2];

>
> so, gehts eigentlich in allen meinen Projekten ...

Nicht ganz, das tBuffer16 steht an der falschen Stelle.

Richtig ist:

typedef union {
  uint16_t _w;
  uint8_t _a[2];
} tBuffer16;


Funktioniert so aber nur auf Little-Endian-Prozessoren...

Frage: Kann man "At-Compile-Time" den Endian des Prozessors (am besten 
per Preprocessor) herausfinden?

Ich habs ausprobiert für einen ATmega168 mit dem avr-gcc 4.3.3:

#include <inttypes.h>
#define F_CPU 8000000LU              //CPU Takt
volatile uint8_t low;
volatile uint8_t high;
volatile uint16_t word = 0x1234;
typedef union
  uint16_t _w;
  uint8_t _a[2];
} tBuffer16;
#define HI8(w) (((tBuffer16*)(&w))->_a[1])
#define LO8(w) (((tBuffer16*)(&w))->_a[0])
int main ()
    low = word & 0xFF;
    high = word >> 8;
    low = LO8(word);
    high = HI8(word);


Ergebnis:

int main ()
    low = word & 0xFF;
  5e:  80 91 60 00   lds  r24, 0x0060
    high = word >> 8;
  6a:  80 91 60 00   lds  r24, 0x0060
  6e:  90 91 61 00   lds  r25, 0x0061
    low = LO8(word);
    high = HI8(word);
  86:  80 e0         ldi  r24, 0x00  ; 0
  88:  90 e0         ldi  r25, 0x00  ; 0


Beim Maskieren bzw. Schieben wird tatsächlich das komplette Wort in zwei 
8-Bit-Register eingelesen, obwohl nur eines von den beiden anschließend 
genutzt wird.

Bei der Makro-Version Hi8()/LO8() entfällt jeweils der überflüssige 
Lesebefehl. Gefällt mir ganz gut, bis auf die fehlende Portabilität 
bzgl. Endian der CPU.

Gruß,

Frank

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Karl F. (kafido)

13.09.2011 12:47

Lesenswert?

•

▲
▼

Frank M. schrieb:
> Beim Maskieren bzw. Schieben wird tatsächlich das komplette Wort in zwei
> 8-Bit-Register eingelesen, obwohl nur eines von den beiden anschließend
> genutzt wird.

Hallo Frank,

danke für's ausprobieren.

Das ist ja das, was mich so genervt hatte ...
Einerseits ist der Compiler intelligent genug, ganze Schleifen bzw. 
Variablen wegzuoptimieren - auch wenn man das manchmal gar nicht will ;)
und andererseits werden hier Register geladen, deren Inhalt nie 
gebraucht wird. Sowas müsste sich doch in einem zweiten Durchlauf 
erschlagen lassen, oder?


> Bei der Makro-Version Hi8()/LO8() entfällt jeweils der überflüssige
> Lesebefehl. Gefällt mir ganz gut, bis auf die fehlende Portabilität
> bzgl. Endian der CPU.

Gefällt mir auch gut! Sobald ich anfange bei ATmega & Co. irgendwelche 
besonderen Hardware-Ressourcen auszunutzen (Timer, ICP, usw.) hat sich 
das mit der Portabilität ohnehin ganz schnell erledigt ...

Gruß
- Karl

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Frank M. (ukw) (Moderator)

13.09.2011 13:26

Lesenswert?

•

▲
▼

Karl F. schrieb:

> Gefällt mir auch gut!

Ich habe es gerade mal mit einem realen Source aus der Praxis 
ausprobiert:

#include <inttypes.h>
#define F_CPU 8000000LU              //CPU Takt
typedef union
  uint16_t _w;
  uint8_t _a[2];
} tBuffer16;
#define HI8(w) (((tBuffer16*)(&w))->_a[1])
#define LO8(w) (((tBuffer16*)(&w))->_a[0])
#define HI8(w) ((w) >> 8)
#define LO8(w) ((w) & 0xFF)
itox (unsigned char * buf, uint8_t i)
    if (i < 10)
        *buf = i + '0';
    else
        *buf = 'A' + i - 10;
itoxx (unsigned char * buf, uint8_t i)
    itox (buf, (i & 0xF0) >> 4);
    itox (buf + 1, i & 0x0F);
itoxxxx (unsigned char * buf, uint16_t i)
    itoxx (buf, HI8(i));
    itoxx (buf + 2, LO8(i));
int main ()
    unsigned char buffer[4];
    itoxxxx (buffer, 0x1234);


Witzigerweise braucht hier die Makro-über-union-Version 16 Byte mehr als 
die Maskier-/Schiebevariante. Hier ist also das Verhältnis ungünstiger. 
Das Verhältnis bleibt auch so, wenn man die ito*-Funktionen static 
deklariert, und sie dann inline übersetzt werden. Wahrscheinlich verhält 
sich der gcc lediglich bei volatiles so ungünstig beim Low-Byte-Zugriff 
über Schieben/Maskieren. Ich hatte in meinem künstlichen Beispiel oben 
mit Absicht volatiles gewählt, um Optimierungen seitens des Compilers 
auszuschließen. Vielleicht war das eine falsche Testbedingung ;-)

Hier der Assembler-Output:

Maskieren/Schieben:

itoxxxx (unsigned char * buf, uint16_t i)
  6c:  ff 92         push  r15
  6e:  0f 93         push  r16
  70:  1f 93         push  r17
  72:  8c 01         movw  r16, r24
  74:  f6 2e         mov  r15, r22
  76:  67 2f         mov  r22, r23
    itoxx (buf, HI8(i));
  78:  e7 df         rcall  .-50       ; 0x48 <itoxx>
    itoxx (buf + 2, LO8(i));
  7a:  c8 01         movw  r24, r16
  7c:  02 96         adiw  r24, 0x02  ; 2
  7e:  6f 2d         mov  r22, r15
  80:  e3 df         rcall  .-58       ; 0x48 <itoxx>
  86:  ff 90         pop  r15


Makros über union:

itoxxxx (unsigned char * buf, uint16_t i)
  6c:  0f 93         push  r16
  6e:  1f 93         push  r17
  70:  df 93         push  r29
  72:  cf 93         push  r28
  74:  00 d0         rcall  .+0        ; 0x76 <itoxxxx+0xa>
  76:  cd b7         in  r28, 0x3d  ; 61
  78:  de b7         in  r29, 0x3e  ; 62
  7a:  8c 01         movw  r16, r24
  7c:  7a 83         std  Y+2, r23  ; 0x02
  7e:  69 83         std  Y+1, r22  ; 0x01
    itoxx (buf, HI8(i));
  80:  6a 81         ldd  r22, Y+2  ; 0x02
  82:  e2 df         rcall  .-60       ; 0x48 <itoxx>
    itoxx (buf + 2, LO8(i));
  84:  c8 01         movw  r24, r16
  86:  02 96         adiw  r24, 0x02  ; 2
  88:  69 81         ldd  r22, Y+1  ; 0x01
  8a:  de df         rcall  .-68       ; 0x48 <itoxx>
  8c:  0f 90         pop  r0
  8e:  0f 90         pop  r0
  90:  cf 91         pop  r28
  92:  df 91         pop  r29


Fazit: ich bleibe beim Maskieren/Schieben. Wenn der Source nicht so 
künstlich, sondern eher praxisgerecht ist, ist die portable Variante 
wohl sogar die bessere.

Gruß,

Frank

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Karl F. (kafido)

13.09.2011 14:01

Lesenswert?

•

▲
▼

Naja, das größte Problem hab ich eigentlich bei volatiles, sprich in ISR 
Routinen wo es mitunter wirklich völlig unnötig (und störend) ist, alle 
zwei/view Bytes zu laden, wenn ich nur eines brauche.

Es geht (mir) auch nicht immer um Code-Größe, sondern öfters auch mal um 
Geschwindigkeit. Wenn der Speicher nicht reicht, nehm ich zur Not den 
nächstgrößeren AVR - wenn ich mit der Geschwindigkeit nicht hinkomme, 
muß ich auf eine ganz andere CPU umsteigen - das ist deutlich mehr 
Aufwand.

Oft ist (mir) auch reproduzierbare Geschwindigkeit wichtig. Deswegen 
hatte ich auch weiter oben geschrieben, dass mir die 10000/1000/100/10 
Subtraktionsmethode nicht so gut gefällt. Mich stört manchmal schon, 
dass alleine das Konstrukt if/else je nach Bedingung einen Takt mehr 
oder weniger braucht - das kann man aber leicht mit einem asm("nop") 
wieder grade biegen.

Ich muß mich wohl noch mehr mit inline Assembler beschäftigen.
Assembler kann ich. C auch. Aber beim inline-Assembler tut der
Compiler nicht immer so ganz das, was ich gerne hätte :-/

naja ... dies ist ja ein recht langer Thread geworden, obwohl es 
eigentlich nur um den direkten Zugriff auf ein Byte ging ;-)

Danke an alle, die mitgegrübelt haben - scheint ja alles nicht so 
einfach zu sein.

Gruß
- Karl

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Johann L. (gjlayde)

13.09.2011 14:13

Lesenswert?

•

▲
▼

Karl F. schrieb:
> Naja, das größte Problem hab ich eigentlich bei volatiles, sprich in ISR
> Routinen wo es mitunter wirklich völlig unnötig (und störend) ist, alle
> zwei/view Bytes zu laden, wenn ich nur eines brauche.

Sowas darf der Compiler garnicht "optimieren", weil es die 
volatile-Korrektheit zerstören würde.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Volkmar D. (volkmar)

13.09.2011 14:13

Lesenswert?

•

▲
▼

Auch wenn zwischenzeitlich ähnliches geschrieben wurde, hier noch mein 
'Senf' dazu:

Frank M. schrieb:
> Ich habs ausprobiert für einen ATmega168 mit dem avr-gcc 4.3.3:
...

> typedef union
>   uint16_t _w;
>   uint8_t _a[2];
> } tBuffer16;
> #define HI8(w) (((tBuffer16*)(&w))->_a[1])
> #define LO8(w) (((tBuffer16*)(&w))->_a[0])


Ich habe es eben mal in mein Projekt eingesetzt und kam leider zu einem 
negativen Ergebnis, zumindest an der Stelle, an der ich direkt ein 
Rechenergebnis verwenden wollte:

out_pwm_ptr->option |= HI8(max_delay * rnd()) & DELAY_MASK;

Das gibt schon mal eine Fehlermeldung, es wird eine Variable als 
Parameter für HI8() benötigt, und kein Ausdruck.

Aber selbst

uint16_t temp = max_delay * rnd();
out_pwm_ptr->option |= HI8(temp) & DELAY_MASK;

bringt kein optimales Ergebnis, es benötigt 14 Bytes mehr als das 
Anfangs erwähnte Union-Konstrukt, das ich üblicherweise in solchen 
Fällen verwende.

Was bei mir alternativ zu dem Union-Konstrukt auch klappt:

typedef union
  uint16_t _w;
  uint8_t _a[2];
} tBuffer16;
static inline uint8_t LO8(uint16_t) __attribute__((always_inline));
static inline uint8_t HI8(uint16_t) __attribute__((always_inline));
uint8_t LO8(uint16_t w) {
  tBuffer16 temp;
  temp._w = w;
  return temp._a[0];
uint8_t HI8(uint16_t w) {
  tBuffer16 temp;
  temp._w = w;
  return temp._a[1];

und dann

uint16_t temp = max_delay * rnd();
out_pwm_ptr->option |= HI8(temp) & DELAY_MASK;

Wenn ich den Ausdruck ins HI8() reinziehe, gibt es zwar keine 
Fehlermeldung, der Compiler benötigt aber insgesamt 2 Byte mehr (wobei 
mir auf die Schnelle nicht klar geworden ist, wo er die benötigt).

Volkmar

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Peter (Gast)

13.09.2011 14:16

Lesenswert?

•

▲
▼

@Frank M. (ukw) Benutzerseite

>Beim Maskieren bzw. Schieben wird tatsächlich das komplette Wort in zwei
>8-Bit-Register eingelesen, obwohl nur eines von den beiden anschließend
>genutzt wird.

Das ist auch richtig so, der Compiler tut genau das, wass er nach 
Konvention auch tun soll: Die Variable "word" und der direkte Zahlenwert 
"0xFF" werden als integer behandelt (beim AVR 16Bit)

Konsequentes Casting auf 8 Bit sollte aber das Problem lösen, aber 
natürlich wäre es schöner, wenn der Optimizer diese Fälle selber 
optimieren würde...

#include <inttypes.h>
#define F_CPU 8000000LU              //CPU Takt
volatile uint8_t low;
volatile uint8_t high;
volatile uint16_t word = 0x1234;
typedef union
  uint16_t _w;
  uint8_t _a[2];
} tBuffer16;
#define HI8(w) (((tBuffer16*)(&w))->_a[1])
#define LO8(w) (((tBuffer16*)(&w))->_a[0])
int main ()
    low = (uint8_t)word & (uint8_t)0xFF;
    high = (uint8_t)word >> 8;

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Frank M. (ukw) (Moderator)

13.09.2011 15:27

Lesenswert?

•

▲
▼

Peter schrieb:
> Das ist auch richtig so, der Compiler tut genau das, wass er nach
> Konvention auch tun soll: Die Variable "word" und der direkte Zahlenwert
> "0xFF" werden als integer behandelt (beim AVR 16Bit)

Ja, natürlich. Zumindest beim Schieben um 8 Bit nach rechts muss er 
"word" als Integer behandeln. Aber er braucht den Low-Wert von "word" 
dafür nicht extra in einem Register ablegen. Naja, ob er das bei einer 
volatile-Variable trotz Nichtgebrauch machen soll, darüber lässt sich 
trefflich streiten :-)

>     low = (uint8_t)word & (uint8_t)0xFF;

Deine Casts hier sind unnötig, da kannst Du auch direkt

      low = word;

schreiben. Es kommt auch derselbe Assembler-Output raus. Der Compiler 
muss einen 16-Bit-Wert in einen 8-Bit-Variable quetschen. Er macht genau 
dasselbe mit und ohne Maskierung und Cast.

>     high = (uint8_t)word >> 8;

Dein Cast hier ist falsch! Wenn Du einen 8-Bit-Wert (durch Deinen Cast) 
um 8 Bit nach rechts schiebst, kommt immer 0 raus ;-)

Beweis:

    high = (uint8_t)word >> 8;
  6a:  80 91 60 00   lds  r24, 0x0060
  6e:  90 91 61 00   lds  r25, 0x0061
  72:  10 92 62 00   sts  0x0062, r1

"word" wird nach r24/r25 geladen und anschließend wird in "high" das 
Register r1 (was wohl 0 ist) gespeichert.

Auch hier wird die volatile-Variable "word" geladen, obwohl sie danach 
komplett ignoriert wird.

Gruß,

Frank

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Frank M. (ukw) (Moderator)

13.09.2011 15:41

Lesenswert?

•

▲
▼

Johann L. schrieb:
> Sowas darf der Compiler garnicht "optimieren", weil es die
> volatile-Korrektheit zerstören würde.

Das sehe ich anders. Ich kann nicht erkennen, warum ein unnötiges Laden 
des Highbyte in ein Register bei

    low = word >> 8;

die "volatile-Korrektheit" mehr erhält als wenn er dieses unterlassen 
würde. Bei der union-Variante lädt er das Highbyte ja auch nicht.

Zur Erinnerung:

    high = word >> 8;
  6a:  80 91 60 00   lds  r24, 0x0060
  6e:  90 91 61 00   lds  r25, 0x0061
    high = HI8(word);
  7e:  80 91 61 00   lds  r24, 0x0061


Meines Erachtens ist der Befehl an der Stelle 6a: hyperfluid - egal, ob 
volatile oder nicht.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Frank M. (ukw) (Moderator)

13.09.2011 15:50

Lesenswert?

•

▲
▼

Hier noch ein anschaulicher Knüller:

#include <inttypes.h>
volatile uint8_t low;
volatile uint32_t longword = 0x12345678;
int main ()
    low = longword >> 24;


Ergebnis:

int main ()
    low = longword >> 24;
  5e:  80 91 60 00   lds  r24, 0x0060
  66:  a0 91 62 00   lds  r26, 0x0062
  6a:  b0 91 63 00   lds  r27, 0x0063
  6e:  8b 2f         mov  r24, r27
  72:  aa 27         eor  r26, r26
  74:  bb 27         eor  r27, r27
  7a:  80 e0         ldi  r24, 0x00  ; 0
  7c:  90 e0         ldi  r25, 0x00  ; 0


Es werden hier also alle 4 Byte von "longword" in Register geladen. 
Anschließend wird das Register, welches das oberste Byte beherbergt, in 
ein 5. Register umgeladen, danach werden die anderen 3 Register 
gelöscht(!) und letztendlich wird das Register r24 dann in low 
gespeichert. Das könnte man reduzieren auf 2 Zeilen:

  lds  r24, 0x0063
  sts  0x0064, r24

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Jörg W. (dl8dtl) (Moderator)

13.09.2011 16:04

Lesenswert?

•

▲
▼

Frank M. schrieb:
> Das sehe ich anders. Ich kann nicht erkennen, warum ein unnötiges Laden
> des Highbyte in ein Register bei
>
>     low = word >> 8;
>
> die "volatile-Korrektheit" mehr erhält als wenn er dieses unterlassen
> würde.

Wenn "word" volatile markiert ist, dann zwingst du damit den
Compiler, es auf jeden Fall komplett zu lesen, mit allen Bits,
egal, ob sie danach gebraucht werden oder nicht.  Denn volatile
besagt ja genau das: "Tu, was ich dir hingeschrieben habe, egal
ob du denkst, dass das nützlich ist."

> Bei der union-Variante lädt er das Highbyte ja auch nicht.

Weil dort dein Typecast-Gewurschtel dem Compiler exakt sagt, dass
er nur 8 bit davon lesen soll.

Frank M. schrieb:
> Es werden hier also alle 4 Byte von "longword" in Register geladen.

Der "Knüller" daran ist nur, dass du offenbar die Semantik hinter
volatile einfach nicht verstanden hast.  Du kannst nicht mit volatile
die Optimierung unterdrücken und dich anschließend drüber aufregen,
dass er nicht optimiert.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von (prx) A. K. (prx)

13.09.2011 16:12

Lesenswert?

•

▲
▼

Frank M. schrieb:

> Das sehe ich anders. Ich kann nicht erkennen, warum ein unnötiges Laden
> des Highbyte in ein Register bei

Denk beispielsweise an I/O-Register, bei denen der Lesevorgang selbst 
schon was auslöst, wie bei den 16-Bit Timern vom AVR. Wenn du da den 
ersten der beiden Ladebefehle weglässt, dann liest der zweite Ladebefehl 
Unsinn.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Frank M. (ukw) (Moderator)

13.09.2011 16:14

Lesenswert?

•

▲
▼

Jörg Wunsch schrieb:
> Wenn "word" volatile markiert ist, dann zwingst du damit den
> Compiler, es auf jeden Fall komplett zu lesen, mit allen Bits,
> egal, ob sie danach gebraucht werden oder nicht.  Denn volatile
> besagt ja genau das: "Tu, was ich dir hingeschrieben habe, egal
> ob du denkst, dass das nützlich ist."

Dann habe ich "volatile" bisher falsch verstanden. Ich dachte bisher, 
ich sage damit dem Compiler:

"Der Wert dieser Variablen kann sich während der Verarbeitung ändern. Du 
musst ihn also immer neu lesen und darfst ihn nicht (über Register) 
cachen".

Danke, da habe ich wieder etwas dazugelernt :-)

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Frank M. (ukw) (Moderator)

13.09.2011 16:16

Lesenswert?

•

▲
▼

A. K. schrieb:
> Denk beispielsweise an I/O-Register, bei denen der Lesevorgang selbst
> schon was auslöst, wie bei den 16-Bit Timern vom AVR. Wenn du da den
> ersten der beiden Ladebefehle weglässt, dann liest der zweite Ladebefehl
> Unsinn.

Vielen Dank für das plastische Beispiel des I/O-Registers. Das hat mich 
endgültig überzeugt.

Bisher konnte ich mir einfach kein Szenario vorstellen, wie die 
Daten-Integrität eines volatiles verletzt werden könnte, wenn man auf 
das Lesen einzelner Bytes desselben verzichtet. Klar, bei einem 
I/O-Register wäre das u.U. fatal.

Man lernt nie aus :-)

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Frank M. (ukw) (Moderator)

13.09.2011 16:29

Lesenswert?

•

▲
▼

Sorry, ich muss jetzt doch noch mal quengeln ;-)

Ich habe jetzt alle volatiles entfernt. Leider werden immer noch alle 
Bytes der 32-Bit-Variablen gelesen, obwohl sie nicht genutzt werden.

Code:

#include <inttypes.h>
uint8_t     low;
uint32_t    longword = 0x12345678;
uint8_t     low2;
uint32_t    longword2 = 0x12345678;
typedef union
  uint16_t _w;
  uint8_t _a[4];
} tBuffer32;
#define HI8L(lw) (((tBuffer32*)(&lw))->_a[3])
int main ()
    low = HI8L(longword);
    low2 = longword2 >> 24;


Ergebnis:

int main ()
    low = HI8L(longword);
  5e:  80 91 63 00   lds  r24, 0x0063
    low2 = longword2 >> 24;
  6a:  90 91 65 00   lds  r25, 0x0065
  6e:  a0 91 66 00   lds  r26, 0x0066
  76:  8b 2f         mov  r24, r27
  7a:  aa 27         eor  r26, r26
  7c:  bb 27         eor  r27, r27
  82:  80 e0         ldi  r24, 0x00  ; 0
  84:  90 e0         ldi  r25, 0x00  ; 0


Das Makro machts also in 2 Zeilen (wie eigentlich erwartet), der Shift 
braucht unverändert dafür 9 Zeilen - auch ohne volatile.

Ich schiebe das jetzt mal auf die schlechte Unterstützung des gcc von 
8-Bit-Prozessoren.... und finde mich damit ab :-)

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Johann L. (gjlayde)

13.09.2011 19:38

Lesenswert?

•

▲
▼

Frank M. schrieb:
> Sorry, ich muss jetzt doch noch mal quengeln ;-)
>
> Ich habe jetzt alle volatiles entfernt. Leider werden immer noch alle
> Bytes der 32-Bit-Variablen gelesen, obwohl sie nicht genutzt werden.

Also mein avr-gcc macht die Zugriffe kurz:

extern char c;
extern unsigned long l;
void shift24 (void)
    c = l >> 24;
void shift16 (void)
    c = l >> 16;
char rshift24 (void)
    return l >> 24;
void shift25 (void)
    c = l >> 25;


Wird mit avr-gcc-4.6.1 -S -Os zu

  lds r24,l+3
  sts c,r24
  lds r24,l+2
  sts c,r24
rshift24:
  lds r24,l+3


> Ich schiebe das jetzt mal auf die schlechte Unterstützung des gcc von
> 8-Bit-Prozessoren.... und finde mich damit ab :-)

No, eher auf eine atwas angestaubte avr-gcc Version. Im avr-Backend 
gibt's dafür keine Zauberei, es wird alles im maschinenunabhängigen Teil 
erledigt.

Wenn allerdings nicht auf einzelne Bytes zugegriffen wird, wie das bei 
shift25() der Fall ist, wird's länglich: Laden, Shiften, Speichern; fein 
säuberlich getrennt:

  lds r24,l
  lds r25,l+1
  lds r26,l+2
  lds r27,l+3
  ldi r18,25
1:  lsr r27
  ror r26
  ror r25
  ror r24
  dec r18
  brne 1b
  sts c,r24


Wer das im avr-Backend (oder sonstwo in GCC) smarter machen will, kann 
es gerne tun. Mir ist das Feld zu schwierig, und mit meinem momentanen 
Wissensstand über GCC und Zeit, die ich in der Lage bin, darin zu 
investieren, werde ich es nicht anfassen.

Vor einiger Zeit gab es einen ähnlich gelagerten Optimierungsfall ohne 
Shift; was daraus geworden ist, weiß ich nicht. Wahrscheinlich nix.
  http://lists.gnu.org/archive/html/avr-gcc-list/2011-05/msg00001.html

Und für 16-Bit Linksshifts, von denen der High-Teil nicht verwendet 
wird, hat's immerhin 4½ Jahre gebraucht...

http://gcc.gnu.org/PR29560

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Frank M. (ukw) (Moderator)

13.09.2011 19:58

Lesenswert?

•

▲
▼

Johann L. schrieb:
> Also mein avr-gcc macht die Zugriffe kurz:
> [...]
> Wird mit avr-gcc-4.6.1 -S -Os zu
> [...]

Gibt es eine einfache Möglichkeit, den avr-gcc-4.6.1 mit dem AVR Studio 
4 für Windows zu verheiraten?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Johann L. (gjlayde)

13.09.2011 21:08

Lesenswert?

•

▲
▼

Jörg Wunsch schrieb:
> Johann L. schrieb:
>> bzw. was
>> sie/jemand mit diesem Silizium [ATtiny] + GCC will.
>
> Naja, auch dort hast du bei einer Produktentwicklung in C eine bessere
> Kosteneffizienz, nicht nur bei der Erstellung, sondern auch bei der
> Pflege.  (Außerdem soll's die Teile ja am Ende wohl bis zu einem
> ATtiny40 geben.)
>
> Was ich mir bei derart kleinen Controllern gut vorstellen kann ist,
> dass sie einen Markt im sicherheitstechnischen Bereich haben: eine
> Firmware dieser Dimension lässt sich mit brauchbarem Aufwand noch
> komplett testen, mit all ihren Eventualitäten.

Gibt für größere AVRs oder andere µC aber ebenso; ein Programm wird ja 
nicht deshalb besser statisch analysierbar, daß man das Silizium bis zur 
Unkenntlichkeit eindampft. Ich tippe eher auf Billigkram auf China wo's 
auf 1/100 Cent ankommt.

Für Sicherheitstechnik fürde ich auch nicht einen neuen Core einsetzen 
sondern einen, wo man sich halbwegs sicher sein kann, daß alle 
Silicon-Bugs bekannt sind. Zudem evtl. Radiation Hardening oder was auch 
immer und in dem Bereich wird eh nicht so gebitpopelt, zB keine 
Optmiierung im Compiler erlaubt, etc.

>>> Ich tu' mir vieles im Opensource-Bereich an, aber da muss ich
>>> leider auch passen.  So wird es (leider) auch einigen anderen gehen,
>>
>> Schade eigentlich. Aber bei dir denk ich daß du ansonsten schon genug
>> Projekte am Bein hast.
>
> Ja, das ohnehin.  Außerdem darfst du nicht vergessen: ich bein /kein/
> Informatiker, ich bin Elektronikingenieur (eigentlich Elektronik-
> technologe).

Informatiker bin ich auch nicht, ich komm von der Algebraische 
Zahlentheorie her.

> Insofern fehlen mir einfach mal einige wesentliche Grundlagen im
> Hinblick auf Compiler-Architektur, und ich habe weder Zeit noch
> Nerven, das nachzuholen.

Davon muss man zum Glück nicht viel wissen, wenn man nur ein Backend 
etaw aufpolieren möchte. Zazu muss man nicht im Gedärm von GCC 
rumrühren.

>> Atmel macht hier vermutlich den Fehler zu glauben, einen Entwickler
>> einfach einkaufen zu können. Stattdessen muss hier auch kontinuerlich
>> daran gearbeitet werden, ein eigenes Compilerteam aufzubauen und eine
>> Mindestmaß an kritischer Masse zu erreichen, um
>> Compilerentwicklung/anpassung sinnvoll zu machen.
>
> Es ist wohl in einer Firma, die sich als Hardwarehersteller sieht,
> nicht ganz einfach, in der Chefetage die Notwendigkeit von Kompetenz
> im Softwarebereich ins Blickfeld zu rücken.  Kommt hinzu, dass AVR
> historisch ja überhaupt nicht in Richtung GCC geguckt hat, sondern
> sich erstmal voll auf IAR stützen wollte [...], und es hat einige
> Jahre gedauert, bis Atmel dann erkannt hat, wie viel ihnen dieses
> Teil an Reputation und damit perspektivisch auch an Gewinn wirklich
> bringt.

Hätten sie besser mal Wikipedia gelesen ;-)

GCC has been ported to a wide variety of processor architectures, and
is widely deployed as a tool in commercial, proprietary and closed
source software development environments. GCC is also available for
most embedded platforms, for example [...] The compiler can target a
wide variety of platforms, including [...]. Several companies make a
business out of supplying and supporting GCC ports to various
platforms, and chip manufacturers today consider a GCC port almost
essential to the success of an architecture.


> Der AVR-GCC ist eine reine Community-Entwicklung

Keine Ahnung, wer was warum macht im GCC. Jedenfalls gehort einiges 
dazu, gcc für ein neues Target anzupassen, als Hobby hat Denis das 
garantiert nicht gemacht.

Übrigens ist avr-gcc bereits über 11 Jahre alt. Das avr-Backend wurde am 
11. Februar 2000 eingespielt, allerdings noch als Frau ohne Unterleib; 
letzerer kam dann am 16. Februar hinzu:

http://gcc.gnu.org/viewcvs?view=revision&revision=31935
http://gcc.gnu.org/viewcvs?view=revision&revision=32002

>> Ansonsten ist das AVR-Backend quasi tot. Anatoly ist nicht mehr aktiv
>> und Andy Hutchinson seit Jahren nicht mehr gesehen. Eric fügt
>> bestenfalls neue copy-paste Derivate ein und Denis beschränkt sich aufs
>> Review der spärlichen Patches (immerhin!).
>
> Denis als ursprünglicher Autor hatte sich von AVR eigentlich komplett
> zurückgezogen und mittlerweile andere GCC-Backends gebastelt
> (möglicherweise bezahlt, keine Ahnung).

Weißt du für welche Maschine(n)? Würd mich interessieren. Ansonsten ist 
Klatsch und Tratsch nicht so mein Metier :-)

> Aber es soll ja da noch einen Johann-Georg geben, der mittlerweile
> sehr aktiv ist. :-)  So wechseln halt die Gesichter über die Jahre,
> und das ist meines Erachtens das beste Zeichen dafür, dass es durchaus
> am Leben ist.

Naja, das ist Tropfen auf den heißen Stein, die wirklichen Nüsse sind so 
nicht zu knacken. Das würde locker eine volle Stelle abgeben.

Adacore mischt doch bei avr/gcc mit (GNAT etc.), warum versucht's Atmel 
nicht mal bei denen...?

Frank M. schrieb:
> AVR Studio
¿¿¿ Was ist AVR Studio???

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Johann L. (gjlayde)

13.09.2011 21:49

Lesenswert?

•

▲
▼

Johann L. schrieb:

> Ok... hab's mit mal im Detail angeschaut für folgenden Code (modulo
> Tippfehler):

>#define umul_hi(a,b) \
> ({ uint8_t _c; \
>    asm ("mul %1, %2"  "\n\t"\
>         "mov %0, R1"  "\n\t"\
>         "clr __zero_reg__"\
>         : "=r" (_c) : "r" ((char) a), "r" ((char) b));\
>         _c;})
>  #define umul_hi(a,b) \
>   ({ uint8_t _a=a, _b=b; \
>      uint8_t _c=_a*_b; _c;})
>  #endif


Muss natürlich heissen

#define umul_hi(a,b) \
 ({ uint8_t _c, _a=(a), _b=(b); \
    asm ("mul %1, %2"  "\n\t"\
         "mov %0, R1"  "\n\t"\
         "clr __zero_reg__"\
         : "=r" (_c) : "r" ((char) _a), "r" ((char) _b));\
         _c;})
#define umul_hi(a,b) \
 ({ uint8_t _a=a, _b=b; \
    uint16_t _c=_a*_b; _a=_c>>8; _a;})

Warum sagt denn keiner was? ;-)

Damit ist die Zeitmessung Makulatur, also nochmal:

avr-gcc -Os -mmcu=atmega8 (Größe in Bytes)

         Asm    ohne Asm


Irgendwie kann ich diese Ergebnisse nicht ganz glauben, bzw. daß es so 
große Unterschiede zwischen den Compiler-Versionen gibt und daß 
Inline-Assembler das Resultat verschlechtert (vermultich weil kein CSE 
mehr möglich ist. Hier stirbt gerade eine Legende ;-)

... 4.3 zeigt eine nicht gerade überzeugende Registeralliokierung, da 
ist 4.5 merklich besser, allerdings stolpert der über fake X-addressing 
(PR46278). 4.6 sieht brauchbar aus. Das Ergebnis für 4.3 im Vergleich 
mit 3.4 ist plausibel: 3.4 war keine schlechte Version, allerdings kann 
er noch kein SSA und macht viele Operationen unnötigerweise als int – 
liegt aber dennoch vor 4.3.

Was 4.7 so treibt, danach schau ich mal die Tage.  Momentan ist eine 
Optimierung in der Mache, die nochmals ein paar Bytes/Ticks soll.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Jörg W. (dl8dtl) (Moderator)

13.09.2011 21:51

Lesenswert?

•

▲
▼

Johann L. schrieb:

> Gibt für größere AVRs oder andere µC aber ebenso; ein Programm wird ja
> nicht deshalb besser statisch analysierbar, daß man das Silizium bis zur
> Unkenntlichkeit eindampft.

Nein, aber dadurch, dass es insgesamt klein bleibt.  Wenn man aber
sowieso klein bleiben muss für eine bestimmte Aufgabe, dann kann
man auch das Silizium klein machen und damit billig.

> Ich tippe eher auf Billigkram auf China wo's
> auf 1/100 Cent ankommt.

Nicht nur in China wird billig gebaut. ;-)

> Hätten sie besser mal Wikipedia gelesen ;-)

Gab's damals noch nicht. ;-)

>> Der AVR-GCC ist eine reine Community-Entwicklung
>
> Keine Ahnung, wer was warum macht im GCC. Jedenfalls gehort einiges
> dazu, gcc für ein neues Target anzupassen, als Hobby hat Denis das
> garantiert nicht gemacht.

Da hab' ich keine Ahnung.  Von Anatoly kann ich dir mit Sicherheit
sagen, dass er das nur als Hobby gemacht hat, denn mit ihm habe ich
mich schon unterhalten können (so gut wie's geht: er kann zwar
Englisch lesen und schreiben, aber nur mit Wörterbuch, sodass wir
uns für die mündliche Kommunikation weitgehend auf mein ziemlich
rostiges Russisch stützen mussten ;-).  Bei Marek Michalkiewicz
bin ich mir auch einigermaßen sicher, dass er das damals alles als
studentisches Freizeitprojekt gemacht hat.  Nach dem Studium ist er
dann zu Intel und hat sich aufgrund irgendwelcher Klauseln in seinem
Arbeitsvertrag dann lieber aus der Opensource-Welt zurückgezogen.

> Übrigens ist avr-gcc bereits über 11 Jahre alt.

Ja, ohne das genaue Datum zu kennen, hatte ich das so ungefähr im
Gefühl.  Ich habe Ende des Jahres nach langer Abstinenz in diesem
Bereich ein Controller-Projekt mit einem PIC gemacht.  Das war,
nach all den vielen Jahren, die ich zuvor in C, C++ oder Skript-
sprachen programmiert habe, so frustrierend, den Assemblerhaufen
zum Spielen zu bekommen, dass ich mir vorgenommen habe, dass mein
nächster Controller einer mit einem C-Compiler sein wird.  Aufgrund
weiterer Randbedingungen (sollte nach Möglichkeit Opensource sein,
Pflichtforderung war Lauffähigkeit auf FreeBSD) bin ich dann beim
AVR mit seinem noch vergleichsweise jungen Port von GCC, binutils
(immerhin schon, davor wurde ja nur mit AVRa assembliert) und den
Anfängen der avr-libc gelandet.

>> Denis als ursprünglicher Autor hatte sich von AVR eigentlich komplett
>> zurückgezogen und mittlerweile andere GCC-Backends gebastelt
>> (möglicherweise bezahlt, keine Ahnung).
>
> Weißt du für welche Maschine(n)?

Hab' ich vergessen.  Wenn man jetzt nach seinem Namen gugelt, scheint
er vor allem bei OpenERP zugange zu sein.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Frank M. (ukw) (Moderator)

14.09.2011 08:45

Angehängte Dateien:

avr-studio.png
41 KB

Lesenswert?

•

▲
▼

Johann L. schrieb:
> Frank M. schrieb:
>> AVR Studio
> ¿¿¿ Was ist AVR Studio???

Die IDE von ATMEL, in welcher standardmäßig avr-gcc 4.3.3 verwendet 
wird.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Oliver (Gast)

14.09.2011 08:54

Lesenswert?

•

▲
▼

Frank M. schrieb:
> Johann L. schrieb:
>> Frank M. schrieb:
>>> AVR Studio
>> ¿¿¿ Was ist AVR Studio???
>
> Die IDE von ATMEL, in welcher standardmäßig avr-gcc 4.3.3 verwendet
> wird.

Na ja, erstens weiß der Johann das, und zweitens ist die Antoert in 
Bezug auf das Studio 4 falsch. Das Studio 4 ist völlig unabhängig von 
irgend einem avr-gcc. Das ruft lediglich über ein plugin den avr-gcc, 
der gerade auf dem System installiert ist, auf. Die Compilerveriosn ist 
dem Studio 4 egal.

Oliver

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Frank M. (ukw) (Moderator)

14.09.2011 09:14

Lesenswert?

•

▲
▼

Oliver schrieb:
> Na ja, erstens weiß der Johann das,

Das hab ich befürchtet. Angesichts der multiplen Fragezeichen von Johann 
war ich dann aber doch etwas verunsichert. Offenbar waren das versteckte 
Ironie-Tags ;-)

> und zweitens ist die Antoert in
> Bezug auf das Studio 4 falsch. Das Studio 4 ist völlig unabhängig von
> irgend einem avr-gcc. Das ruft lediglich über ein plugin den avr-gcc,
> der gerade auf dem System installiert ist, auf. Die Compilerveriosn ist
> dem Studio 4 egal.

Das dachte ich mir bereits. Damit reduziert sich meine ursprüngliche 
Frage auf die unausgesprochenen Worte: Wo bekomme ich den avr-gcc-4.6.1 
für Windows her? Auf Sourceforge finde ich nur einen WinAVR vom 
20.01.2010. Das ist aber meines Wissens nach die gcc-Version 4.3.3, die 
ich schon habe.

Gruß,

Frank

Edit:

Habs gefunden: Beitrag "avr-gcc 4.6.1 für Windows"

Danke

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Jörg W. (dl8dtl) (Moderator)

14.09.2011 09:19

Lesenswert?

•

▲
▼

Frank M. schrieb:
> Wo bekomme ich den avr-gcc-4.6.1
> für Windows her?

Wahrscheinlich da, wo Johann seine Version auch herbekommen hat: aus
dem Quellcode.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Frank M. (ukw) (Moderator)

14.09.2011 09:58

Lesenswert?

•

▲
▼

Jörg Wunsch schrieb:
> Wahrscheinlich da, wo Johann seine Version auch herbekommen hat: aus
> dem Quellcode.

Danke, das weiß ich auch ;-) Bereits 1985 habe ich den gcc als 
CrossCompiler für VME-Bus-Systeme ohne jegliches Betriebssystem auf 
UNIX-System-V-Rechner portiert. Wie das geht, weiß ich also auch. Aber 
es ist Arbeit ;-)

Und im fortgeschrittenen Alter wird man da etwas "fauler" und schaut 
erstmal, ob es nicht schon einer gemacht hat. Daher meine Frage. Ich bin 
auch unter

  Beitrag "avr-gcc 4.6.1 für Windows"

fündig geworden. Mittlerweile habe ich den avr-gcc-4.6.1 laufen und 
direkt erste Tests gemacht: Johann hat recht, der "neue" gcc reduziert 
tatsächlich die byteweisen Shifts auf 2 Befehle. Sehr schön. Schade, 
dass avr-size wegen -C noch nicht funktioniert. So hätte ich direkt mal 
fertige AVR-Projekte von der Größe her vergleichen können.

So warte ich jetzt ungeduldig auf den avr-gcc-4.6.2, welcher dann wohl 
als nächste WinAVR-Version rauskommen soll - so wie ich das verstanden 
habe.

Vielen Dank an Johann.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Jörg W. (dl8dtl) (Moderator)

14.09.2011 10:27

Lesenswert?

•

▲
▼

Frank M. schrieb:
> Schade,
> dass avr-size wegen -C noch nicht funktioniert.

Dann lass das blöde -C weg.  Nimm die Standardeinstellung, und
vergleich die paar Zahlen im Kopf.  Ich fand diesen Hack von Eric
schon immer gruselig, vor allem deshalb, weil er absolut keine
Chance hat, jemals seinen Weg in die binutils zu finden.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Johann L. (gjlayde)

14.09.2011 19:26

Angehängte Dateien:

madd-b.s (3,49 KB)

Lesenswert?

•

▲
▼

Johann L. schrieb:
> avr-gcc -Os -mmcu=atmega8 (Größe in Bytes)

>          Asm    ohne Asm


hmmm. ich hab das mal mit einem nativ generierten avr-gcc-4.6.2-exp 
erzeugt (oben ist -rc1), dafür bekomme ich

           Asm    ohne Asm
6.1-rc1 186    160
6.2-exp 186    190
7.0-exp 184    190

Das -exp steht füht "experimental" und -rc für "release candidate". 
Irgendwas scheint im 4.6 faul zu sein.

Frank M. schrieb:
>   Beitrag "avr-gcc 4.6.1 für Windows"

Das ist nur eine prerelease zu Rumspielen und dafür, sich den Compiler 
vor der geplanten WinAVR-Release mal näher betrachten zu begutachten zu 
können. Die "Release Notes" stehen in dem Link zu avr-freaks.

Inzwischen wurde schon einige Fehler behoben, siehe avr-gcc Bugs im 
Wiki.

Frank M. schrieb:
> Mittlerweile habe ich den avr-gcc-4.6.1 laufen

Macht er wenigstens, was er soll? Der Unterschied 160 (die Version -rc1, 
die du hast) und -exp dürften eigentlich kein Unterschied zeigen.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Frank M. (ukw) (Moderator)

14.09.2011 20:41

Lesenswert?

•

▲
▼

Johann L. schrieb:
> Das ist nur eine prerelease zu Rumspielen und dafür, sich den Compiler
> vor der geplanten WinAVR-Release mal näher betrachten zu begutachten zu
> können. Die "Release Notes" stehen in dem Link zu avr-freaks.

Ja, ich hatte gelesen, dass es sich um eine RC1 handelte.

> Macht er wenigstens, was er soll? Der Unterschied 160 (die Version -rc1,
> die du hast) und -exp dürften eigentlich kein Unterschied zeigen.

Ich hatte es nur mal angetestet mit den obigen Codebeispielen. Ich werde 
in den nächsten Tagen mal einige Projekte (IRMP, SOUNDRX, MCURSES) mit 
dem avr-gcc-4.6.1 übersetzen und durchchecken. Kann aber etwas dauern, 
bis ich dazu komme.

Gruß,

Frank

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: direkter Zugriff auf Low/High Byte von 16bit-Werten

von Johann L. (gjlayde)

14.09.2011 21:06

Angehängte Dateien:

putdec.c (2,58 KB) | Codeansicht

Lesenswert?

•

▲
▼

Johann L. schrieb:

>            Asm    ohne Asm
>  4.6.1-rc1 186    160
>  4.6.2-exp 186    190
>  4.7.0-exp 184    190

War wohl nur der Tipp-Teufel: avr-gcc-4.6.1-rc1 bringt ebenfalls 190 
Bytes ohne Asm. Hier nochmal die komplette Liste ohne Tippos:

            Asm    ohne Asm
4.7.0-exp   184    190

Und anbei die Quelle, die ich verwendete, einmal mit -Os -mmcu=avr4 
-DX=0 (ihne Asm) und einmal mit -Os -mmcu=avr4 -DX=1 (mit Asm).

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Forum: Compiler & IDEs direkter Zugriff auf Low/High Byte von 16bit-Werten