skip to main content

kiesler.at

Codeoptimierung mit BURG
updated by rck, 2006-03-26

Im Sommersemester 2004 galt es, wie schon viele Jahre davor, im Rahmen der Übung Übersetzerbau einen codeerzeugenden Compiler zu schreiben und zu optimieren. Ich möchte hier ein paar der von mir eingesetzten naheliegenden und weniger naheliegenden Tricks vorstellen.

1 | 2 | 3 | 4 | 5 | 6 | 7

Das Rückgaberegister

Ich habe so geschwollen formuliert "die Nummerierung der Register beginnt bei 0". Ja und, wir verwenden Register 0 ja gar nicht als Arbeitsregister!

Stimmt, doch das werden wir gleich ändern. 0 ist unser Rückgaberegister und als solches in jeder Funktion präsent. Zumindest in unserem Mini-Compiler, der keine void-Funktionen kennt.

Hier sehen wir: Es hat sich ausgezahlt, den Registercheck mit -1 zu machen. Noch besser, man tut das gleich von Anfang an, im Gegensatz zu mir... ;-)

21 int free_registers[]=           { 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1 };
22 const int register_nr[]=        { 0, 1, 2, 3, 4, 5, 6, 7, 8,22,23,24,25 };
23 const int register_amount=      13;

In der Registerbibliothek ändert sich nicht viel, das Knoten einhängen darf allerdings auch nicht vergessen werden:

21 treenodep newRegLeaf(int regnr) {
22         treenodep newNode = malloc(sizeof(treenode));
23 
24         if (newNode == NULL) yyerror("can't malloc");
25 
26         newNode->op = AREG;
27         newNode->left = newNode->right = NULL;
28         newNode->regnr = regnr;
29 
30         return newNode;
31 }
32 
33 treenodep newConstLeaf(int val) {
34         treenodep newNode = malloc(sizeof(treenode));
35 
36         if (newNode == NULL) yyerror("can't malloc");
37 
38         newNode->op = AREG;
39         newNode->left = newNode->right = NULL;
40         newNode->num = val;
41         newNode->regnr = -1;
42 
43         return newNode;
44 }

Wir sehen hier auch gleich: Bei mir haben Konstanten und Register die gleiche Operation. Könnte man aufsplitten, wäre im BURG angenehmer zu Optimieren. Habe ich aber nicht gemacht, passiert bei mir alles in node_xxx() und funktioniert recht effizient.

Einfaches Beispiel: add

Wir haben kaum was optimiert (eigentlich nichts) und haben doch schon Code, der ziemlich "tight" ist. So soll es sein. Hier als Beispiel der von add erzeugte Code:

Anmerkung: Im Sommersemester 2004 gab es eine Typunterscheidung, die geprüft werden muß (blbs). Bit 0 gelöscht: Zahl, Bit 0 gesetzt: Liste.

==========> Eingabe von /usr/ftp/pub/ublu/test/code/c5.xin:
$17+1

Übersetzung: Status korrekt

Ausgabe:
blbs $17, raisesig
addq $17, 2, $0

Übersetze und linke das Testprogramm:

Rufe folgendes Codefragment auf:
return testasm (a, b, c, d), 0;

Konsequenz: Für add ist der Code bereits maximal optimiert. Dazu tragen allerdings natürlich auch die Routinen print_add_* bei, die ich im folgenden vorstellen möchte.

1 | 2 | 3 | 4 | 5 | 6 | 7



RSSComments - Make a comment
The comments are owned by the poster. We are not responsible for its content.
  • Prototypes

    Posted on 2004-06-03 11:43:21 By Anonymous

    changed On 2004-06-03 12:32:28 Edited By rck (reason: versehentlich original-Kommentar von Gergo durch meinen Ersetzt. Hier wieder sein Kommentar. Sorry!)

    Prototypes
    Gesendet am: 2004-06-03 11:43:21 von: Anonymous

    Im Jahr 1989 wurde die Programmiersprache C in den USA von ANSI standardisiert, 1990 wurde dieser Standard von ISO als internationale Norm verabschiedet. Schon in diesem C89-Standard galten Funktionsdefinitionen ohne Protype (d.h. ohne explizite Angabe von Rückgabe- und Parametertypen) als "obsolescent feature". Eine Definition wie "alloc_register() {" ist also bereits seit 15 Jahren veraltet!
    Der neue C-Standard, C99, läßt überhaupt keine Funktionsdefinition ohne Prototype mehr zu. Es empfiehlt sich daher, in allen neu geschriebenen Programmen auf Prototypes zu achten und die Funktion explizit als "int alloc_register(void)" zu deklarieren. Das ist nicht bloß eine Stilfrage, dadurch ermöglicht man dem Compiler ja erst anständiges type checking.
    Der Preis: Man muß etwas mehr tippen. Das sollte es uns aber schon wert sein ;-)

    Gergo

    [Reply ]

    • Re: Prototypes

      Posted on 2004-06-03 12:31:28 By rck[110]

      Hallo Gergo! Herzlichen Dank für Deinen Kommentar.

      die Funktion explizit als "int alloc_register(void)" zu deklarieren. Das ist nicht bloß eine Stilfrage, dadurch ermöglicht man dem Compiler ja erst anständiges type checking.

      hmm. Ich hab durchaus Prototypen geschrieben, in die .h Datei, wo sie hingehören. Ein Auszug:

      1 /*              the assembler codegenerator,
      2                 to keep the bfe file tidy.
      3 
      4                 http://www.kiesler.at/
      5 */
      6 
      7 
      8 int print_not(int rs1, int rd);
      9 int print_not_const(int const, int rd);
      10 
      11 int print_neg(int rs1, int rd);
      12 int print_neg_const(int const, int rd);
      13 
      14 int print_head(int rs1, int rd);
      15 int print_tail(int rs1, int rd);
      16 int print_islist(int rs, int rd);
      17 
      18 int print_add(int rs1, int rs2, int rd);
      19 int print_add_const(int rs1, int const, int rd);
      20 int print_add_const_const(int const1, int const2, int rd);
      21 
      22 int print_mul(int rs1, int rs2, int rd);
      23 int print_mul_const(int rs1, int const, int rd);
      24 int print_mul_const_const(int const1, int const2, int rd);
      25 
      26 int print_add(int rs1, int rs2, int rd);
      27 int print_add_const(int rs1, int const, int rd);
      28 int print_add_const_const(int const1, int const2, int rd);


      ist das lesbarer als:

      17 /*              arithmetics
      18 
      19                 our mini-compiler only supports
      20                 add, negate and multiply.
      21 
      22 */
      23 
      24 node_add(treenodep a, treenodep b, treenodep dest);
      25 node_mul(treenodep a, treenodep b, treenodep dest);
      26 node_neg(treenodep a, treenodep b, treenodep dest);


      ? Stelle ich zur Diskussion, imho nicht. "Richtig" wäre wahrscheinlich sogar, statt der ints überall ein void hinzuschreiben. Dem Compiler ist das aber Wurst.

      Gleichzeitig stelle ich mir die Frage: Ändert das was an der Wartbarkeit? Habe ich davon einen Mehrwert? Wird dadurch mein erzeugter Code schneller? Was hab ich überhaupt davon, wenn ich explizit einen Rückgabetyp hinschreiben?

      Ich persönlich habe lieber übersichtlichen, kompakten Code. Vergleiche zB mal das Mini-Tutorial zu BURG mit folgendem Snippet aus meinem Code:

      22 start:  ARETURN(regnr)          # 1 #   node_return(LEFT_CHILD(this));
      23 
      24 regnr:  AADD(regnr, regnr)      # 3 #   node_add(LEFT_CHILD(this), RIGHT_CHILD(this), this);
      25 regnr:  AAND(regnr, regnr)      # 3 #   node_and(LEFT_CHILD(this), RIGHT_CHILD(this), this);
      26 regnr:  AMUL(regnr, regnr)      # 3 #   node_mul(LEFT_CHILD(this), RIGHT_CHILD(this), this);


      ...was ist übersichtlicher?

      Bezüglich seit 15 Jahren obsolet: Ja, vielleicht. Eigentlich sollte MS-DOS auch seit ewig obsolet sein, jeder neue AMD64 Rechner hat trotzdem noch das dazu passende A20-Gate. Irgendwo eine philosophische Frage... // René!

      [Reply ]

      • Re: Prototypes

        Posted on 2004-06-03 13:20:35 By Anonymous

        changed On 2004-06-03 13:33:08 Edited By rck (reason: Code lesbarer gemacht)

        Du argumentierst leider etwas an meiner beabsichtigten Richtung vorbei: Ja, ob man jetzt explizit "int" als Rueckgabewert hinschreibt oder nicht, ist ziemlich egal.
        Der Mehrwert von Prototypes kommt aber nicht vom Rueckgabewert, sondern von den Parametern.
        Nimm zum Beispiel dieses Programm:


        1 #include <stdio.h>
        2 
        3 func_ohne_args()
        4 {
        5         puts("hallo, arglose welt!");
        6 }
        7 
        8 func_nimmt_float(f)
        9         float f;
        10 {
        11         printf("f ist: %f\n", f);
        12 }
        13 
        14 int main(void)
        15 {
        16         func_ohne_args();
        17         func_ohne_args(1);
        18         func_ohne_args(1,2);
        19 
        20         func_nimmt_float();
        21         func_nimmt_float(12345);
        22         func_nimmt_float("kernighan und ritchie");
        23         func_nimmt_float(3.14159);
        24         func_nimmt_float(3.14159, 2.7172);
        25 
        26         return 0;
        27 }

        und sag mir, ob du das so wartbar findest. (Und ob du ueber den Output ebenso erstaunt bist wie ich!) Mit anstaendigen Prototypen wuerden die falschen Aufrufe sofort vom Compiler erkannt werden, aber in C89 ist der Compiler dazu nicht verpflichtet (GCC tut's auch nicht). Ohne type checking stehst du ziemlich allein da.
        Und ja, es bringt auch einen Mehrwert, sich an Standards zu halten.

        Gergo

        [Reply ]

RSSAll Articles
2008, 2007, 2006, 2005, 2004