Compilerbau (Einführung)
Ein Schüler (Lukas) bat um eine Erklärung, wie ein Compiler (z.B. EOS programmiert wird. Leider pflegen alle Artikel, die ich dazu im Internet finde, einen recht theoretischen Zugang zum Thema. Daher möchte ich die Sache im Folgenden so erklären, wie ich sie (damals als Schüler in der 12. Jahrgangsstufe) an einem einfachen, in Pascal geschriebenen Compiler gelernt habe.
Ein Compiler ist ein Computerprogramm, das einen in einer Programmiersprache verfassten Programmtext einliest und in eine andere Programmiersprache umwandelt oder direkt ausführt. Er arbeitet üblicherweise in drei Schritten, die nacheinander ausgeführt werden:
- Lexer: Der Lexer zerlegt den Programmtext in die kleinsten syntaktisch sinnvollen Einheiten („Tokens“).
- Parser: Der Parser analysiert die Liste der Tokens und erstellt daraus eine strukturelle Repräsentation des Programms, üblicherweise einen Baum („Syntaxbaum“ oder „abstract syntax tree“ oder kurz: AST)
- Interpreter/Codegenerator: Ein Interpreter kann das als Parsebaum übergebene Programm direkt ausführen. Ein Codegenerator kann es in eine andere Programmiersprache (z.B. Maschinensprache) umwandeln.
Im Folgenden wird die Funktionsweise eines Compilers vorgestellt, der mathematische Terme (z.B. 2 * (3 + a) - b
) mit gegebenen Variablenbelegungen zur Laufzeit auswerten kann. In einem zweiten Schritt wird dieser Compiler zu einer einfachen Programmiersprache erweitert, die Wiederholungen, Zuweisungen und eine einfach Print-Anweisung enthält.
Hier schon mal der Quelltext zum ersten Compiler: Quelltext
Hier geht's zu den einzelnen Kapiteln:
- Die Schritte des Compilers