手动写编译器实现加减乘除运算
创始人
2024-02-15 09:18:13
0

众所周知啊(或许并不hh),写一个编译器需要词法、语法和代码生成这些部分。
本迷你编译器目的是接收一个算术表达式,生成汇编代码,并在linux上运行,从而生成结果。
如果没有Linux系统,可以把driver.c注释掉,在main里直接复制汇编代码文本,在虚拟机上跑。
为什么不写一个能在Windows上能直接跑出来的呢?因为我不会。。(众所周知啊,Linux和Windows所能接收的汇编语言是不一样的)

那么,什么是编译器?

C语言代码由固定的词汇按照固定的格式组织起来,简单直观,程序员容易识别和理解,但是对于CPU,C语言代码就是天书,根本不认识,CPU只认识几百个二进制形式的指令。这就需要一个工具,将C语言代码转换成CPU能够识别的二进制指令,也就是将代码加工成 .exe 程序;这个工具是一个特殊的软件,叫做编译器(Compiler)。

编译器能够识别代码中的词汇、句子以及各种特定的格式,并将他们转换成计算机能够识别的二进制形式,这个过程称为编译(Compile)。

编译也可以理解为“翻译”,类似于将中文翻译成英文、将英文翻译成象形文字,它是一个复杂的过程,大致包括词法分析、语法分析、语义分析、性能优化、生成可执行文件五个步骤,期间涉及到复杂的算法和硬件架构。对于学计算机或者软件的大学生,“编译原理”是一门专业课程,有兴趣的读者请自行阅读《编译原理》一书,这里我们不再展开讲解。

C语言的编译器有很多种,不同的平台下有不同的编译器,例如:

Windows 下常用的是微软开发的 cl.exe,它被集成在 Visual Studio 或 Visual C++ 中,一般不单独使用;

Linux 下常用的是 GUN 组织开发的 GCC,很多 Linux 发行版都自带 GCC;

Mac 下常用的是 LLVM/Clang,它被集成在 Xcode 中(Xcode 以前集成的是 GCC,后来由于 GCC 的不配合才改为 LLVM/Clang,LLVM/Clang 的性能比 GCC 更加强大)。

你的代码语法正确与否,编译器说了才算,我们学习C语言,从某种意义上说就是学习如何使用编译器,让编译器生成可执行程序(例如 Windows 下的 .exe 程序)。

编译器可以 100% 保证你的代码从语法上讲是正确的,因为哪怕有一点小小的错误,编译也不能通过,编译器会告诉你哪里错了,便于你的更改。

类的描述:Lexer提供词法,Parser提供语法,AstNode定义语法树为Parser服务,Print用来打印,CodeGen生成汇编代码,driver接收代码,main用来测试。
具体代码如下:
Lexer.h:

//
// Created by xiaoyu ren on 2022/11/21.
//#ifndef COMPILER_LEXER_H
#define COMPILER_LEXER_H
#include 
#include namespace compiler {enum class TokenKind{Add,Sub,Mul,Div,Num,Eof,Null};class Token{public:TokenKind kind;int value;std::string_view content;};class Lexer {private:std::string_view sourceCode;std::shared_ptr currentToken;char currentChar{' '};int cursor{0};public:Lexer(const char *code){sourceCode = code;}void GetNextToken();void GetNextChar();std::shared_ptr GetCurrentToken();};
}#endif //COMPILER_LEXER_H

Lexer.cpp:

//
// Created by xiaoyu ren on 2022/11/21.
//#include "Lexer.h"void compiler::Lexer::GetNextToken() {while (isspace(currentChar)){GetNextChar();}TokenKind kind = TokenKind::Null;int value = 0;int startPos = cursor -1;if (currentChar == '\0'){kind = TokenKind::Eof;}else if (currentChar == '+'){kind = TokenKind::Add;GetNextChar();}else if (currentChar == '-'){kind = TokenKind::Sub;GetNextChar();}else if (currentChar == '*'){kind = TokenKind::Mul;GetNextChar();}else if (currentChar == '/'){kind = TokenKind::Div;GetNextChar();}else if (std::isdigit(currentChar)){value = 0;kind = TokenKind::Num;do{value = value * 10 + currentChar - '0';GetNextChar();} while (isdigit(currentChar));} else {printf("error:invalid type\n");}currentToken = std::make_shared();currentToken->kind = kind;currentToken->value = value;currentToken->content = sourceCode.substr(startPos, cursor - startPos - 1);
}void compiler::Lexer::GetNextChar() {if (cursor >= sourceCode.size()){currentChar = '\0';cursor++;} else {currentChar = sourceCode[cursor++];}
}std::shared_ptr compiler::Lexer::GetCurrentToken() {return currentToken;
}

Parser.h:

//
// Created by xiaoyu ren on 2022/11/21.
//#ifndef COMPILER_PARSER_H
#define COMPILER_PARSER_H
#include "Lexer.h"
#include "AstNode.h"namespace compiler {class Parser {private:Lexer &lexer;std::shared_ptr ParseExpr();std::shared_ptr ParseAddExpr();std::shared_ptr ParseMulExpr();std::shared_ptr ParsePrimaryExpr();public:Parser(Lexer &lexer):lexer(lexer){}std::shared_ptr Parse();};
}#endif //COMPILER_PARSER_H

Parser.cpp

//
// Created by xiaoyu ren on 2022/11/21.
//#include "Parser.h"std::shared_ptr compiler::Parser::Parse() {auto node = std::make_shared();node->Lhs = ParseExpr();return node;
}std::shared_ptr compiler::Parser::ParseExpr() {return ParseAddExpr();
}std::shared_ptr compiler::Parser::ParseAddExpr() {std::shared_ptr left = ParseMulExpr();while (lexer.GetCurrentToken()->kind == TokenKind::Add || lexer.GetCurrentToken()->kind == TokenKind::Sub) {BinaryOperator binaryOperator = BinaryOperator::Add;if (lexer.GetCurrentToken()->kind == TokenKind::Sub){binaryOperator = BinaryOperator::Sub;}lexer.GetNextToken();auto node = std::make_shared();node->binaryOperator = binaryOperator;node->Lhs = left;node->Rhs = ParseMulExpr();left = node;}return left;
}std::shared_ptr compiler::Parser::ParseMulExpr() {std::shared_ptr left = ParsePrimaryExpr();while (lexer.GetCurrentToken()->kind == TokenKind::Mul || lexer.GetCurrentToken()->kind == TokenKind::Div) {BinaryOperator binaryOperator = BinaryOperator::Mul;if (lexer.GetCurrentToken()->kind == TokenKind::Div){binaryOperator = BinaryOperator::Div;}lexer.GetNextToken();auto node = std::make_shared();node->binaryOperator = binaryOperator;node->Lhs = left;node->Rhs = ParsePrimaryExpr();left = node;}return left;
}std::shared_ptr compiler::Parser::ParsePrimaryExpr() {auto node = std::make_shared();node->value = lexer.GetCurrentToken()->value;lexer.GetNextToken();return node;
}

AstNode.h:

//
// Created by xiaoyu ren on 2022/11/21.
//#ifndef COMPILER_ASTNODE_H
#define COMPILER_ASTNODE_H
#include namespace compiler {class AstVisitor;class AstNode {public:virtual ~AstNode(){};virtual void Accept(AstVisitor *visitor) {};};class ProgramNode : public AstNode{public:std::shared_ptr Lhs;void Accept(AstVisitor *visitor) override;};enum class BinaryOperator{Add,Sub,Mul,Div};class BinaryNode : public AstNode{public:BinaryOperator binaryOperator;std::shared_ptr Lhs;std::shared_ptr Rhs;void Accept(AstVisitor *visitor) override;};class ConstantNode : public AstNode{public:int value;void Accept(AstVisitor *visitor) override;};class AstVisitor{public:virtual void VisitorProgramNode(ProgramNode *node) {};virtual void VisitorBinaryNode(BinaryNode *node) {};virtual void VisitorConstantNode(ConstantNode *node) {};};
}#endif //COMPILER_ASTNODE_H

AstNode.cpp:

//
// Created by xiaoyu ren on 2022/11/21.
//#include "AstNode.h"void compiler::BinaryNode::Accept(compiler::AstVisitor *visitor) {visitor->VisitorBinaryNode(this);
}void compiler::ConstantNode::Accept(compiler::AstVisitor *visitor) {visitor->VisitorConstantNode(this);
}void compiler::ProgramNode::Accept(compiler::AstVisitor *visitor) {visitor->VisitorProgramNode(this);
}

Print.h:

//
// Created by xiaoyu ren on 2022/11/22.
//#ifndef COMPILER_PRINT_H
#define COMPILER_PRINT_H
#include "AstNode.h"namespace compiler {class Print : public AstVisitor {private:void VisitorBinaryNode(BinaryNode *node) override;void VisitorConstantNode(ConstantNode *node) override;public:void VisitorProgramNode(ProgramNode *node) override;};
}#endif //COMPILER_PRINT_H

Print.cpp:

//
// Created by xiaoyu ren on 2022/11/22.
//#include 
#include "Print.h"void compiler::Print::VisitorProgramNode(compiler::ProgramNode *node) {node->Lhs->Accept(this);printf("\n");
}void compiler::Print::VisitorBinaryNode(compiler::BinaryNode *node) {node->Rhs->Accept(this);node->Lhs->Accept(this);switch (node->binaryOperator) {case BinaryOperator::Add:printf("+ ");break;case BinaryOperator::Sub:printf("- ");break;case BinaryOperator::Mul:printf("* ");break;case BinaryOperator::Div:printf("/ ");break;default:assert(0);}
}void compiler::Print::VisitorConstantNode(compiler::ConstantNode *node) {printf("%d ", node->value);
}

CodeGen.h:

//
// Created by xiaoyu ren on 2022/11/21.
//#ifndef COMPILER_CODEGEN_H
#define COMPILER_CODEGEN_H
#include "AstNode.h"namespace compiler {class CodeGen : public AstVisitor {private:int top{0};void VisitorBinaryNode(BinaryNode *node) override;void VisitorConstantNode(ConstantNode *node) override;void Push();void Pop(const char *reg);public:CodeGen(){}void VisitorProgramNode(ProgramNode *node) override;};
}#endif //COMPILER_CODEGEN_H

CodeGen.cpp:

//
// Created by xiaoyu ren on 2022/11/21.
//#include "CodeGen.h"
#include void compiler::CodeGen::VisitorProgramNode(compiler::ProgramNode *node) {printf("\t.text\n");
#ifdef __linux__printf("\t.global prog\n");printf("_prog\n");
#endifprintf("\tpush %%rbp\n");printf("\tmove %%rsp, %%rbp\n");printf("\tsub $32, %%rsp\n");node->Lhs->Accept(this);assert(top == 0);printf("\tmove %%rbp, %%rsp\n");printf("\tpop %%rbp\n");printf("\tret\n");
}void compiler::CodeGen::VisitorBinaryNode(compiler::BinaryNode *node) {node->Rhs->Accept(this);Push();node->Lhs->Accept(this);Pop("%rdi");switch (node->binaryOperator) {case BinaryOperator::Add:printf("\tadd %%rdi, %%rax\n");break;case BinaryOperator::Sub:printf("\tsub %%rdi, %%rax\n");break;case BinaryOperator::Mul:printf("\timul %%rdi, %%rax\n");break;case BinaryOperator::Div:printf("\tcqo\n");printf("\tdiv %%rdi\n");break;default:assert(0);}
}void compiler::CodeGen::VisitorConstantNode(compiler::ConstantNode *node) {printf("\tmove $%d, %%rax\n", node->value);
}void compiler::CodeGen::Push() {printf("\tpush %%rax\n");top++;
}void compiler::CodeGen::Pop(const char *reg) {printf("\tpop %s\n", reg);top--;
}

driver.c:

//
// Created by xiaoyu ren on 2022/11/23.
//
#include int prog();int main() {printf("%d\n", prog());return 0;
}

main.cpp:

#include 
#include "Lexer.h"
#include "Parser.h"
#include "Print.h"
#include "CodeGen.h"int main() {const char *code = " 5 + 1 - 3 * 4 / 2";compiler::Lexer lexer(code);//test lexer
//    do{
//        lexer.GetNextToken();
//        std::cout << lexer.GetCurrentToken()->content << std::endl;
//    } while (lexer.GetCurrentToken()->kind != compiler::TokenKind::Eof);//test parser,后序遍历lexer.GetNextToken();compiler::Parser parser(lexer);
//    compiler::Print visitor;
//    auto root = parser.Parse();
//    root->Accept(&visitor);//test codeGencompiler::CodeGen codeGen;auto root = parser.Parse();root->Accept(&codeGen);//execute
//    make
//    ./compiler "5+1-3*4/2" > tmp.s
//    clang tmp.s ../driver.c -o tmp.out
//    ./tmp.out
//    0return 0;
}

如果你懒得自己复制,可以去走下面链接下载压缩包(为什么要1积分?因为你懒哈哈)
https://download.csdn.net/download/r643064456/87156158

相关内容

热门资讯

诗词的由来? 诗词的由来?几年前?为啥来?诗歌概念起源 诗歌是一种主情的文学体裁,它以抒情的方式,高度凝练,集中地...
陈梦佳是好人吗? 陈梦佳是好人吗?我不了解TA
关于鹏的成语典故? 关于鹏的成语典故?据一个叫庄周的说这货在水里是鱼名鲲,上了天变成鸟叫鹏,纵横几千里,如垂天之云。据西...
上夜班很困怎么办, 上夜班很困怎么办, 白天多休息。注意饮食营养。晚上上班的时候可以听听节奏比较快的歌,或者听自己一向...
男生不主动找聊天就是没戏吧? 男生不主动找聊天就是没戏吧?你分情况,不同性格的人不一样。比如说处女男,因为天性原因希望女孩子主动一...
说人守时回家的成语 说人守时回家的成语 分秒必争 [fēn miǎo bì zhēng] 生词本基本释义一分一秒也一...
大航海探险物语要在什么辅助脚本... 大航海探险物语要在什么辅助脚本玩呢?大航海探险物语要在鸟人助手上玩呀,这款辅助脚本不用root一样可...
怎样锻炼孩子注意力集中? 怎样锻炼孩子注意力集中?第一,多训练孩子听力,在孩子听某些声音或语言,能听懂其中的细节和主旨。第二,...
本来可爱的小家伙,变成了难管教... 本来可爱的小家伙,变成了难管教的熊孩子,孩子太难管教了怎么办呢?多跟孩子沟通,走进孩子的内心,了解她...
孩子跳舞发圈简单句子 孩子跳舞发圈简单句子1、爸爸妈妈会为你在赛场上的努力而感到骄傲。我们爱你。2、感觉女儿特别的用心,在...
我女朋友和我说她只是喜欢我而不... 我女朋友和我说她只是喜欢我而不爱我,我还怎么办?就是因为你平时对她的宠爱,,让她变成了理所当然,,她...
关于通缉令的问题! 关于通缉令的问题!分级别的。A级才能公布大众的。如果你想曝光此事,可以找当地媒体。。。。
湖南涉外经济学院教师车祸造成 ... 湖南涉外经济学院教师车祸造成 2 人受伤,事故原因是什么?这是因为他们的心情不好的原因,所以,这样的...
微电影创作过程中,工作思路怎么... 微电影创作过程中,工作思路怎么写请问你说的是剧本创作还是拍摄工作,还是整个流程?
求类似异形大战铁血战士这样的把... 求类似异形大战铁血战士这样的把两部不同电影里的人物放到一起对打的电影弗莱迪大战杰森
喜欢看小说的进来 喜欢看小说的进来小说里面都有那些 剑法 轻功 剑名(倚天剑 )门派(专收女弟子的名字要好听的)风云也...
顾瑶周夜深小说叫什么名字? 顾瑶周夜深小说叫什么名字?不是冤家不成婚场景一:“贺尧谦你会有报应的!”某女手握拳头信誓旦旦。“放心...
永恒之塔各种达人(6种),前期... 永恒之塔各种达人(6种),前期中期后期分别做什么东西好卖?永恒之塔各种达人(6种),前期中期后期分别...
用精字组成不同的词语填空 用精字组成不同的词语填空节目( ) 制作( ) 装备( ) 包装( ) ( ...
什么是白富美?什么是高富帅? 什么是白富美?什么是高富帅?白富美就是长得白净、有钱、美丽漂亮,一般形容女的,高富帅是长得个子高,又...