compiler-theory-1

compiler-theory-1

Charles Lv7

概论

编译的起源

程序设计语言的发展

  • 低级语言(Low level Language)

    • 字位码、机器语言、汇编语言

    • 特点:与特定的机器有关,功效高,但使用复杂、繁琐、费时、易出错

  • 高级语言

  • Fortran、Pascal、C 、Java 语言等(面向用户的语言,面向问题的语言)

  • 特点:不依赖具体机器,移植性好、对用户要求低、易使用、易维护等

基本概念

  • 源程序

用汇编语言或高级语言编写的程序称为源程序。

  • 目标程序

目标语言所表示的程序。

目标语言: 可以是介于源语言和机器语言之间的“中间语言”,可以是某种机器的机器语言,也可以是某机器的汇编语言。

  • 翻译程序

源程序转换为目标程序的程序称为翻译程序。

它是指各种语言的翻译器,包括汇编程序和编译程序,是汇编程序、编译程序以及各种变换程序的总称。

源程序是翻译程序的输入,目标程序是翻译程序的输出

  • 汇编程序

若源程序用汇编语言书写,经过翻译程序得到用机器语言表示的程序,这时的翻译程序就称之为汇编程序,这种翻译过程称为“汇编”(Assemble)

  • 编译程序

若源程序是用高级语言书写,经加工后得到目标程序,这种翻译过程称“编译”(Compile)

汇编程序编译程序都是翻译程序,主要区别是加工对象的不同。由于汇编语言格式简单,常与机器语言之间有一一对应的关系,汇编程序所要做的翻译工作比编译程序简单得多。

  • 解释程序(Interpreter)

对源程序进行解释执行的程序。

编译过程

编译过程是指将高级语言程序翻译为等价的目标程序的过程。

graph LR
    A(词法分析) -->B(语法分析)
    B --> C(语义分析,生成中间代码)
    C --> D(代码优化)
    D --> E(生成目标程序)

词法分析

任务:分析和识别单词。

源程序是由字符序列构成的,词法分析扫描源程序(字符串),根据语言的词法规则分析并识别单词,并以某种编码形式输出。

语法分析

任务:根据语法规则即语言的文法,分析并识别出各种语法成分,如表达式、各种说明、各种语句、过程、函数等,并进行语法正确性检查。

语义分析,生成中间代码

任务:对识别出的各种语法成分进行语义分析,并产生相应的中间代码。

  • 中间代码:一种介于源语言和目标语言之间的中间语言形式

  • 生成中间代码的目的:

    <1> 便于做优化处理;

    <2> 便于编译程序的移植。

  • 中间代码的形式:编译程序设计者可以自己设计,常用的有四元式、三元式、逆波兰表示等。

代码优化

任务:目的是为了得到高质量的目标程序。

生成目标程序

由中间代码很容易生成目标程序(地址指令序列)。这部分工作与机器关系密切 ,所以要根据机器进行。在做这部分工作时(要注意充分利用累加器),也可以进行优化处理。

编译程序构造

编译程序的逻辑结构

按逻辑功能不同,可将编译过程划分为五个基本阶段,与此相对应,我们将实现整个编译过程的编译程序划分为五个逻辑阶段(即五个逻辑子过程)。

flowchart TD
	F(符号表管理) --> A
	F(符号表管理) --> B
	F(符号表管理) --> C
	F(符号表管理) --> D
	F(符号表管理) --> E
    A(词法分析) -->B(语法分析)
    B --> C(语义分析,生成中间代码)
    C --> D(代码优化)
    D --> E(生成目标程序)
    G(出错处理) --> A
    G(出错处理) --> B
    G(出错处理) --> C
    G(出错处理) --> D
    G(出错处理) --> E

编译程序中要包括符号表管理和出错处理两部分

  • 符号表管理

在整个编译过程中始终都要贯穿着建表(填表)和查表的工作。即要及时地把源程序中的信息和编译过程中所产生的信息登记在表格中,而在随后的编译过程中同时又要不断地查找这些表格中的信息。

  • 出错处理

规模较大的源程序难免有多种错误,编译程序必须要有出错处理的功能。即能诊察出错误,并能报告用户错误的性质和位置,以便用户修改源程序。出错处理能力的大小是衡量编译程序质量好坏的一个重要指标。

遍:对源程序(包括源程序中间形式)从头到尾扫描一次,并做有关的加工处理 ,生成新的源程序中间形式或目标程序,通常称之为一遍。

遍与基本阶段的区别:

五个基本阶段 上一遍的结果是下一遍的输入,最后一遍生成目标程序。

遍:是指完成上述5个基本阶段的工作,要经过几次扫描处理。

前端和后端

根据编译程序各部分功能,将编译程序分成前端和后端。

  • 前端:通常将与源程序有关的编译部分称为前端。词法分析、语法分析、语义分析、中间代码生成、代码优化 -------分析部分

    特点:与源语言有关

  • 后端:与目标机有关的部分称为后端。目标程序生成(与目标机有关的优化)-------综合部分

    特点:与目标机有关

编译技术的应用

编译器是链接程序员和机器的桥梁:

  • 语法制导的结构化编辑器

  • 程序格式化工具

  • 软件测试工具

  • 程序理解工具

  • 高级语言的翻译工具

  • Title: compiler-theory-1
  • Author: Charles
  • Created at : 2023-07-18 08:16:01
  • Updated at : 2024-06-04 17:50:18
  • Link: https://charles2530.github.io/2023/07/18/compiler-theory-1/
  • License: This work is licensed under CC BY-NC-SA 4.0.
Comments