- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

深入浅出JVM（六）之前端编译过程与语法糖原理

菜菜的后端私房菜发表于 2024/10/09 09:19:56 2024/10/09

【摘要】深入浅出JVM（六）之前端编译过程与语法糖原理本篇文章将围绕Java中的编译器，深入浅出的解析前端编译的流程、泛型、条件编译、增强for循环、可变长参数、lambda表达式等语法糖原理编译器Java中的编译器不止一种，Java编译器可以分为：前端编译器、即时编译器和提前编译器最为常见的就是前端编译器javac，它能够将Java源代码编译为字节码文件，它能够优化程序员使用起来很方便的语法糖...

深入浅出JVM（六）之前端编译过程与语法糖原理

本篇文章将围绕Java中的编译器，深入浅出的解析前端编译的流程、泛型、条件编译、增强for循环、可变长参数、lambda表达式等语法糖原理

编译器

Java中的编译器不止一种，Java编译器可以分为：前端编译器、即时编译器和提前编译器

最为常见的就是前端编译器javac，它能够将Java源代码编译为字节码文件，它能够优化程序员使用起来很方便的语法糖

即时编译器是在运行时，将热点代码直接编译为本地机器码，而不需要解释执行，提升性能

提前编译器将程序提前编译成本地二进制代码

前端编译过程

准备阶段: 初始化插入式注解处理器
处理阶段
- 解析与填充符号表
  1. 词法分析: 将Java源代码的字符流转变为token(标记)流
    - 字符: 程序编写的最小单位
    - 标记(token) : 编译的最小单位
    - 比如关键字 static 是一个标记 / 6个字符
  2. 语法分析: 将token流构造成抽象语法树
  3. 填充符号表: 产生符号信息和符号地址
    - 符号表是一组符号信息和符号地址构成的数据结构
    - 比如: 目标代码生成阶段，对符号名分配地址时，要查看符号表上该符号名对应的符号地址
- 插入式注解处理器的注解处理
  1. 注解处理器处理特殊注解: 在编译器允许注解处理器对源代码中特殊注解作处理，可以读写抽象语法树中任意元素，如果发生了写操作，就要重新解析填充符号表
    - 比如: Lombok通过特殊注解，生成get/set/构造器等方法
- 语义分析与字节码生成
  1. 标注检查: 对语义静态信息的检查以及常量折叠优化
```
 int i = 1;
 char c1 = 'a';
 int i2 = 1 + 2;//编译成 int i2 = 3 常量折叠优化
 char c2 = i + c1; //编译错误 标注检查 检查语法静态信息 
```
  2. 数据及控制流分析: 对程序运行时动态检查
    - 比如方法中流程控制产生的各条路是否有合适的返回值
  3. 解语法糖: 将(方便程序员使用的简洁代码)语法糖转换为原始结构
  4. 字节码生成: 生成<init>,<clinit>方法,并根据上述信息生成字节码文件

前端编译流程图

源码分析

代码位置在JavaCompiler的compile方法中

Java中的语法糖

泛型

将操作的数据类型指定为方法签名中一种特殊参数，作用在方法、类、接口上时称为泛型方法、泛型类、泛型接口

Java中的泛型是类型擦除式泛型，泛型只在源代码中存在，在编译期擦除泛型，并在相应的地方加上强制转换代码

与具现化式泛型(不会擦除，运行时也存在泛型)对比

优点: 只需要改动编译器，Java虚拟机和字节码指令不需要改变
- 因为泛型是JDK5加入的，为了满足对以前版本代码的兼容采用类型擦除式泛型
缺点: 性能较低，使用没那么方便
- 为提供基本类型的泛型，只能自动拆装箱，在相应的地方还会加速强制转换代码，所以性能较低
- 运行期间无法获取到泛型类型信息
  - 比如书写泛型的List转数组类型时，需要在方法的参数中指定泛型类型
```
 public static <T> T[] listToArray(List<T> list,Class<T> componentType){
         T[] instance = (T[]) Array.newInstance(componentType, list.size());
         return instance;
 }
```

增强for循环与可变长参数

增强for循环 -> 迭代器

可变长参数 -> 数组装载参数

泛型擦除后会在某些位置插入强制转换代码

自动拆装箱

自动装箱、拆箱的错误用法

         Integer a = 1;
         Integer b = 2;
         Integer c = 3;
         Integer d = 3;
         Integer e = 321;
         Integer f = 321;
         Long g = 3L;
         //true
         System.out.println(c == d);//范围小，在缓冲池中
         //false
         System.out.println(e == f);//范围大，不在缓冲池中，比较地址因此为false
         //true
         System.out.println(c == (a + b));
         //true
         System.out.println(c.equals(a + b));
         //false
         System.out.println(g == (b + a));
         //true
         System.out.println(g.equals(a + b));

注意:
1. 包装类重写的equals方法中不会自动转换类型
2. 包装类的 == 就是去比较引用地址，不会自动拆箱

条件编译

布尔类型 + if语句 : 根据布尔值类型的真假，编译器会把分支中不成立的代码块消除（解语法糖）

Lambda原理

编写函数式接口

 @FunctionalInterface
 interface LambdaTest {
     void lambda();
 }

编写测试类

 public class Lambda {
     private int i = 10;
 
     public static void main(String[] args) {
         test(() -> System.out.println("匿名内部类实现函数式接口"));
     }
 
     public static void test(LambdaTest lambdaTest) {
         lambdaTest.lambda();
     }
 }

使用插件查看字节码文件

生成了一个私有静态的方法,这个方法中很明显就是lambda中的代码

在使用lambda表达式的类中隐式生成一个静态私有的方法，这个方法代码块就是lambda表达式中写的代码

执行class文件时带上参数java -Djdk.internal.lambda.dumpProxyClasses 包名.类名即可显示出这个匿名内部类

使用invokedynamic生成了一个实现函数式接口的匿名内部类对象，在重写函数式接口的方法实现中调用使用lambda表达式类中隐式生成的静态私有方法

总结

本篇文章以Java中编译器的分类为开篇，深入浅出的解析前端编译的流程，Java中泛型、增强for循环、可变长参数、自动拆装箱、条件编译以及Lambda等语法糖的原理

前端编译先将字符流转换为token流，再将token流转换为抽象语法树，填充符号表的符号信息、符号地址，然后注解处理器处理特殊注解（比如Lombok生成get、set方法），对语法树发生写改动则要重新解析、填充符号，接着检查语义静态信息以及常量折叠，对运行时程序进行动态检查，再解语法糖，生成init实例方法、clinit静态方法，最后生成字节码文件

Java中为了兼容之前的版本使用类型擦除式的泛型，在编译期间擦除泛型并在相应位置加上强制转换，想为基本类型使用泛型只能搭配自动拆装箱一起使用，性能有损耗且在运行时无法获取泛型类型

增加for循环则是使用迭代器实现，并在适当位置插入强制转换；可变长参数则是创建数组进行装载参数

自动拆装箱提供基本类型与包装类的转换，但包装类尽量不使用==，这是去比较引用地址，同类型比较使用equals

条件编译会在if-else语句中根据布尔类型将不成立的分支代码块消除

lambda原理则是通过invokeDynamic指令动态生成实现函数式接口的匿名对象，匿名对象重写函数时接口方法中调用使用lambda表达式类中隐式生成的静态私有的方法（该方法就是lambda表达式中的代码内容）

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

深入浅出JVM（六）之前端编译过程与语法糖原理

深入浅出JVM（六）之前端编译过程与语法糖原理

编译器

前端编译过程

Java中的语法糖

泛型

增强for循环与可变长参数

自动拆装箱

条件编译

Lambda原理

总结

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

深入浅出JVM（六）之前端编译过程与语法糖原理

深入浅出JVM（六）之前端编译过程与语法糖原理

编译器

前端编译过程

Java中的语法糖

泛型

增强for循环与可变长参数

自动拆装箱

条件编译

Lambda原理

总结

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品