我的代码出现幻觉?说好的a = 1; x = b,怎么成了x = b; a = 1?

举报
poemyang 发表于 2025/08/06 10:10:47 2025/08/06
【摘要】 本文探讨了多线程环境下指令重排序对程序执行结果的影响。示例代码展示了代码重排序可能导致x=0、y=0的意外结果。文章分析了重排序的优化原理,包括编译阶段静态重排序和运行阶段动态重排序,指出其必须遵守数据依赖性和as-if-serial语义两个原则。为解决多线程重排序问题,介绍了内存屏障机制,并说明Java通过volatile关键字实现内存屏障,禁止被修饰变量发生指令重排序,从而保证共享变量的可见性

有序性:代码执行的幻觉

前面讲到通过缓存一致性协议,来保障共享变量的可见性。那么是否还有其他情况,导致对共享变量操作不符合预期结果。可以看下面的代码:

private int a, b;
private int x, y;

public void test() {
    Thread t1 = new Thread(() -> {
        x = b;
        a = 1;
    });

    Thread t2 = new Thread(() -> {
        y = a;
        b = 2;
    });
        
    // ...start启动线程,join等待线程
    assert x == 2;
    assert y == 1;
}

假设将线程t1的代码块从a = 1; x = b;改成x = b; a = 1; 。将线程t2的代码块从b = 2; y = a;改成y = a; b = 2;。
对于线程t1和t2自己来说,代码的重排序,不会影响当前线程执行。但是在多线程并发执行下,会出现如下情况:
1)假设处理器A先将变量b = 0赋值给x,再将变量a赋值1。处理器B先将变量a = 0赋值给y,再将变量b赋值2。那么这时结果是:x等于0,y等于0。
可见代码的重排序也会影响到程序最终结果。
重排序是一种被编译器和处理器采用的优化策略,以便更有效地利用处理器资源,减少指令的执行延迟,以及提高并行指令的数量。
在编译阶段,编译器会进行静态重排序。例如,编译器可能会将计算密集型的指令移动到I/O操作之前,以便在等待I/O完成时,处理器可以执行其他的计算任务。
在运行阶段,现代处理器会进行动态重排序,也被称为指令重排序。例如,当一个指令需要等待数据从内存加载时,处理器可能会先执行其他没有数据依赖的指令,从而避免处理器空闲。

image.png

重排序需要遵守两点。
1)数据依赖性:如果两个操作之间存在数据依赖,那么编译器和处理器不能调整它们的顺序。

// 写后读
a = 1;
b = a;
// 写后写
a = 1;
a = 2;
// 读后写
a = b;
b = 1;

上面3种情况,编译器和处理器不能调整它们的顺序,否则将会造成程序语义的改变。
2)as-if-serial语义:即给程序一个顺序执行的假象。即经过重排序的执行结果要与顺序执行的结果保持一致。

a = 1;
b = 2;
c = a * b;

如上对变量a的赋值和对变量b的赋值,不存在数据依赖关系。因此对变量a和b重排序不会影响变量c的结果。
但数据依赖性和as-if-serial语义只保证单个处理器中执行的指令序列和单个线程中执行的操作,并不考虑多核处理器和多线程之间的数据依赖情况。因此在多线程程序中,对存在数据依赖的操作重排序,可能会改变程序的执行结果。因此要避免程序的错误的执行,便是需要禁止这种编译和处理器优化导致的重排序。
这种解决重排序问题的机制,叫做内存屏障。内存屏障也被称为内存栅栏或内存栅障,是一种用于处理多处理器编程中的同步问题的计算机指令。它的主要作用是防止某些内存操作的重排序。以日常接触的 X86_64 架构来说,内存操作指令如读读(LoadLoad)、读写(LoadStore)以及写写(StoreStore)内存屏障是空操作(no-op),只有写读(StoreLoad)内存屏障会被替换成具体指令。
在Java语言中,内存屏障通过volatile关键字实现,禁止被它修饰的变量发生指令重排序操作:
1)不允许 volatile 字段写操作之前的内存访问被重排序至其之后。
2)不允许 volatile 字段读操作之后的内存访问被重排序至其之前。

//  变量a,b通过volatile修饰
private volatile int a, b; 
private int x, y;

public void test() {
    Thread t1 = new Thread(() -> {
        a = 1;
        // 编译器插入storeload内存屏障指令
        // 1)禁止代码和指令重排序
        // 2)强制刷新变量a的最新值到内存
        x = b;
        // 1)强制从内存中读取变量b的最新值
    });

    Thread t2 = new Thread(() -> {
        b = 2;
        // 编译器插入storeload内存屏障指令
        // 1)禁止代码和指令重排序
        // 2)强制刷新变量b的最新值到内存
        y = a;
        // 1)强制从内存中读取变量a的最新值
    });
        
    // ...start启动线程,join等待线程
    assert x == 2;
    assert y == 1;
}

可以看到通过volatile修饰的变量通过LOCK指令和内存屏障,实现共享变量的可见性和避免代码和指令的重排序,最终保障了程序在多线程情况下的正常执行。

未完待续

很高兴与你相遇!如果你喜欢本文内容,记得关注哦!!!

【版权声明】本文为华为云社区用户原创内容,未经允许不得转载,如需转载请自行联系原作者进行授权。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。