OpenJDK: Java Memory Order

发表于： 2023-08-12 更新于： 2024-12-31

字数： 1748 阅读：≈ 4分钟

CPU 内存屏障：https://sf-zhou.github.io/programming/memory_barrier.html

volatile 与内存屏障总结： https://zhuanlan.zhihu.com/p/43526907

X86-64 下仅支持一种指令重排：Store-Load ，即读操作可能会重排到写操作前面，同时不同线程的写操作并没有保证全局可见，例子见《Intel® 64 and IA-32 Architectures Software Developer’s Manual》手册 8.6.1、8.2.3.7 节。要注意的是这个问题只能用 mfence 解决，不能靠组合 sfence 和 lfence 解决。（用 sfence+lfence 组合仅可以解决重排问题，但不能解决全局可见性问题，简单理解不如视为 sfence 和 lfence 本身也能乱序重排）

X86-64 一般情况根本不会需要使用 lfence 与 sfence 这两个指令，除非操作 Write-Through 内存或使用 non-temporal 指令（NT 指令，属于 SSE 指令集），比如 movntdq, movnti, maskmovq，这些指令也使用 Write-Through 内存策略，通常使用在图形学或视频处理，Linux 编程里就需要使用 GNC 提供的专门的函数（例子见参考资料 13：Memory part 5: What programmers can do）。

下面是 GNU 中的三种内存屏障定义方法，结合了编译器屏障和三种 CPU 屏障指令：

#define lfence() __asm__ __volatile__("lfence": : :"memory")
#define sfence() __asm__ __volatile__("sfence": : :"memory")
#define mfence() __asm__ __volatile__("mfence": : :"memory")

代码中仍然使用 lfence() 与 sfence() 这两个内存屏障应该也是一种长远的考虑。按照 Interface 写代码是最保险的，万一 Intel 以后出一个采用弱一致模型的 CPU，遗留代码出问题就不好了。目前在 x86 下面视为编译器屏障即可。

sun.misc.Unsafe

sun.misc.Unsafe 中出现了 loadFence()/storeFence()/fullFence() 三种创建内存屏障的方法。而这个 Unsafe 又转而调用了 jdk.internel.misc.Unsafe 的方法。

jdk.internal.misc.Unsafe

loadFence()/storeFence()/fullFence() 都是 native 方法。loadLoadFence() 和 storeStoreFence() 调用了 loadFence() 和 storeFence() 实现。形如 AB 的 barrier 其实指的是 fence 之前的 A 操作和 fence 之后的 B 操作不可以重排，组合下来共有 4 种。

Java 的 volatile 类型~~对写带了 release 语义，对读带了 acquire 语义~~是遵循序列一致性的。C++ 的 volatile 保证了写内存的操作不被优化、禁止了线程内一些操作的重排，但是不保证原子性。

loadFence

类似于 C11 atomic_thread_fence(memory_order_acquire)，fence 之前的读和 fence 之后的读写不会重排。即：LoadLoad + LoadStore barrier

storeFence

类似于 C11 atomic_thread_fence(memory_order_release)，fence 之前的读写和 fence 之后的写不会重排。即：StoreStore + LoadStore barrier

fullFence

类似于 C11 atomic_thread_fence(memory_order_seq_cst)，fence 前后的读写都不会重排。即：loadFence + storeFence + StoreLoad barrier

loadLoadFence

含义是 fence 之前的 load 和 fence 之后的 load 不会重排。但实际上使用了约束性更强的 loadFence() 来代为实现。

storeStoreFence

含义是 fence 之前的 store 和 fence 之后的 store 不会重排。但实际上使用了约束性更强的 storeFence() 来代为实现。

比较：C++ 内存屏障类型

可见文档：https://devdocs.io/cpp/atomic/memory_order