模在Java中很慢吗?

2022-09-01 23:14:19

出于好奇,我一直在研究JDK中的实现,我发现这个:ThreadLocal

/**
 * Increment i modulo len.
 */
 private static int nextIndex(int i, int len) {
     return ((i + 1 < len) ? i + 1 : 0);
 }

看起来很明显,这可以通过一个简单的来实现,但我认为这些家伙知道他们的东西。任何想法他们为什么这样做?return (i + 1) % len

此代码高度面向性能,具有用于保存线程 - 本地映射的自定义映射,用于帮助GC变聪明的弱引用等等,因此我想这是性能问题。模在Java中很慢吗?


答案 1

%在此示例中,出于性能原因避免使用。

div/rem即使在CPU架构级别,操作速度也较慢;不仅在Java中。例如,Haswell 上指令的最小延迟约为 10 个周期,但 只有 1 个周期。idivadd

让我们使用 JMH 进行基准测试。

import org.openjdk.jmh.annotations.*;

@State(Scope.Benchmark)
public class Modulo {
    @Param("16")
    int len;

    int i;

    @Benchmark
    public int baseline() {
        return i;
    }

    @Benchmark
    public int conditional() {
        return i = (i + 1 < len) ? i + 1 : 0;
    }

    @Benchmark
    public int mask() {
        return i = (i + 1) & (len - 1);
    }

    @Benchmark
    public int mod() {
        return i = (i + 1) % len;
    }
}

结果:

Benchmark           (len)  Mode  Cnt  Score   Error  Units
Modulo.baseline        16  avgt   10  2,951 ± 0,038  ns/op
Modulo.conditional     16  avgt   10  3,517 ± 0,051  ns/op
Modulo.mask            16  avgt   10  3,765 ± 0,016  ns/op
Modulo.mod             16  avgt   10  9,125 ± 0,023  ns/op

如您所见,使用速度比条件表达式慢约 2.6 倍。JIT 无法在讨论的代码中自动优化此值,因为除数 () 是可变的。%ThreadLocaltable.length


答案 2

mod在Java中并不那么慢。它分别实现为字节码指令以及整数和浮点数。JIT 在优化这一点方面做得很好。iremfrem

在我的基准测试(参见文章)中,JDK 1.8 中的调用大约需要 1 纳秒。这很快。 调用速度大约慢 3 倍,因此请尽可能使用整数。iremfrem

如果您使用的是自然整数(例如数组索引)和 2 除数的幂(例如 8 个线程局部变量),那么您可以使用一个有点微调技巧来获得 20% 的性能提升。


推荐