%
在此示例中,出于性能原因避免使用。
div
/rem
即使在CPU架构级别,操作速度也较慢;不仅在Java中。例如,Haswell 上指令的最小延迟约为 10 个周期,但 只有 1 个周期。idiv
add
让我们使用 JMH 进行基准测试。
import org.openjdk.jmh.annotations.*;
@State(Scope.Benchmark)
public class Modulo {
@Param("16")
int len;
int i;
@Benchmark
public int baseline() {
return i;
}
@Benchmark
public int conditional() {
return i = (i + 1 < len) ? i + 1 : 0;
}
@Benchmark
public int mask() {
return i = (i + 1) & (len - 1);
}
@Benchmark
public int mod() {
return i = (i + 1) % len;
}
}
结果:
Benchmark (len) Mode Cnt Score Error Units
Modulo.baseline 16 avgt 10 2,951 ± 0,038 ns/op
Modulo.conditional 16 avgt 10 3,517 ± 0,051 ns/op
Modulo.mask 16 avgt 10 3,765 ± 0,016 ns/op
Modulo.mod 16 avgt 10 9,125 ± 0,023 ns/op
如您所见,使用速度比条件表达式慢约 2.6 倍。JIT 无法在讨论的代码中自动优化此值,因为除数 () 是可变的。%
ThreadLocal
table.length