Java 基准测试 - 为什么第二个循环更快?

2022-08-31 21:30:11

我对此感到好奇。

我想检查哪个函数更快,所以我创建了一些代码,并执行了很多次。

public static void main(String[] args) {

        long ts;
        String c = "sgfrt34tdfg34";

        ts = System.currentTimeMillis();
        for (int k = 0; k < 10000000; k++) {
            c.getBytes();
        }
        System.out.println("t1->" + (System.currentTimeMillis() - ts));

        ts = System.currentTimeMillis();
        for (int i = 0; i < 10000000; i++) {
            Bytes.toBytes(c);
        }
        System.out.println("t2->" + (System.currentTimeMillis() - ts));

    }

“second”循环更快,所以,我认为来自hadoop的Bytes类比String类中的函数更快。然后,我改变了循环的顺序,然后c.getBytes()变得更快。我执行了很多次,我的结论是,我不知道为什么,但是在第一个代码执行后,我的VM中发生了一些事情,因此第二个循环的结果变得更快。


答案 1

这是一个经典的 Java 基准测试问题。Hotspot/JIT/etc 会在你使用代码时编译你的代码,所以它在运行过程中会变得更快。

首先绕循环运行至少3000次(在服务器上或64位上运行10000次) - 然后进行测量。


答案 2

您知道有问题,因为内部调用:Bytes.toBytesc.getBytes

public static byte[] toBytes(String s) {
    try {
        return s.getBytes(HConstants.UTF8_ENCODING);
    } catch (UnsupportedEncodingException e) {
        LOG.error("UTF-8 not supported?", e);
        return null;
    }
}

来源取自此处。这告诉您,呼叫不可能比直接呼叫更快 - 在最好的情况下(即,如果它被内联),它将具有相同的时间。但是,通常情况下,您会期望它稍微慢一些,因为调用函数的开销很小。

这是在解释型垃圾回收环境中使用在任意时间运行的组件(如垃圾回收器)中进行微基准测试的典型问题。最重要的是,有一些硬件优化,例如缓存,会扭曲图片。因此,了解正在发生的事情的最佳方法通常是查看源头。


推荐