如何测量线程堆栈深度?

2022-09-04 21:15:13

我有一个32位Java服务,存在可伸缩性问题:由于用户计数过多,我们耗尽了内存。从长远来看,我计划切换到 64 位并降低每个用户的线程数比率。在短期内,我想减少堆栈大小(-Xss,-XX:ThreadStackSize)以获得更多的空间。但这是有风险的,因为如果我把它做得太小,我就会得到StackOverflowErrors。

如何测量应用程序的平均和最大堆栈大小,以指导我做出最佳 -Xss 值的决策?我对两种可能的方法感兴趣:

  1. 在集成测试期间测量正在运行的 JVM。哪些分析工具将报告最大堆栈深度?
  2. 对查找深层调用层次结构的应用程序进行静态分析。依赖关系注入中的反射使得这不太可能起作用。

更新我知道解决这个问题的长期正确方法。请关注我提出的问题:如何测量堆栈深度?

更新2:我得到了一个很好的答案,特别是关于JProfiler的相关问题:JProfiler可以测量堆栈深度吗?(我根据JProfiler的社区支持建议发布了单独的问题)


答案 1

您可以通过可以编织到代码中的方面来了解堆栈深度(加载时间编织器允许建议除系统类加载器之外的所有加载代码)。该方面将解决所有已执行的代码,并且能够记录何时调用方法以及何时返回。您可以使用它来捕获大部分堆栈使用情况(您将错过从系统类加载器加载的任何内容,例如.java.*)。虽然不完美,但它避免了在采样点收集StackTraceElement[]的代码,并且还使您进入了您可能尚未编写的非jdk代码。

例如(aspectj):

public aspect CallStackAdvice {

   pointcut allMethods() : execution(* *(..)) && !within(CallStackLog);

   Object around(): allMethods(){
       String called = thisJoinPoint.getSignature ().toLongString ();
       CallStackLog.calling ( called );
       try {
           return proceed();
       } finally {
           CallStackLog.exiting ( called );
       }
   }

}

public class CallStackLog {

    private CallStackLog () {}

    private static ThreadLocal<ArrayDeque<String>> curStack = 
        new ThreadLocal<ArrayDeque<String>> () {
        @Override
        protected ArrayDeque<String> initialValue () {
            return new ArrayDeque<String> ();
        }
    };

    private static ThreadLocal<Boolean> ascending = 
        new ThreadLocal<Boolean> () {
        @Override
        protected Boolean initialValue () {
            return true;
        }
    };

    private static ConcurrentHashMap<Integer, ArrayDeque<String>> stacks = 
         new ConcurrentHashMap<Integer, ArrayDeque<String>> ();

    public static void calling ( String signature ) {
        ascending.set ( true );
        curStack.get ().push ( signature.intern () );
    }

    public static void exiting ( String signature ) {
        ArrayDeque<String> cur = curStack.get ();
        if ( ascending.get () ) {
            ArrayDeque<String> clon = cur.clone ();
            stacks.put ( hash ( clon ), clon );
        }
        cur.pop ();
        ascending.set ( false );
    }

    public static Integer hash ( ArrayDeque<String> a ) {
        //simplistic and wrong but ok for example
        int h = 0;
        for ( String s : a ) {
            h += ( 31 * s.hashCode () );
        }
        return h;
    }

    public static void dumpStacks(){
        //implement something to print or retrieve or use stacks
    }
}

示例堆栈可能如下所示:

net.sourceforge.jtds.jdbc.TdsCore net.sourceforge.jtds.jdbc.JtdsStatement.getTds()
public boolean net.sourceforge.jtds.jdbc.JtdsResultSet.next()
public void net.sourceforge.jtds.jdbc.JtdsResultSet.close()
public java.sql.Connection net.sourceforge.jtds.jdbc.Driver.connect(java.lang.String, java.util.Properties)
public void phil.RandomStackGen.MyRunnable.run()

非常慢,有自己的内存问题,但可以为您提供所需的堆栈信息。

然后,您可以使用堆栈跟踪中每个方法的max_stack和max_locals来计算该方法的帧大小(请参阅类文件格式)。根据vm规范,我认为这应该是(max_stack + max_locals)* 4bytes作为方法的最大帧大小(长/双占用操作数堆栈/本地vars上的两个条目,并在max_stack和max_locals中考虑)。

您可以轻松地对感兴趣的类进行 javap,如果调用堆栈中没有那么多,则查看帧值。像asm这样的东西为您提供了一些简单的工具,可用于在更大范围内执行此操作。

计算完此值后,您需要估计 JDK 类的其他堆栈帧,这些堆栈帧可能由您在最大堆栈点处调用,并将其添加到堆栈大小中。它不会是完美的,但它应该让你为-Xss调优提供一个不错的起点,而不会绕过JVM / JDK。

另一个注意事项:我不知道JIT/OSR对帧大小或堆栈要求有什么影响,所以请注意,在冷JVM和暖JVM上,-Xss调优可能会产生不同的影响。

EDIT有几个小时的停机时间,并提出了另一种方法。这是一个java代理,它将检测方法来跟踪最大堆栈帧大小和堆栈深度。这将能够将大多数jdk类与其他代码和库一起检测,从而为您提供比方面编织器更好的结果。您需要 asm v4 才能使其正常工作。它更多的是为了它的乐趣,所以在plink java下提交这个是为了好玩,而不是利润。

首先,制作一些东西来跟踪堆栈帧的大小和深度:

package phil.agent;

public class MaxStackLog {

    private static ThreadLocal<Integer> curStackSize = 
        new ThreadLocal<Integer> () {
        @Override
        protected Integer initialValue () {
            return 0;
        }
    };

    private static ThreadLocal<Integer> curStackDepth = 
        new ThreadLocal<Integer> () {
        @Override
        protected Integer initialValue () {
            return 0;
        }
    };

    private static ThreadLocal<Boolean> ascending = 
        new ThreadLocal<Boolean> () {
        @Override
        protected Boolean initialValue () {
            return true;
        }
    };

    private static ConcurrentHashMap<Long, Integer> maxSizes = 
        new ConcurrentHashMap<Long, Integer> ();
    private static ConcurrentHashMap<Long, Integer> maxDepth = 
        new ConcurrentHashMap<Long, Integer> ();

    private MaxStackLog () { }

    public static void enter ( int frameSize ) {
        ascending.set ( true );
        curStackSize.set ( curStackSize.get () + frameSize );
        curStackDepth.set ( curStackDepth.get () + 1 );
    }

    public static void exit ( int frameSize ) {
        int cur = curStackSize.get ();
        int curDepth = curStackDepth.get ();
        if ( ascending.get () ) {
            long id = Thread.currentThread ().getId ();
            Integer max = maxSizes.get ( id );
            if ( max == null || cur > max ) {
                maxSizes.put ( id, cur );
            }
            max = maxDepth.get ( id );
            if ( max == null || curDepth > max ) {
                maxDepth.put ( id, curDepth );
            }
        }
        ascending.set ( false );
        curStackSize.set ( cur - frameSize );
        curStackDepth.set ( curDepth - 1 );
    }

    public static void dumpMax () {
        int max = 0;
        for ( int i : maxSizes.values () ) {
            max = Math.max ( i, max );
        }
        System.out.println ( "Max stack frame size accummulated: " + max );
        max = 0;
        for ( int i : maxDepth.values () ) {
            max = Math.max ( i, max );
        }
        System.out.println ( "Max stack depth: " + max );
    }
}

接下来,创建 java 代理:

package phil.agent;

public class Agent {

    public static void premain ( String agentArguments, Instrumentation ins ) {
        try {
            ins.appendToBootstrapClassLoaderSearch ( 
                new JarFile ( 
                    new File ( "path/to/Agent.jar" ) ) );
        } catch ( IOException e ) {
            e.printStackTrace ();
        }
        ins.addTransformer ( new Transformer (), true );
        Class<?>[] classes = ins.getAllLoadedClasses ();
        int len = classes.length;
        for ( int i = 0; i < len; i++ ) {
            Class<?> clazz = classes[i];
            String name = clazz != null ? clazz.getCanonicalName () : null;
            try {
                if ( name != null && !clazz.isArray () && !clazz.isPrimitive ()
                        && !clazz.isInterface () 
                        && !name.equals ( "java.lang.Long" )
                        && !name.equals ( "java.lang.Boolean" )
                        && !name.equals ( "java.lang.Integer" )
                        && !name.equals ( "java.lang.Double" ) 
                        && !name.equals ( "java.lang.Float" )
                        && !name.equals ( "java.lang.Number" ) 
                        && !name.equals ( "java.lang.Class" )
                        && !name.equals ( "java.lang.Byte" ) 
                        && !name.equals ( "java.lang.Void" )
                        && !name.equals ( "java.lang.Short" ) 
                        && !name.equals ( "java.lang.System" )
                        && !name.equals ( "java.lang.Runtime" )
                        && !name.equals ( "java.lang.Compiler" )
                        && !name.equals ( "java.lang.StackTraceElement" )
                        && !name.startsWith ( "java.lang.ThreadLocal" )
                        && !name.startsWith ( "sun." ) 
                        && !name.startsWith ( "java.security." )
                        && !name.startsWith ( "java.lang.ref." )
                        && !name.startsWith ( "java.lang.ClassLoader" )
                        && !name.startsWith ( "java.util.concurrent.atomic" )
                        && !name.startsWith ( "java.util.concurrent.ConcurrentHashMap" )
                        && !name.startsWith ( "java.util.concurrent.locks." )
                        && !name.startsWith ( "phil.agent." ) ) {
                    ins.retransformClasses ( clazz );
                }
            } catch ( Throwable e ) {
                System.err.println ( "Cant modify: " + name );
            }
        }

        Runtime.getRuntime ().addShutdownHook ( new Thread () {
            @Override
            public void run () {
                MaxStackLog.dumpMax ();
            }
        } );
    }
}

代理类具有用于检测的预主挂钩。在该钩子中,它添加了一个类转换器,用于检测堆栈帧大小跟踪。它还将代理程序添加到引导类装入器中,以便它也可以处理 jdk 类。为此,我们需要重新转换任何可能已经加载的内容,例如String.class。但是,我们必须排除代理或堆栈日志记录使用的各种内容,这些内容会导致无限循环或其他问题(其中一些是通过反复试验发现的)。最后,代理添加一个关机挂钩,将结果转储到 stdout。

public class Transformer implements ClassFileTransformer {

    @Override
    public byte[] transform ( ClassLoader loader, 
        String className, Class<?> classBeingRedefined,
            ProtectionDomain protectionDomain, byte[] classfileBuffer )
            throws IllegalClassFormatException {

        if ( className.startsWith ( "phil/agent" ) ) {
            return classfileBuffer;
        }

        byte[] result = classfileBuffer;
        ClassReader reader = new ClassReader ( classfileBuffer );
        MaxStackClassVisitor maxCv = new MaxStackClassVisitor ( null );
        reader.accept ( maxCv, ClassReader.SKIP_DEBUG );

        ClassWriter writer = new ClassWriter ( ClassWriter.COMPUTE_FRAMES );
        ClassVisitor visitor = 
            new CallStackClassVisitor ( writer, maxCv.frameMap, className );
        reader.accept ( visitor, ClassReader.SKIP_DEBUG );
        result = writer.toByteArray ();
        return result;
    }
}

转换器驱动两个单独的转换 - 一个用于计算每种方法的最大堆栈帧大小,另一个用于检测用于记录的方法。它可能在一次传递中是可行的,但我不想使用ASM树API或花更多的时间来弄清楚它。

public class MaxStackClassVisitor extends ClassVisitor {

    Map<String, Integer> frameMap = new HashMap<String, Integer> ();

    public MaxStackClassVisitor ( ClassVisitor v ) {
        super ( Opcodes.ASM4, v );
    }

    @Override
    public MethodVisitor visitMethod ( int access, String name, 
        String desc, String signature,
            String[] exceptions ) {
        return new MaxStackMethodVisitor ( 
            super.visitMethod ( access, name, desc, signature, exceptions ), 
            this, ( access + name + desc + signature ) );
    }
}

public class MaxStackMethodVisitor extends MethodVisitor {

    final MaxStackClassVisitor cv;
    final String name;

    public MaxStackMethodVisitor ( MethodVisitor mv, 
        MaxStackClassVisitor cv, String name ) {
        super ( Opcodes.ASM4, mv );
        this.cv = cv;
        this.name = name;
    }

    @Override
    public void visitMaxs ( int maxStack, int maxLocals ) {
        cv.frameMap.put ( name, ( maxStack + maxLocals ) * 4 );
        super.visitMaxs ( maxStack, maxLocals );
    }
}

MaxStack*Visitor 类处理计算最大堆栈帧大小。

public class CallStackClassVisitor extends ClassVisitor {

    final Map<String, Integer> frameSizes;
    final String className;

    public CallStackClassVisitor ( ClassVisitor v, 
        Map<String, Integer> frameSizes, String className ) {
        super ( Opcodes.ASM4, v );
        this.frameSizes = frameSizes;
        this.className = className;
    }

    @Override
    public MethodVisitor visitMethod ( int access, String name, 
        String desc, String signature, String[] exceptions ) {
        MethodVisitor m = super.visitMethod ( access, name, desc, 
                             signature, exceptions );
        return new CallStackMethodVisitor ( m, 
                 frameSizes.get ( access + name + desc + signature ) );
    }
}

public class CallStackMethodVisitor extends MethodVisitor {

    final int size;

    public CallStackMethodVisitor ( MethodVisitor mv, int size ) {
        super ( Opcodes.ASM4, mv );
        this.size = size;
    }

    @Override
    public void visitCode () {
        visitIntInsn ( Opcodes.SIPUSH, size );
        visitMethodInsn ( Opcodes.INVOKESTATIC, "phil/agent/MaxStackLog",
                "enter", "(I)V" );
        super.visitCode ();
    }

    @Override
    public void visitInsn ( int inst ) {
        switch ( inst ) {
            case Opcodes.ARETURN:
            case Opcodes.DRETURN:
            case Opcodes.FRETURN:
            case Opcodes.IRETURN:
            case Opcodes.LRETURN:
            case Opcodes.RETURN:
            case Opcodes.ATHROW:
                visitIntInsn ( Opcodes.SIPUSH, size );
                visitMethodInsn ( Opcodes.INVOKESTATIC,
                        "phil/agent/MaxStackLog", "exit", "(I)V" );
                break;
            default:
                break;
        }

        super.visitInsn ( inst );
    }
}

CallStack*Visitor 类使用代码处理检测方法,以调用堆栈帧日志记录。

然后你需要一个清单。代理的 MF.jar:

Manifest-Version: 1.0
Premain-Class: phil.agent.Agent
Boot-Class-Path: asm-all-4.0.jar
Can-Retransform-Classes: true

最后,将以下内容添加到要检测的程序的 java 命令行中:

-javaagent:path/to/Agent.jar

您还需要将 asm-all-4.0.jar与 Agent.jar 位于同一目录中(或更改清单中的 Boot-Class-Path 以引用该位置)。

示例输出可能是:

Max stack frame size accummulated: 44140
Max stack depth: 1004

这一切都有点粗糙,但对我有用。

注意:堆栈帧大小不是总堆栈大小(仍然不知道如何获取该大小)。实际上,线程堆栈有各种开销。我发现我通常需要报告的堆栈最大帧大小的2到3倍作为-Xss值。哦,请务必在不加载代理的情况下进行 -Xss 调整,因为它会增加堆栈大小要求。


答案 2

我会减少测试环境中的设置,直到您看到问题为止。然后添加一些头部空间。-Xss

减小堆大小将为应用程序提供更多线程堆栈空间。

只需切换到 64 位操作系统就可以为应用程序提供更多内存,因为大多数 32 位操作系统仅允许每个应用程序大约 1.5 GB,但是 64 位操作系统上的 32 位应用程序最多可以使用 3-3.5 GB,具体取决于操作系统。


推荐