我以前做压测的时候,偶然发现lambda表达式的效率很低,但凡有lambada表达式的地方cpu指标都会超限,那么现在我来研究一下为何会如此低下(以下内容部分会参考网上其他作者的)
public static void main(String[] args) {
List<Integer> list = new ArrayList<>();
for (int i = 0; i < 100000; i++) {
list.add(i);
}
long normalStart = System.currentTimeMillis();
for (int i = 0; i < list.size(); i++) {}
long normalEnd = System.currentTimeMillis();
System.out.println("for循环运行" + (normalEnd - normalStart) + "毫秒");
long innerLambdaStart = System.currentTimeMillis();
list.forEach(i -> {});
long innerLambdaEnd = System.currentTimeMillis();
System.out.println("lambda consumer在内部 运行" + (innerLambdaEnd - innerLambdaStart) + "毫秒");
}
打印出结果:
for循环运行4毫秒
lambda consumer在内部 运行230毫秒
可以看到,lambda运行时间比普通for循环长太多了,这是为什么呢?(这里我为什么打印的是consumer在内部,这个内部的含义看到最后就明白了)
分析一下Lambda表达式流程
如果我们要研究Lambda表达式,最正确、最直接的方法就是查看它所对应的字节码指令。
使用以下命令查看class文件对应的字节码指令:
javap -v -p Test.class
上述命令解析出来的指令非常多,我这里提取比较重要的部分来给大家分析:
使用Lambda表达式所对应的字节码指令如下:
34: invokestatic #6 // Method java/lang/System.currentTimeMillis:()J
37: lstore_2
38: aload_1
39: invokedynamic #7, 0 // InvokeDynamic #0:accept:()Ljava/util/function/Consumer;
44: invokeinterface #8, 2 // InterfaceMethod java/util/List.forEach:(Ljava/util/function/Consumer;)V
49: invokestatic #6 // Method java/lang/System.currentTimeMillis:()J
不使用Lambda表达式所对应的字节码指令如下:
82: invokestatic #6 // Method java/lang/System.currentTimeMillis:()J
85: lstore 6
87: iconst_0
88: istore 8
90: iload 8
92: aload_1
93: invokeinterface #17, 1 // InterfaceMethod java/util/List.size:()I
98: if_icmpge 107
101: iinc 8, 1
104: goto 90
107: invokestatic #6 // Method java/lang/System.currentTimeMillis:()J
从上面两种方式所对应的字节码指令可以看出,两种方式的执行方式确实不太一样。
不使用Lambda表达式执行循环流程
字节码指令执行步骤:
- 82:invokestatic: 执行静态方法,java/lang/System.currentTimeMillis:();
- 85-92: 简单来说就是初始化数据,int i = 0;
- 93:invokeinterface:执行接口方法,接口为List,所以真正执行的是就是ArrayList.size方法;
- 98:if_icmpge: 比较,相当于执行i < list.size();
- 101:iinc: i++;
- 104:goto: 进行下一次循环;
- 107:invokestatic: 执行静态方法;
那么这个流程大家应该问题不大,是一个很正常的循环逻辑。
使用Lambda表达式执行循环流程
我们再来看一下对应的字节码指令:
34: invokestatic #6 // Method java/lang/System.currentTimeMillis:()J
37: lstore_2
38: aload_1
39: invokedynamic #7, 0 // InvokeDynamic #0:accept:()Ljava/util/function/Consumer;
44: invokeinterface #8, 2 // InterfaceMethod java/util/List.forEach:(Ljava/util/function/Consumer;)V
49: invokestatic #6 // Method java/lang/System.currentTimeMillis:()J
字节码指令执行步骤:
- 34: invokestatic: 执行静态方法,java/lang/System.currentTimeMillis:();
- 37-38: 初始化数据
- 39: invokedynamic: 这是在干什么?
- 44: invokeinterface: 执行java/util/List.forEach()方法
- 49: invokestatic: 执行静态方法,java/lang/System.currentTimeMillis:();
和上面正常循环的方式的字节码指令不太一样,我们认真的看一下这个字节码指令,这个流程并不像是一个循环的流程,而是一个方法顺序执行的流程:
- 先初始化一些数据
- 执行invokedynamic指令(暂时这个指令是做什么的)
- 然后执行java/util/List.forEach()方法,所以真正的循环逻辑在这里
所以我们可以发现,使用Lambda表达式循环时,在循环前会做一些其他事情,所以导致执行时间要更长一点。
那么invokedynamic指令到底做了什么事情呢?
java/util/List.forEach
方法接收一个参数Consumer<? super T> action
,Consumer是一个接口,所以如果要调用这个方法,就要传递该接口类型的对象。
而我们在代码里实际上是传递的一个Lambda表达式,那么我们这里可以假设:需要将Lambda表达式转换成对象,且该对象的类型需要根据该Lambda表达式所使用的地方在编译时期进行反推。
这里在解释一下反推:一个Lambda表达式是可以被多个方法使用的,而且这个方法所接收的参数类型,也就是函数式接口,是可以不一样的,只要函数式接口符合该Lambda表达式的定义即可。
本例中,编译器在编译时可以反推出,Lambda表达式对应一个Cosumer接口类型的对象。
那么如果要将Lambda表达式转换成一个对象,就需要有一个类实现Consumer接口。
所以,现在的问题就是这个类是什么时候生成的,并且生成在哪里了?
所以,我们慢慢的应该能够想到,invokedynamic指令,****它是不是就是先将Lambda表达式转换成某个类,然后生成一个实例以便提供给forEach方法调用呢?
我们回头再看一下invokedynamic指令:
invokedynamic #7, 0 // InvokeDynamic #0:accept:()Ljava/util/function/Consumer;
Java中调用函数有四大指令:invokevirtual、invokespecial、invokestatic、invokeinterface,在JSR 292 添加了一个新的指令invokedynamic,这个指令表示执行动态语言,也就是Lambda表达式。
该指令注释中的#0
表示的是BootstrapMethods中的第0个方法:
BootstrapMethods:
0: #60 invokestatic java/lang/invoke/LambdaMetafactory.metafactory:(Ljava/lang/invoke/MethodHandles$Lookup;Ljava/lang/String;Ljava/lang/invoke/MethodType;Ljava/lang/invoke/MethodType;Ljava/lang/invoke/MethodHandle;Ljava/lang/invoke/MethodType;)Ljava/lang/invoke/CallSite;
Method arguments:
#61 (Ljava/lang/Object;)V
#62 invokestatic com/luban/Test.lambda$main$0:(Ljava/lang/Integer;)V
#63 (Ljava/lang/Integer;)V
所以invokedynamic执行时,实际上就是执行BootstrapMethods中的方法,比如本例中的:java/lang/invoke/LambdaMetafactory.metafactory
。
代码如下:
public static CallSite metafactory(MethodHandles.Lookup caller,
String invokedName,
MethodType invokedType,
MethodType samMethodType,
MethodHandle implMethod,
MethodType instantiatedMethodType)
throws LambdaConversionException {
AbstractValidatingLambdaMetafactory mf;
mf = new InnerClassLambdaMetafactory(caller, invokedType,
invokedName, samMethodType,
implMethod, instantiatedMethodType,
false, EMPTY_CLASS_ARRAY, EMPTY_MT_ARRAY);
mf.validateMetafactoryArgs();
return mf.buildCallSite();
}
这个方法中用到了一个特别明显且易懂的类:InnerClassLambdaMetafactory。
这个类是一个针对Lambda表达式生成内部类的工厂类。当调用buildCallSite方法是会生成一个内部类并且生成该类的一个实例。
那么现在要生成一个内部类,需要一些什么条件呢:
- 类名:可按一些规则生成
- 类需要实现的接口:编译时就已知了,本例中就是Consumer接口
- 实现接口里面的方法:本例中就是Consumer接口的
void accept(T t)
方法。
那么内部类该怎么实现void accept(T t)
方法呢?
我们再来看一下javap -v -p Test.class
的结果中除开我们自己实现的方法外还多了一个方法:
private static void lambda$main$0(java.lang.Integer);
descriptor: (Ljava/lang/Integer;)V
flags: ACC_PRIVATE, ACC_STATIC, ACC_SYNTHETIC
Code:
stack=0, locals=1, args_size=1
0: return
LineNumberTable:
line 25: 0
LocalVariableTable:
Start Length Slot Name Signature
0 1 0 i Ljava/lang/Integer;
很明显,这个静态的lambda$main$0
方法代表的就是我们写的Lambda表达式,只是因为我们例子中Lambda表达式没写什么逻辑,所以这段字节码指令Code部分也没有什么内容。
那么,我们现在在实现内部类中的void accept(T t)
方法时,只要调用一个这个lambda$main$0
静态方法即可。
所以到此,一个内部类就可以被正常的实现出来了,内部类有了之后,Lambda表达式就是可以被转换成这个内部类的对象,就可以进行循环了。
最后,根据上面分析的,我们把lambda的表达式的创建过程提取出来,再试一次:
public static void main(String[] args) {
List<Integer> list = new ArrayList<>();
for (int i = 0; i < 100000; i++) {
list.add(i);
}
long normalStart = System.currentTimeMillis();
for (int i = 0; i < list.size(); i++) {}
long normalEnd = System.currentTimeMillis();
System.out.println("for循环运行" + (normalEnd - normalStart) + "毫秒");
long innerLambdaStart = System.currentTimeMillis();
list.forEach(i -> {});
long innerLambdaEnd = System.currentTimeMillis();
System.out.println("lambda consumer在内部 运行" + (innerLambdaEnd - innerLambdaStart) + "毫秒");
long outLambdaStart = System.currentTimeMillis();
Consumer consumer = i -> {};
list.forEach(consumer);
long outLambdaEnd = System.currentTimeMillis();
System.out.println("lambda consumer在外部 运行" + (outLambdaEnd - outLambdaStart) + "毫秒");
}
打印出结果:
for循环运行4毫秒
lambda consumer在内部 运行230毫秒
lambda consumer在外部 运行5毫秒
可以看到,把consumer提取到外面以后,效率大大提升,几乎可以达到和for循环一样的水平,这个也说明了lambda的耗时是在于对consumer对象的生成和解析,并且有可能每次循环都会解析一次consumer,因为我们把Consumer consumer = i -> {};这一行代码提取到打印时间的上面,结果还是一样快的.
这个结果也提醒了各位开发,如果对性能有要求,尽量不用lambada表达式,特别是简单的for循环,完全没必要用,切记不要滥用lambada表达式,如果实在要用的时候也可以把consumer先提取出来以此提高效率。
标签:lang,java,退烧,System,currentTimeMillis,lambda,表达式,Lambda From: https://www.cnblogs.com/leecoder5/p/18420725