首页 > 其他分享 >求求你们了,别再乱用 parallelStream 了,速度竟然比 Stream 还要慢!!

求求你们了,别再乱用 parallelStream 了,速度竟然比 Stream 还要慢!!

时间:2022-10-04 22:01:07浏览次数:77  
标签:parallelStream Java Stream 求求 List sorted ParallelStream size

parallelStream 一定更快吗?

大家都知道 Stream 分为顺序流和并行流:

  • stream(顺序流)
  • parallelStream(并行流)

它们最大的区别就是 parallelStream 支持并行化处理,所以效率较 stream(顺序流)肯定是要更快的。这篇不会介绍 Stream 基础,Stream 系列我之前写过一个专题了,不懂的关注公众号Java技术栈,然后在公众号 Java 教程菜单中阅读。

然而你确定 parallelStream 一定要更快吗?

栈长写了一段排序的示例,分别用 stream 和 parallelStream,对 100 ~ 10000000 条数据的集合进行排序,来看下执行效率究竟如何!

顺序流排序:

/**
* 顺序流排序
* @author: 栈长
* @from: 公众号Java技术栈
*/
private static void streamSort() {
long start = System.currentTimeMillis();
List<SortTest.User> list = new ArrayList<>(LIST);

list.stream().sorted(SortTest.User::compareAge).collect(Collectors.toList());

System.out.println("\nList size: " + list.size() + " Stream.sorted: " + (System.currentTimeMillis() - start));
}

并行流排序:

/**
* 并行流排序
* @author: 栈长
* @from: 公众号Java技术栈
*/
private static void parallelStreamSort() {
long start = System.currentTimeMillis();
List<SortTest.User> list = new ArrayList<>(LIST);

list.parallelStream().sorted(SortTest.User::compareAge).collect(Collectors.toList());

System.out.println("List size: " + list.size() + " ParallelStream.sorted: " + (System.currentTimeMillis() - start));
}

本文所有完整示例源代码已经上传:

​https://github.com/javastacks/javastack​

执行结果如下:

List size: 10000000 Stream.sorted: 202
List size: 10000000 ParallelStream.sorted: 402

List size: 1000000 Stream.sorted: 53
List size: 1000000 ParallelStream.sorted: 15

List size: 100000 Stream.sorted: 1
List size: 100000 ParallelStream.sorted: 2

List size: 10000 Stream.sorted: 0
List size: 10000 ParallelStream.sorted: 1

List size: 1000 Stream.sorted: 0
List size: 1000 ParallelStream.sorted: 1

List size: 100 Stream.sorted: 0
List size: 100 ParallelStream.sorted: 0

在 100000 以下是没什么区别的;

在 1000000 左右 ParallelStream 虽然领先 Stream,但也不是绝对每次都领先,经过不断测试,这个数据量区间的测试两者会互相领先;

在 10000000 左右就很稳定了,ParallelStream 几乎比 Stream 慢了 2 倍!

现在你可能会有疑问了,为什么会这样?

栈长起初也有疑问,并行流(ParallelStream)怎么会比顺序流(Stream)还要慢。。

其实我后面想想也就明白了,并行流(ParallelStream)的背后其实是 Java7 开始支持的 ​​Fork/Join​​,即把一个大任务拆分成 N 个小任务,然后最终合并各个子任务的结果,所以对于子任务线程的拆分、创建、结果合并等操作都需要不少的开销,特别是线程的创建。

所以这种不耗时的简单排序操作事实上是不适用于并行流(ParallelStream)的,它所带来的线程创建的损耗可能还会比顺序流(Stream)还要更慢。

最新 Java 8+ 面试题也都整理好了,点击Java面试库小程序在线刷题。

什么时候用 ParallelStream?

既然使用 ​​Fork/Join​​ 是会有损耗的,那对于单条数据的处理的时间最好是理论上要超过用并行流(ParallelStream)本身的损耗,这种情况下就比较合适。

也就是说,如果对于流中的每条数据的处理比较费时间,并且没有顺序要求,这种场景下用并行流(ParallelStream)会更快,更合适。

来看下面这个示例:

顺序流数据处理:

/**
* 顺序流数据处理
* @author: 栈长
* @from: 公众号Java技术栈
*/
private static void streamProcess() {
long start = System.currentTimeMillis();
List<SortTest.User> list = new ArrayList<>(LIST);

list.stream().map(StreamSpeedTest::process).collect(Collectors.toList());

System.out.println("\nList size: " + list.size() + " Stream process: " + (System.currentTimeMillis() - start));
}

并行流数据处理:

/**
* 并行流数据处理
* @author: 栈长
* @from: 公众号Java技术栈
*/
private static void parallelStreamProcess() {
long start = System.currentTimeMillis();
List<SortTest.User> list = new ArrayList<>(LIST);

list.parallelStream().map(StreamSpeedTest::process).collect(Collectors.toList());

System.out.println("List size: " + list.size() + " ParallelStream process: " + (System.currentTimeMillis() - start));
}

数据处理:

/**
* 数据处理
* @author: 栈长
* @from: 公众号Java技术栈
*/
private static SortTest.User process(SortTest.User user) {
try {
user.setName(user.getName() + ": process");
Thread.sleep(5);
} catch (InterruptedException e) {
e.printStackTrace();
}
return user;
}

注意: 这里加了个休眠 5 毫秒,为了体现真实的处理数据耗时。

本文所有完整示例源代码已经上传:

​https://github.com/javastacks/javastack​

并行流排序:

List size: 1000 Stream process: 5750
List size: 1000 ParallelStream process: 745

List size: 100 Stream process: 566
List size: 100 ParallelStream process: 77

结果很明显了,不管测试多少次,并行流(ParallelStream)的处理速度都要比顺序流(Stream)要快几倍!!我这里只测试了 100 和 1000 条数据,因为 10000 条以上的数据用顺序流(Stream)可能要等非常久。

而且我程序中的处理逻辑只休眠了 5 毫秒,如果实际处理单条数据的耗时要比这个更长,那并行流(ParallelStream)的处理效率还会更明显。

总结

稍微总结下:

  • stream:适用于避免线程安全问题、要求顺序执行、数据处理简单不耗时的任务;
  • parallelStream:适用于不存在线程安全问题、不需要顺序性执行、数据处理比较耗时的任务;

所以,你学废了吗?赶紧发给身边的同事看看吧,别再乱用 parallelStream 了!用的不好,存在线程安全问题不说,效率上可能还会适得其反。

大家如果对 Java 8 新增的知识点(Lambda、Stream、函数式接口等)还不会用的可以关注公众号:Java技术栈,在 Java 教程菜单中阅读,Java 8+ 系列教程我都写了一堆了。

本文所有完整示例源代码已经上传:

​https://github.com/javastacks/javastack​

欢迎 Star 学习,后面 Java 示例都会在这上面提供!

好了,今天的分享就到这里了,后面栈长会分享更多好玩的 Java 技术和最新的技术资讯,关注公众号Java技术栈第一时间推送,我也将主流 Java 面试题和参考答案都整理好了,在公众号后台回复关键字 "面试" 进行刷题。


标签:parallelStream,Java,Stream,求求,List,sorted,ParallelStream,size
From: https://blog.51cto.com/javastack/5731838

相关文章

  • C++标准库iostream
    iostream标准库iostream是C++的标准库之一,为内置类型对象提供了输入输出支持,同时也支持文件的输入输出,封装的命名空间名称为std。C++的I/O发生在流中,流是字节序列。iost......
  • Two-Stream Convolutional Networks for Action Recognition in Videos论文精读
    Two-StreamConvolutionalNetworksforActionRecognitioninVideos论文精读大家好,今天我要讲的论文是一篇视频理解领域的开山之作,这是2014年发表在NIPS的一篇文章。这......
  • .NET教程 - 文件 & 流 & 压缩(File & Stream & Compress)
    更新记录转载请注明出处:2022年10月4日发布。2022年10月1日从笔记迁移到博客。文件I/O基础(FileI/O)文件概念存储在磁盘上按特定顺序字节的数据组成的命名集合Af......
  • 微服务设计(五)---分布式配置中心与spring cloud stream
    一、SpringCloudStream在实际的企业开发中,消息中间件是至关重要的组件之一。消息中间件主要解决应用解耦,异步消息,流量削锋等问题,实现高性能,高可用,可伸缩和最终一致......
  • stream().map().collect()
    原文链接:https://blog.csdn.net/qq_42688149/article/details/1180243471示例有一个集合:Listusers=getList(); //从数据库查询的用户集合现在想获取User的身份证号......
  • Streamlit常用组件
    一、前言因为Streamlit的组件使用比较简单,我下面直接贴图和上代码,就不一一细说了,详细的可以查看官方文档二、Streamlit常用组件1、效果图 (图1)     ......
  • FileStream,StreamReader,StreamWiter的用法
    https://blog.csdn.net/Good_StudyDaydayUp/article/details/82976951https://blog.csdn.net/linxinfa/article/details/95215416https://blog.csdn.net/qq_42778001/art......
  • java.util.zip包 OutputStream ZipOutputStream以压缩包的方式导出
    转自:https://blog.csdn.net/lvoelife/article/details/108620182/***压缩文件*@paramfileIds文件id:根据id可获取文件*@parampackageName下载......
  • nodejs stream 背压处理学习
    内容是nodejs官方的,对于需要开发自己的stream是很值得学习参考的参考资料​​https://nodejs.org/en/docs/guides/backpressuring-in-streams/​​​​https://nodejs.org......
  • Redis Stream实现全部节点机器推送消息
    背景有时候,在微服务时代,我们需要对全部的机器节点进行通知。在常规情况下,一个请求经过负载均衡只有一个机器可以收到。那么,如何能让全部的机器都收到同样的请求呢?需要借助......