串联并行流
假设我有两个数组和.我只想从第一个数组中获取正数,从第二个数字中获取不同的数字,将它们合并在一起,排序并存储到结果数组中。这可以使用流执行:int[]
input1
input2
int[] result = IntStream.concat(Arrays.stream(input1).filter(x -> x > 0),
Arrays.stream(input2).distinct()).sorted().toArray();
我想加快任务速度,所以我考虑使流并行。通常,这只是意味着我可以在流构造和终端操作之间的任何位置插入,结果将是相同的。IntStream.concat 的 JavaDoc 表示,如果任何输入流是并行的,则生成的流将是并行的。因此,我认为制作流或流或串联流将产生相同的结果。.parallel()
parallel()
input1
input2
实际上我错了:如果我添加到生成的流中,输入流似乎仍然是连续的。此外,我可以将输入流(其中一个或两个)标记为 ,然后将生成的流转换为 ,但输入保持并行。因此,实际上有8种可能性:input1,input2和串联流中的任何一种都可以并行,也可以不并行:.parallel()
.parallel()
.sequential()
int[] sss = IntStream.concat(Arrays.stream(input1).filter(x -> x > 0),
Arrays.stream(input2).distinct()).sorted().toArray();
int[] ssp = IntStream.concat(Arrays.stream(input1).filter(x -> x > 0),
Arrays.stream(input2).distinct()).parallel().sorted().toArray();
int[] sps = IntStream.concat(Arrays.stream(input1).filter(x -> x > 0),
Arrays.stream(input2).parallel().distinct()).sequential().sorted().toArray();
int[] spp = IntStream.concat(Arrays.stream(input1).filter(x -> x > 0),
Arrays.stream(input2).parallel().distinct()).sorted().toArray();
int[] pss = IntStream.concat(Arrays.stream(input1).parallel().filter(x -> x > 0),
Arrays.stream(input2).distinct()).sequential().sorted().toArray();
int[] psp = IntStream.concat(Arrays.stream(input1).parallel().filter(x -> x > 0),
Arrays.stream(input2).distinct()).sorted().toArray();
int[] pps = IntStream.concat(Arrays.stream(input1).parallel().filter(x -> x > 0),
Arrays.stream(input2).parallel().distinct()).sequential().sorted().toArray();
int[] ppp = IntStream.concat(Arrays.stream(input1).parallel().filter(x -> x > 0),
Arrays.stream(input2).parallel().distinct()).sorted().toArray();
我针对不同的输入大小对所有版本进行了基准测试(在Core i5 4xCPU,Win7上使用JDK 8u45 64bit),并在每种情况下都获得了不同的结果:
Benchmark (n) Mode Cnt Score Error Units
ConcatTest.SSS 100 avgt 20 7.094 ± 0.069 us/op
ConcatTest.SSS 10000 avgt 20 1542.820 ± 22.194 us/op
ConcatTest.SSS 1000000 avgt 20 350173.723 ± 7140.406 us/op
ConcatTest.SSP 100 avgt 20 6.176 ± 0.043 us/op
ConcatTest.SSP 10000 avgt 20 907.855 ± 8.448 us/op
ConcatTest.SSP 1000000 avgt 20 264193.679 ± 6744.169 us/op
ConcatTest.SPS 100 avgt 20 16.548 ± 0.175 us/op
ConcatTest.SPS 10000 avgt 20 1831.569 ± 13.582 us/op
ConcatTest.SPS 1000000 avgt 20 500736.204 ± 37932.197 us/op
ConcatTest.SPP 100 avgt 20 23.871 ± 0.285 us/op
ConcatTest.SPP 10000 avgt 20 1141.273 ± 9.310 us/op
ConcatTest.SPP 1000000 avgt 20 400582.847 ± 27330.492 us/op
ConcatTest.PSS 100 avgt 20 7.162 ± 0.241 us/op
ConcatTest.PSS 10000 avgt 20 1593.332 ± 7.961 us/op
ConcatTest.PSS 1000000 avgt 20 383920.286 ± 6650.890 us/op
ConcatTest.PSP 100 avgt 20 9.877 ± 0.382 us/op
ConcatTest.PSP 10000 avgt 20 883.639 ± 13.596 us/op
ConcatTest.PSP 1000000 avgt 20 257921.422 ± 7649.434 us/op
ConcatTest.PPS 100 avgt 20 16.412 ± 0.129 us/op
ConcatTest.PPS 10000 avgt 20 1816.782 ± 10.875 us/op
ConcatTest.PPS 1000000 avgt 20 476311.713 ± 19154.558 us/op
ConcatTest.PPP 100 avgt 20 23.078 ± 0.622 us/op
ConcatTest.PPP 10000 avgt 20 1128.889 ± 7.964 us/op
ConcatTest.PPP 1000000 avgt 20 393699.222 ± 56397.445 us/op
从这些结果中,我只能得出结论,步骤的并行化会降低整体性能(至少在我的测试中)。distinct()
所以我有以下问题:
- 是否有任何关于如何更好地将并行化与串联流结合使用的官方指南?测试所有可能的组合并不总是可行的(特别是在连接两个以上的流时),所以有一些“经验法则”会很好。
- 似乎如果我连接直接从集合/数组创建的流(在连接之前不执行中间操作),那么结果并不依赖于 .这是真的吗?
parallel()
- 除了串联之外,是否还有其他情况,其中的结果取决于流管道在哪个点上并行化?