1.14 并行流_Java核心技术·卷2：高级特性（原书第10版）-QQ阅读中文武侠网

上QQ阅读APP看书，第一时间看更新

1.14　并行流

流使得并行处理块操作变得很容易。这个过程几乎是自动的，但是需要遵守一些规则。首先，必须有一个并行流。可以用Collection.parallelStream（）方法从任何集合中获取一个并行流：

而且，parallel方法可以将任意的顺序流转换为并行流。

只要在终结方法执行时，流处于并行模式，那么所有的中间流操作都将被并行化。

当流操作并行运行时，其目标是要让其返回结果与顺序执行时返回的结果相同。重要的是，这些操作可以以任意顺序执行。

下面的示例是一项你无法完成的任务。假设你想要对字符串流中的所有短单词计数：

这是一种非常非常糟糕的代码。传递给forEach的函数会在多个并发线程中运行，每个都会更新共享的数组。正如我们在卷Ⅰ第14章中所解释的，这是一种经典的竞争情况。如果多次运行这个程序，你很可能就会发现每次运行都会产生不同的计数值，而且每个都是错的。

你的职责是要确保传递给并行流操作的任何函数都可以安全地并行执行，达到这个目的的最佳方式是远离易变状态。在本例中，如果用长度将字符串群组，然后分别对它们进行计数，那么就可以安全地并行化这项计算。

警告：传递给并行流操作的函数不应该被堵塞。并行流使用fork-join池来操作流的各个部分。如果多个流操作被阻塞，那么池可能就无法做任何事情了。

默认情况下，从有序集合（数组和列表）、范围、生成器和迭代产生的流，或者通过调用Stream.sorted产生的流，都是有序的。它们的结果是按照原来元素的顺序累积的，因此是完全可预知的。如果运行相同的操作两次，将会得到完全相同的结果。

排序并不排斥高效的并行处理。例如，当计算stream.map（fun）时，流可以被划分为n的部分，它们会被并行地处理。然后，结果将会按照顺序重新组装起来。

当放弃排序需求时，有些操作可以被更有效地并行化。通过在流上调用unordered方法，就可以明确表示我们对排序不感兴趣。Stream.distinct就是从这种方式中获益的一种操作。在有序的流中，distinct会保留所有相同元素中的第一个，这对并行化是一种阻碍，因为处理每个部分的线程在其之前的所有部分都被处理完之前，并不知道应该丢弃哪些元素。如果可以接受保留唯一元素中任意一个的做法，那么所有部分就可以并行地处理（使用共享的集来跟踪重复元素）。

还可以通过放弃排序要求来提高limit方法的速度。如果只想从流中取出任意n个元素，而并不在意到底要获取哪些，那么可以调用：