web-dev-qa-db-ja.com

java 8並列のStream()とsorted()

JDK 8 EAは現在出ており、私はラムダと新しいStream APIに慣れるようにしています。私は並列ストリームでリストをソートしようとしましたが、結果は常に間違っています:

import Java.util.ArrayList;
import Java.util.List;

public class Test
{
    public static void main(String[] args)
    {
        List<String> list = new ArrayList<>();
        list.add("C");
        list.add("H");
        list.add("A");
        list.add("A");
        list.add("B");
        list.add("F");
        list.add("");

        list.parallelStream() // in parallel, not just concurrently!
            .filter(s -> !s.isEmpty()) // remove empty strings
            .distinct() // remove duplicates
            .sorted() // sort them
            .forEach(s -> System.out.println(s)); // print each item
    }
}

出力:

C
F
B
H
A

毎回出力が異なることに注意してください。私の質問は、それはバグですか?または、リストを並行してソートすることはできませんか?もしそうなら、なぜJavaDocはそれを述べていないのですか?最後の質問ですが、ストリームタイプによって出力が異なる別の操作はありますか?

32
Eng.Fouad

forEachOrderedではなくforEachを使用する必要があります。

forEachドキュメントに従って:

並列ストリームパイプラインの場合、並列化の利点が失われるため、この操作はストリームの遭遇順序を尊重することを保証しません。特定の要素について、ライブラリが選択した任意の時間およびスレッドでアクションを実行できます。アクションが共有状態にアクセスする場合、必要な同期を提供する必要があります。

52
Louis Wasserman

さらに、並列処理とforEachOrderedの詳細については、 here の非常に優れた例を参照してください。要約すると、並列ストリームでforEachOrderedを使用すると、並列処理の利点が失われる可能性があります。

ここで同じリソースからの例:

Integer[] intArray = {1, 2, 3, 4, 5, 6, 7, 8 };
List<Integer> listOfIntegers =
    new ArrayList<>(Arrays.asList(intArray));

System.out.println("listOfIntegers:");
listOfIntegers
    .stream()
    .forEach(e -> System.out.print(e + " "));
System.out.println("");

System.out.println("listOfIntegers sorted in reverse order:");
Comparator<Integer> normal = Integer::compare;
Comparator<Integer> reversed = normal.reversed(); 
Collections.sort(listOfIntegers, reversed);  
listOfIntegers
    .stream()
    .forEach(e -> System.out.print(e + " "));
System.out.println("");

System.out.println("Parallel stream");
listOfIntegers
    .parallelStream()
    .forEach(e -> System.out.print(e + " "));
System.out.println("");

System.out.println("Another parallel stream:");
listOfIntegers
    .parallelStream()
    .forEach(e -> System.out.print(e + " "));
System.out.println("");

System.out.println("With forEachOrdered:");
listOfIntegers
    .parallelStream()
    .forEachOrdered(e -> System.out.print(e + " "));
System.out.println("");

そして出力は

listOfIntegers:
1 2 3 4 5 6 7 8
listOfIntegers sorted in reverse order:
8 7 6 5 4 3 2 1
Parallel stream:
3 4 1 6 2 5 7 8
Another parallel stream:
6 3 1 5 7 8 4 2
With forEachOrdered:
8 7 6 5 4 3 2 1

5番目のパイプラインは、forEachOrderedメソッドを使用します。これは、ストリームをシリアルで実行したかパラレルで実行したかに関係なく、ソースによって指定された順序でストリームの要素を処理します。並列ストリームでforEachOrderedなどの操作を使用すると、並列処理の利点が失われる可能性があることに注意してください。

6
cemal