Java SE 8ストリームを使用したデータの処理、パート1

Raoul-Gabriel Urma

ストリーム運用を使用して高度なデータ処理クエリを表現します。

コレクションなしで何をするのでしょうか。ほぼすべてのJavaアプリケーションが、コレクションを作成および処理します。コレクションは多くのプログラミング作業にとって基本的なもので、データをグループ化して処理することができます。たとえば、顧客の取引明細書を表す銀行取引のコレクションを作成できます。次に、回収全体を処理して、顧客が費やした金額を調べることもできます。その重要性にもかかわらず、Javaではコレクションの処理は完璧とは言えません。

原本は、Java Magazineの2014年3月/4月号に掲載されました。今すぐ購読する

まず、コレクションに対する一般的な処理パターンは、「finding」（たとえば、最も価値の高いトランザクションを見つける）や「grouping」（たとえば、食料品の買い物に関連するすべてのトランザクションをグループ化する）といったSQLのような操作に似ています。ほとんどのデータベースでは、このような操作を宣言的に指定できます。たとえば、次のSQLクエリでは、"SELECT id, MAX(value) from transactions"という値が最も大きいトランザクションIDを検索できます。

おわかりのように、最大値を計算する方法を導入する必要はありません（たとえば、ループや最大値を追跡する変数を使用する）。期待しているものだけを表現すればよいのです。この基本的な考え方は、このようなクエリの明示的な実装方法について心配する必要がないことを意味します。なぜコレクションで同じようなことができないのでしょうか。ループを使った操作を何度も何度も再実装していないでしょうか。

では、どうすれば本当に大きなコレクションを効率的に処理できるのでしょうか。理想的には、処理を高速化するには、マルチコア・アーキテクチャを活用する必要があります。ただし、パラレル・コードの記述は困難でエラーが発生しやすくなります。

Java SE 8で解決Java API設計者は、宣言的な方法でデータを処理できるストリームと呼ばれる新しい抽象化を使用してAPIを更新しています。さらに、ストリームは、マルチスレッド・コードの単一行を記述しなくても、マルチコア・アーキテクチャを利用できます。良さそうですよね。この一連の記事では、その点を探っていきます。

驚くべき考えがあります。この2つの操作は、要素を「永遠に」作り出すことができるのです。

ストリームで何ができるかを詳しく調べる前に、Java SE 8ストリームで新しいプログラミング・スタイルを理解できるように、例を見てみましょう。たとえば、groceryタイプのすべてのトランザクションを検索し、トランザクション値の降順でソートされたトランザクションIDのリストを返す必要があるとします。Java SE 7では、リスト1に示すようにこれを行います。Java SE 8では、リスト2に示すように実行します。

Java SE 8ストリームを使用したデータの処理、パート1

ここから始めよう

Streamsとコレクション

ストリーム操作: ストリームの展開によるデータの処理

数値ストリーム

ストリームの作成

詳細

結論