Procesamiento de datos con streams de Java SE 8 - Parte 1

Por Raoul-Gabriel Urma

Uso de operaciones de streams para expresar consultas de procesamiento de datos complejas

¿Qué haríamos sin las colecciones? Casi todas las aplicaciones de Java crean y procesan colecciones. Son esenciales para muchas tareas de programación: permiten agrupar y procesar datos. Por ejemplo, el desarrollador podría querer crear una colección de transacciones bancarias para representar el extracto de un cliente. Luego, tal vez quiera procesar toda la colección para averiguar cuánto dinero gastó el cliente. A pesar de su importancia, el procesamiento de colecciones en Java dista de ser perfecto.

En primer lugar, los patrones de procesamiento de colecciones típicos son similares a las operaciones del estilo de las que se usan en SQL para "buscar" (por ejemplo, buscar la transacción de mayor valor) o "agrupar" (por ejemplo, agrupar todas las transacciones relacionadas con compras de almacén). La mayoría de las bases de datos permiten establecer operaciones como esas de manera declarativa. Por ejemplo, la siguiente consulta de SQL permite buscar la identificación de la transacción de mayor valor: "SELECT id, MAX(value) from transactions".

Como puede verse, no es necesario programar cómo calcular el valor máximo (por ejemplo, mediante bucles y una variable para hacer el seguimiento del mayor valor). Solo se expresa qué resultado se espera. Así, debemos preocuparnos menos acerca de cómo codificar explícitamente las consultas; el lenguaje lo hace por nosotros. ¿Por qué no se puede hacer algo parecido con las colecciones? ¿Quién no se ha encontrado codificando esas operaciones con bucles una y otra vez?

En segundo lugar, ¿cómo podemos hacer para procesar colecciones realmente grandes con eficiencia? Idealmente, para acelerar el procesamiento conviene trabajar con arquitecturas de núcleos mútiples. No obstante, programar código paralelo es una tarea ardua y en la que es fácil cometer errores.

Presentamos una posibilidad extraordinaria: Esas dos operaciones pueden generar elementos "infinitamente".

Y todo gracias a Java SE 8. Los diseñadores de la interfaz API de Java han incorporado en su actualización una nueva abstracción denominada Stream, que permite procesar datos de modo declarativo. Más aún, los streams permiten aprovechar las arquitecturas de núcleos múltiples sin necesidad de programar líneas de código multiproceso. Suena bien, ¿no? Eso es lo que exploraremos en esta serie de artículos.

Antes de ahondar en lo que se puede hacer con streams, veamos un ejemplo para tener una idea del nuevo estilo de programación que posibilitan los streams de Java SE 8. Imaginemos que necesitamos encontrar todas las transacciones del tipo grocery y obtener un listado de identificaciones de transacciones ordenadas de mayor a menor por valor de transacción. En Java SE 7, usaríamos el código que se muestra en la Secuencia 1. En Java SE 8, usaremos el código que se muestra en la Secuencia 2.

Procesamiento de datos con streams de Java SE 8 - Parte 1

Uso de operaciones de streams para expresar consultas de procesamiento de datos complejas

Secuencia 1

Secuencia 2

Secuencia 3

Streams vs. colecciones

Secuencia 4

Secuencia 5

Secuencia 6

Secuencia 7

Secuencia 8

Secuencia 9

Secuencia 10

Secuencia 11

Secuencia 12

Secuencia 13

Secuencia 14

Secuencia 15

Secuencia 16

Secuencia 17

Secuencia 18

Secuencia 19