Java

Tutorial Java: Operaciones intermedias con Streams: distinct()

Java stream distinct: eliminación de duplicados. Domina la eliminación de duplicados en Java utilizando stream distinct con ejemplos prácticos.

Aprende Java GRATIS y certifícate

En el contexto de la programación funcional en Java, los Streams representan una secuencia de elementos que pueden ser procesados en paralelo o secuencialmente. La operación intermedia distinct() es una de las muchas operaciones disponibles en la API de Streams de Java. Esta operación devuelve un stream que consta de elementos únicos, eliminando los duplicados. Esta es una operación intermedia, lo que significa que puede utilizarla en combinación con otras operaciones, como map(), filter(), flatMap(), y sorted(), para formar una cadena de operaciones.

La sintaxis de distinct() es muy sencilla. Solo necesita invocar el método sobre el stream sin ningún argumento, como se muestra a continuación:

stream.distinct()

Ejemplo de uso de distinct()

Consideremos un simple ejemplo de cómo se puede usar distinct() para eliminar elementos duplicados de un stream.

import java.util.Arrays;
import java.util.List;
import java.util.stream.Collectors;

public class Main {
    public static void main(String[] args) {
        List<String> fruits = Arrays.asList("Manzana", "Banana", "Manzana", "Naranja", "Banana", "Naranja");
        List<String> distinctFruits = fruits.stream().distinct().collect(Collectors.toList());
        System.out.println(distinctFruits);
    }
}

En el código anterior, primero creamos una lista de frutas donde algunas frutas están duplicadas. Luego creamos un stream a partir de la lista y usamos distinct() para filtrar las frutas duplicadas. Por último, convertimos el stream a una lista y la imprimimos. El resultado será una lista de frutas sin duplicados.

Cómo funciona distinct()

Internamente, distinct() utiliza equals() para comparar los elementos y determinar si son duplicados. Por lo tanto, si está trabajando con objetos personalizados, debe asegurarse de que ha sobrescrito el método equals() en su clase. Si no sobrescribe equals(), distinct() considerará diferentes instancias del mismo objeto como distintas, incluso si sus campos son idénticos.

Aquí hay un ejemplo que ilustra este punto. Supongamos que tenemos una clase Fruit que representa una fruta:

public class Fruit {
    private String name;

    public Fruit(String name) {
        this.name = name;
    }

    // getters y setters omitidos para brevedad
}

Si creamos una lista de Fruit y tratamos de eliminar los duplicados con distinct(), obtendremos resultados inesperados:

List<Fruit> fruits = Arrays.asList(new Fruit("Manzana"), new Fruit("Banana"), new Fruit("Manzana"));
List<Fruit> distinctFruits = fruits.stream().distinct().collect(Collectors.toList());
System.out.println(distinctFruits.size());  // Imprime 3, aunque esperábamos 2

Para solucionar este problema, debemos sobrescribir equals() en la clase Fruit:

@Override
public boolean equals(Object obj) {
    if (this == obj) return true;
    if (obj == null || getClass() != obj.getClass()) return false;
    Fruit fruit = (Fruit) obj;
    return name.equals(fruit.name);
}

Con este cambio, distinct() funcionará como se esperaba.

Consideraciones de rendimiento

Aunque distinct() es una herramienta poderosa, no es libre de costos. Para eliminar los duplicados, distinct() debe mantener un conjunto de elementos previamente vistos. Esto implica un coste de memoria adicional, que puede ser significativo para streams muy grandes. Además, si está trabajando con un stream paralelo, distinct() puede tener que realizar un costoso paso de combinación para fusionar los conjuntos de elementos vistos en diferentes hilos.

Por lo tanto, si la memoria o la velocidad son una preocupación, puede que desee considerar alternativas a distinct(). Por ejemplo, si sus datos provienen de una base de datos, puede ser más eficiente eliminar los duplicados en el lado de la base de datos mediante una consulta SQL. O si sus datos están en una lista, puede considerar el uso de un Set para eliminar los duplicados, que puede ser más rápido y consumir menos memoria que distinct().

Conclusión

En resumen, distinct() es una operación intermedia en la API de Streams de Java que puede ser utilizada para eliminar duplicados de un stream. Aunque distinct() es fácil de usar y puede ser muy útil en algunas situaciones, también tiene costos de memoria y rendimiento que deben ser considerados. Si está trabajando con objetos personalizados, también debe asegurarse de que ha sobrescrito el método equals(), ya que distinct() lo usa para comparar elementos.

Aprende Java GRATIS online

Ejercicios de esta lección Operaciones intermedias con Streams: distinct()

Evalúa tus conocimientos de esta lección Operaciones intermedias con Streams: distinct() con nuestros retos de programación de tipo Test, Puzzle, Código y Proyecto con VSCode, guiados por IA.

Clases abstractas

Test

Streams: reduce()

Test

Streams: flatMap()

Test

Llamada y sobrecarga de funciones

Puzzle

Métodos referenciados

Test

Métodos de la clase String

Código

Representación de Fecha

Puzzle

Operadores lógicos

Test

Tipos de datos

Código

Estructuras de iteración

Puzzle

Streams: forEach()

Test

Objetos

Puzzle

Funciones lambda

Test

Uso de Scanner

Puzzle

CRUD en Java de modelo Customer sobre un ArrayList

Proyecto

Tipos de variables

Puzzle

Streams: collect()

Puzzle

Operadores aritméticos

Puzzle

Interfaz funcional Consumer

Test

API java.nio 2

Puzzle

API Optional

Test

Interfaz funcional Function

Test

Encapsulación

Test

Interfaces

Código

Uso de API Optional

Puzzle

Representación de Hora

Test

Herencia básica

Test

Clases y objetos

Código

Interfaz funcional Supplier

Puzzle

HashMap

Puzzle

Sobrecarga de métodos

Test

Polimorfismo de tiempo de ejecución

Puzzle

OOP en Java

Proyecto

Creación de Streams

Test

Streams: min max

Puzzle

Métodos avanzados de la clase String

Puzzle

Polimorfismo de tiempo de compilación

Test

Excepciones

Puzzle

Herencia avanzada

Puzzle

Estructuras de selección

Test

Uso de interfaces

Test

HashSet

Test

Objeto Scanner

Test

Streams: filter()

Puzzle

Operaciones de Streams

Puzzle

Interfaz funcional Predicate

Puzzle

Streams: sorted()

Test

Configuración de entorno

Test

CRUD en Java de modelo Customer sobre un HashMap

Proyecto

Uso de variables

Test

Clases

Test

Streams: distinct()

Puzzle

Streams: count()

Test

ArrayList

Test

Datos de referencia

Test

Interfaces funcionales

Puzzle

Métodos básicos de la clase String

Test

Instalación

Test

Funciones

Código

Estructuras de control

Código

Herencia de clases

Código

Streams: map()

Puzzle

Funciones y encapsulamiento

Test

Streams: match

Test

Gestión de errores y excepciones

Código

Datos primitivos

Puzzle

Todas las lecciones de Java

Accede a todas las lecciones de Java y aprende con ejemplos prácticos de código y ejercicios de programación con IDE web sin instalar nada.

Introducción A Javascript

JavaScript

Sintaxis

Tipos De Datos

JavaScript

Sintaxis

Variables

JavaScript

Sintaxis

Operadores

JavaScript

Sintaxis

Estructuras De Control

JavaScript

Sintaxis

Funciones

JavaScript

Sintaxis

Funciones Cierre (Closure)

JavaScript

Sintaxis

Funciones Flecha

JavaScript

Programación Funcional

Filtrado Con Filter() Y Find()

JavaScript

Programación Funcional

Transformación Con Map()

JavaScript

Programación Funcional

Reducción Con Reduce()

JavaScript

Programación Funcional

Clases Y Objetos

JavaScript

Programación Orientada A Objetos

Excepciones

JavaScript

Programación Orientada A Objetos

Encapsulación

JavaScript

Programación Orientada A Objetos

Herencia

JavaScript

Programación Orientada A Objetos

Polimorfismo

JavaScript

Programación Orientada A Objetos

Array

JavaScript

Estructuras De Datos

Conjuntos Con Set

JavaScript

Estructuras De Datos

Mapas Con Map

JavaScript

Estructuras De Datos

Manipulación Dom

JavaScript

Dom

Selección De Elementos Dom

JavaScript

Dom

Modificación De Elementos Dom

JavaScript

Dom

Eventos Del Dom

JavaScript

Dom

Callbacks

JavaScript

Programación Asíncrona

Promises

JavaScript

Programación Asíncrona

Async / Await

JavaScript

Programación Asíncrona

Instalación De Java

Introducción Y Entorno

Configuración De Entorno Java

Introducción Y Entorno

Ecosistema Jakarta Ee De Java

Introducción Y Entorno

Tipos De Datos

Sintaxis

Variables

Sintaxis

Operadores

Sintaxis

Estructuras De Control

Sintaxis

Funciones

Sintaxis

Excepciones

Programación Orientada A Objetos

Clases Y Objetos

Programación Orientada A Objetos

Encapsulación

Programación Orientada A Objetos

Herencia

Programación Orientada A Objetos

Clases Abstractas

Programación Orientada A Objetos

Interfaces

Programación Orientada A Objetos

Sobrecarga De Métodos

Programación Orientada A Objetos

Polimorfismo

Programación Orientada A Objetos

La Clase Scanner

Programación Orientada A Objetos

Métodos De La Clase String

Programación Orientada A Objetos

Listas

Framework Collections

Conjuntos

Framework Collections

Mapas

Framework Collections

Funciones Lambda

Programación Funcional

Interfaz Funcional Consumer

Programación Funcional

Interfaz Funcional Predicate

Programación Funcional

Interfaz Funcional Supplier

Programación Funcional

Interfaz Funcional Function

Programación Funcional

Métodos Referenciados

Programación Funcional

Creación De Streams

Programación Funcional

Operaciones Intermedias Con Streams: Map()

Programación Funcional

Operaciones Intermedias Con Streams: Filter()

Programación Funcional

Operaciones Intermedias Con Streams: Distinct()

Programación Funcional

Operaciones Finales Con Streams: Collect()

Programación Funcional

Operaciones Finales Con Streams: Min Max

Programación Funcional

Operaciones Intermedias Con Streams: Flatmap()

Programación Funcional

Operaciones Intermedias Con Streams: Sorted()

Programación Funcional

Operaciones Finales Con Streams: Reduce()

Programación Funcional

Operaciones Finales Con Streams: Foreach()

Programación Funcional

Operaciones Finales Con Streams: Count()

Programación Funcional

Operaciones Finales Con Streams: Match

Programación Funcional

Api Optional

Programación Funcional

Api Java.nio 2

Entrada Y Salida (Io)

Api Java.time

Api Java.time

Accede GRATIS a Java y certifícate

Certificados de superación de Java

Supera todos los ejercicios de programación del curso de Java y obtén certificados de superación para mejorar tu currículum y tu empleabilidad.

En esta lección

Objetivos de aprendizaje de esta lección

  1. Comprender el concepto y la funcionalidad del método distinct() en Java.
  2. Aprender cómo usar distinct() en un stream.
  3. Comprender la importancia de sobrescribir el método equals() al trabajar con objetos personalizados.
  4. Apreciar las implicaciones de rendimiento y memoria del uso de distinct().
  5. Conocer alternativas a distinct() cuando la eficiencia es crucial.