Java

Tutorial Java: Operaciones intermedias con Streams: distinct()

Java stream distinct: eliminación de duplicados. Domina la eliminación de duplicados en Java utilizando stream distinct con ejemplos prácticos.

Aprende Java y certifícate

En el contexto de la programación funcional en Java, los Streams representan una secuencia de elementos que pueden ser procesados en paralelo o secuencialmente. La operación intermedia distinct() es una de las muchas operaciones disponibles en la API de Streams de Java. Esta operación devuelve un stream que consta de elementos únicos, eliminando los duplicados. Esta es una operación intermedia, lo que significa que puede utilizarla en combinación con otras operaciones, como map(), filter(), flatMap(), y sorted(), para formar una cadena de operaciones.

La sintaxis de distinct() es muy sencilla. Solo necesita invocar el método sobre el stream sin ningún argumento, como se muestra a continuación:

stream.distinct()

Ejemplo de uso de distinct()

Consideremos un simple ejemplo de cómo se puede usar distinct() para eliminar elementos duplicados de un stream.

import java.util.Arrays;
import java.util.List;
import java.util.stream.Collectors;

public class Main {
    public static void main(String[] args) {
        List<String> fruits = Arrays.asList("Manzana", "Banana", "Manzana", "Naranja", "Banana", "Naranja");
        List<String> distinctFruits = fruits.stream().distinct().collect(Collectors.toList());
        System.out.println(distinctFruits);
    }
}

En el código anterior, primero creamos una lista de frutas donde algunas frutas están duplicadas. Luego creamos un stream a partir de la lista y usamos distinct() para filtrar las frutas duplicadas. Por último, convertimos el stream a una lista y la imprimimos. El resultado será una lista de frutas sin duplicados.

Cómo funciona distinct()

Internamente, distinct() utiliza equals() para comparar los elementos y determinar si son duplicados. Por lo tanto, si está trabajando con objetos personalizados, debe asegurarse de que ha sobrescrito el método equals() en su clase. Si no sobrescribe equals(), distinct() considerará diferentes instancias del mismo objeto como distintas, incluso si sus campos son idénticos.

Aquí hay un ejemplo que ilustra este punto. Supongamos que tenemos una clase Fruit que representa una fruta:

public class Fruit {
    private String name;

    public Fruit(String name) {
        this.name = name;
    }

    // getters y setters omitidos para brevedad
}

Si creamos una lista de Fruit y tratamos de eliminar los duplicados con distinct(), obtendremos resultados inesperados:

List<Fruit> fruits = Arrays.asList(new Fruit("Manzana"), new Fruit("Banana"), new Fruit("Manzana"));
List<Fruit> distinctFruits = fruits.stream().distinct().collect(Collectors.toList());
System.out.println(distinctFruits.size());  // Imprime 3, aunque esperábamos 2

Para solucionar este problema, debemos sobrescribir equals() en la clase Fruit:

@Override
public boolean equals(Object obj) {
    if (this == obj) return true;
    if (obj == null || getClass() != obj.getClass()) return false;
    Fruit fruit = (Fruit) obj;
    return name.equals(fruit.name);
}

Con este cambio, distinct() funcionará como se esperaba.

Consideraciones de rendimiento

Aunque distinct() es una herramienta poderosa, no es libre de costos. Para eliminar los duplicados, distinct() debe mantener un conjunto de elementos previamente vistos. Esto implica un coste de memoria adicional, que puede ser significativo para streams muy grandes. Además, si está trabajando con un stream paralelo, distinct() puede tener que realizar un costoso paso de combinación para fusionar los conjuntos de elementos vistos en diferentes hilos.

Por lo tanto, si la memoria o la velocidad son una preocupación, puede que desee considerar alternativas a distinct(). Por ejemplo, si sus datos provienen de una base de datos, puede ser más eficiente eliminar los duplicados en el lado de la base de datos mediante una consulta SQL. O si sus datos están en una lista, puede considerar el uso de un Set para eliminar los duplicados, que puede ser más rápido y consumir menos memoria que distinct().

Conclusión

En resumen, distinct() es una operación intermedia en la API de Streams de Java que puede ser utilizada para eliminar duplicados de un stream. Aunque distinct() es fácil de usar y puede ser muy útil en algunas situaciones, también tiene costos de memoria y rendimiento que deben ser considerados. Si está trabajando con objetos personalizados, también debe asegurarse de que ha sobrescrito el método equals(), ya que distinct() lo usa para comparar elementos.

CONSTRUYE TU CARRERA EN IA Y PROGRAMACIÓN SOFTWARE

Accede a +1000 lecciones y cursos con certificado. Mejora tu portfolio con certificados de superación para tu CV.

Plan mensual

19.00 € /mes

Precio normal mensual: 19 €
47 % DE DESCUENTO

Plan anual

10.00 € /mes

Ahorras 108 € al año
Precio normal anual: 120 €
Aprende Java online

Ejercicios de esta lección Operaciones intermedias con Streams: distinct()

Evalúa tus conocimientos de esta lección Operaciones intermedias con Streams: distinct() con nuestros retos de programación de tipo Test, Puzzle, Código y Proyecto con VSCode, guiados por IA.

Clases abstractas

Test

Listas

Código

Métodos de la clase String

Código

Streams: reduce()

Test

Polimorfismo

Código

Pattern Matching

Código

Streams: flatMap()

Test

Llamada y sobrecarga de funciones

Puzzle

Métodos referenciados

Test

Métodos de la clase String

Código

Representación de Fecha

Puzzle

Operadores lógicos

Test

Inferencia de tipos con var

Código

Tipos de datos

Código

Estructuras de iteración

Puzzle

Streams: forEach()

Test

Objetos

Puzzle

Funciones lambda

Test

Uso de Scanner

Puzzle

CRUD en Java de modelo Customer sobre un ArrayList

Proyecto

Tipos de variables

Puzzle

Streams: collect()

Puzzle

Operadores aritméticos

Puzzle

Arrays y matrices

Código

Clases y objetos

Código

Interfaz funcional Consumer

Test

Interfaces

Código

Enumeraciones Enums

Código

API java.nio 2

Puzzle

API Optional

Test

Interfaz funcional Function

Test

Encapsulación

Test

Interfaces

Código

Uso de API Optional

Puzzle

Representación de Hora

Test

Herencia básica

Test

Clases y objetos

Código

Interfaz funcional Supplier

Puzzle

HashMap

Puzzle

Sobrecarga de métodos

Test

Polimorfismo de tiempo de ejecución

Puzzle

OOP en Java

Proyecto

Sobrecarga de métodos

Código

Clases sealed

Código

Creación de Streams

Test

Records

Código

Encapsulación

Código

Streams: min max

Puzzle

Métodos avanzados de la clase String

Puzzle

Funciones

Código

Polimorfismo de tiempo de compilación

Test

Reto sintaxis Java

Proyecto

Conjuntos

Código

Estructuras de control

Código

Recursión

Código

Excepciones

Puzzle

Herencia avanzada

Puzzle

Estructuras de selección

Test

Uso de interfaces

Test

Operadores

Código

Variables

Código

HashSet

Test

Objeto Scanner

Test

Streams: filter()

Puzzle

Operaciones de Streams

Puzzle

Interfaz funcional Predicate

Puzzle

Streams: sorted()

Test

Configuración de entorno

Test

CRUD en Java de modelo Customer sobre un HashMap

Proyecto

Uso de variables

Test

Clases

Test

Streams: distinct()

Puzzle

Streams: count()

Test

ArrayList

Test

Datos de referencia

Test

Interfaces funcionales

Puzzle

Métodos básicos de la clase String

Test

Tipos de datos

Código

Clases abstractas

Código

Instalación

Test

Funciones

Código

Excepciones

Código

Estructuras de control

Código

Herencia de clases

Código

La clase Scanner

Código

Generics

Código

Streams: map()

Puzzle

Funciones y encapsulamiento

Test

Streams: match

Test

Gestión de errores y excepciones

Código

Datos primitivos

Puzzle

Todas las lecciones de Java

Accede a todas las lecciones de Java y aprende con ejemplos prácticos de código y ejercicios de programación con IDE web sin instalar nada.

Instalación De Java

Introducción Y Entorno

Configuración De Entorno Java

Introducción Y Entorno

Tipos De Datos

Sintaxis

Variables

Sintaxis

Operadores

Sintaxis

Estructuras De Control

Sintaxis

Funciones

Sintaxis

Recursión

Sintaxis

Excepciones

Programación Orientada A Objetos

Clases Y Objetos

Programación Orientada A Objetos

Encapsulación

Programación Orientada A Objetos

Herencia

Programación Orientada A Objetos

Clases Abstractas

Programación Orientada A Objetos

Interfaces

Programación Orientada A Objetos

Sobrecarga De Métodos

Programación Orientada A Objetos

Polimorfismo

Programación Orientada A Objetos

La Clase Scanner

Programación Orientada A Objetos

Métodos De La Clase String

Programación Orientada A Objetos

Records

Programación Orientada A Objetos

Pattern Matching

Programación Orientada A Objetos

Inferencia De Tipos Con Var

Programación Orientada A Objetos

Enumeraciones Enums

Programación Orientada A Objetos

Generics

Programación Orientada A Objetos

Clases Sealed

Programación Orientada A Objetos

Listas

Framework Collections

Conjuntos

Framework Collections

Mapas

Framework Collections

Funciones Lambda

Programación Funcional

Interfaz Funcional Consumer

Programación Funcional

Interfaz Funcional Predicate

Programación Funcional

Interfaz Funcional Supplier

Programación Funcional

Interfaz Funcional Function

Programación Funcional

Métodos Referenciados

Programación Funcional

Creación De Streams

Programación Funcional

Operaciones Intermedias Con Streams: Map()

Programación Funcional

Operaciones Intermedias Con Streams: Filter()

Programación Funcional

Operaciones Intermedias Con Streams: Distinct()

Programación Funcional

Operaciones Finales Con Streams: Collect()

Programación Funcional

Operaciones Finales Con Streams: Min Max

Programación Funcional

Operaciones Intermedias Con Streams: Flatmap()

Programación Funcional

Operaciones Intermedias Con Streams: Sorted()

Programación Funcional

Operaciones Finales Con Streams: Reduce()

Programación Funcional

Operaciones Finales Con Streams: Foreach()

Programación Funcional

Operaciones Finales Con Streams: Count()

Programación Funcional

Operaciones Finales Con Streams: Match

Programación Funcional

Api Optional

Programación Funcional

Api Java.nio 2

Entrada Y Salida (Io)

Api Java.time

Api Java.time

Ecosistema Jakarta Ee De Java

Frameworks Para Java

Accede GRATIS a Java y certifícate

Certificados de superación de Java

Supera todos los ejercicios de programación del curso de Java y obtén certificados de superación para mejorar tu currículum y tu empleabilidad.

En esta lección

Objetivos de aprendizaje de esta lección

  1. Comprender el concepto y la funcionalidad del método distinct() en Java.
  2. Aprender cómo usar distinct() en un stream.
  3. Comprender la importancia de sobrescribir el método equals() al trabajar con objetos personalizados.
  4. Apreciar las implicaciones de rendimiento y memoria del uso de distinct().
  5. Conocer alternativas a distinct() cuando la eficiencia es crucial.