Ejercicio de programación con Bash: Expresiones regulares y manipulación de texto

Código
Práctica
0h 20m

Bash: Extraer de un archivo de texto utilizando expresiones regulares, eliminando duplicados y ordenando alfabéticamente, ejercicio de Expresiones regulares y manipulación de texto.

Escribe un script Bash que reciba como argumento la ruta de un archivo de texto que contiene varias líneas con posibles direcciones de correo electrónico. El script deberá realizar las siguientes tareas utilizando expresiones regulares:

Identificar y extraer todas las direcciones de correo electrónico que cumplan con el siguiente patrón:

  • Usuario: Puede incluir letras mayúsculas y minúsculas, números, puntos (.), guiones (-) y guiones bajos (_).
  • Dominio: Puede incluir letras, números y guiones (-).
  • Dominio de nivel superior (TLD): Debe contener entre 2 y 6 letras.

Guardar todas las direcciones válidas extraídas en un archivo llamado emails_extraidos.txt.

Asegurarse de que el archivo emails_extraidos.txt contenga únicamente direcciones únicas, sin repeticiones, y ordenadas alfabéticamente.

Entrada

Un archivo de texto con múltiples líneas que pueden contener o no direcciones de correo electrónico. Por ejemplo, entrada.txt:

Contacto: juan.perez@example.com
Correo alternativo: juan_perez@sub.example.co.uk
Dirección inválida: juan@.com
Otro contacto: maria-123@domain.org
Correo duplicado: juan.perez@example.com

Salida esperada

El archivo emails_extraidos.txt debe contener las siguientes direcciones:

juan.perez@example.com
maria-123@domain.org

Instrucciones:

  1. El script debe aceptar un argumento: la ruta al archivo de entrada.
  2. Utiliza grep con expresiones regulares para identificar las direcciones de correo válidas.
  3. Emplea otros comandos como sort y uniq para procesar los resultados.
  4. Al finalizar, el script debe generar el archivo emails_extraidos.txt en el mismo directorio donde se ejecuta.

Restricciones:

  • No se deben incluir direcciones de correo inválidas en el archivo de salida.
  • Las direcciones deben ser únicas y ordenadas alfabéticamente.
  • El script debe manejar archivos de entrada de cualquier tamaño de forma eficiente.

Ejemplo de ejecución:

Damos por hecho la existencia de un script entrada.txt con el contenido mencionado anteriormente. Al ejecutar el siguiente comando:

bash extraer_emails.sh entrada.txt

Se generará un archivo emails_extraidos.txt con el contenido esperado. Prueba en tu ordenador y escribe aquí tu código Bash.

Empezar ejercicio de programación

Todos los ejercicios de programación de Bash

Evalúa tus conocimientos con ejercicios de programación en Bash de tipo Test, Puzzle, Código y Proyecto con VSCode.

Tutorial para resolver este ejercicio de programación

GNU Bash

Bash

Expresiones regulares y manipulación de texto

Sintaxis scripting

Otros tutoriales de programación con Bash