Cómo extraer direcciones de correo electrónico, números de teléfono y enlaces del texto
Tiene un correo electrónico o una carta con números de teléfono, direcciones de correo electrónico o vínculos a sitios web en todo el texto, y le gustaría obtener una lista de cada uno de esos elementos por su cuenta. Copiar y pegar es tedioso y requiere mucho tiempo y, de todos modos, ¿las computadoras no están diseñadas para realizar tareas como esa por nosotros?
Ellos son. Todo lo que necesita es un poco de Regex (o código) y un editor de texto, y puede extraer los datos que desea de su texto para pegarlos en otra aplicación. O, si desea extraer automáticamente texto de cualquiera de los cientos de aplicaciones para enviarlo a otra aplicación, también puede hacerlo con Formatter de Zapier. Aquí se explica cómo usar Regex en editores de texto populares o Formatter en aplicaciones web populares.
Cómo extraer texto con Regex
Es probable que esté familiarizado con la herramienta de búsqueda integrada en la mayoría de las aplicaciones de su computadora. prensa Control+F o Command+F, escriba la palabra que desea buscar y la aplicación se resaltará cada vez que esa palabra aparezca en su texto. Por ejemplo, si está buscando el número «47» en la oración «Compré 47 manzanas», la herramienta de su programa resaltará el número en esa oración.
¿Qué pasa si, en cambio, quisiera encontrar cualquier número en su texto? Quizás su oración ahora dice «Compré 47 manzanas y 23 huevos» y le gustaría una lista de los números. Regex, o, es lo que usará. Regex le permite decirle a la computadora qué texto está buscando, usando su propia sintaxis. Digamos que queremos encontrar cualquier número. Haríamos una búsqueda de expresiones regulares para [0-9]—Que buscará cualquier cosa que contenga al menos un número (dígitos entre 0 y 9). ¿Quieres encontrar cualquier número de la letra «a»? [0-9]|a haría el truco, ya que regex usa la tubería | carácter a significar.
Entonces, si está buscando direcciones de correo electrónico, simplemente puede buscar @ con la herramienta normal para resaltar cada dirección de correo electrónico, junto con cualquier cosa que incluya un símbolo @, aunque pocas cosas aparte de las direcciones de correo electrónico hacen. Sin embargo, una secuencia de comandos de expresiones regulares detallada podría funcionar mejor. Podría encontrar todos los caracteres alrededor del símbolo «@» y seleccionar la dirección de correo electrónico completa. Y luego, con las herramientas de las populares aplicaciones de edición de texto, puede copiar cada dirección de correo electrónico de su texto.
¿Quieres saber más sobre Regex? El artículo de Wikipedia de Regex hace un buen trabajo al explicar la sintaxis principal, y Regex Tester (en la imagen de arriba) y RegExr son excelentes formas de aprender a usar expresiones regulares con popovers que explican lo que hacen los scripts mientras los escribe.
Regex es geek, pero en realidad puede ser fácil de usar, con herramientas de expresiones regulares en aplicaciones populares junto con scripts de expresiones regulares predefinidos. Primero, revisemos algunos scripts de expresiones regulares rápidas para extraer enlaces, correos electrónicos y números de teléfono, luego aprendamos a usar expresiones regulares en programas populares de edición de texto Sublime Text, Notepad ++ y BBEdit:
Scripts Regex para extraer datos
Antes de que pueda extraer texto en sus aplicaciones, necesitará algunas secuencias de comandos de expresiones regulares para usar. Aquí hay tres scripts que hemos probado ampliamente para extraer enlaces de sitios web, correos electrónicos y números de teléfono de grandes bloques de texto. Cada uno funciona con una gama de resultados lo más amplia posible, y todos funcionan en cada uno de los editores de texto mencionados aquí. Aunque pueden parecer una palabrería intimidante, todo lo que tienes que hacer para usarlos es copiar y pegar en los comandos de búsqueda del editor de texto.
-
Extraer enlaces de sitios web (a través de Bola de fuego atrevida):
(? i) b ((?:[w-]+: (?: / {1,3} |[a-z0-9%]) | www d {0,3}[.]|[a-z0-9.-]+[a-z]{2,4} /) (?:[^s()<>]+ | (([^s()<>]+ | (([^s()<>]+)))[^s()<>][^s()<>]) |[^s`!()[]{} ;: ‘»., <>?« »» «‘ ‘]))
Funciona con todos los enlaces estándar, incluidos los caracteres que no están en inglés, siempre que el enlace incluya un http, httpsy / o www, o un final / seguido de texto. Por ejemplo, google.com/about funcionaría, como lo haría https://google.com, pero google.com no lo haría.
-
Extraer direcciones de correo electrónico (a través de Regex de correo electrónico casi perfecto)
(?:[a-z0-9!#$%&’*+/=?^_`{|}~-]+ (?: .[a-z0-9!#$%&’*+/=?^_`{|}~-]+) * | «(?:[x01-x08x0bx0cx0e-x1fx21x23-x5bx5d-x7f]| \[x01-x09x0bx0cx0e-x7f]) * «) @ (? 🙁 ?:[a-z0-9](?:[a-z0-9-]*[a-z0-9])? .) +[a-z0-9](?:[a-z0-9-]*[a-z0-9])? | [(?:(?:25[0-5]| 2[0-4][0-9]|[01]?[0-9][0-9]?) .) {3} (?: 25[0-5]| 2[0-4][0-9]|[01]?[0-9][0-9]? |[a-z0-9-]*[a-z0-9]:( ?:[x01-x08x0bx0cx0e-x1fx21-x5ax53-x7f]| \[x01-x09x0bx0cx0e-x7f]) +) ])
Funciona con todas las direcciones de correo electrónico, subdominios y TLD estándar, siempre que el correo electrónico y el dominio usen caracteres estándar en inglés.
-
Extraer números de teléfono (retocado basado en el guión de Desbordamiento de pila)
(?: (?: +? ([1-9]|[0-9]|[0-9][0-9])s[.-])?)?(?:(s[2-9][02-9][02-8][02-8][02-9]) | ([1-9]|[0-9]1[02-9]|[02-8]1 |[02-8][02-9]))s[.-])?)? ([2-9]1[02-9]|[02-9]1 |[02-9]{2}) s[.-])? ([0-9]{4}) (?: S ( d +))?
Funciona con todos los números de teléfono estándar, incluidos los códigos de país y área para la mayoría de los números internacionales. Cualquier cosa de +65 800 123 4567 ext.405 a 02-201-1222 a 865.101.1000 y más deberían funcionar.
Simplemente use esos scripts Regex en la herramienta de su editor de texto, y deberían encontrar todos los enlaces, correos electrónicos y números de teléfono en su texto. Luego, utilice los pasos anteriores para copiar cada uno de ellos en su propia lista.
¿Quieres más scripts de expresiones regulares? RegExLib incluye una amplia gama de secuencias de comandos de expresiones regulares prefabricadas en las que puede buscar, y si no encuentra lo que necesita, a menudo los resultados de búsqueda de Google tendrán las secuencias de comandos de expresiones regulares que necesita.
Ahora, aprendamos a usar expresiones regulares en Sublime Text, Notepad ++, BBEdit y Google Sheets:
Cómo usar Regex en texto sublime (Windows, Mac, Linux)
El editor de texto multiplataforma Sublime Text es una de las formas más fáciles de extraer texto con expresiones regulares a través de su herramienta incorporada.
En el documento de texto del que desea extraer un texto específico, presione Control+F o Command+F para abrir la barra de búsqueda. Haga clic en el * en el extremo derecho para habilitar el modo de expresión regular, luego escriba o pegue su secuencia de comandos de expresión regular. Ahora, haga clic y Sublime Text resaltará y seleccionará cada instancia de su texto que encuentre.
¿Quiere extraer ese texto y ponerlo en su propia lista? Solo presione Control+F o Command+F nuevamente, luego cree un nuevo documento y pegue sus resultados para obtener una lista de cada una de las cosas que extrajo.
Precio de texto sublime: Libre de evaluar; $ 70 por licencia de usuario
Cómo hacer expresiones regulares en Notepad ++ (Windows)
El editor de texto gratuito de Windows Notepad ++ también tiene una opción de expresión regular en su herramienta, pero no le permite copiar texto de la misma manera que lo hace Sublime Text. En su lugar, lo usaremos para poner cada resultado en su propia línea, marcar esas líneas y luego copiar esas líneas marcadas por sí mismas.
Así es como funciona. Simplemente escriba o pegue su texto en Notepad ++ y presione Control+F para abrir la herramienta de búsqueda. Haga clic en la pestaña, luego escriba o pegue su secuencia de comandos de expresiones regulares en el cuadro. Debajo de eso, escriba lo siguiente en el cuadro para poner cada resultado en su propia línea:
n1n
Ahora, haga clic en la viñeta en la esquina inferior izquierda, luego haga clic en el botón. Eso debería obtener cada uno de los resultados de búsqueda de expresiones regulares en su propia línea.
Para copiar sus resultados de expresiones regulares, deberá hacer dos cosas más. Primero, haga clic en el cuadro de la ventana Buscar, seleccione las opciones y haga clic en. Eso pondrá una viñeta roja al lado de cada una de las líneas con sus resultados de expresiones regulares.
Finalmente, haga clic en el menú de búsqueda y seleccione. Abra un nuevo documento y pegue el texto, y tendrá una lista del texto que desea encontrar a través de expresiones regulares.
Precio del Bloc de notas ++: Descarga gratuita de código abierto
Cómo usar Regex en BBEdit (Mac)
Quizás la forma más fácil de extraer texto con expresiones regulares es usando el editor de texto de Mac BBEdit. Simplemente ingrese su texto en Regex, prensa Command+F para abrir la ventana e ingrese su script de expresiones regulares en el cuadro. Marque la opción en la parte inferior de la página para ejecutar el script de expresiones regulares (que, en BBEdit, funciona con la aplicación de terminal Grep, otra forma más de extraer texto a través de expresiones regulares).
Ahora, haga clic en el botón de la derecha y BBEdit creará un nuevo archivo de texto y agregará cada uno de los elementos extraídos al documento. Es la forma más rápida de extraer texto con expresiones regulares.
Precio BBEdit: Evaluación gratuita; Licencia de $ 49.99 por usuario
Cómo usar Regex en Google Sheets (Web)
Si solo necesita un resultado de expresiones regulares, Google Sheet ‘ =regextract La función le permite usar expresiones regulares dentro de su hoja de cálculo para encontrar el primer resultado coincidente. Solo entra =regextract(, luego escriba el texto en el que desea buscar o seleccione la celda correcta, agregue una coma, luego ingrese su script de expresiones regulares entre comillas y agregue un paréntesis de cierre al final. Luego, Google Sheets extraerá la primera coincidencia de su texto, y si su secuencia de comandos de expresiones regulares incluye secciones como la secuencia de comandos en la imagen que verifica cada parte de un número de teléfono, Google Sheets dividirá el resultado en una celda por sección.
Lo mismo funciona en Google Docs, aunque no hay una manera fácil de copiar todos los resultados. prensa Control+F o Command+F para abrir el cuadro de diálogo de búsqueda, toque el icono de tres puntos para abrir el cuadro de diálogo de búsqueda completo, agregue su script de expresión regular en el cuadro de diálogo y marque la casilla. Eso le permitirá encontrar cada elemento que coincida con su consulta de expresiones regulares, aunque tendrá que copiar cada resultado manualmente para extraerlos de su documento.
Precio de Hojas de cálculo y Documentos de Google: Gratis para uso personal; desde $ 5 / mes plan G Suite Basic para uso comercial
Extraiga direcciones de correo electrónico, números de teléfono y enlaces en línea
¿Quieres algo más sencillo? Hay una serie de aplicaciones web sencillas que pueden extraer el texto que necesita con unos pocos clics. La más versátil de las aplicaciones que probamos es ConvertCSV.com. Puede extraer direcciones de correo electrónico, enlaces y números de teléfono, aunque no reconoce tantas variaciones como los scripts de expresiones regulares anteriores. Y también puede convertir sus archivos de hoja de cálculo a diferentes formatos si lo necesita.
Estas son algunas de las mejores herramientas sencillas gratuitas para extraer texto en línea:
Extraiga direcciones de correo electrónico, números de teléfono y enlaces automáticamente con Zapier
Regex funciona muy bien cuando tiene un documento largo con correos electrónicos, enlaces y números, y necesita extraerlos todos. Pero, con mucha más frecuencia, necesitará extraer texto de una cosa y usarlo directamente en otra aplicación.
Por ejemplo, digamos que alguien le envía un correo electrónico con un enlace y le gustaría agregar automáticamente ese enlace a Pocket para poder leerlo más tarde. O tal vez guarde su información de contacto en las notas de Evernote y desee extraer la dirección de correo electrónico y enviar un correo electrónico automático a sus nuevos contactos.
La herramienta Formateador de Zapier puede ayudar. Zapier es una herramienta de automatización de aplicaciones que conecta más de 750 aplicaciones, por lo que cada vez que sucede algo en una aplicación, Zapier puede iniciar una reacción en cadena, copiando su texto en otras aplicaciones para agregar contactos, iniciar proyectos, enviar correos electrónicos y más. Y el formateador de Zapier puede, entre otras cosas, extraer texto para que obtenga exactamente lo que desea de sus aplicaciones.
Así es como funciona. Primero, creará un nuevo Zap y seleccionará la aplicación que desea activar (o iniciar) el flujo de trabajo. Aquí elegiremos Gmail para buscar enlaces en nuevos correos electrónicos.
Luego, agregue un paso de Formateador y elija la acción. Seleccione la transformación para encontrar el enlace en el correo electrónico y haga clic en el + junto al campo y seleccione el campo para que Zapier encuentre un enlace en el texto del correo electrónico. Pruebe ese paso y Zapier encontrará ese primer enlace del texto del cuerpo del correo electrónico.
¿Quiere buscar una dirección de correo electrónico, un número de teléfono o un número individual como un precio? Simplemente seleccione las transformaciones, o para encontrar esos elementos en su texto.
Finalmente, agregue una aplicación de acción a su Zap. Elegiremos Pocket aquí. Seleccione, luego haga clic en el + junto al campo y seleccione el enlace del paso Formateador.
! Ahora, cada vez que reciba un correo electrónico con un enlace, Zapier lo agregará automáticamente a su lista de lectura de Pocket.
Aquí hay un Zap prefabricado para probarlo con Gmail y Ontraport. El formateador de Zapier puede dividir el nombre del remitente en dos campos y enviar la dirección de correo electrónico para crear un nuevo contacto en Ontraport:
¿Quiere utilizar sus propias consultas Regex personalizadas en Zapier? También puede hacerlo con los pasos del código de Zapier. Así es cómo..
Ahora, haz tus propias automatizaciones. Las herramientas de extracción de Zapier Formatter son una forma poderosa de encontrar lo que necesita de su texto y luego usarlo en otras aplicaciones. Ya sea que necesite copiar información de contacto, datos financieros, enlaces a sitios web y más, Formatter puede ayudarlo de forma automática e instantánea.
O, si desea extraer texto a granel una sola vez, regex es su mejor nuevo amigo.
¿Tiene un script de expresiones regulares favorito para extraer texto? ¡Nos encantaría saberlo en los comentarios a continuación!
Haga más con el formateador Zapier
¿Quiere automatizar más su trabajo con texto? Consulte los otros tutoriales de esta serie para conocer más formas de usar Formatter, junto con prácticos consejos para otras aplicaciones que quizás ya esté usando:
