javascriptpythonregex

Regex tutorial – Ejemplo prácticos

Expresiones regulares

Las expresiones regulares son poderosas cuando necesitamos extraer información de algún texto, usando la búsqueda de caracteres por un patrón de busqueda especifico ( Tal vez una secuencia de código ASCII o caracteres Unicode).

Se puede aplicar en el análisis de cadenas, web scraping, traducción de información y otras cosas mas. Se puede aplicar en diversos lenguajes de programación.

BÁSICO

Regex reconoce secuencias de escape comunes tales como:

\n NewLine Salto de linea
\t Tab Tabulador
\r Carriege return Retorno de carro
\nnn 3 digit octal number 3 dígitos de numero octal
\uhhhhhhhh 8-digit Unicode 8 Digitos unicode

Metacaracteres  (Metacharacters)

Meta caracteres consiste de símbolos no alfanuméricos tales como:

.    \\\    |    (    )    [    {    $    *    +   ?

Position Anchors

Solo validar posición de inicio o fin de una palabra

  • ^The => Cualquier cadena que inicie con “The” -> Pruebalo
  • end$ => Cualquier cadena que finalice con “End”
  • ^The end$ => Coincidencia exacta de la palabra “The end”
  • \bla => Coincidencia de la palabra “la” al inicio de cualquier palabra
  • \bla\b => Coincidencia de la palabra “la” de manera exacta

Quantifiers — * + ? and {}

  • abc* => Cadena que coincida con “ab” seguida de cero o más caracteres “c”  -> Pruebalo
  • abc+ => Cadena que coincida con ab seguida con uno o mas caracteresc” 
  • abc? => Cadena que coincida con “ab” seguida por cero o un carácter “c”
  • abc{2} => Cadena que tenga “ab” seguida de 2 caracteres exactos “c” 
  • abc{2,} => cadena que tenga “ab” seguido de 2 o mas caracteres “c”
  • abc{2,5} => cadena que tenga “ab” seguido por 2 a 5 caracteres “c”

OR operator — | or []

  • aa(b|c) => Cadena de caracteres que tiene “aa” seguido por un carácter “b” o “c”
  • aa[bc] => Similar al ejemplo anterior

Character classes — \d \w \s and .

  • \d => Busca caracteres que son dígitos.
  • \w => Busca caracteres, dígito o guion abajo.  Equivalente a [a-zA-Z0-9_]
  • \s =>  Busca cualquier espacio, tab o salto de linea.
  • . => Coincide con cualquier carácter que no sea nueva línea (o que incluye nueva línea con el flag /s)

Caracteres especiales

Para la búsqueda de caracteres especiales tales como ^.[$()|*+?{\  se usa el backslash \ como un traductor especial

  • \$\d => Busca cadenas que tienen dolar ($) antes de un dígito

 

 

Leave a Reply

Your email address will not be published. Required fields are marked *