Aide:Expressions régulières
Une expression régulière (de l’anglais regular expression — en français expression rationnelle) consiste en une suite de caractères nommée motif (pattern) permettant de décrire une chaine de caractères et d'en chercher les occurrences dans un texte, pour leur appliquer un traitement comme les remplacer, supprimer, compléter (voir Wikipedia).
Un motif est écrit avec des caractères ordinaires et des caractères affectés de rôles spéciaux de substitution, de groupement et de quantification.
Par défaut un caractère ordinaire se représente lui-même. On peut annuler le rôle spécial d'un caractère, et ainsi le faire devenir ordinaire, en le faisant précéder de "\" (sauf quand il est entre crochets).
[] | Contient une liste de caractères possibles |
- | Situé entre deux caractères dans une liste, représente l'intervalle entre eux dans la table ascii |
() | Isole ou regroupe une partie de l'expression |
* | Représente 0 à n occurrences du motif précédent |
+ | Représente 1 à n occurrences du motif précédent |
? | Représente 0 ou 1 occurrence du motif précédent |
{} | Indiquent un nombre d'occurrences du motif précédent |
. | Représente un caractère quelconque |
Représente une alternative, le motif qui précède OU celui qui suit | |
^ | Placé en début d'expression indique qui commence par... Placé au début d'une liste [] indique qui ne contient pas... |
$ | Placé en fin d'expression indique qui termine par... |
Il existe aussi des séquences représentant des types de caractères prédéfinis :
\b | Représente le début ou la fin d'un mot |
\B | Représente une partie de mot située ni au début ni à la fin du mot |
\d | Représente un caractère numérique (équivalent à [0-9]) |
\w | Représente un caractère non alphanumérique (équivalent à [^a-zA-Z0-9_]) |
\n | Représente un saut de ligne |
\s | Représente un caractère "blanc" (espace, tabulation, saut de ligne) |
\S | Le complément de \s |
Les chaines correspondant aux occurrences trouvées sont stockées et peuvent être utilisées :
$& | Contient la dernière occurrence trouvée |
$+ | Contient la dernière partie d'occurrence correspondant à un motif entre parenthèses |
$1 à $9 | Contiennent les dernières parties d'occurrence correspondant aux motifs entre parenthèses dans l'ordre de leur apparition dans l'expression |