« Aide:Expressions régulières » : différence entre les versions

De BoyWiki
(doc)
(doc)
 
Ligne 1 : Ligne 1 :
Les ''expressions régulières'' désignent des motifs écrits avec des caractères spéciaux et des caractères ordinaires permettant de décrire des occurrences de texte à chercher ou remplacer correspondant à cette suite de motifs.
Une ''expression régulière'' (de l’anglais  ''regular expression'' — en français ''expression rationnelle'') consiste en une suite de caractères nommée motif (''pattern'') permettant de décrire une chaine de caractères et d'en chercher les occurrences dans un texte, pour leur appliquer un traitement comme les remplacer, supprimer, compléter (voir [http://fr.wikipedia.org/wiki/Expression_rationnelle Wikipedia]).
 
Un motif est écrit avec des caractères ordinaires et des caractères affectés de rôles spéciaux de substitution, de groupement et de quantification.
 
Par défaut un caractère ordinaire se représente lui-même. On peut annuler le rôle spécial d'un caractère, et ainsi le faire devenir ordinaire, en le faisant précéder de "\" (sauf quand il est entre crochets).
 




Ces caractères spéciaux sont des caractères normaux affectés de rôles particuliers :


{| class="wikitable centre cellgauche" width="60%"
{| class="wikitable centre cellgauche" width="60%"
|------------------
|\
|Indique un caractère spécial ou retire son rôle spécial au caractère suivant
|------------------
|------------------
|[]
|[]
Ligne 16 : Ligne 17 :
|------------------
|------------------
|()
|()
|Isolent une partie de l'expression
|Isole ou regroupe une partie de l'expression
|}
 
 
{| class="wikitable centre cellgauche" width="60%"
|------------------
|------------------
|*
|*
Ligne 29 : Ligne 34 :
|{}
|{}
|Indiquent un nombre d'occurrences du motif précédent
|Indiquent un nombre d'occurrences du motif précédent
|}
{| class="wikitable centre cellgauche" width="60%"
|------------------
|------------------
|.
|.
|Représente un caractère quelconque
|Représente un caractère quelconque
|------------------
|------------------
|{{|}}
|{{!}}
|Représente une alternative, le motif qui précède ou le motif qui suit
|Représente une alternative, le motif qui précède OU celui qui suit
|------------------
|------------------
|^
|^
Ligne 44 : Ligne 53 :




Pour indiquer un caractère ordinaire appartenant aux caractères spéciaux, on lui retire son rôle particulier en le faisant précéder d'un antislash "\" (sauf quand il est entre crochets).
 





Dernière version du 15 mai 2014 à 11:24

Une expression régulière (de l’anglais regular expression — en français expression rationnelle) consiste en une suite de caractères nommée motif (pattern) permettant de décrire une chaine de caractères et d'en chercher les occurrences dans un texte, pour leur appliquer un traitement comme les remplacer, supprimer, compléter (voir Wikipedia).

Un motif est écrit avec des caractères ordinaires et des caractères affectés de rôles spéciaux de substitution, de groupement et de quantification.

Par défaut un caractère ordinaire se représente lui-même. On peut annuler le rôle spécial d'un caractère, et ainsi le faire devenir ordinaire, en le faisant précéder de "\" (sauf quand il est entre crochets).



[] Contient une liste de caractères possibles
- Situé entre deux caractères dans une liste, représente l'intervalle entre eux dans la table ascii
() Isole ou regroupe une partie de l'expression


* Représente 0 à n occurrences du motif précédent
+ Représente 1 à n occurrences du motif précédent
? Représente 0 ou 1 occurrence du motif précédent
{} Indiquent un nombre d'occurrences du motif précédent


. Représente un caractère quelconque
Représente une alternative, le motif qui précède OU celui qui suit
^ Placé en début d'expression indique qui commence par...
Placé au début d'une liste [] indique qui ne contient pas...
$ Placé en fin d'expression indique qui termine par...



Il existe aussi des séquences représentant des types de caractères prédéfinis :

\b Représente le début ou la fin d'un mot
\B Représente une partie de mot située ni au début ni à la fin du mot
\d Représente un caractère numérique (équivalent à [0-9])
\w Représente un caractère non alphanumérique (équivalent à [^a-zA-Z0-9_])
\n Représente un saut de ligne
\s Représente un caractère "blanc" (espace, tabulation, saut de ligne)
\S Le complément de \s


Les chaines correspondant aux occurrences trouvées sont stockées et peuvent être utilisées :

$& Contient la dernière occurrence trouvée
$+ Contient la dernière partie d'occurrence correspondant à un motif entre parenthèses
$1 à $9 Contiennent les dernières parties d'occurrence correspondant aux motifs entre parenthèses dans l'ordre de leur apparition dans l'expression

Exemples