Expresiile regulate în texte românești

simboluri arbitrare

Dot "" reprezintă orice caracter unic. Setul de caractere posibile (clasa) se include între paranteze pătrate „[]“ - aceasta înseamnă că într-o anumită locație poate fi una dintre simbolul în paranteze. Dacă primul caracter din paranteze este „^“ - deci nu unul dintre caracterele specificate nu pot sta în locul expresiei. In interiorul clasei, puteți folosi simbolul „-“ indică o serie de caractere. De exemplu, „[a-z]“ reprezintă una dintre litere mici ale alfabetului latin.

"A", "b" sau "c"

Orice literă mică, cu excepția „a“, „b“ sau „c“.

Odată cu utilizarea de modificatori:

Orice literă mică, sau lipsa de caracter

orice număr de caractere

Gruparea: Parantezele

Parantezele sunt folosite pentru a defini grupul de caractere sau părți ale expresiei căreia caracterul alternativ ( „|“) sau modificator.

conversie internă

În expresii regulate, a permis literele românești pe codificarea selectată (KOI8 sau Windows 1251). În fața expresiei motor de căutare motor de căutare transformat în litere pentru sistemul nostru de transliterare). În plus, punctul. se înlocuiește cu expresia "[a-zA-Z]". În cazuri rare, această conversie poate duce la faptul că anumite simboluri din cadrul claselor ([]), sau la o altă valoare obținută modificatori. Pentru cea mai mare control asupra acestor transformări expresie de căutare convertite este dată la începutul paginii cu rezultatele căutării.

Opțiuni de căutare

Deoarece expresiile de căutare sunt permise forme de cuvinte și expresii regulate. Noi trebuie să căutăm întregul formular cuvânt. Expresia de căutare trebuie să conțină o formă de cuvânt complet. Pentru a se referi la orice parte a cuvântului poate fi folosit de caractere „*“ (Dot și asterisc).
Conform opțiunii selectate, litere mari și mici sunt diferite sau nu diferite. Formele Word sunt separate printr-un spațiu. Acest lucru se aplică și semnele de punctuație, deoarece acestea sunt tratate ca și cuvinte separate.
Punctul în acronime (și așa mai departe. D. MS), sau la sfârșitul propoziției în căutare ar trebui să fie setat semnul „#“ și un semn de întrebare ( „?“) Așa cum „\?“, Deoarece punctul și semnul de întrebare în expresii regulate Ele sunt metacaractere.
În cazul în care codul selectat „KOI8“ sau „Windows 1251“, de intrare este un litere românești pe codificarea selectată, sau caractere latine în sistemul nostru de transliterare. Este chiar un amestec de litere românești și latine.
În plus față de formele întregi cuvântul pe care îl puteți utiliza expresii regulate perl limba.
(A se vedea. O scurtă introducere în expresii regulate)
(Descriere detaliată a expresiilor regulate în limba PERL)

articole similare