Puteți începe cu Wikipedia și să încerce să facă exemple on-line)
Când vedeți o mulțime de text, citit prin alineatul
Ei nu trebuie să înțeleagă, trebuie doar să le citiți.
Foarte simplu.
există stații
^ - partea de sus a liniei
$ - sfârșitul liniei
| - simbolul „sau“ - este utilizat între caractere sau grupuri care arată „unul sau altul“
Se pare ca acest lucru:
/ ^ (([A-z] +) | ([az] +)), $ /
se citește ca un șir format din orice număr de litere de la A la Z (litere mici în engleză), sau orice număr de litere din România, cu excepția e, producția va fi de trei probe - primul - întregul rând, al doilea rând de litere englezești, al treilea - șirul de română .
Dar acest cod special, poate fi, de asemenea, în scris, după cum urmează:
/ ^ ([A-ZA-I] +) $ /
Pentru că nu are nici un sens să se separe limba română și engleză în grupuri separate. Deci, pur și simplu mai scurte și mai ușoare.
există simboluri
. - Acest „punct“. orice caracter care nu este, inclusiv cele mai anumite tipuri de file, sfârșiturile de linie diferite acolo
\ W - cuvântul - care este directă orice design de orice număr de litere
(Există și alte diferite)
Există semne cantitative
.* - un asterisc înseamnă fie acolo sau nu, în orice cantitate
.+ - Plus - este obligat să aibă cel puțin un „punct“
. - de la doi la infinit „puncte“
. - de la două până la cinci „puncte“
există șabloane
[A-zA-Z] - orice literă engleză. la fel?
[A-nk-YaoO] - orice literă Rusă
[?] - semnul de întrebare sau de exclamare
există grupuri
([A-z] [a-z]) - un grup format din două litere. fiecare dintre acestea, în intervalul dintre o-z britanic
Grupurile de template-uri diferă prin faptul că acestea sunt capturate de căutarea. Nu uitați că sezonul regulat - este în primul rând un motor de căutare?
Modificatori de acolo
/ ([Az] [az]) / Gl - g (la nivel mondial), i (ignorcase) - mijloace globale pentru a căuta întregul text fără a ține cont de sfârșiturile de linie, dacă nu pune - va căuta numai într-o singură linie, ignorcase - nu va indica litere mari
/ ([A-Z] [a-z]) / gu - g (la nivel mondial), u (utf8) - utf8 permite lucru în mod corect, cu litere românești în utf8 codificată, o problemă frecventă la forumuri