Textul programului C ++ este stocat în fișierele sursă care utilizează o anumită codificare a caracterelor. Standardul C ++ specifică codificarea codului sursă principal pentru fișierele sursă și codarea principală a execuției pentru fișierele compilate. Visual C ++ vă permite să utilizați un set suplimentar de caractere definite de standardul de limbă în fișierele sursă și compilate.
Standardul C ++ specifică codificarea principală a codului sursă. care pot fi utilizate în fișierele sursă. Pentru a reprezenta caracterele în afara acestui set, puteți specifica caractere suplimentare utilizând numele simbolurilor universale. Când sunt compilate, codificarea execuției principale și setul de caractere de execuție extinse reprezintă caracterele și șirurile care pot fi prezente în program. Implementarea Visual C ++ permite utilizarea de caractere suplimentare în codul sursă și compilat.
Codificarea codului sursă principal
Codificarea de bază a codului sursă este compusă din 96 de caractere, care pot fi utilizate în fișierele sursă. Acest set include un caracter spațial, filele orizontale și verticale, caracterele de control pentru traducerea paginii și o nouă linie, precum și următorul set de simboluri grafice:
a b c d e f g h i j k l m n o p q r t u u v w x y z
A B C D E F G I I J K L M N O P Q R U T U V W X Y Z
0 1 2 3 4 5 6 7 8 9
Un bloc care este specific numai sistemelor Microsoft
Denumiri simbol universale
Deoarece programele C ++ pot folosi mult mai multe caractere decât cele specificate în codificarea codului sursă principal, puteți specifica aceste caractere în formă portabilă folosind nume de simboluri generice. Un nume universal constă dintr-o secvență de caractere reprezentând un punct de cod Unicode. Poate avea două forme. Utilizați \ UNNNNNNNN pentru a reprezenta punctul de cod Unicode în formularul U + NNNNNNNN, unde NNNNNNNN este numărul punctului de cod hexazecimal de opt cifre. Utilizați codul de patru cifre \ nNNNN pentru a reprezenta punctul de cod Unicode în formularul U + 0000NNNN.
Denumirile simbolurilor universale pot fi folosite în identificatori și în literali de șir și de caractere. Un nume generic nu poate fi folosit pentru a reprezenta un punct de cod surogat în intervalul de la 0xD800 la 0xDFFF. În schimb, utilizați punctul de cod dorit: compilatorul creează automat toate surogatele necesare. Pentru denumirile universale ale simbolurilor care pot fi folosite în identificatori, se aplică restricții suplimentare. Pentru mai multe informații, consultați C ++ Identifiers and String and Characters.
Un bloc care este specific numai sistemelor Microsoft
Compilatorul Visual C ++ tratează caracterul sub forma unui nume de simbol universal și sub forma unui literal ca fiind interschimbabil. De exemplu, puteți declara un identificator utilizând formularul universal al simbolului și îl puteți utiliza în forma literală: