Codificarea informațiilor textuale.
Determinați cantitatea de fișier text.
Majoritatea PC-urilor din lume sunt implicate în prelucrarea informațiilor textuale.
Codarea este aceea că fiecare caracter este atribuit unui cod binar unic. O persoană distinge caracterele de conturul lor și un calculator prin codul lor.
Inițial, numai alfabetul latin a fost folosit în calculatoare - 26 de litere (simboluri).
Pentru a codifica codul binar de 26 de caractere (ultima lecție), trebuie să alocați 5 biți pentru fiecare caracter (codare pe 5 biți).
Dar în text nu există doar litere mici, dar și majuscule (simboluri), precum și cifre zecimale. Prin urmare, numărul de simboluri codificate va fi mai mare:
Ksymb = 26 + 26 + 10 = 62 [simbol]
Pentru a codifica un cod binar de 62 de caractere, sunt necesare 6 biți pe caracter (codare pe 6 biți).
Prin urmare, în primele computere vorbite în limba engleză, o silabă de octet a inclus șase biți.
În ceea ce privește textul de calculator include, de asemenea, semne de punctuație, caractere speciale, cum ar fi „=“, „(“, „“, spațiu, iar caracterele de desen precum și coduri de control al imprimantei, lumini pilot și alte echipamente.
Pentru a codifica toate aceste numere de caractere, este necesară codarea pe 7 biți (128 caractere).
Luând în considerare codarea simbolurilor limbilor naționale, de exemplu rusă, este necesară o codare de cel puțin 8 biți.
Astfel, conceptul de BYTE a apărut ca un set de BIT-uri, minimul necesar pentru a codifica un simbol al mașinii.
Cu o codare pe 8 biți, puterea alfabetului (numărul de caractere din alfabet) este de 256.
Corespondența simbolului cu codul este afișată în tabelul de coduri.
Când apăsați o tastă de pe tastatură (un dispozitiv de intrare sau un encoder de informații), se formează un cod binar conform căruia conturul de caractere este afișat pe ecranul monitorului de tabelul de coduri.
În prezent, există cinci tabele de coduri diferite pentru literele rusești (Windows, MS-DOS, KOI-8, Mac, ISO), astfel încât textele create în aceeași codare nu vor fi afișate corect în altul. Pentru diferite tipuri de computere, se folosesc diferite tabele de codificare. Odată cu proliferarea computerelor personale, cum ar fi IBM PC, standardul internațional a fost Codul American Standard pentru schimbul de informații (ASCII), codul standard american pentru schimbul de informații în care:
- Primele 33 de coduri (de la 0 la 33) nu corespund simbolurilor, ci operațiunilor (introducerea unui spațiu, a unei linii de alimentare etc.);
- Codurile 33 până la 127 sunt internaționale și corespund simbolurilor alfabetului latin, numerelor, semnelor de operații aritmetice și punctelor de punctuație;
- Codurile 128-255 sunt naționale, i. E. În diferite codificări naționale, diferite simboluri corespund aceluiași cod.
În computerele moderne folosiți codificarea pe 16 biți (unicode) care permite codarea a 65536 de caractere.
În memoria calculatorului, orice text este reprezentat de o secvență de coduri a tuturor caracterelor care alcătuiesc textul.
Pentru a găsi volumul de informații al textului (Vtf), multiplicați numărul de caractere din text (Ksymb) cu volumul unui singur caracter (V1s):
Vft = Ksymv * V1c
Determinați volumul de informații al textului
Bambarbiya! Kergudu!
la codarea pe 8 biți
Numărul de caractere din text este determinat de recalcularea simplă, amintiți-vă că și caracterul spațial este de asemenea un simbol.
soluţie:
1. Volumul unui fișier text este determinat de formula:
Vft = Ksymv * V1c
Vtf = 19 * 8 = 152 [Bit]
Bitii trebuie convertiți în octeți:
152 [Bit] = 152. 8 = 19 [Byte]
Răspuns: 19 octeți
Dispozitivul automat a transcodat mesajul de informare în limba rusă, scris inițial în codul Unicode pe 16 biți, la codarea pe 8 biți a KOI-8. În același timp, mesajul de informare a scăzut cu 480 de biți. Cât timp este mesajul în caractere?
soluţie:
1. Volumul fișierului text 1 este determinat de formula:
V1.1 = Ksymb * V1c.1
2. Volumul fișierului text 2 este determinat de formula:
Vtf.2 = Ksymb * V1c.2
3. Definirea diferenței în volume:
V1.1 - Vtf.2 = Ksymb * V1c.1 - Ksv * V1c.2
4. Am pus Ksym în paranteze
KSIM * (V1c.1 - V1c.2) = 480
5. Deci, puteți determina numărul de caractere
Ksymb = 480. (V1c.1 - V1c.2)
Ksymb = 480. (16 - 8) = 60
Răspuns: 60 de caractere
teme pentru acasă
1 Presupunând că fiecare caracter este codificat într-un octet, determinați ce volum de informații din următoarea afirmație a lui Jean-Jacques Rousseau este egal cu:
Mii de căi duc la eroare, la adevăr - doar la una.
2 În codificarea Unicode, doi octeți sunt alocați pentru fiecare caracter. Determinați volumul de informații al unui mesaj de douăzeci și patru de caractere în această codificare.
3 Dispozitivul automat a transcodat mesajul de informare în limba rusă, scris inițial în cod Unicode pe 16 biți, la codarea pe 8 biți a KOI-8. În același timp, mesajul de informare a scăzut cu 800 de biți. Cât timp este mesajul în caractere?
4 Dosarele angajaților după codarea pe 16 biți ocupă 8 Mb. Fiecare dintre ele conține 16 pagini (32 de linii de 64 de caractere pe linie). Câți angajați există în organizație?
5 Puterea alfabetului este 256. Câte Kbytes de memorie aveți nevoie pentru a stoca 160 de pagini de text care conțin în medie 192 de caractere pe fiecare pagină?
6 Volumul fișierului text de 640 Kb. Fișierul conține o carte care are o medie de 32 de linii pe pagină și 64 de caractere pe linie. Câte pagini din cartea cu codificare pe 8 biți?
Dimensiunea mesajului este de 7,5 KB. Este cunoscut faptul că acest mesaj conține 7680 de caractere. Care este puterea alfabetului?
Formare profesională
1 Presupunând că fiecare caracter este codificat într-un octet, determinați ce volum de informație din următoarea afirmație a lui Aleksey Tolstoy este egal cu:
Nu este o greșeală faptul că el nu face nimic, deși aceasta este principala lui greșeală.
2 Presupunând că fiecare caracter este codificat într-un octet, determinați ce volum de informație din următoarea afirmație a lui Rene Descartes este egal cu:
Cred, așadar, că există.
3 Presupunând că fiecare caracter este codificat cu 16 biți, estimați volumul informațional al următoarei expresii Pushkin în codificarea Unicode:
Obiceiul ne este dat de sus: este un substitut al fericirii.
4 Având în vedere că fiecare caracter este codificat într-un singur octet, estimați volumul de informații din următoarea propoziție din Pushkin quatrain:
Cântărețul David a fost o mică creștere, dar Goliat!
5 Având în vedere că fiecare caracter este codificat într-un singur octet, estimați volumul de informații din următoarea teză:
Unchiul meu de cele mai cinstite reguli, Când nu a fost o glumă aspirată, Sa făcut respectat și nu sa gândit mai bine.
6 Dispozitivul automat a recodificat mesajul de informare în limba rusă, scris inițial în cod de 8 biți, într-o codificare Unicode pe 16 biți. În același timp, mesajul de informare a crescut cu 2048 de octeți. Care a fost volumul de informații al mesajului înainte de conversie?
7 Considerând că fiecare caracter este codificat cu 16 biți, estimați volumul de informații al următoarei fraze în codificarea Unicode:
În șase litri, 6000 mililitri.
8 Considerând că fiecare caracter este codificat cu 16 biți, estimați volumul de informații al următoarei propoziții:
Binecuvântat este cel care crede, că este cald pentru el în lume!
9 Considerând că fiecare caracter este codificat într-un octet, estimați volumul de informații din următoarea teză:
Sail singuratic este alb în ceață de mare albastru!
10 Dispozitivul automat a transcodat mesajul de informare în limba rusă, scris inițial în cod Unicode pe 16 biți, la codarea pe 8 biți a KOI-8. În același timp, mesajul de informare a scăzut cu 160 de biți. Cât timp este mesajul în caractere?
Dispozitiv automat 11 efectuat un mesaj de informare transcodare în lungime rusă a 8 simboluri, înregistrată inițial în codul Unicode 16-biți, un 8-biți care codifică KOI-8. Cât de mult sa schimbat volumul de informații al mesajului?
12 Dispozitivul automat a transcodat mesajul de informare în limba rusă, scris inițial în cod Unicode pe 16 biți, în codificarea pe 8 biți a KOI-8. În același timp, mesajul de informare a scăzut cu 240 de biți. Cât timp este mesajul în caractere?
13 Dispozitivul automat a recodificat mesajul de informare în limba rusă, în lungime de 20 de caractere, scris inițial în cod Unicode pe 16 biți, în codificarea pe 8 biți a KOI-8. Cât de mult sa schimbat volumul de informații al mesajului?
Dimensiunea mesajului este de 11 KB. Mesajul conține 11264 de caractere. Care este puterea alfabetului?