Codurile uniforme și non-uniforme

Codul se numește uniform (sau cod de lungime fixă), în cazul în care toate cuvintele de cod conțin același număr de litere (aceeași lungime cuvânt). Prin urmare, codificarea se numește uniform. în cazul în care codul corespunzător are o lungime fixă. În prezent, mai frecvent utilizate de codificare uniformă în informatică, este mai ușor și mai convenabil. Calculatorul în codificarea informației sunt utilizate în principal coduri uniforme care corespund mărimii calculatorului celulei.

Prin codul uniform se referă codul Baudot telegrafice (cod Baudot). Acesta poate fi considerat un cod alfabetic uniform binar. Versiunea originală a acestui cod proiectat Emil Bodo în 1870 pentru telegraful. Codul administrat direct tastatura constând din cinci taste, presare sau cheie de transfer nepresată sau nu pentru a transfera corespunde un bit într-un cod de cinci biți. De exemplu, litera A este transmisă ca - - + - -. care corespunde cu apăsarea tastei centru. În acest cod binar poate fi scris ca 00100. Astfel, se înregistrează fiecare literă cinci biți. Prin urmare, codul poate fi trimis Bodo 5 februarie = 32 de caractere diferite.

Un alt exemplu interesant este uniform codul Trisime în care alfabetul latin sunt atribuite codewords de lungime 3 în alfabetul de 3 caractere. Acest cod este prezentat în tabelul următor:

Este clar că codul Trisime poate codifica mai mult de 3 3 = 27 de caractere.

Numărul de litere din alfabet codul numit cod de bază, iar lungimea cuvintelor de cod de cod uniform se referă la ordinea de cod. Codurile de bază 2, așa cum sa menționat deja, sunt numite binar. iar baza 3 - ternar. și așa mai departe. Astfel, codul Baudot are o bază 2, iar ordinea de 5 și codul Trisime y și o bază, iar ordinea egală cu 3.

Codul se numește neregulat (sau cod de lungime variabilă), în cazul în care cuvintele cod care au un număr diferit de litere (cuvinte de lungimi inegale). Prin urmare, codificarea se numește neregulat dacă codul neuniforma corespunzător.

Un exemplu tipic este non-uniform codul telegrafic, care se numește codul Morse. Tabelul următor prezintă codul Morse cod alfabet românesc:

• - - • - •

După cum puteți vedea, codul Morse este compus din cuvinte peste un alfabet de două personaje: un punct și cratimă. Dar, strict vorbind, acest cod nu este binar, deoarece este în codificarea cuvintelor sugerează un alt caracter pentru a separa literele din cuvântul (simbol „pauză“). Fără acest simbol nu ar avea unicitatea în textele de decodare. De exemplu, codul celor patru cratimele ar putea fi decodificate în moduri diferite: fie ca un singur cod W litere, sau combinații ale celor două litere de cod - MM, FROM sau TO. caracter de separare poate decoda în mod unic orice secvență de cod obținut prin codarea mesajelor folosind codul Morse, dar codul codul Morse, atunci ar trebui să fie considerate ca fiind triplu deoarece alfabetul are trei simboluri.

inventatorul american al telegrafului Semyuel Morze a dezvoltat acest cod în 1838 pentru transmiterea mesajelor de telegraf sub forma unei secvențe de semnale electrice transmise de la o fire de telegraf ale unui alt telegraf. Acest cod a fost inventat cu mult timp înainte de cercetare Morse

frecvența relativă de apariție a diferitelor litere în textele, dar, cu toate acestea, codul Morse utilizate în prepararea principiului frecvenței literelor. Literele folosite mai frecvent, acestea sunt atribuite codewords scurte, scrisori rar utilizate - lung. Morse a estimat frecvența relativă a literelor limbii engleze prin numărarea literelor în celulele ale mașinii de imprimare typesetting. Cel mai frecvent folosit litera „E“ (în limba engleză), el a atribuit cel mai scurt cod „punct“. Următoarea literă cu privire la numărul de litere a atribuit codul de durată ceva mai lungă, și așa mai departe.

La elaborarea codului alfabetul Morse la contabilitatea românească a frecvenței relative a scrisorilor au fost făcute, și-a crescut redundanță sale. Morse calcule redundanța codului pe baza studiilor de frecvența de apariție a scrisorilor a arătat că literele alfabetului este de 19%, pentru alfabetul românesc 22%.

Cel mai faimos mesaj telegrafic este semnalul de primejdie „SOS“ (salva sufletele noastre - a salva sufletele noastre). Iată cum arată: «• • • - - - • • •»

Avantaj pentru codurile neregulate în uniformă constă tocmai în faptul că mesajele pot fi trimise mod mai economic, deoarece este adesea transmis cuvinte de cod mai scurt, și, prin urmare, secvența de cod poate avea o lungime mai scurtă decât pentru codurile de uniforme. Mai jos va fi afișat.

Dar codurile neregulate au un dezavantaj serios în comparație cu coduri uniforme. În secvența de cod de coduri uniforme întotdeauna decodificat în mod clar de faptul că cuvintele cod au aceeași lungime (secvență de cod este ușor împărțit în cuvinte cod). Dar nu a realizat toate codurile de decodare neuniforme secvențe de cod lipsite de ambiguitate. Am văzut deja acest lucru, încercând să ia în considerare codul Morse ca un cod binar.

Aici este un exemplu simplu. Să presupunem că S = 1, s2. ..., s7> - numărul de mesaje, care este dată de cuvintele cod de codificare peste alfabetul folosind F:

Acest cod este denivelată (cuvintele cod de diferite lungimi).

Coda secvența mesajelor: S7 S7. Avem F (S7 S7) = B = 111111. Cu toate acestea, această secvență poate fi decodat într-un mod diferit, ca: B = F (s3 s3 s3) = F (s1 s3 s7) = F (s3 s7 s1) = F (s1 s1 s1 s1 s1 s1 s1 s). După cum puteți vedea, o mulțime de moduri de a decoda (conta: câți dintre ei?). Decodate și ambigua următoarea secvență:

11011011 (și cât de multe sunt căile de decodare?). Evident, acest cod este aproape imposibil de utilizat. Și dacă vom schimba codul, astfel încât acesta devine uniform, de exemplu, să extindă funcția F, după cum urmează:

acum nici o problema cu decodificarea nu va.

articole similare

Pagina anterioară

Pagina următoare