Numele "Hemp" (sau, mai exact, "BONNO") vine direct din fenomenul de setare incorectă a codificărilor în programele de e-mail. Acesta este cuvântul "Întrebare", convertit de la codificarea CP1251 la KOI8-R. Prin cuvântul "BINNING" utilizatorii experimentați au identificat imediat noii veniți care au pus întrebarea de a stabili codificarea.
În ciuda răspândirii în creștere a Unicode. fenomenul crocodililor apare uneori astăzi. De asemenea, este posibil să obțineți caractere inadecvate atunci când utilizați fonturi incorecte atunci când imprimați pe o imprimantă sau într-o mașină de copiat. configurația incorectă a programului (atunci când se utilizează CP1252 în loc de CP1251)
Text corect:
(când se joacă, aceeași codificare este utilizată ca atunci când se creează textul)
Øèðîêàÿ ýëåêòðèôèêàöèÿ þæíûõ ãóáåðíèé äàñò ìîùíûé oie ÷ iE ïîäú¸ìó ñåëüñêîãî õîçÿéñòâà.
HPNYYu SCHKEYRPHTHYYUZHH CHFMSHU TSSAEPMHI DYUYAR LNYMSHI RNKVNY ONDZ╦LS YAEKEYAYNTSN UNGIYARBYU.
ish№yurџ §yhђ№shєshrіshџ ўtseћѕ uѓskh№eshsch froђ yuљeћsch ђyuyїyu yayufњIѓ ohyќoyuuyu ѕyuchџschoђtr.
╪shOyur ¤yhЄOshЇshrЎsh ■ tse√ї uєskhOeshsch froЄ yu ∙ e√sch Єyuyўyu yayuf · ╕є ohy№oyuuyu їyuch schoЄtr.
notițe
- ↑ 12345 Tabelul de cod ISO 8859-1 diferă numai în absența unui număr de caractere afișat. În sistemul Microsoft Windows, în locul paginii de cod ISO 8859-1, este utilizată extensia Windows-1252.
- ↑ Opțiunile de decodare pentru UTF-8 nu sunt date; cea mai mare parte a textului rus scrise pe pagina de cod pe 8 biți. va fi considerată eronată (fără reprezentare).
recodare
Pentru a recupera textul (în general pentru transcodare) puteți folosi utilitarul
Dacă primiți un crocodil la deschiderea fișierelor text, încercați să îl deschideți cu orice browser, unde puteți specifica manual codificarea (de obicei: Vizualizare - codare - în meniul de sus sau în meniul contextual). Dacă după aceasta obțineți textul dintr-o singură linie, fără a fi divizat prin paragrafe, puteți selecta textul sursă (View Source) din meniul contextual și îl puteți atribui la începutul paginii
și salvați.Recodare, în scopul de a restabili textul original nu este întotdeauna posibil. De exemplu, chiar și atunci când dubla recodificarea care a avut loc, de exemplu, când se transmite un mesaj în câteva servere de e-mail incorect configurat pot apărea pierderea ireversibilă a informațiilor, adică. K. Anumite simboluri diferite ale textului sursă, în anumite condiții poate înlocui cealaltă, dar aceleași caractere incorecte, și de a restabili un astfel de mesaj nu este posibil, chiar dacă știi ce conversie și în ce ordine au fost făcute.
Alte distorsiuni asociate cu transcodarea
Se întâmplă adesea că recodificarea este realizată în direcția cea bună, dar transcodificator operează nu este în întregime corectă. De exemplu, din cauza lenei de programatori multe decodoare converti doar litere rusești de bază și toate celelalte personaje sunt lăsate în loc. În final, se transformă în ø, și așa mai departe. D. (Aceste texte sunt abundente pe internet, este suficient să se uite pentru cuvântul „vsЈ“ atunci când transcodarea KOI8-R → Windows 1251 lit.e se transformă într-J (scrisoare sârbă), simbolul de grad (°) sau "њS").
O altă opțiune de distorsiune datorită faptului că, în codificarea țintă poate fi de caractere disponibile în codificarea originală lipsă. În acest caz, personajele care lipsesc sunt pur și simplu aruncate, înlocuit de un simbol substitut (de multe ori un semn de întrebare -.? Uneori) sau înlocuite cu caractere similare din U + 2212. -) poate fi înlocuită cu o liniuță simplă (U + 002D -.), Litera S poate fi înlocuită cu s, etc. În cazul unui text simplu, o astfel de pierdere de date este inevitabilă, cu toate acestea, în cazul în care conversia este supusă fișierul HTML sau XML, conversia corectă este de a înlocui .. lipsește codificarea caracterelor țintă pe codurile ampersendom: de exemplu, semnul minus ar trebui să fie înlocuită cu − sau # 8722; litera Ł ar trebui înlocuită cu š sau # 353; și așa mai departe.
Vedeți ce "cânepă" în alte dicționare:
Articole similare