Ce este DjVu?
DjVu este un format de stocare a imaginii de înaltă rezoluție. Se bazează pe algoritmul de compresie utilizând analiza wavelet. Datorită posibilității unei compresii bune a imaginii atunci când textul rămâne lizibil, DjVu nu are concurenți pentru stocarea documentelor scrise sau a fotografiilor.
Varietate de format
Pentru a lucra cu documente simple sau cu mai multe pagini, în imagini alb-negru sau color, fotografii și imagini de înaltă rezoluție DjVu combină trei formate de compresie: DjVuText, DjVuPhoto și DjVuLayered.
DjVuText (cunoscut și ca JB2): un format pentru comprimarea imaginilor alb-negru și monocrom. Algoritmul folosit aici oferă un grad ridicat de comprimare datorită procesării într-un mod special a elementelor de aceeași formă (de exemplu, litere) de pe pagină. Documentele multi-pagini alb-negru cu o rezoluție de 300 dpi (12 puncte pe milimetru) care conțin doar text sunt de obicei comprimate la o dimensiune de 5-20 KB. Fișierele procesate de DjVuText sunt de 3-10 ori mai mici decât fișierele PDF sau TIFF de aceeași calitate. DjVuText acceptă, de asemenea, un mod în care o anumită culoare poate fi asociată cu fiecare obiect. Acest mod poate fi folosit pentru documente electronice sau pentru imagini GIF.
DjVuPhoto (cunoscut sub numele de IW44): un format de compresie avansat pentru color și în tonuri de gri (nuanțe de gri) de fotografii, desene și alte imagini. Se bazează pe teoria matematică a wavelet-urilor. Dimensiunea fișierului comprimat este o medie de jumătate din dimensiunea unui fișier JPEG de aceeași calitate. Principalele avantaje ale DjVuPhoto înainte de JPEG sunt:
Formatul vă permite să lucrați cu imagini foarte mari, dar dimensiunea maximă a imaginii este limitată de dimensiunea memoriei RAM a computerului. O altă limitare DjVuPhoto - formatul acceptă o singură schemă de culori (YCrCb). Această limitare poate provoca probleme atunci când lucrați cu imagini medicale sau geologice. În acest scop, formatul din LizardTech - MrSID este mai potrivit.
Documentul DjVu poate conține atât o pagină, cât și multe pagini. Documentele multi-pagini pot fi de două tipuri: grupate - stocate într-un singur fișier și "indirect" - când paginile individuale ale documentului sunt stocate în fișiere separate în același director.
Notă. documentele cu mai multe pagini colectate utilizând versiunile software 2.x și 3.x ale programului DjVu sunt incompatibile. Plugin-urile de versiunea 3.x afișează în mod corect documente multipage de versiunea 2.x, DjVuShop 2.0 funcționează numai cu documente multipagina de versiunea 2.0
Utilizarea DjVu
Raspunsul scurt la intrebarea "Cand trebuie sa folosesc DjVu?" este după cum urmează:
- Pentru stocarea imaginilor cu o rezoluție de peste 1 milion de pixeli (documente scanate, fotografii de înaltă definiție).
- Pentru stocarea oricăror imagini care conțin text.
- Pentru stocarea documentelor cu mai multe pagini: cărți scanate, albume foto etc.
Avantajele DjVu
Colectăm documentul DjVu
Dacă nu ați mai lucrat cu DjVu înainte, trebuie să instalați două pachete. Pentru distribuții diferite, numele lor nu ar trebui să fie foarte diferite. În Debian, aceasta se face prin următoarea comandă:
\ $ sudo apt-get instalează netpbm djvulibre-bin
Acum puteți continua cu crearea efectivă a documentului DjVu. Să presupunem că avem o carte scanată - fișiere 010. BMP și copertă - 010.BMP.
Mai întâi de toate, convertim toate imaginile în formatul "anymap portabil". Puteți face acest lucru cu comanda bmptopnm. redirecționând ieșirea către un fișier cu numele dorit. Pentru alte formate de fișiere, există comenzi jpegtopnm. pngtopnm. giftopnm sau anytopnm. Pentru a nu introduce aceeași comandă pentru fiecare fișier, vom scrie o bucla mică, așa cum am aflat în articolul despre bash:
\ $ pentru i în 010 * BMP; a face bmptopnm \ $ i> \ $ pnm; bmptopnm făcut: Ferestre BMP, 2480x3507x1 bmptopnm: SCRIEREA PBM IMAGE bmptopnm: Ferestre BMP, 2480x3507x8 bmptopnm: SCRIEREA PGM IMAGE.
După aceea, fișierele cu extensii de .pnm și nume vor apărea în directorul curent, precum și în fișierele BMP.
Imagini alb-negru
Pentru a converti imaginile alb-negru, vom folosi comanda cjb2. Această comandă are două argumente - fișierul "anymap portabil" și numele fișierului djvu dorit. De asemenea, există mai multe opțiuni: -dpi - rezoluție imagine, -losslevel <число> Raportul de compresie. Există, de asemenea, câteva abrevieri pentru confort:
- -lossless este echivalent cu -losslevel 0 - nu comprima deloc (aceasta este opțiunea implicită)
- -curat este echivalent cu -losslevel 1 - eliminarea celor mai mici bloturi din imagine
- -lossy este echivalent cu -losslevel 100 - include abilitatea de a codifica identice caracterele similare.
Sunt posibile și valori mai mari ale nivelului de pierdere, dar acest lucru va duce la deteriorarea calității imaginii.
Deci, procesăm imagini într-un ciclu:
\ $ pentru i în 010 * pnm; face cjb2 -dpi 300 -clean \ $ i \ $ djvu; făcut
După această operație, fișierele cu extensia .djvu apar în directorul de lucru.
Imagini color
Pentru a comprima imaginile color, vom folosi utilitarul c44. Am doar o acoperire de culoare. Comanda c44 are mai multe opțiuni decât cea anterioară, dar voi folosi doar două dintre ele: rezoluție și "-slice" pentru a controla calitatea compresiei. În manualul pentru fotografii, se recomandă valoarea -fold 74 + 13 + 10. dar voi lua o valoare puțin mai mică - pentru că un capac cu patru culori va fi bine. (pentru informații detaliate despre parametri vezi omul c44).
\ $ c44 -dpi 300 -slice 60 + 7 + 7 01.pnm 01.djvu
Colectăm un document cu mai multe pagini
Acum, că am procesat fiecare pagină, le putem colecta pe toate într-un singur document. Acest lucru se face astfel:
\ $ djvm -c my-cool-book.djvu 01. djvu 010 * djvu
Opțiunea -c ('creați') indică faptul că vrem să creăm un document nou. Apoi vine titlul pe care dorim să-l oferim cărții noastre, iar apoi fișierele ".djvu" din care va fi compusă cartea. Este important ca numele fișierelor sunt în ordine alfabetică, dacă vom folosi expandarea (metacaractere * în loc de numele fișierului), apoi pagina din cartea va merge în ordine