Este vorba despre cum să taie câmpul (și, în general, pentru a modifica dimensiunea paginii) a PDF-document. După ce am avut un e-reader de cerneală, o fac destul de des.
Cu toate acestea, în multe cazuri, puteți face cu ușurință un PDF dintr-un PDF convențional, ușor de citit pe cititor de ecran. Faptul că o parte semnificativă a zonei paginii ia de obicei câmpul. Acestea sunt necesare pentru versiunea de hârtie, dar fără ele este posibil să se facă pe cititor electronic. Și dacă vă tăiați câmpul (și, în unele cazuri, pot fi tăiate și subsoluri), este de multe ori o parte substanțială a paginii va arata destul de ușor de citit pe un mic cititor de ecran.
Până în prezent, am găsit și am încercat trei moduri de a decupa câmpul din PDF-fișier.
1. câmpurile decupare utilizând pdfcrop
Există pdfcrop script în Perl (a nu se confunda cu același script în Python), care este capabil să taie automat câmpul. Pe Debian face parte din pachetul texlive extra-utils.
Am să recomande întotdeauna lasă încă un câmp mic (--margin 5), sau pe marginea literelor nu pot fi afișate pe cititor de ecran.
În general, totul este simplu. Avantaje: mod automat facil, pe PDF-ul rezultat în acest fel se poate căuta în continuare. Dezavantajele acestei metode: pdfcrop foarte lent, cu documente mari (sute de pagini), se poate tăia automat antetele și subsolurile și observă, în marja (în unele cazuri este mai ușor de a face fără numere de pagină și titlurile capitolelor din partea de sus, dar pentru a obține o imagine mai mare a textului principal), în special cititorul meu uneori supraîncărcat de urgență de pe PDF astfel obținute, unele fișiere pdfcrop definește în mod incorect limitele textului, unele fonturi răsfață.
2. rasterizarea și culturilor de pagini din ImageMagick
De câteva ori a trebuit să recurgă la scrierea unui scenariu improvizat, ascutita de o anumită sursă PDF. Schema generală este după cum urmează:
Original PDF → rasterizat imagini de pagini (folosind pdftoppm) → tăierea paginile în afară și decuparea câmpurilor (folosind conversia de la ImageMagick) → construi un nou PDF sau pagini DjVu ale circumcizie.
Aici este un exemplu de un astfel de scenariu pe care am folosi (permite nu numai să taie pagina în mai multe coloane, dar, de asemenea, tăiate de pe teren și pinch, aruncarea pagini goale) - PDF-asieta-to-DjVu:
Cum se folosește - ar trebui să fie clar de anchetă sale:
Marja automată Decuparea destul de bine pusă în aplicare într-o echipă -trim ImageMagick, dar puteți seta manual parametrii de tăiere (a avut). De exemplu, pentru a reduce forța la 3% pe fiecare parte din inserție poate converti opțiunea -shave 3% x3% + repage.
Dacă doriți să nu DjVu, și anume PDF, apoi se colectează din imagine în PDF, puteți (pentru a crea PDF prin intermediul IM, a se vedea aici.): În cazul în care o mulțime de pagini, această metodă este foarte lent (și lacom), cel mai bine este de a converti fiecare separat (poate fi același convert. dacă este îndeplinită calitatea, este posibil în acest scop, sam2p intenționat), iar apoi se combină paginile împreună. Pentru a combina PDF-pagini într-un PDF document-am folosi pdftk.
Avantajele acestei metode: este posibil să se taie și tăiați pagina exact așa cum trebuie. Dezavantaje: capacitatea de a căuta textul este pierdut, dimensiunea fișierului este de obicei crescut, pentru a atinge rasterizarea normale font dificil, bine, script-ul în sine este uneori necesar pentru a schimba o anumită carte.