Care este formatul PDF
PDF - este un format versatil pentru stocarea și difuzarea publicațiilor electronice (cărți, documente, broșuri, cataloage, etc.), ceea ce le permite să-și păstreze aceeași formatare atunci când se deschide pe orice dispozitiv. Cartea de documente / PDF pot fi integrate text, imagini (vectoriale și raster, inclusiv transparența), animație, sunet, formule, tabele, fonturi, link-uri (interne și externe), script-uri (Java), un tabel interactiv cuprins, și multe altele elemente utile. Fotografiile pot fi comprimate, reducând astfel dimensiunea generală a fișierului.
Aș identifica două tipuri de PDF - ca să spunem așa, în ceea ce privește utilizatorul mediu. Primul tip este PDF "text", al doilea tip este PDF "imagine". În textul textul PDF este într-adevăr text; poate fi copiat, documentul poate fi căutat și așa mai departe; dacă doriți, puteți mări dimensiunea fontului. În plus față de textul din text, textul PDF poate conține tabele, grafice, formule, imagini și alte elemente. Principalul lucru este că textul conține exact textul.
Imaginea PDF este doar un set de pagini scanate (sau fotografiate) dintr-o carte, un document, o broșură. Textul de acolo - doar o imagine și, uneori, o imagine cu o calitate foarte mediocră. Nu veți putea să copiați acest text, să îl căutați, să măriți dimensiunea fontului ... Cu toate acestea, desigur, puteți apela la ajutorul programelor de recunoaștere a textului.
Astfel de programe pot, prin recunoașterea unui document PDF, să suprapună stratul așa-numit OCR care conține textul recunoscut. Mai târziu, va fi posibilă căutarea (pe unele dispozitive - și căutarea cuvintelor în dicționare, dacă sunt instalate). Dar pentru a mări dimensiunea fontului și pentru a copia textul va fi în continuare imposibil. Cu toate acestea, după cum înțelegeți, "imaginea" PDF cu strat OCR este mai bună decât imaginea obișnuită "imagine" PDF.
PDF este un format deschis, dacă se dorește, oricine îl poate modifica. În plus, pentru a citi cărți în format PDF, puteți crea programe fără probleme. Cărțile PDF în sine pot fi distribuite fără restricții și deschise pe orice număr de dispozitive. În același timp, cărțile în format PDF pot fi, de asemenea, echipate cu protecție împotriva copierii - cea mai populară protecție DRM, dezvoltată de Adobe. Practic toate cărțile vândute în magazinele de conținut europene și americane sunt echipate cu protecție DRM.
În final, trebuie spus că există un număr de subspecii specializate de PDF, dar, în general, aceste subspecii sunt de interes doar pentru dezvoltatori și imprimante.
Extinderea formatului PDF - .PDF
Două dezavantaje majore ale PDF-ului
De fapt, este bine ca fiecare dimensiune a ecranului să creeze un fișier PDF separat. Și în magazinele e-book decent (conținut), puteți găsi fiecare carte în mai multe versiuni: PDF A4, PDF A5, PDF A6. Pentru un cititor tipic de șase inci, PDF A6 este de preferat.
În general, PDF-ul nu poate fi numit un format de succes pentru stocarea ficțiunii; dar pentru literatură și învățătură este o opțiune foarte bună, deoarece vă permite să construiți un număr imens de elemente diferite - orice grafică, tabele, formule și așa mai departe.
Cititoare PDF
Apropo, PDF-ul este, de asemenea, posibilitatea de a deschide unele browsere - de exemplu, Safari de la Apple. Dar, firește, funcționalitatea pe care o oferă este foarte limitată. Pentru o citire simplă a documentului este suficient, dar, de exemplu, nu puteți face nici o notificare sau selecție.
Programe pentru crearea PDF-urilor
programe specializate în valoare de remarcat Free Apps PDF Creator pentru Windows (puteți crea, dar nu edita PDF), pdftk pentru MacOS și Linux (vă permite să editați PDF, dar este un program de consolă - nu are interfața clasică de utilizator), PDFedit (pentru Linux), PDF XChange Viewer (pentru Windows; editare simplă). Este demn de menționat, și programe plătite: PDF Studio (MacOS X, Linux, Windows), infix PDF Editor (pentru Windows), ABBYY PDF Transformer (pentru Windows).
Conversia cărților PDF în alte formate nu este de obicei o sarcină ușoară. Este relativ ușor de tradus PDF la DJVU; textul simplu "PDF" poate fi convertit în DOC, FB2, EPUB, HTML - de asemenea, fără mari probleme și, cel mai important, costuri. O listă cu convertoarele relevante (atât opțiuni online care nu necesită instalare pe computer, cât și programe full-fledged) pot fi vizualizate aici.
Dacă doriți să convertiți o imagine PDF în format text (DOC, RTF, TXT ...), atunci trebuie să utilizați un program de recunoaștere a textului bun. De exemplu, ABBYY FineReader. Acest program este plătit, este lansat în versiuni pentru Windows și MacOS.
Principalii concurenți sunt PDF: DjVu, EPUB. În Rusia, concurentul PDF este, de asemenea, DOC, care este foarte popular cu mulți angajați în birouri. Documentele DOC sunt bune deoarece sunt foarte ușor de creat și editate, sunt destul de "ușoare" și au o dimensiune mică. Cu toate acestea, documentul DOC este un format foarte complex și unic, iar pe diferite dispozitive documentele DOC pot arăta destul de diferite. PDF-ul în acest sens este mult mai universal. În plus, unele dispozitive deschid PDF-ul, dar nu deschideți documentul DOC (de exemplu, un număr de e-cititoare).
Un alt plus al PDF-ului este funcționalitatea sa excelentă: în PDF puteți încorpora orice, până la muzică și animație. Principalul dezavantaj al PDF în comparație cu DjVU este greutatea sa. Cu alte cuvinte, setul de pagini scanate în format PDF cântărește semnificativ mai mult decât în DjVu. Dar odată cu dezvoltarea tehnologiilor de telecomunicații, precum și a tehnologiilor pentru producerea de memorii, hard disk-uri, acest minus nu mai devine atât de semnificativ. În plus, formatul PDF în sine nu merită și este îmbunătățit.
Rămâne de a compara PDF cu EPUB. În prezent, PDF-ul este încă mai puternic decât EPUB-ul: poate încorpora animație, sunet (deși nu este deja important cu lansarea EPUB-ului 3); posibilitățile de formatare sunt practic nelimitate. Pe de altă parte, fișierele PDF sunt, de obicei, "mai grele" decât EPUB-urile și mulți cititori ai e-reader-ului se confruntă cu lectura lor mult mai rău. Minusul principal al fișierului PDF este, de fapt, că trebuie să creați un fișier separat pentru fiecare dimensiune a ecranului. Prin urmare, PDF-ul nu poate fi numit un format de succes pentru stocarea ficțiunii; dar pentru literatură și formare, aceasta este o opțiune foarte bună, deși, din nou, viitorul EPUB 3 va fi probabil chiar mai bun.
Opinia mea despre formatul PDF
Perspectivele formatului PDF
Când am început să scriu acest articol, am crezut că PDF are perspective bune. Dar apoi mi-am dat seama că nu era așa. Viitorul PDF-ului este foarte neclar și neclar. Desigur, de astăzi este un format remarcabil. Dar concurenții nu dorm; Ripening alternative, cum ar fi EPUB și KF8. Desigur, acestea nu vor înlocui PDF-ul complet, dar îl pot apăsa complet. Cu toate acestea, în următorii câțiva ani, PDF-ul va rămâne cu siguranță unul dintre cele mai populare formate.
4 gânduri pe "Despre formatul PDF"
Principala problemă cu PDF este că ... este foarte comună. Este modelat acolo unde este necesar și nu este necesar. În cazul în care a fost utilizat în alte scopuri - în locuri în care un „pixel cu pixel“ precizie a poziției relative a elementelor pe pînză, și că, ca document, gata pentru semnătură electronică și a creat „timp de secole“, el ar fi avut probleme.
În toate celelalte cazuri, nu îmi pot imagina un aspect pe care HTML nu l-ar putea gestiona. Uită-te la mii de pagini web și fii uimit de posibilitățile. Este cu atât mai dificil să creați o cerință în cartea tehnică decât pe aceste pagini?
textul simplu "PDF" poate fi convertit în DOC, FB2, EPUB, HTML - de asemenea, fără prea multe probleme și, cel mai important, costuri
Cum pot converti un text PDF cu aspect multi-coloană? Niciun convertor de la testat nu are o coloană în serie, ci se amestecă pur și simplu textul lor - rândul 1 coloana 1, pagina 1 numărul 2, pagina 1 numărul 3, pagina 2 numărul 1, pagina 2 numărul 2 etc.
În toate celelalte cazuri, nu îmi pot imagina un aspect pe care HTML nu l-ar putea gestiona. Uită-te la mii de pagini web și fii uimit de posibilitățile. Este cu atât mai dificil să creați o cerință în cartea tehnică decât pe aceste pagini?
PDF-ul, spre deosebire de HTML, este bun pentru că se afișează la fel peste tot; dar fișierele HTML în diferite browsere pot fi afișate în moduri diferite - cu mici diferențe. În plus, paginile scanate din cărți în HTML nu se răspândesc - în special deoarece acestea cântăresc prea mult; PDF are mecanisme speciale de compresie pentru imagini. În ceea ce privește celelalte momente, nu pot să spun - nu un poligrafist sau un dezvoltator, dar cred că există și alte constrângeri.
În principiu, pe baza formatului HTML / XML EPUB - în special a celei de-a treia versiuni - este foarte promițător și cred că după un timp va împinge PDF-ul. De fapt, este un hibrid de HTML și PDF, având cele mai bune caracteristici din ambele formate.
>> paginile scanate din cărți în HTML nu se răspândesc
Această problemă nu este luată în considerare. Aplicația este exclusiv piratată.
>> PDF, spre deosebire de HTML, este bun prin aceea că afișează același peste tot
Și în ce cazuri aveți nevoie de o cartografiere identică? Numai în cazul revistelor, în cazul în care layout-ul asumă titluri, tabele, cifre, situate pe răspândire (imediat pe două pagini). Și apoi, costul unei mici răsturnări a unor astfel de elemente este neglijabil. De obicei nu există mai mult de o duzină.
Asta e tot. Punct. În toate celelalte cazuri, identitatea nu este importantă. Întrucât nu există pur și simplu conceptul paginii. Prin urmare, subsolurile și materialele din versiunea electronică nu sunt pur și simplu necesare, ele nu au niciun sens fizic. Ordinea principală a elementelor și fluxul maxim în jurul elementelor cu text, care este plus sau minus una sau două linii, se realizează destul de calitativ.
Surprinzător de reviste, care de multe ori nu au o versiune de hârtie, dar încă strâns într-un multi-coloană pdf. Și altele, cu calitatea de "computer inițial" dofig și mai mult.
Din câte știu, programele majore de impunere pot face export la HTML. Dar formatele PDF sunt necesare și nu. Chiar și dumneavoastră, nu observați excesul de format pentru citirea (consumarea) informațiilor text-ilustrative de la dispozitivele electronice.
>> Și în mod ideal, desigur, merită să cumpărați programul ABBYY PDF Transformer:
Care este diferența față de FineReader triviale? Poate _ fara recunoastere _ rasturnare _ initial computer_, inclusiv multicolumn, PDF in HTML?
Această problemă nu este luată în considerare. Aplicația este exclusiv piratată.
Nu-mi spune. De exemplu, revistele străine stochează și distribuie articolele sub formă de fișiere PDF (scanează) cu strat OCR.
Apropo, am un alt avantaj al PDF înainte de HTML: securitate - abilitatea de a adăuga o semnătură digitală, de a instala protecția prin copiere DRM ...
De asemenea, există un punct mai mic dacă se compară PDF cu HTML, în loc cu EPUB. PDF-ul este întotdeauna un fișier. HTML este întotdeauna un fișier și o arhivă cu o grămadă de fișiere suplimentare, ceea ce nu este întotdeauna convenabil.
În cele din urmă, PDF utilizează un font încorporat, în timp ce atunci când afișează codul HTML, browserul poate înlocui fontul specificat cu alt font dacă fontul nu este instalat pe computer.