Experiența acumulată de bibliotecile rusești face posibilă formularea clară a răspunsurilor la cele trei întrebări principale ale digitalizării fondului de bibliotecă: de ce scanați, ce să scanați, cum să scanați.
De ce este biblioteca imaginea cea mai frapantă a sistemologiei - știința fundamentală care studiază organizarea proceselor și a fenomenelor din lume? Răspunsul constă în fundația și aparatul de referință și de căutare al bibliotecii. Pentru un cititor regulat, cărțile de pe rafturi au, de asemenea, o fundație, dar acest lucru nu este în întregime adevărat. Fondul de bibliotecă este o structură complexă de documente prezentate pe diverse suporturi media, care corespund anumitor ramuri ale cunoașterii și asociate cu un mecanism specializat de căutare bazat pe catalogul de cărți.
Chiar și plasarea revistelor pe rafturile bibliotecii bazată pe o abordare științifică: legea Bradford informetric explică modelul de distribuire de articole pentru publicații și, prin urmare, face posibilă, cu o probabilitate mare de a anticipa cererea de materiale, pe baza informațiilor specifice.
Cu alte cuvinte, bibliotecile au reușit să creeze un sistem ideal de clasificare și structurare a informațiilor, ceea ce a permis rezolvarea problemei stocării și recuperării unor cantități imense de date din orice sursă. În acest scop au fost elaborate clasificatoare de biblioteci specializate care reglementează distribuirea și amenajarea fondurilor, metodele de organizare a cataloagelor sistematice și standardele de înregistrare și înregistrare a documentelor.
Despre digitizare
Când vorbim despre digitalizarea cărților de orice bibliotecă, în plus față de păstrarea originalelor și pentru a asigura autenticitatea unei copii electronice, trebuie să vă amintiți să mențină identitatea structurii de clasificare și căuta informații pe suport de hârtie și electronic de fonduri. Cu alte cuvinte, cărțile de scanare necesită crearea obligatorie a unui catalog electronic și formarea unei baze de date index-căutare cu gradul maxim de exhaustivitate a conținutului.
Proiecte privind crearea resurselor electronice ale bibliotecilor
sunt printre cele mai complexe și saturate din punct de vedere al muncii,
metodologiile aplicate și execuția tehnică.
Există o întrebare firească - de ce? De ce cu astfel de dificultăți în implementarea proiectelor similare care se aventurează digitalizarea materialelor de bibliotecă, deoarece „cartea poate fi păstrată timp de secole“, și „toate în bibliotecă, nimeni nu merge“?
Nu uitați de păstrarea cunoștințelor neprețuite și a valorilor culturale acumulate în depozitele de cărți din întreaga țară. În acest scop, digitalizarea este cea mai eficientă modalitate de păstrare a publicațiilor și de asigurare a accesului sigur la informațiile conținute în acestea.
Catalogul electronic
Baza pentru automatizarea bibliotecilor moderne este crearea unui catalog electronic și completarea unui sistem informațional automat de bibliotecă (ALIS). ALIS este necesară pentru automatizarea contabilității fondurilor. Un catalog electronic complet crește semnificativ eficiența și viteza de recuperare a informațiilor, mărind în mod semnificativ calitatea generală a serviciilor pentru cititori.
Ca regulă, biblioteca menține mai multe tipuri de cataloage: alfabetic, în care toate cărțile sunt aranjate în ordine alfabetică; Sistematic, unde cartelele sunt aranjate în funcție de ramurile cunoașterii. Există cataloage care sunt împărțite prin acoperirea fondurilor: părți generale sau individuale ale fondului; prin numire: citire sau service; pe multe alte motive: istoria locală, subiectul etc.
Cu un număr mare de fonduri
digitizarea întregului catalog este un proces destul de lung,
care se desfășoară de obicei în etape.
Baza catalogului este o carte de bibliotecă care conține informații de publicare, indici de clasificare, număr de carte (ISBN) și alte date. Datorită cantității mari de informații specifice, cardul este un document foarte complicat pentru extragerea datelor din index. Chiar mai dificilă prelucrare a informațiilor în limbi străine, texte scrise de mână sau semne diacritice (diverse superscript-uri, indici, mai puține ori inline).
O înregistrare bibliografică poate conține până la 24 de câmpuri diferite. Transferarea intrărilor în sistem direct de pe hârtie nu este adecvată, din cauza ratei scăzute și pierderea / lipsă de risc cheie de informații, astfel încât lucrările privind crearea catalogului electronic a însemnat cataloage obligatorii de pre-scanare bibliotecă, crearea și verificarea indexului bazei de date înainte de încărcare în ALIS.
Chiar și într-o mică bibliotecă, numărul de cărți este de mii de unități. În astfel de circumstanțe, să caute propriile lor resurse umane și tehnice și să se angajeze în sine, practic, imposibilă formarea catalogului electronic, astfel încât pentru a economisi timp și bani implicați în antreprenori profesioniști specializați în prelucrarea informațiilor de bibliotecă și sunt dispuși să garanteze rezultatul final.
Proces tehnologic tipic de creare a unui catalog electronic
Se recomandă ca digitalizarea să se producă pe teritoriul bibliotecii, astfel încât să nu se retragă cartelele de bibliotecă de la utilizare și să nu se perturbe lucrarea cu cititorii. Procesul este împărțit în mai multe etape:
Examinare. Se evaluează starea fizică a cardurilor și a volumelor de fișiere ale cardurilor. Se determină compoziția descrierii bibliografice și formatul necesar al înregistrărilor care pot fi citite de mașină. Pe baza datelor primite, se pregătește un lanț tehnologic suplimentar. Lista lucrărilor și a metodelor de extragere a datelor este influențată de nuanțe în scris, format și chiar de compoziția materialului (carton, hârtie). Următoarele tipuri de cărți posibile sunt:
Echipamentele moderne vă permit să atingeți o viteză de scanare de 170 de carduri pe minut, în timp ce alegeți un scaner profesionist ajută la evitarea deteriorării cardurilor.
- carte suplimentară. Caracteristică: caractere tipărite și scrise de mână,
- delimitator. Caracteristică: diferită de formatul standard al cartelei,
- carte de referință. Caracteristică: numai caractere scrise de mână,
- descriere. Caracter: Text vechi rusesc.
Scanarea. Scanarea cardurilor de hârtie se efectuează pe scanere de documente de mare viteză. Cerințe standard pentru digitizare: rezoluție 300 dpi, modul de scanare alb-negru, format TIFF sau JPEG. Majoritatea cardurilor de dimensiuni standard de 130x80 mm, dar pot satisface până la A6 (148x105 mm) inclusiv. Uneori, înainte de scanare, cardurile deteriorate sunt lipite împreună. Scanarea pe două fețe a cardurilor este adesea efectuată, unde pe partea inversă există numere de inventar, o defalcare pe ramuri. Cardurile de separare nesemnificative nu sunt scanate.
După digitizare, matricea de fișiere de hârtie este resetată.
Toate lucrările ulterioare se desfășoară cu recepția
imagini grafice ale cardurilor.
Asigurați-vă că rotiți imaginile șterse, ștergeți fundalul, afișați caractere cu contrast scăzut etc.
Proprietățile copiilor electronice ar trebui să excludă pierderea de informații și să nu degradeze lizibilitatea documentului în comparație cu originalul pe suport de hârtie. În cazul unei stări precare a materialului sursă, sunt permise instrumente software pentru îmbunătățirea calității imaginii.
Toate prelucrările de imagini sunt efectuate în modul automat. Este posibilă corectarea manuală a geometriei imaginilor, eliminarea zgomotului și a marcajelor de îndoire atunci când este necesar să se proceseze un număr mic de documente deteriorate.
Chiar și atunci când tastați pe o mașină de scris, nu toate caracterele sunt recunoscute corect. Recunoașterea automată a textului scris de mână, a mărcilor de creion și a cărților create înainte de mijlocul secolului XX este aproape imposibilă.
Numărul de imagini grafice trebuie să coincidă cu numărul de coli de masiv de hârtie. Norma a fost scanarea în ordinea cărților de catalog. Ștergerea paginilor este considerată căsătorie.
Retroconversia: introducerea informațiilor din cardurile scanate și formarea unei baze de date. Cardurile pot conține text și scris de mână, note de creion, simboluri fuzzy și alte caracteristici de umplere.
În cazuri rare, cu un document de bună calitate care conține text imprimat, puteți utiliza software-ul de recunoaștere pentru a extrage automat anumite câmpuri ale cardului.
Prin urmare, datele din cardurile de bibliotecă sunt introduse în principal manual
și să treacă un sistem de control al calității pe mai multe niveluri.
Înainte de a Retroconversion produse de separare (sortare) gruparea imaginilor pe părți individuale ale cărților de matrice și alte tipuri de caracteristici de indexare (carduri de componente de cuplare pentru a crea unități de date de volume, separarea limbilor, etc.). Se face o marcare a blocurilor pentru facilitarea extragerii datelor de către operator.
Ieșirea formează baza de date în formatul necesar pentru bibliotecă (RUSMARC, UNIMARK, MARC21, etc.). În unele cazuri, atunci când se creează un catalog electronic, imaginile grafice ale cărților pot servi ca obiect de procesare. Apoi, operatorii sunt implicați în lucrare, cunoscând regulile pentru compilarea descrierilor bibliografice.
Cerințele pentru un procent minim de erori în baza de date sunt foarte mari, deoarece acestea afectează în mod direct calitatea recuperării informațiilor din catalogul electronic. Prin urmare, după introducerea datelor, există o etapă de testare prin diferiți parametri de către verificatori experimentați.
Pentru a accelera procesul de retroconversie, se folosește o tehnologie de împrumut,
simplificând introducerea informațiilor datorită auto-potrivire a umplerii câmpurilor
pe baza datelor introduse anterior.
Scanarea cărților
După crearea unui catalog electronic sau paralel cu acest proces, bibliotecile rezolvă problemele de asigurare a siguranței și accesibilității fondului de carte prin digitizarea cărților. Lucrările de digitalizare sunt realizate pentru a completa proiectele electronice naționale, a crea colecții de cărți rare și resurse fulltext, colecții de materiale ilustrate tematice și multe altele.
Bibliotecile pot lucra independent la digitizarea fondurilor. De exemplu, în bibliotecile mari sunt organizate întregi departamente de scanare, care au o flotă de echipamente profesionale.
Un aspect important îl reprezintă caracteristicile copiilor digitale. Dacă se rezolvă problemele locale, biblioteca poate determina în mod independent cerințele pentru resursele electronice de ieșire. Dar atunci când se implementează proiecte naționale, în cazul în care se folosesc fonduri din diferite biblioteci, este necesar un standard comun care să reglementeze principalele caracteristici ale lucrării.
La crearea NEB, resursele electronice create de executorul tehnic
și bibliotecile în mod independent, au avut diferiți parametri de digitizare,
ceea ce a complicat munca de procesare și descărcare a conținutului digital.
Prin urmare, consiliul de experți sucursale a elaborat "Recomandări privind digitizarea materialelor din fondurile bibliotecilor" *, care arată principiul creării resurselor electronice de bibliotecă. Recomandările specifică trei tipuri de copii digitale. Copie de bază - o copie de referință a originalului într-o calitate poligrafică (rezoluție nu mai mică de 600 dpi). Copie personalizată - pentru a crea colecții electronice și pentru a oferi cititorilor o rezoluție de cel puțin 300 dpi. O copie de serviciu este folosită pentru sarcinile interne ale bibliotecii și pentru publicarea pe site-uri web (o rezoluție de cel puțin 150 dpi).
Caracteristicile cărților de scanare
La digitizarea cărților, etapele de lucru repetă procesul de creare a unui catalog electronic. Biblioteca funcționează independent sau angajează un contractor, dar într-un fel sau altul, în primul rând, este necesar să se determine scopul proiectului și să se efectueze o examinare a fondului de carte pentru a înțelege costul și complexitatea lucrării. În viitor, se formează compoziția edițiilor ce urmează a fi digitizate, sunt convenite cerințe tehnice și se realizează evaluarea finală a proiectului.
Luați în considerare câteva caracteristici ale digitalizării cărților care afectează costul și calendarul proiectelor. O mare importanță este formatul și starea cărților, precum și volumul fondului de hârtie. Pe baza acestor caracteristici, se determină tipul de echipament de scanare și tehnologia digitizării.
Hârtia veche, sfâșiată, precum și o legare groasă a mai multor cărți vă permite să utilizați numai scanere non-contact - scanere profesionale planetare (carte). Utilizarea scanerelor flatbed este exclusă.
După scanare, copiile digitale recepționate suferă un proces de corectare a software-ului, sunt conduse la cea mai convenabilă citire a calității imaginilor. Adesea, atunci când folosiți scanere profesionale pentru cărți pentru aceste instrumente de procesare software suficient de încorporate. După primirea unei serii de copii digitale, dacă este necesar, se compilează descrieri bibliografice ale publicațiilor scanate.
Separat este necesar să se evidențieze lucrările de scanare de înaltă calitate a colecțiilor de cărți rare, monumente de carte, folii și alte exemple valoroase. Pentru aceasta, sunt utilizate complexe specializate de scanare de înaltă calitate. oferind o rezoluție optică unică.
Caracteristicile formării de cărți PDF cu text integral
Pentru a crea astfel de cărți, recunoașterea textului integral se efectuează cu verificarea ulterioară a textului și verificarea ortografiei. Editorii de corecții profesioniști sunt implicați în corectarea finală a documentului.
Ca rezultat al prototipării, se formează o carte electronică,
complet identic cu originalul pe hârtie - cu aspectul exact al paginilor,
ilustrații, păstrarea limbii și stilului.
Digitalizarea cărților și a cataloagelor bibliotecilor, în special cu un volum semnificativ, eterogenitatea fondurilor în forma și starea originalelor, este cel mai complicat proces de producție. Numai companiile calificate care posedă toată infrastructura necesară și o vastă experiență în crearea resurselor electronice pot realiza acest lucru calitativ.