Poziționarea automată a imaginii

Poziționarea automată a imaginii

Pentru cei care scanează sau procesează scanări, nu este nici un secret faptul că alinierea imaginii scanate este o procedură destul de neplăcută (dacă este făcută manual). Există mai multe abordări (algoritmi) pentru alinierea automată. Bazele ambelor metode - găsirea de linii în imagine, deviind aceste linii de la orizontală / verticală, puteți judeca modul de rotire a imaginii. Înclinarea opțiunilor cele mai nebune și imaginea este rotită acolo unde este necesar.

Am folosit mai întâi algoritmul lui Khuf. care este bine descrisă pe internet și oferă, în principiu, rezultate bune. Dar - numai pe imagini care constau în întregime din text. Și am o sarcină - să alin imagini cu text și imagini. (M-am făcut în scanarea de timp liber și restaurarea cărților sovietice. Și aceasta este transformarea este atât de uimitor detectează linie și calculează unghiul de înclinare, am decis să găsească picioare de unde să crească, și să încerce să-l rescrie în Java. Surse sunt acolo codul atât de confuz. și optimizat pentru C ++, că traducerea a avut loc undeva în jurul zilei 2. Asta sa dovedit:

Algoritmul funcționează rapid pentru diavol datorită unei hărți a tuturor variantelor posibile de biți din octet, adică 8 pixeli sunt calculate simultan pentru o singură iterație. Dar cum funcționează și ce se întâmplă în interiorul meu, un mister :) Principalul lucru care funcționează.

Nu-mi cred ochii. Există coincidențe.

Acum două zile am terminat să port același Java cod. Și procesul, apropo, a durat și câteva zile. Practic, din cauza neînțelegerii totale a esenței algoritmului. Încercarea de a citi teoria nu a fost decât în ​​cele din urmă confuză. Dar totul a funcționat așa cum ar trebui.

Acum, aici mă gândesc cum să rezolv problema cu autocrop. Caut pe cineva care deja lucrează în rețea - și acum am fugit în postul tău.

Cu ajutorul autocropului, puteți face ceva de la ImageMagic - există o opțiune de decupare care elimină pur și simplu zona cu cea mai mare densitate de conținut.

De asemenea, mă gândesc la autocrop, dar am o altă specificitate - am tăiat scanează - există în jurul marginilor biciului și a liniilor reziduale după curățarea din fundal. Când scriu, o voi posta.

Apropo, de ce convertiți DJVU în PDF? Primul format este mai bun pentru cărțile scanate. În PDF, docurile sunt obținute mai mult și calitatea nu este foarte - rezoluția este redusă.

> Apropo, de ce ar trebui să convertească DJVU la PDF? Primul format este, de asemenea, mai bun pentru cărțile scanate. În PDF, docurile> sunt obținute mai mult și calitatea nu este foarte - rezoluția> este redusă.

> De asemenea cred că peste AutoCrop, dar am o specificitate diferită -> Am tăiat scanări - acolo pe margini byaki și linia reziduală> după îndepărtarea de fundal. Când scriu, o voi posta.

La mine declarația de sarcină este ideală: exact aceleași scanări murdare netratate, dar numai sigilate în djvu.

Sunt în concediu în această săptămână, mă voi întoarce - mă voi ocupa mai mult de această chestiune (dacă nu există pietre pentru locul de muncă principal). Vor apărea câteva idei - voi împărtăși.

Apropo, dacă este interesant, încă o problemă sunt culorile estompate ale fontului. A decis deja aproape. Problema este că vreau să fac acest lucru în mod automat, și nu poate fi pur și simplu o anumită culoare (culoarea fontului) pentru a face un negru, pentru că el a găsit în alte locuri - de exemplu, o carte cu imagini color, sau un fundal în textul din imaginea de acolo. Fac acest lucru - o pagină este selectată în carte, unde există o imagine și un text. Apoi selectăm o zonă unde există doar text. Determinați obiectele conținute pe pagină. Acele obiecte care sunt în zona de text, atribuie eticheta „Text“, restul „Imagine“. Cea mai apropiată se conectează între ele într-un anumit grup de obiecte, de exemplu, 3-4 și înregistra comunicații și dimensiunea obiectelor într-o serie de caracteristici. Apoi, harta de auto-organizare le dă totul - pregătim. În cele din urmă se dovedește foarte rezolvator de înaltă calitate, care este, textul și ce nu. Am încercat pe o carte pentru copii, rezultatele de 100% ghicitul pe pagina pe care am studiat. Acum este necesar ca armarea să încerce pe alte pagini. Dacă totul se dovedește, voi scrie un alt scurt articol despre cum să procedăm. Singura byaka este faptul că algoritmul trebuie să arate mai întâi zona de text - pentru a preda. Dar nicaieri pe Internet am gasit ceva mai bun.

Am făcut un algoritm mai mult sau mai puțin acceptabil pentru decuparea câmpurilor. Desigur, în multe privințe este potrivit pentru documentele mele de testare și nu pretinde universalitatea. Dar testez totul la rând - mai ales doar pe coperți și pagini bogat ilustrate (nu pot recunoaște unde se termină murdăria și imaginea începe sau marginile imaginii pot fi confundate cu o umbră de legare). Cred că am o nouă versiune de o săptămână.

Lucrarea dvs. cu privire la albirea paginilor - negarea scrisorilor pentru mine este foarte interesantă. Acum, eu doar umple alb sau negru cu toți pixelii care nu se încadrează în anumite limite. Ca rezultat - găuri și rupte pe marginile literelor.

Asta mă scot despre autocrop.

Băieții oferă o metodă bună. Implementarea poate fi introdusă în ocropus.

Articole similare