Прочетете онлайн как да се чисти сканирани книги, и една книга автор Storozhev Иван kpnemo - rulit -

Има 2 начина:

След сканиране нейната книга се очаква да се разпространява в мрежата (или се съхраняват в диска).

1) Възможно е да се признае сканира в програмата OCR, като FineReader (FR).

Ако качеството на оригинала е добро, като печат върху lazernike с 12pt размер на шрифта, ФР перфектно тя признава без никакви допълнителни мерки. Но ако трябва да се признае, старата книга на груб жълта хартия, мръсен и така нататък. N ... Ето предварително третиране на драстично повишаване на качеството на разпознаване, което означава, че много по-малко труд и време ще отнеме, за да проверят, т.е. ръчна корекция на грешки. Аз трябва да кажа, че вградените изображение FR почистващи препарати, а примитивни, толкова лоши, шумни сканира той се справя въпрос.

2) Можете да съхранявате незабелязано, като растерна графика, в една или друга форма: DJVU, PDF, TIFF.

За почистване на изображението се използва много и различни методи и програми, понякога си струва десетки хиляди долари. Ще опиша по прост и достъпен начин, особено ценни с това оръжие ще трябва да работят само с една страница на книгата, а останалите могат да се обработват автоматично, на базата на съхранените параметри.

Етап 1: Сканиране

Сканиране на книга, че е необходимо да се режим на сивата гама (сиво). Забележка: режим на сканиране б / т (черно и бяло), не може да бъде! В режим б / w, по-нататъшна обработка не е възможно.

Можете да сканирате в истинския образ (пълноцветно), но това ще забави обработката, увеличаване на размера на файловете и специален няма да спечели. Изключение е, когато тези страници имат цветни петна от мръсотия, а след това работи с цвят може да помогне много.

Някои скенери позволяват да изберете един от цветови канала (червен, зелен, син), който ще се използва при сканиране в сиво, има и други настройки, и те също могат да се обърне. Но не се увличайте, повечето от функциите на скенер обработка на изображения само на водача. Същото може да бъде направено в Photoshop, само че много по-добре.

Опитайте с различни опции, изберете този, който се нуждаят, когато контраста на изображението, буквите изглеждат по-отчетливи. Ако малките шумове (например, текстура на хартията), ще, в разумни граници, както и повече - това няма значение, след това извадете.

И обратното, ако хартията има голям писмо размер 2-3 и по-големи петна, след което можете да се опитате да изберете настройките на скенер, така че тези петна са бледи в сравнение с буквите, макар и с цената на по-малко контраст в сравнение с други варианти на писма ,

Казано по-просто, конфигуриране на скенера:

1) Ако няма големи петна, най-важното нещо да се направи ясни букви, но шумът не е специално гледам.

2) Ако има големи петна, най-важната от печалбите си, дори и ако буквите не са толкова ясни.

И в двата случая, не трябва да се прекалява, предвид натрупания опит и здравия разум.

Ако използвате, за да сканирате FR, след това махнете опциите за сканиране "ясно изображение", "премахване на нарушаване на реда", "Сподели обрати." Всичко това, което правите след това, когато чисти сканирани изображения и да ги прибере обратно в ФР. На този етап, всяка обработка на изображения в FR само бавно сканиране и почистване уврежда изображението по-подходящи програми.

За да изберете разделителната способност на сканиране.

Обикновено книги с текст сканира с резолюция 300dpi. Това е възможност за чисто текстови, приличен печат за качество и не е твърде малък шрифт добра стойност, по-кратък друг бестселър като "Blind срещу Blind". Но в този случай, ще се изисква и почистване. Когато една шумна образ, дребния шрифт, което трябва да се сканира при резолюция 600 dpi. Това значително ще улесни почистването и качеството на крайния файл, ако не признае книгата и да я съхранявате на сгъстен растерна графика. Не се притеснявайте за размера на крайния файл. Ами четка книга с 600 dpi резолюция по време на компресия в DJVU файл дава малко по-голяма от 300 dpi резолюция.

Растер форма на книги за съхранение най-често се използва за книги с формули. В този случай, разделителната способност на сканиране от 600 dpi се иска да е по друг начин трудно да разглобявате индекси във формулите за разграничаване на подобни символи като "омега" и w Но по математика често под индекси (индекс). Има сканиране на 300dpi цяло е трудно да се разбере нещо, особено за печат. Виж: