OCR в DjVu файлове - нов подход към старите възможности

OCR в DjVu файлове - нов подход към старите функции.

На коефициентът на плодовитост е много материал за прилагането на DjVu, тъй като форматът става все по-популярна, става необходимо да се допълни вече наличната информация.

На възможността за OCR (оптично разпознаване на символи - оптическо разпознаване на символи, обикновено текст) в DjVu Отдавна е известно, но единственият инструмент за това не е безплатно, а не евтин софтуер от гущер, но дори и той няма и не се очаква кирилица. В България е имало опити за разработване на софтуер, който ви позволява да се преодолее този недостатък, но се стигна до техническите библиотеки, най-малко, тази информация може да се намери в рускоезичните Интернет.

Днес можем да кажем със сигурност, че РОК в DjVu файлове получи нов живот! Благодарение на усилията на българския програмист Генчо набор от услуги, предназначени да позволят да получавате файлове DjVu с текста, който позволява на плъгин за Internet Explorer, за да копирате текст в клипборда, и най-важното - да бъде в състояние да търсите в документа. Точно тази функция е от ключово значение. Защо? Да предположим, че са сканирани и otkonvertili в DjVu техническа справка, в която масовите диаграми, формули и други неща, които е почти невъзможно да се OCR. Не е случайно, че някой някога действително се възползват пълноценно пренаписва книгата, не е измислица, която се състои най-вече от само текст. Оказва се, че книгата е, но намери в него необходимата информация в текста е невъзможно, защото не DjVu "чисти" PDF, където търсения текст положи подразбиране. В допълнение, OCR, не и не можем да гарантираме без грешки предаване на оригиналната информация. Не програма не е в състояние да идентифицират всички грешки след РОК, той може да се справи само с един човек, но това е трудна работа коректор. Ако обикновен текст все още е възможно да се намерят и да коригира някои печатни грешки, в техническата литература, която се прави такава усилия, които е малко вероятно има ентусиаст, който може напълно тества всеки знак във всяка формула, а дори и отново събира всички формули в специален софтуер.

Цялата необходима информация за използването на OCR DjVu файлове, съдържащи се в опаковката. Първият пакет да се признае като такъв, а вторият индексирането вече разпознат текст.
Разбира се, за тези операции, в допълнение към DjVu на енкодер, трябва да имате FaynRider пето или седмо версия, може да се добави към този списък и шести версия.

В заключение, бих искал да благодаря от името на радиолюбители Генчо за своята работа по създаване на безплатна програма за всеки, който използва DjVu формат.

Грешка в параметрите минаха