признаване на системата, или текст OCR система

разпознаване на текст система или OCR система (оптично разпознаване на символи) са предназначени за автоматично въвеждане в компютърната документ. Това може да е страница на книга, списание, речник, който и да е документ - нещо, което вече е публикувано, и трябва да се преобразува обратно в електронна форма.

OCR-система да разпознае текста и различните й елементи (изображения, таблици) с електронно изображение. Изображението се обикновено получени чрез сканиране на документ и най-малко - неговата фотография. Входящо изображението се обработва от алгоритъм, OCR-програма, подчертава области на текст, изображения, таблици, боклук се отделят от желаните данни.

В следващата стъпка, като всеки символ се сравнява със специален знак речника, и ако има съвпадение, тогава този герой се счита за да бъде признат. В резултат на това вие получавате набор от разпознатите символи, тоест текст за търсене.

Съвременните OCR-системи са доста сложни софтуерни решения. В крайна сметка, текстът може да бъде застлана, изкривен, мръсен и програмата трябва да вземе това под внимание и да бъде в състояние да се справят както с такива ситуации. В допълнение, модерни OCR системи също могат да получат копие от отпечатан документ в електронен формат с форматиране, стилове, текстови размери и шрифтове и т.н.

1. предварителна обработка на изображението.

2. Признаване на обекти на по-високи нива.

3. разпознаване на символи

4. Структуриране на хипотези. Речник чек.

5. Синтез на електронен документ.

Повечето OCR софтуер (OCR оптично разпознаване на символи) са работа с растерна графика, който се получава чрез факс модем, скенер, цифров фотоапарат или друго устройство. В първия етап трябва да се счупи OCR блокове текст на страница, на базата на характеристиките на левия и десния подравняването и наличието на няколко говорители. Тогава призната блок е разделен на линии. Въпреки очевидната си простота, това не е толкова очевидна задача, тъй като на практика неизбежно нов на изображенията на страниците или фрагменти от страниците на стадото. Дори малък наклон води до факта, че в левия край на редицата падне под десния край на следващия, особено при малки интервали. Vrezultate определение на проблема линия, до която една или друга част на изображението. Например, за J писма, J, г с малък наклон е трудно да се определи кой ред отнася горната (отделен) част от символ (в някои случаи може да бъде погрешно за запетая или точка).

Тогава линии са разделени на непрекъснати области на изображението, което обикновено съответства на отделните букви; алгоритъм за разпознаване прави предположения за съответствието на тези символи на домейни; и след това да направят своя избор за всеки символ, в резултат на една страница се възстановява с букви от текст и като правило, в съответния формат. OCR система може да се постигне най-голяма точност на откриване на над 99,9% за чисти изображения, състоящи се от конвенционалните шрифтове. На пръв поглед това изглежда перфектно точността на разпознаване, но процентът на грешки е все още разочароващо, защото, ако има около 1500 знака на страница, дори и ако процентът на успеваемост при 99.9% се получава признание от една или две грешки на стр. случаи VTAK дума за метода на проверка на речника. Това означава, че ако някои думи, липсва в речника на системата, тя е на специални правила, като се опитва да намери. Но това все още не позволява правилното 100% от грешките, които изискват резултати човешките тестване.

В момента най-широко разпространени. Пакетирани интегрира с Microsoft Office. Основната цел-да създавате и редактирате текстови документи. Тя има широки възможности. Програмата е лесна за работа с големи документи достъпни чрез това означава, че създаването на индекси, съдържания, горни и долни колонтитули, йерархични заглавията и т.н.

2. Word процесори за създаване на сложни документи; документи, представляващи таблиците на текстове, снимки, графики.

3. Програми за наборен текстове (типография)

· Нормален режим - се използва за отпечатване на текстова информация

· Разпределение страница

· Оглед план - документ пропадане на системата от друг. Проектиран да работи с голям текст и с редица заглавия, подзаглавия.

Писане и редактиране на текст:

1. Не отпечатате празен в началото на изречения. А пространство се счита за символ.

2. Не натиснете клавиша Enter, за да започнете нов ред. Но не забравяйте да натиснете влиза в новия параграф.

3. Преди символите ". "Не мога да поставя интервал след характера необходимо да се постави интервал.

4. Необходимо е първо да изберете текста, и то само за извършване на някаква работа.

Форматиране на документа включва:

форматиране 1. Page

2. Параграф форматиране

4. Форматът на таблицата

5. форматиране модел.

1. Въз основа на готовия модел

2. На базата на съществуващ документ.

Вторият метод за горичката, но първата е по-правилно методично. Когато създавате документ на базата на съществуващ документ или отваряне на съществуващ документ, да го запишете под ново име, а след това го пуснете да се премахнат всички съдържанието и всичко, а след това имаме празен документ с от свое име и спестява всички настройки, направени по оригиналния документ.

-- автоматично заместване да се коригира автоматично общи печатни грешки;

-- Автоматична проверка на правописа включва проверка на правописа и граматиката. Потребителят има възможност да забраните някои от видовете проверки или дори извърши одит само след въвеждане на целия документ;

-- авто-формат при влизане за автоматично форматиране на документ директно при влизане или след приключването му;

-- Асистент, предназначена за автоматично дава съвети и предоставяне на допълнителна информация, която може да е необходима по време на изпълнение на задачата.

Например, ако асистентът реши, че вие ​​ще започнете да създавате писмото, че ще предложи да се започне Letter Wizard.

В Word, има инструменти, които улесняват работата с таблици граници (рамкова) и плънката:

-- с помощта на мишката може да се направи маси с различни форми (една клетка от таблицата може да има всяка ширина и височина). Гранична клетка, ред или колона на таблицата може лесно да се отстранява, има същия ефект като обединение на клетки. В Word, можете да обедините всички съседни клетки, както хоризонтално и вертикално;

-- съдържанието на клетките на таблицата може да бъде в съответствие с горната или долната част или в центъра на клетката. Текстът в клетката може да бъде разположен вертикално (с 90 градуса въртят);

-- Word, включени в повече от 150 различни видове граници, които помагат украсяват всеки документ и да го организира професионално;

Словото предоставя набор от графични средства, чрез които може да се обогатят и украсяват текст и снимки с добавяне на размера на сянка и прозрачна текстура запълвания, автоматични форми.

Списък на функции на Microsoft Word

Редактиране на текст се извършва с помощта на следните функции:

§ номера вложка страници в документа, датата и часа, бележки под линия, специални символи и др.;

§ възможността за намиране, преместване на мястото на думата, която искате текстов ред, секция, страница и др.;

§ възможност за повтаряне или отмяна на последното действие, произведен с текста;

§ засилено форматиране на документа. За разлика от Word Pad, документ Word признава изравняване на двата края, оформление мулти-колона;

§ стилове работа бързо да форматирате документ.

В допълнение към тези функции на програмата разполага с набор от функции за услуги, като например:

§ проверка на правописа и граматиката, в това число на заден план - като въвеждането на текст;

§ подбор на думи синоними (елемент от менюто "синонимен речник");

§ пренасянето в документа;

статистика § документи разделителна способност (брой букви, думи, линии, параграфи, страници);

§ Работа с макроси и шаблони на документи.

Програмата също така разполага с голям набор от функции за работа с таблици и диаграми, обем помощна система (система за помощ) и много, много повече.