Как да улавяте текст от изображения с ocr софтуер

Едно от нещата, които често ме смущават, е невъзможността лесно да копирам текст от изображения и определени PDF файлове (напр. Тези, които може да са създадени от сканирани документи). За щастие, във времето са разработени софтуерни решения за справяне с този проблем, които позволяват значителни икономии на време, които иначе биха били изразходвани ръчно за копиране и повторно въвеждане на текста. В днешния съвет ще говоря за безплатен софтуерен инструмент, наречен Capture2Text, който използва алгоритъм за оптично разпознаване на символи (OCR), който ще ви позволи да улавяте текст от файлове с изображения и PDF.

Инсталиране и настройка

За начало отидете на страницата SourceForge на проекта и изтеглете най-новата версия на Capture2Text. Софтуерът се предлага като zip архив и по това време не включва специализиран инсталатор. След като изтеглите, разархивирайте архива и стартирайте файла Capture2Text.exe. Това ще стартира софтуера и ще постави икона надолу в системната област:

Първо, това, което искате да направите, е да настроите предпочитанията на софтуера, по-специално кои горещи клавиши (или преки пътища) да използвате за стартиране и спиране на заснемането:

В моя случай съм избрал да използвам клавишите „Windows + q“, за да започна улавянето, и „Enter“, за да го спра. Можете да коригирате тези опции към това, което работи най-добре за вас. Имайте предвид, че клавишът „Windows + s“ често се използва за заснемане на екран (например от програми като Microsoft One Note).

На следващия раздел, OCR опциите могат да бъдат конфигурирани, включително входния език (в момента се поддържат седем езика) и дали да се използва предварителна обработка на OCR за подобряване на точността (силно препоръчително). И накрая, в раздела Изход, сред другите опции, можете да изберете дали просто да запазите заснетия текст в клипборда или дали да стартирате отделен изскачащ прозорец.

Използване на софтуера

След като софтуерът е инсталиран и конфигуриран, можете да започнете да го използвате чрез стартовата комбинация от горещи клавиши. С помощта на мишката изберете областта на изображението, която включва текста, който искате да заснемете. За да спрете заснемането, просто натиснете горещия клавиш, който сте избрали, за да спрете заснемането. След това текстът ще бъде копиран или в клипборда, изходен изскачащ прозорец или и двете. Пример можете да видите по-долу.

От моето бързо тестване на инструмента с изображения, установих, че точността му е прилична. Очевидно има ограничения за инструменти като този и OCR като цяло. Например силно модифицираният текст (много наклонен, курсив или модерен) може да не работи доста добре, а понякога и изобщо. Освен това в някои случаи ще помогне леко да коригирате размерите на полето за заснемане или да играете с увеличението на самото изображение, за да получите по-точен резултат.

При заснемане на текст от сканирани PDF документи точността е наред, като обикновено са необходими няколко окончателни модификации на заснетия изход (в зависимост от качеството на първоначалното сканиране). Също така забелязах, че обработката на софтуера може да отнеме няколко секунди повече, особено когато се поиска да преобразува големи количества текст.

Като всичко казано, като цяло мисля, че инструментът върши добра работа, още повече, че е свободно достъпен - насърчавам ви да го изпробвате.

Допълнение 16.11.2015 г.:

Като друга опция за тези, които имат акаунти в Google, е възможно да се използват и OCR възможностите на Google, като се качи файл във вашия Google Drive (повече подробности можете да намерите тук). Освен това има и OCR плъгин за потребители на Google Chrome, наречен Copyfish, който може да искате да проверите и вие.