useful_faq | Распознавание текста по шаблону

Суть проблемы: есть порядочное количество А4 листочков с печатным текстом, интервал 1.5-2-строчный (где как) и пометками между этими строчками, сделанными рапидографом (сиречь смена контраста эти пометки не сотрет). Хочется перевести эти листочки в электронный вид, но FineReader очень уж сильно спотыкается на подписях, даже не просто выделяя её в отдельную строчку с белибердой, а путая с текстом. В итог результат такой, что быстрее перенабрать...Но все листы как-то перенабирать муторно.

Что хочется: нет ли такой софтинки (или может это есть в FR, а я просто не нашёл? ;)), чтобы можно было указать маску распознавания (например "блоки по 0.5 см с верхнего края с расстоянием между в 0.75 см") и распознавать только по ней?

Спасибо)

Flat | Top-Level Comments Only

From:

spamsink.livejournal.com

Сделайте из чистого листа бумаги маску с помощью линейки и лезвия, и будет вам счастие.

maig4eg.livejournal.com

Или из фотошопа.

maxxk.livejournal.com

Abbyy Form Reader?
http://www.abbyy.ru/formreader/?param=4347

emankcinon.livejournal.com

а я никогда не доверял автораспознаванию файнридера. проще и быстрее всегда получается вручную выделить блоки текста на отсканированных страницах, а потом запускать распознавание

Полезные вопросы

Распознавание текста по шаблону

Распознавание текста по шаблону

no subject

no subject

no subject

no subject