[identity profile] darthserge.livejournal.com posting in [community profile] useful_faq
Суть проблемы: есть порядочное количество А4 листочков с печатным текстом, интервал 1.5-2-строчный (где как) и пометками между этими строчками, сделанными рапидографом (сиречь смена контраста эти пометки не сотрет). Хочется перевести эти листочки в электронный вид, но FineReader очень уж сильно спотыкается на подписях, даже не просто выделяя её в отдельную строчку с белибердой, а путая с текстом. В итог результат такой, что быстрее перенабрать...Но все листы как-то перенабирать муторно.

Что хочется: нет ли такой софтинки (или может это есть в FR, а я просто не нашёл? ;)), чтобы можно было указать маску распознавания (например "блоки по 0.5 см с верхнего края с расстоянием между в 0.75 см") и распознавать только по ней?

Спасибо)

Date: 2007-10-11 12:53 am (UTC)
From: [identity profile] spamsink.livejournal.com
Сделайте из чистого листа бумаги маску с помощью линейки и лезвия, и будет вам счастие.

Date: 2007-10-11 03:43 am (UTC)
From: [identity profile] maig4eg.livejournal.com
Или из фотошопа.

Date: 2007-10-11 02:29 am (UTC)
From: [identity profile] maxxk.livejournal.com
Abbyy Form Reader?
http://www.abbyy.ru/formreader/?param=4347

Date: 2007-10-11 05:41 am (UTC)
From: [identity profile] emankcinon.livejournal.com
а я никогда не доверял автораспознаванию файнридера. проще и быстрее всегда получается вручную выделить блоки текста на отсканированных страницах, а потом запускать распознавание