Распознавание текста по шаблону
Oct. 11th, 2007 04:04 am![[identity profile]](https://www.dreamwidth.org/img/silk/identity/openid.png)
![[community profile]](https://www.dreamwidth.org/img/silk/identity/community.png)
Суть проблемы: есть порядочное количество А4 листочков с печатным текстом, интервал 1.5-2-строчный (где как) и пометками между этими строчками, сделанными рапидографом (сиречь смена контраста эти пометки не сотрет). Хочется перевести эти листочки в электронный вид, но FineReader очень уж сильно спотыкается на подписях, даже не просто выделяя её в отдельную строчку с белибердой, а путая с текстом. В итог результат такой, что быстрее перенабрать...Но все листы как-то перенабирать муторно.
Что хочется: нет ли такой софтинки (или может это есть в FR, а я просто не нашёл? ;)), чтобы можно было указать маску распознавания (например "блоки по 0.5 см с верхнего края с расстоянием между в 0.75 см") и распознавать только по ней?
Спасибо)
Что хочется: нет ли такой софтинки (или может это есть в FR, а я просто не нашёл? ;)), чтобы можно было указать маску распознавания (например "блоки по 0.5 см с верхнего края с расстоянием между в 0.75 см") и распознавать только по ней?
Спасибо)
no subject
Date: 2007-10-11 12:53 am (UTC)no subject
Date: 2007-10-11 03:43 am (UTC)no subject
Date: 2007-10-11 02:29 am (UTC)http://www.abbyy.ru/formreader/?param=4347
no subject
Date: 2007-10-11 05:41 am (UTC)