![[identity profile]](https://www.dreamwidth.org/img/silk/identity/openid.png)
![[community profile]](https://www.dreamwidth.org/img/silk/identity/community.png)
Что делать? Конвертирую для своих нужд (см. http://useful-faq.livejournal.com/19191830.html) ПДФки в ТИФФки с помощью онлайновых конвертеров, но файлы на моём компике (Виндоуз XP) упорно сохраняются как Microsoft Office Document Imaging.
Имеющаяся одноименная утилита Microsoft Office Document Imaging НЕ распознаёт текст, требуя установки какого-то компонента,. который может быть установлен только на Вин Про 2003 (а у меня обычный Хоум).
И как быть?
Имеющаяся одноименная утилита Microsoft Office Document Imaging НЕ распознаёт текст, требуя установки какого-то компонента,. который может быть установлен только на Вин Про 2003 (а у меня обычный Хоум).
И как быть?
no subject
Date: 2016-01-12 10:12 pm (UTC)no subject
Date: 2016-01-12 10:32 pm (UTC)Впрочем, может, я ошибаюсь касательно ТИФФок? Сохраняется-то всё равно не ТИФФ, а МОДИ. Правда, в имеющемся у меня распознавателе АББИ файлы МОДИ открываются. Но хочется поэкспериментировать и с другими вариантами - может, более чистое распознавание будет.
no subject
Date: 2016-01-12 10:42 pm (UTC)no subject
Date: 2016-01-12 10:53 pm (UTC)Зачем промежуточный файл?
no subject
Date: 2016-01-12 11:34 pm (UTC)Для нового ФайнРидера надо всего-то пять тысяч рублей выложить.
Сейчас попыталась скачать бесплатный пробный Файнридер последнего выпуска - FAILED.
Онлайновые конвертеры OCR, обрабатывая ПДФ, выдают неудобочитаемую хрень (проверено на нескольких).
no subject
Date: 2016-01-13 10:22 am (UTC)поставь Windows 3.1
Date: 2016-01-12 10:58 pm (UTC)no subject
Date: 2016-01-12 11:00 pm (UTC)скармливайте Файнридеру(или иному OCR) непосредственно пдфку
no subject
Date: 2016-01-12 11:35 pm (UTC)Для нового ФайнРидера надо всего-то пять тысяч рублей выложить.
Сейчас попыталась скачать бесплатный пробный Файнридер последнего выпуска - FAILED.
Онлайновые конвертеры OCR, обрабатывая ПДФ, выдают неудобочитаемую хрень (проверено на нескольких).
no subject
Date: 2016-01-12 11:49 pm (UTC)no subject
Date: 2016-01-12 11:51 pm (UTC)http://www.mmnt.ru/get?st=finereader&in=f
no subject
Date: 2016-01-12 11:58 pm (UTC)из ПДФ вычитывает прекрасно, только что проверил.
Сохраняет в doc - хоть все страницы разом, хоть поштучно.. ну в общем как настроите и запросите.
А паче чаяния разбогатеете - так и заплатите.. не мне, конечно, а ФР ))
ЗЫ. ну вот скормил распознавателю достаточно сложную книжку http://multi-up.com/1083996 - кривой текст, грязные страницы.
За семь минут открыл, распознал 56 страниц, сохранил в word.doc..
конечно без вычитки.)) это самый муторный и долгий процесс
no subject
Date: 2016-01-13 07:50 am (UTC)no subject
Date: 2016-01-13 09:44 am (UTC)Файл -> Сохранить как -> Тип файла
no subject
Date: 2016-01-13 09:44 am (UTC)no subject
Date: 2016-01-13 10:28 am (UTC)2) В прошлом посте был коммент самый первый про выделение. У вас PDF действительно не текстовые (текст картинкой, грубо говоря), или просто не тот инструмент выбран?
no subject
Date: 2016-01-13 12:23 pm (UTC)