[identity profile] perevodchik-spb.livejournal.com posting in [community profile] useful_faq
Что делать? Конвертирую для своих нужд (см. http://useful-faq.livejournal.com/19191830.html) ПДФки в ТИФФки с помощью онлайновых конвертеров, но файлы на моём компике (Виндоуз XP) упорно сохраняются как Microsoft Office Document Imaging.

Имеющаяся одноименная утилита Microsoft Office Document Imaging НЕ распознаёт текст, требуя установки какого-то компонента,. который может быть установлен только на Вин Про 2003 (а у меня обычный Хоум).

И как быть?

Date: 2016-01-12 10:12 pm (UTC)
From: [identity profile] vinitski.livejournal.com
Господи, а в тиф-то зачем???

Date: 2016-01-12 10:42 pm (UTC)
From: [identity profile] vinitski.livejournal.com
Посмотрел в интернетах - это действительно невозможно.

Date: 2016-01-12 10:53 pm (UTC)
From: [identity profile] existas.livejournal.com
Так распознавайте сразу pdf - finereader это прекрасно умеет.
Зачем промежуточный файл?

Date: 2016-01-13 10:22 am (UTC)
From: [identity profile] irq-a.livejournal.com
Могу посоветовать попробовать cuneiform (как-то так), она бесплатная вроде. Дома где-то должна быть старая версия.

поставь Windows 3.1

Date: 2016-01-12 10:58 pm (UTC)
From: [identity profile] dobrosvet108.livejournal.com
Windows 3.1 и все дела. нe поможет - ставь dos

Edited Date: 2016-01-12 11:07 pm (UTC)

Date: 2016-01-12 11:00 pm (UTC)
From: [identity profile] sviatoy-duhh.livejournal.com
не надо ничо конвертировать.
скармливайте Файнридеру(или иному OCR) непосредственно пдфку

Date: 2016-01-12 11:49 pm (UTC)
From: [identity profile] sviatoy-duhh.livejournal.com
про торренты что нить знаете?

Date: 2016-01-12 11:51 pm (UTC)
From: [identity profile] sviatoy-duhh.livejournal.com
или например так:
http://www.mmnt.ru/get?st=finereader&in=f

Date: 2016-01-12 11:58 pm (UTC)
From: [identity profile] sskain.livejournal.com
http://multi-up.com/1083994 - там лежит портабельный распознаватель.
из ПДФ вычитывает прекрасно, только что проверил.
Сохраняет в doc - хоть все страницы разом, хоть поштучно.. ну в общем как настроите и запросите.

А паче чаяния разбогатеете - так и заплатите.. не мне, конечно, а ФР ))


ЗЫ. ну вот скормил распознавателю достаточно сложную книжку http://multi-up.com/1083996 - кривой текст, грязные страницы.
За семь минут открыл, распознал 56 страниц, сохранил в word.doc..
конечно без вычитки.)) это самый муторный и долгий процесс

Edited Date: 2016-01-13 12:39 am (UTC)

Date: 2016-01-13 07:50 am (UTC)
From: [identity profile] apashenko.livejournal.com
А что значит «сохраняются как Microsoft Office Document Imaging»? Расширение у файлов какое?

Date: 2016-01-13 09:44 am (UTC)
From: [identity profile] cyber4ainik.livejournal.com
А старый способ уже не помогает?
Файл -> Сохранить как -> Тип файла

Image

Date: 2016-01-13 09:44 am (UTC)
From: [identity profile] krazzzer.livejournal.com
А зачем использовать онлайновый конвертер? И даже после него - не пробовали просто расширение поменять?

Date: 2016-01-13 10:28 am (UTC)
From: [identity profile] irq-a.livejournal.com
1) Комп не может сохранять tiff как-то ещё. Он сохраняет tiff как tiff, а вот открывать может как раз тем, что есть. И пытается открыть их MODI, поэтому и тип файла отображается именно так. Но сам файл tiff.
2) В прошлом посте был коммент самый первый про выделение. У вас PDF действительно не текстовые (текст картинкой, грубо говоря), или просто не тот инструмент выбран?

Date: 2016-01-13 12:23 pm (UTC)
From: [identity profile] nanometrolog.livejournal.com
Вас спасет Universal Document Converter - становится как один из принтеров.