[identity profile] weirdo85.livejournal.com posting in [community profile] useful_faq
У меня есть DOC'овский файл...в нем находятся отсканированные рисунки с текстом...хотелось бы их распознать Finereader'ом...хотелось бы получить нормальный DOC'воский документ для последующего редактирования...
finereader распознает или с рисунка или с pdf...какие варианты?
перегнать в jpg каждый рисунок-долго...да и качество потеряется...

Date: 2009-02-07 08:17 am (UTC)
From: [identity profile] fergus-macdubh.livejournal.com
Написать пдф из форда и распознавать

Date: 2009-02-07 08:44 am (UTC)
From: [identity profile] kiisinkummitus.livejournal.com
У нас в Word-файле текст+иллюстрации по месту(а), или просто изображения, включающие в себя и текст и иллюстрации(б)?

Мы понимаем, что такое формат PDF? http://www.adobe.com/devnet/pdf/pdf_reference.html

Мы понимаем, что при преобразовании DOC->PDF происходит? Т.е. получается растровое изображение, которое помещается в виде объекта в скрипт PDF.

Для варианта (а) стоит извлечь иллюстрации, преобразование DOC->PDF, PDF->TXT. На основе текста и выгруженных иллюстраций собираем результирующий документ

Для варианта (б) выгружаем из DOC все изображения, конвертируем в JPG и распознаем, потом вырезая иллюстрации из изображений собираем результирующий документ

Принтеры DOC->PDF opensource есть в изобилии - погуглюйте.

Date: 2009-02-07 09:23 am (UTC)
From: [identity profile] metallicat20.livejournal.com
ищите софтину dopdf. она превращает автоматом в пдф всё что угодно.

Date: 2009-02-07 09:24 am (UTC)
From: [identity profile] an-ko-r.livejournal.com
сохранить DOC как HTML. при этом картинки сохранятся в отдельном фолдере. далее - файнридером.

Date: 2009-02-07 10:20 am (UTC)
From: [identity profile] roman-pro.livejournal.com
+1.
з.ы. В случае docx (ныне модный Office 2007) - просто открываем файл архиватором и извлекаем картинки.

Date: 2009-02-07 09:59 am (UTC)
From: [identity profile] filiola-tristis.livejournal.com
Universal Document Converter
http://www.print-driver.ru/

Date: 2009-02-07 11:23 am (UTC)
From: [identity profile] shergi.livejournal.com
А нафига было мучатся, сканы в ворд пихать? Потом наверняка их удалили?
Жесть

Date: 2009-02-07 01:44 pm (UTC)
From: [identity profile] passat.livejournal.com
Есть такие индивидуумы, для которых из файлов существует только Ворд. Поэтому чтобы увидеть, сохранить, отправить что либо, оно засовывается в doc-файл.

Date: 2009-02-08 07:10 am (UTC)
From: [identity profile] shergi.livejournal.com
Всеобщая компьютерная грамотность рулит

Date: 2009-02-08 09:41 am (UTC)
From: [identity profile] passat.livejournal.com
Пока, к сожалению, рулит компьютерная безграмотность...

Date: 2009-02-07 12:56 pm (UTC)
From: [identity profile] shellador.livejournal.com
Есть софтина "PDF-printer"

Date: 2009-02-07 02:40 pm (UTC)
From: [identity profile] stragazer.livejournal.com
+1

doPDF, например

получаете PDF из ЛЮБОГО документа

Date: 2009-02-07 03:13 pm (UTC)
From: [identity profile] chabapok.livejournal.com
pdf creator
primo pdf

Обе бесплатные, обе не ставят в углу странички своего банера. Первая - посложней, вторая - попроще.