FineReader
Oct. 17th, 2016 05:57 pm![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
![[community profile]](https://www.dreamwidth.org/img/silk/identity/community.png)
Где в файнридере находится заветная галочка, поставив которую, можно приказать этой прекрасной программе не разносить к чертям верстку уже собранного PDF? Я извращалась по-всякому, но даже при наличии сканов одного размера, сделанных на одном устройстве, гадская прога при сохранении распознанного документа в PDF изменяет размеры страниц по своему усмотрению, в результате в итоговом PDF все страницы разной ширины. А нужно, чтоб одной (длина не волнует).
Интересует только одинаковая ширина страниц в PDF. Acrobat так не гадит, но и с русским дореформенным не работает, а у меня почти сплошь дореволюционка.
Помогите советом, пожалуйста, явно это как-то просто делается, но я что-то торможу.
ПРАВИЛЬНЫЙ ОТВЕТ НА МОЙ ВОПРОС:
Задайте в настройках "режим бумаги по умолчанию ПОЛЬЗОВАТЕЛЬСКИЙ"
Не размер оригинала, это не срабатывает, нужен именно пользовательский.
Интересует только одинаковая ширина страниц в PDF. Acrobat так не гадит, но и с русским дореформенным не работает, а у меня почти сплошь дореволюционка.
Помогите советом, пожалуйста, явно это как-то просто делается, но я что-то торможу.
ПРАВИЛЬНЫЙ ОТВЕТ НА МОЙ ВОПРОС:
Задайте в настройках "режим бумаги по умолчанию ПОЛЬЗОВАТЕЛЬСКИЙ"
Не размер оригинала, это не срабатывает, нужен именно пользовательский.
no subject
Date: 2016-10-17 03:22 pm (UTC)Уточните задачу. Дайте пример текста. У меня есть одна мысль и средство. Но я должен быть уверен в релевантности.
no subject
Date: 2016-10-17 03:29 pm (UTC)no subject
Date: 2016-10-17 03:51 pm (UTC)вам надо экспортировать этот PDF постранично с ратсровые файлы, потом пакетно изменить размер этих растров (например, задать 2400 пкс по горизонтали), чтобы он был един по ширине для всех файлов, а потом распознавать.
no subject
Date: 2016-10-17 03:55 pm (UTC)И да, распознавание в других программах таких проблем не доставляет. Но они хреново распознают дореформенный.
no subject
Date: 2016-10-17 04:00 pm (UTC)А разрешение?
no subject
Date: 2016-10-17 04:49 pm (UTC)no subject
Date: 2016-10-17 03:52 pm (UTC)no subject
Date: 2016-10-17 03:52 pm (UTC)no subject
Date: 2016-10-17 03:58 pm (UTC)И вопрос-то простой - как задать в FR только распознавание,без любых дополнительных функций. Как распознает - так и ладно, это не предпечатная подготовка, я просто облегчаю себе работу по приляпыванию содержания, не более того.
no subject
Date: 2016-10-17 04:03 pm (UTC)НЕ ДЕЛАЙТЕ PDF в Файнридере. Получите сперва нормальный редактируемый файл, а потом уже из него делайте файнридер.
Покажите исходный файл. (https://postimg.org/image/71dpyvzc3/)
no subject
Date: 2016-10-17 04:15 pm (UTC)ГЫ. ну,посмотрите
https://yadi.sk/d/5rac7jncCP4wo
И нет, меня не устраивает другой формат вывода.
Меня интересует, как заставить FR не выеживаться и выдать только слой распознанного текста вместе с исходником, не меняя ширину страниц, точно так же, как делает это любая другая программа. Все.
no subject
Date: 2016-10-17 04:32 pm (UTC)no subject
Date: 2016-10-17 04:35 pm (UTC)no subject
Date: 2016-10-17 04:12 pm (UTC)no subject
Date: 2016-10-17 04:17 pm (UTC)no subject
Date: 2016-10-17 06:23 pm (UTC)no subject
Date: 2016-10-17 04:41 pm (UTC)Если бы книгу сканировали на планшетном сканере, то эти размеры были бы одинаковыми. А у нас книгу фотографировали с рук каждый кадр чуть выше или чуть ниже... Со штатива надо снимать. ;)
Решение есть.
Разделить все развороты и устранить перекосы средствами Файнридера.
Сохранить все страны в отдельные файлы в растре.
Руками обрезать лишнее.
Пакетно задать единый размер по ширине.
Потом обратно сунуть в Фанридер и распознать.
Там всего 220 стр. Это работы часа на 2.
no subject
Date: 2016-10-17 04:54 pm (UTC)no subject
Date: 2016-10-17 05:34 pm (UTC)Забейте в поисковик FineReader исходный текст - выдаст что то типа этого:
Редактор ABBYY FineReader поддерживает два режима просмотра документа: режим с полным сохранением исходного оформления документа и черновой режим просмотра.
В режиме с полным сохранением исходного оформления документа блоки с распознанным текстом, таблицами и картинками отображаются именно там, где они были в исходном изображении. Таким образом, в этом режиме сохраняется исходный вид изображения: колонки, таблицы, картинки и буквицы (большие буквы на несколько строк в абзаце). Блок, в котором находится курсор, является активным. При перемещении курсора с помощью клавиатуры последовательность обхода блоков определяется их порядковыми номерами. Если текст блока не умещается внутри его границ (например, в результате редактирования распознанного текста), то часть текста неактивного блока может быть не видна на экране. Признаком этого являются специальные красные маркеры на границах блока. Когда блок становится активным, его границы расширяются таким образом, чтобы весь его текст был виден на экране целиком.
В черновом режиме редактора не отображаются: левый отступ; выравнивание абзаца (все абзацы прижаты к левому краю); цвет и фон символов. Для показа текста используется шрифт одного размера (по умолчанию 12 пт.). При этом сохраняется шрифт и форматирование текста: полужирный, курсив, подчеркнутый, верхние и нижние индексы.
Переход из одного режима в другой осуществляется нажатием кнопок (режим отображения исходного оформления документа) и (черновой режим редактора) в окне Текст.
Ну это я для примера. В FR особо не копалась. Сами смотрите, что подходит к вашей версии FR.
Итог: запрос в поисковике: исходный текст в FineReader )))
no subject
Date: 2016-10-17 05:38 pm (UTC)no subject
Date: 2016-10-17 06:30 pm (UTC)no subject
Date: 2016-10-17 07:30 pm (UTC)no subject
Date: 2016-10-17 05:53 pm (UTC)Можно только сохранить неформатированный текст и потом задать нужную ширину страниц в Ворде. И после этого уже экспортировать в PDF.
Не бывает на фотоаппаратах кнопки "Шедевр". И в Файнридере нет кнопки "Сделать Алене хорошо". :)
no subject
Date: 2016-10-17 06:18 pm (UTC)А он звучит так - Задайте в настройках "режим бумаги по умолчанию ПОЛЬЗОВАТЕЛЬСКИЙ".
no subject
Date: 2016-10-17 06:27 pm (UTC)no subject
Date: 2016-10-17 06:29 pm (UTC)no subject
Date: 2016-10-17 07:25 pm (UTC)Представьте себе, я пользуюсь далеко не одной программой. Но мне нужен определенный итог, и не тот, какой нравится Вам, а тот, который нужен мне.
no subject
Date: 2016-10-17 05:27 pm (UTC)Акробат при распознавании крутит страницы в случае нужды. Но сохраняет он их неперекрученными. И одной, одинаковой ширины. КАК добиться того же самого от ФР? Как задать одинаковую(конкретно, ту же, что в исходнике) ширину страниц в этой чертовой шибко умной программе?
no subject
Date: 2016-10-17 05:56 pm (UTC)Надо выводить в редактируемый формат и там подправлять параметры страницы глобально во всем файле.
А в Акробате нет режима обучения? Там же этих дореформенных букв не так много.
no subject
Date: 2016-10-17 05:58 pm (UTC)no subject
Date: 2016-10-17 07:27 pm (UTC)no subject
Date: 2016-10-18 09:22 am (UTC)no subject
Date: 2016-10-18 12:35 pm (UTC)