Конвертация PDF для ридера
Feb. 16th, 2014 10:44 am![[identity profile]](https://www.dreamwidth.org/img/silk/identity/openid.png)
![[community profile]](https://www.dreamwidth.org/img/silk/identity/community.png)
У меня есть довольно большая коллекция книг в PDF, собранная для ридера Sony. Sony приказала долго жить, а новый ридер Pocketbook читает PDF коряво - при масштабировании текст выходит за пределы экрана. Конвертация при помощи Calibre в EPUB ничего хорошего не дала - то же самое при масштабировании. И FB2, и RTF, полученные тем же способом, имеют разрывы строк. Хотелось бы все-таки привести библиотечку к удобочитаемому виду, не прибегая к правке вручную.
Заранее благодарю за советы и идеи.
Заранее благодарю за советы и идеи.
no subject
Date: 2014-02-16 10:47 am (UTC)no subject
Date: 2014-02-16 10:48 am (UTC)no subject
Date: 2014-02-16 10:56 am (UTC)Конвертить по одной - тоже геморой похуже, чем скачать все заново.
Надо смотреть в сторону пакетного конвертирования, в таком случае.
no subject
Date: 2014-02-16 10:59 am (UTC)Калибр конвертирует не по одной, но с разрывами.
no subject
Date: 2014-02-16 11:05 am (UTC)А то это как гинекологический осмотр по телефону. ;)
no subject
Date: 2014-02-16 11:09 am (UTC)no subject
Date: 2014-02-16 11:14 am (UTC)no subject
Date: 2014-02-16 11:21 am (UTC)no subject
Date: 2014-02-16 11:47 am (UTC)Т.е. внутри нормально извлекаемый электронный текст.
Надо было качать FB2? а потом уже самостоятельно в Calibre пакетно конвертировать в нужный формат.
Вот ваш файл (https://dl.dropboxusercontent.com/u/7217262/__OUT/Panin.docx).
Конвертируется с помощью SolidDocuments PDF to Word за 1 минуту.
Это хороший конвертер при условии наличия извлекаемого текста (а не сканов).
Он недорогой.
no subject
Date: 2014-02-16 11:58 am (UTC)no subject
Date: 2014-02-16 12:03 pm (UTC)no subject
Date: 2014-02-16 12:05 pm (UTC)no subject
Date: 2014-02-16 12:19 pm (UTC)no subject
Date: 2014-02-16 01:36 pm (UTC)no subject
Date: 2014-02-16 01:37 pm (UTC)Прежде чем переводить, текст нужно извлечь.
no subject
Date: 2014-02-16 12:04 pm (UTC)no subject
Date: 2014-02-16 12:05 pm (UTC)no subject
Date: 2014-02-16 11:04 am (UTC)no subject
Date: 2014-02-16 11:07 am (UTC)no subject
Date: 2014-02-16 11:18 am (UTC)PDF -- это уже производный формат, предназначенный для печати независимо от платформы, т.е. для точного воспроизведения текста без использования софта, в котором выполнялась верстка.
no subject
Date: 2014-02-16 11:23 am (UTC)no subject
Date: 2014-02-16 11:40 am (UTC)no subject
Date: 2014-02-16 12:02 pm (UTC)no subject
Date: 2014-02-16 12:07 pm (UTC)Файлы ПДФ иногда имеют нужный шрифт внутри себя. Я же написал, что это формат для независимой печати. ОН должен идеально печататься на любом компе, где даже нет нужных шрифтов. Это основой замысел формата. Чтобы китаец мог на своем китайском компе распечатать файл на белорусском языке, а белорус -- на корейском. Для этого все необходимое для печати сохраняется внутри файла.
no subject
Date: 2014-02-16 12:10 pm (UTC)no subject
Date: 2014-02-16 12:21 pm (UTC)no subject
Date: 2014-02-16 11:24 am (UTC)no subject
Date: 2014-02-16 11:27 am (UTC)no subject
Date: 2014-02-16 11:29 am (UTC)Вот либрусек http : // booktracker.org/viewtopic.php?p=2417%20%20%20librusec%28fb2%29
А Волга - она всегда в хозяйстве пригодится.
no subject
Date: 2014-02-16 12:19 pm (UTC)no subject
Date: 2014-02-16 11:03 am (UTC)(Формат PDF -- это формат для печати, не предполагающий динамическое масштабирование и пр. чудеса.
Сам формат по определению не предполагает обратные действия по извлечению текста.)
no subject
Date: 2014-02-16 11:08 am (UTC)no subject
Date: 2014-02-16 11:16 am (UTC)PDF - это электронная бумага, со всеми ограничениями бумаги...
Можно попробовать ABBYY Fine Reader, скормить ему PDF и на выходе получить текст RTF, который конвертируется куда угодно.
Еще у Adobe Acrobat есть режим вытаскивания текста из PDF, как сейчас работает эта хрень, не знаю, раньше на выходе было кривое форматирование и, по сравнению, с ФайнРидером результат был дрянным.
no subject
Date: 2014-02-16 11:24 am (UTC)no subject
Date: 2014-02-16 11:16 am (UTC)Рентабельность процесса оценивайте путем сравнения времени чтения книги и распознавания. А то бывает, что, пока распознаешь, уже и прочитаешь...
no subject
Date: 2014-02-16 11:24 am (UTC)no subject
Date: 2014-02-16 11:36 am (UTC)no subject
Date: 2014-02-16 11:38 am (UTC)no subject
Date: 2014-02-16 11:55 am (UTC)no subject
Date: 2014-02-16 12:00 pm (UTC)no subject
Date: 2014-02-16 11:54 am (UTC)no subject
Date: 2014-02-16 12:13 pm (UTC)no subject
Date: 2014-02-16 03:14 pm (UTC)no subject
Date: 2014-02-16 03:39 pm (UTC)no subject
Date: 2014-02-16 05:22 pm (UTC)Но даже если у вас 360, который не плюс и который не плюс новый - т.е. тот, последнее обновление прошивки которого было выпущено в 2010 году - всё равно в нем есть этот режим отображения. Я специально посмотрел в инструкции с этой страницы: http://www.pocketbook-int.com/ru/support/pocketbook-360
no subject
Date: 2014-02-16 05:44 pm (UTC)