PDF

May. 30th, 2008 09:53 am
[identity profile] daniyas.livejournal.com posting in [community profile] useful_faq
имеются несколько PDF-файлов.
хотелось бы их объединить в один файл.
каким способом/программой это можно сделать?
(deleted comment)

Date: 2008-05-30 09:40 am (UTC)
From: [identity profile] bbb28.livejournal.com
Разжевать возможно, если понимаешь, что происходит. А этого (в данной ситуации) понять без соображающего человека, находящегося "на той стороне", невозможно :)

Date: 2008-05-30 09:38 am (UTC)
From: [identity profile] bbb28.livejournal.com
Приятно было с Вами работать. Вы хорошо схватываете новый материал. Таких людей приятно и несложно обучать:) Ежели что - обращайтесь ;-)

UPD. Ну да, и диагностику тоже осмысленно описываете. А не вроде "Ничего не работает. Что происходит? Да ничего не происходит" :))))

Date: 2008-05-30 09:44 am (UTC)
From: [identity profile] bbb28.livejournal.com
На первый взгляд странно, конечно.
Поверить - просуммируйте количества страниц в исходных файлах (Acrobat Reader же показывает внизу, сколько страниц в документе).
И посмотрите, сколько их получилось в "суммарном" файле.

Как первый пришедший в голову вариант: не могло ли быть мало свободного места на вашем диске C:, так в что "суммарный" файл вошли только часть страниц?

Date: 2008-05-30 09:54 am (UTC)
From: [identity profile] bbb28.livejournal.com
Тогда не знаю... :)
Может, там, конечно, что-нибудь "соптимизировалось" при слиянии... Ну, допустим, какая-то служебная информация, которая имелась в каждом PDF-е. А при слиянии она вошла только один раз, а не 11. Но огромный размер "оптимизации" кажется необычным.

Если не лениво поэкспериментировать, можете набрать статистику уменьшения размера объединенного файла по сравнению с суммой размеров исходных при соединении этих Ваших 2-х, 3-х и т.д. файлов. Может, какую-нибудь закономерность обнаружите.

Date: 2008-05-30 10:37 am (UTC)
From: [identity profile] bbb28.livejournal.com
Еще тема для эксперимента - провести обратную операцию. Т.е. разложить объединенный файл на отдельные страницы-файлы. И посмотреть суммарный размер получившихся файлов-страниц.

Т.е. копируете (раз уж коммандера нет :)) pdftk.exe и file_SUN.pdf в отдельную папку и (по вышеописанной технологии) выполняете:

pdftk.exe file_SUN.pdf burst

В итоге порождается куча файлов с именами вида:
pg_0001.pdf, pg_0002.pdf, ....

И сравниваете (примерно) размеры Вашего исходного 00.pdf и pg_0001.pdf, 01.pdf и pg_0002.pdf и т.д.

Примерно - т.к. я посмотрел на своих файлах, у меня размеры чуть-чуть отличаются.

Логично предположить, что если суммарный размер исходных файлов и суммарный размер вновь полученных файлов совпадет, то информация не исказилась.

Тонкость. Если Ваши исходные 00.pdf, 01.pdf и т.д. уже сами многостраничные, то эксперимент не бцудет показательным. Я тут попробовал один двухстраничный файлик (размер - 60 Кб) разделить на жва одностраничных, размеры каждого получились 40 Кб.

Date: 2008-05-30 12:33 pm (UTC)
From: [identity profile] bbb28.livejournal.com
В какой-то мере гипотеза подтверждается. Т.е. то, что есть некая информация (например, описания шрифтов), которая должна быть в наличии для нескольких страниц. И если каждая (или часть, но не все) страница - в отдельном файле, то эта информация в каждом из них (или в некоторых, но более, чем в одном) присутствует. А если страницы объединяются в один файл, то информация попадает только один раз (не дублируется).

Правда, в это объяснение на первый взгляд не вписывается то, что возрастание количества файлов с 11 до 150 увеличило сумманый объем всего на 10 МБ, а уменьшение с 11 до 1 понизило в на 20 с лишним.