PDF

May. 30th, 2008 09:53 am
[identity profile] daniyas.livejournal.com posting in [community profile] useful_faq
имеются несколько PDF-файлов.
хотелось бы их объединить в один файл.
каким способом/программой это можно сделать?

Date: 2008-05-30 09:06 am (UTC)
From: [identity profile] bbb28.livejournal.com
Правильно. Он запускается (в Вашей терминологии - "раскрывается" :)), пишет справку, как его использовать и завершается (в Вашей терминологии - "тут же закрывается").

Если у Вас установлен на компе винкомандер - запускайте его и идите в ту папку, куда распаковался pdftk.exe.

Для удобства скопируйте туда же все PDF-файлы, которые хотите объединить. Потом (из панели винкоммандера) запускайте команду по примеру написанной выше, т.е. вида:

pdftk.exe file_1.pdf file_2.pdf ...<еще имена файлов>... file_N.pdf cat output file_SUN.pdf

Date: 2008-05-30 09:18 am (UTC)
From: [identity profile] bbb28.livejournal.com
см. ниже. А вообще, ставьте что-нибудь из вышеназванного. Вы как заново родитесь! :) Увидите, насколько удобнее "перемещаться" по своему компу. В сравнении со стардартыми средствами, предоставляемыми Windows.

Еще вариант. Если файлы не слишком большого размера и не секретные. И нет азарта (и желания) научиться-таки пользоваться этой утилитой, кидайте на мне на e-mail, я их объединю и вышлю обратно ;)

Date: 2008-05-30 09:11 am (UTC)
From: [identity profile] bbb28.livejournal.com
Если win-командера нет, то можно попробовать через "Пуск->Выполнить".
(Но pdf-файлы для удобства [по крайнйе мере, на первый раз] все равно стоит скопировать в тот каталог, где лежит pdftk.exe)

"Пуск->Выполнить" ... выбираете в строку файл pdftk.exe и вручную ДОписываете параметры (как описано выше). После чего жмете на кнопку [OK] (т.е. запустить программу).
Попробовал у себя - в итоге в этой же папке появляется результирующий ("суммарный") файл.

Date: 2008-05-30 09:27 am (UTC)
From: [identity profile] bbb28.livejournal.com
Пробелы в названиях папок :)
Обрамите кавычками путь+имя pdftk.exe, вот так (У себя по аналогии проверил, получилось):

"C:\Documents and Settings\kp\Рабочий стол\pdftk-1.12\pdftk.exe" 00.pdf 01.pdf 02.pdf 03.pdf 04.pdf 05.pdf 06.pdf 07.pdf 08.pdf 09.pdf 10.pdf cat output file_SUN.pdf

Ну, и надеюсь, что Ваши файлы именно таки называются: 01.pdf, 02.pdf, etc. :)
(deleted comment)

Date: 2008-05-30 09:40 am (UTC)
From: [identity profile] bbb28.livejournal.com
Разжевать возможно, если понимаешь, что происходит. А этого (в данной ситуации) понять без соображающего человека, находящегося "на той стороне", невозможно :)

Date: 2008-05-30 09:38 am (UTC)
From: [identity profile] bbb28.livejournal.com
Приятно было с Вами работать. Вы хорошо схватываете новый материал. Таких людей приятно и несложно обучать:) Ежели что - обращайтесь ;-)

UPD. Ну да, и диагностику тоже осмысленно описываете. А не вроде "Ничего не работает. Что происходит? Да ничего не происходит" :))))

Date: 2008-05-30 09:44 am (UTC)
From: [identity profile] bbb28.livejournal.com
На первый взгляд странно, конечно.
Поверить - просуммируйте количества страниц в исходных файлах (Acrobat Reader же показывает внизу, сколько страниц в документе).
И посмотрите, сколько их получилось в "суммарном" файле.

Как первый пришедший в голову вариант: не могло ли быть мало свободного места на вашем диске C:, так в что "суммарный" файл вошли только часть страниц?

Date: 2008-05-30 09:54 am (UTC)
From: [identity profile] bbb28.livejournal.com
Тогда не знаю... :)
Может, там, конечно, что-нибудь "соптимизировалось" при слиянии... Ну, допустим, какая-то служебная информация, которая имелась в каждом PDF-е. А при слиянии она вошла только один раз, а не 11. Но огромный размер "оптимизации" кажется необычным.

Если не лениво поэкспериментировать, можете набрать статистику уменьшения размера объединенного файла по сравнению с суммой размеров исходных при соединении этих Ваших 2-х, 3-х и т.д. файлов. Может, какую-нибудь закономерность обнаружите.

Date: 2008-05-30 10:37 am (UTC)
From: [identity profile] bbb28.livejournal.com
Еще тема для эксперимента - провести обратную операцию. Т.е. разложить объединенный файл на отдельные страницы-файлы. И посмотреть суммарный размер получившихся файлов-страниц.

Т.е. копируете (раз уж коммандера нет :)) pdftk.exe и file_SUN.pdf в отдельную папку и (по вышеописанной технологии) выполняете:

pdftk.exe file_SUN.pdf burst

В итоге порождается куча файлов с именами вида:
pg_0001.pdf, pg_0002.pdf, ....

И сравниваете (примерно) размеры Вашего исходного 00.pdf и pg_0001.pdf, 01.pdf и pg_0002.pdf и т.д.

Примерно - т.к. я посмотрел на своих файлах, у меня размеры чуть-чуть отличаются.

Логично предположить, что если суммарный размер исходных файлов и суммарный размер вновь полученных файлов совпадет, то информация не исказилась.

Тонкость. Если Ваши исходные 00.pdf, 01.pdf и т.д. уже сами многостраничные, то эксперимент не бцудет показательным. Я тут попробовал один двухстраничный файлик (размер - 60 Кб) разделить на жва одностраничных, размеры каждого получились 40 Кб.

Date: 2008-05-30 12:33 pm (UTC)
From: [identity profile] bbb28.livejournal.com
В какой-то мере гипотеза подтверждается. Т.е. то, что есть некая информация (например, описания шрифтов), которая должна быть в наличии для нескольких страниц. И если каждая (или часть, но не все) страница - в отдельном файле, то эта информация в каждом из них (или в некоторых, но более, чем в одном) присутствует. А если страницы объединяются в один файл, то информация попадает только один раз (не дублируется).

Правда, в это объяснение на первый взгляд не вписывается то, что возрастание количества файлов с 11 до 150 увеличило сумманый объем всего на 10 МБ, а уменьшение с 11 до 1 понизило в на 20 с лишним.