PDF

May. 30th, 2008 09:53 am
[identity profile] daniyas.livejournal.com posting in [community profile] useful_faq
имеются несколько PDF-файлов.
хотелось бы их объединить в один файл.
каким способом/программой это можно сделать?

Date: 2008-05-30 06:01 am (UTC)
From: [identity profile] ldok.livejournal.com
Adobe Acrobat Pro (не тот, который Reader, а именно редактор). Делается обычной вставкой страниц из одного файла в указанное место в другом.

Date: 2008-05-30 06:06 am (UTC)
From: [identity profile] dfase.livejournal.com
Хорошая прога + проста в освоении. Правда цена кусается.

Date: 2008-05-30 06:28 am (UTC)
From: [identity profile] trojanrabbit.livejournal.com
Для этого вам потребуется полная версия adobe acrobat

Date: 2008-05-30 08:20 am (UTC)
From: [identity profile] bbb28.livejournal.com
Adobe Acrobat? Если Вам только для того, чтобы склеить файлы, плюньте на этот трудоемкий (с учетом того, что он у Вас сйечас не установлен) метод! :)

Pdftk.
Довольно мощная утилина командной строки. Бесплатная, работает безо всяких Acrobat-ов:

http://accesspdf.com/pdftk/

Ссылка на файл (в архиве, 1.5 Мб):
http://www.pdfhacks.com/pdftk/pdftk-1.12.exe.zip

Описание (также присутствует внутри архива):
http://www.accesspdf.com/article.php/20041129165718588

Примеры:
http://www.accesspdf.com/article.php/20041129175231241

Конкретно для слияния нескольких PDF-ов в один следует выполнить:

pdftk.exe 01.pdf 02.pdf 03.pdf cat output 123.PDF

На выходе получится файл 123.PDF, составленный из содержимого трех (01.pdf 02.pdf 03.pdf)

Date: 2008-05-30 08:43 am (UTC)
From: [identity profile] bbb28.livejournal.com
Вы в Far-е или WinComander-е (или других подобных штуках) работате? (потому как с утилитами командной строки удобнее оттуда работать)

Date: 2008-05-30 08:46 am (UTC)
From: [identity profile] bbb28.livejournal.com
То, что Вы скачали (файл pdftk-1.12.exe.zip) - это архив. Если его распаковать (например, WinRAR-ом), пояится папка pdftk-1.12, в которой три файла:
pdftk.exe, pdftk.1.html, pdftk.1.txt

Второй и третий - это описания. Искомая утилита - первый файл: pdftk.exe

Date: 2008-05-30 09:06 am (UTC)
From: [identity profile] bbb28.livejournal.com
Правильно. Он запускается (в Вашей терминологии - "раскрывается" :)), пишет справку, как его использовать и завершается (в Вашей терминологии - "тут же закрывается").

Если у Вас установлен на компе винкомандер - запускайте его и идите в ту папку, куда распаковался pdftk.exe.

Для удобства скопируйте туда же все PDF-файлы, которые хотите объединить. Потом (из панели винкоммандера) запускайте команду по примеру написанной выше, т.е. вида:

pdftk.exe file_1.pdf file_2.pdf ...<еще имена файлов>... file_N.pdf cat output file_SUN.pdf

Date: 2008-05-30 09:18 am (UTC)
From: [identity profile] bbb28.livejournal.com
см. ниже. А вообще, ставьте что-нибудь из вышеназванного. Вы как заново родитесь! :) Увидите, насколько удобнее "перемещаться" по своему компу. В сравнении со стардартыми средствами, предоставляемыми Windows.

Еще вариант. Если файлы не слишком большого размера и не секретные. И нет азарта (и желания) научиться-таки пользоваться этой утилитой, кидайте на мне на e-mail, я их объединю и вышлю обратно ;)

Date: 2008-05-30 09:11 am (UTC)
From: [identity profile] bbb28.livejournal.com
Если win-командера нет, то можно попробовать через "Пуск->Выполнить".
(Но pdf-файлы для удобства [по крайнйе мере, на первый раз] все равно стоит скопировать в тот каталог, где лежит pdftk.exe)

"Пуск->Выполнить" ... выбираете в строку файл pdftk.exe и вручную ДОписываете параметры (как описано выше). После чего жмете на кнопку [OK] (т.е. запустить программу).
Попробовал у себя - в итоге в этой же папке появляется результирующий ("суммарный") файл.

Date: 2008-05-30 09:27 am (UTC)
From: [identity profile] bbb28.livejournal.com
Пробелы в названиях папок :)
Обрамите кавычками путь+имя pdftk.exe, вот так (У себя по аналогии проверил, получилось):

"C:\Documents and Settings\kp\Рабочий стол\pdftk-1.12\pdftk.exe" 00.pdf 01.pdf 02.pdf 03.pdf 04.pdf 05.pdf 06.pdf 07.pdf 08.pdf 09.pdf 10.pdf cat output file_SUN.pdf

Ну, и надеюсь, что Ваши файлы именно таки называются: 01.pdf, 02.pdf, etc. :)
(deleted comment)

Date: 2008-05-30 09:40 am (UTC)
From: [identity profile] bbb28.livejournal.com
Разжевать возможно, если понимаешь, что происходит. А этого (в данной ситуации) понять без соображающего человека, находящегося "на той стороне", невозможно :)

Date: 2008-05-30 09:38 am (UTC)
From: [identity profile] bbb28.livejournal.com
Приятно было с Вами работать. Вы хорошо схватываете новый материал. Таких людей приятно и несложно обучать:) Ежели что - обращайтесь ;-)

UPD. Ну да, и диагностику тоже осмысленно описываете. А не вроде "Ничего не работает. Что происходит? Да ничего не происходит" :))))

Date: 2008-05-30 09:44 am (UTC)
From: [identity profile] bbb28.livejournal.com
На первый взгляд странно, конечно.
Поверить - просуммируйте количества страниц в исходных файлах (Acrobat Reader же показывает внизу, сколько страниц в документе).
И посмотрите, сколько их получилось в "суммарном" файле.

Как первый пришедший в голову вариант: не могло ли быть мало свободного места на вашем диске C:, так в что "суммарный" файл вошли только часть страниц?

Date: 2008-05-30 09:54 am (UTC)
From: [identity profile] bbb28.livejournal.com
Тогда не знаю... :)
Может, там, конечно, что-нибудь "соптимизировалось" при слиянии... Ну, допустим, какая-то служебная информация, которая имелась в каждом PDF-е. А при слиянии она вошла только один раз, а не 11. Но огромный размер "оптимизации" кажется необычным.

Если не лениво поэкспериментировать, можете набрать статистику уменьшения размера объединенного файла по сравнению с суммой размеров исходных при соединении этих Ваших 2-х, 3-х и т.д. файлов. Может, какую-нибудь закономерность обнаружите.

Date: 2008-05-30 10:37 am (UTC)
From: [identity profile] bbb28.livejournal.com
Еще тема для эксперимента - провести обратную операцию. Т.е. разложить объединенный файл на отдельные страницы-файлы. И посмотреть суммарный размер получившихся файлов-страниц.

Т.е. копируете (раз уж коммандера нет :)) pdftk.exe и file_SUN.pdf в отдельную папку и (по вышеописанной технологии) выполняете:

pdftk.exe file_SUN.pdf burst

В итоге порождается куча файлов с именами вида:
pg_0001.pdf, pg_0002.pdf, ....

И сравниваете (примерно) размеры Вашего исходного 00.pdf и pg_0001.pdf, 01.pdf и pg_0002.pdf и т.д.

Примерно - т.к. я посмотрел на своих файлах, у меня размеры чуть-чуть отличаются.

Логично предположить, что если суммарный размер исходных файлов и суммарный размер вновь полученных файлов совпадет, то информация не исказилась.

Тонкость. Если Ваши исходные 00.pdf, 01.pdf и т.д. уже сами многостраничные, то эксперимент не бцудет показательным. Я тут попробовал один двухстраничный файлик (размер - 60 Кб) разделить на жва одностраничных, размеры каждого получились 40 Кб.

Date: 2008-05-30 12:33 pm (UTC)
From: [identity profile] bbb28.livejournal.com
В какой-то мере гипотеза подтверждается. Т.е. то, что есть некая информация (например, описания шрифтов), которая должна быть в наличии для нескольких страниц. И если каждая (или часть, но не все) страница - в отдельном файле, то эта информация в каждом из них (или в некоторых, но более, чем в одном) присутствует. А если страницы объединяются в один файл, то информация попадает только один раз (не дублируется).

Правда, в это объяснение на первый взгляд не вписывается то, что возрастание количества файлов с 11 до 150 увеличило сумманый объем всего на 10 МБ, а уменьшение с 11 до 1 понизило в на 20 с лишним.