[identity profile] hmyr.livejournal.com posting in [community profile] useful_faq
Решил озаботится сканированием своего архива старых журналов.
Архив большой и журналы разные. От "Смехача" 1928 через "Мурзилку" и "Вокруг света" 80-х к "Науке и жизни" и "Химии и жизни" начала 90-х.
Шрифты, картинки и прочие виньетки...
Порывшись в разных архивах журналов выложенных в сети назрели вопросы.
Вопросы:
1. Каким наилучшим образом сохранять страницу? (PDF, DJVU, RTF, JPG, TIFF)
2. В случае сканирование текста оставлять ли шрифт изначальным?
3. Имеет ли смысл делать скан (jpg) а затем рядом с ним выкладывать распознанный текст

PS В общем любые советы и прочее и прочее....

Date: 2007-06-04 11:58 pm (UTC)
From: [identity profile] mftsch.livejournal.com
Учитывая, что тут журналы 20-х годов и прочие раритеты с оформлением не менее интересным, чем текст - однозначно пдф.
Да и вообще он вне конкуренции.

Плюсы пдф:
- Быстрая обработка. Распознавать не нужно. Отсканировал страницу - сразу в пдф. Потом одним движением собираем страницы в одну книгу.
- Мало места. ПДФ использует мощный джпег-алгоритм сжатия изображений.
- Мультистраничность.
- Не требует специальной программы, как джву.
- Адоб Акробат(в котором открывается пдф) заточен под чтение документов. Всё для этого сделано.
Джпег или Тифф для этого неудобны.

Распознавать, имхо, только тратить драгоценное время. Это же журнал, а не книга.
Кому понадобится текст - перепечатает.

Date: 2007-06-05 09:22 am (UTC)
From: [identity profile] mftsch.livejournal.com
Я когда-то тоже так планировал делать. Сканирование+распознавание+вёрстка(!).
Безумный объём работы. Не стоит того, поверьте. Представьте, сколько времени вы будете сидеть над каждой страницей?

Скан->пдф. Всё.

Date: 2007-06-05 04:52 am (UTC)
From: [identity profile] pan-2.livejournal.com
>> мощный джпег-алгоритм сжатия изображений
да, компрессия там такая зачастую выставлена, что на картинки при увеличении без слёз не взглянешь.

Date: 2007-06-05 06:11 am (UTC)
From: [identity profile] mftsch.livejournal.com
А пользователю руки на что? Чтобы оптимальную степень сжатия выставить.

Date: 2007-06-05 02:39 pm (UTC)
From: [identity profile] pan-2.livejournal.com
ага, потом придут юзвери и будут жаловаться что ПДФы слишком большие, сделайте поменьше =)

Date: 2007-06-05 06:11 pm (UTC)
From: [identity profile] alb-wiki.livejournal.com
перепечатает. Смешно. Зотя если другого не дано...