Сканирование старых журналов
Jun. 5th, 2007 01:11 am![[identity profile]](https://www.dreamwidth.org/img/silk/identity/openid.png)
![[community profile]](https://www.dreamwidth.org/img/silk/identity/community.png)
Решил озаботится сканированием своего архива старых журналов.
Архив большой и журналы разные. От "Смехача" 1928 через "Мурзилку" и "Вокруг света" 80-х к "Науке и жизни" и "Химии и жизни" начала 90-х.
Шрифты, картинки и прочие виньетки...
Порывшись в разных архивах журналов выложенных в сети назрели вопросы.
Вопросы:
1. Каким наилучшим образом сохранять страницу? (PDF, DJVU, RTF, JPG, TIFF)
2. В случае сканирование текста оставлять ли шрифт изначальным?
3. Имеет ли смысл делать скан (jpg) а затем рядом с ним выкладывать распознанный текст
PS В общем любые советы и прочее и прочее....
Архив большой и журналы разные. От "Смехача" 1928 через "Мурзилку" и "Вокруг света" 80-х к "Науке и жизни" и "Химии и жизни" начала 90-х.
Шрифты, картинки и прочие виньетки...
Порывшись в разных архивах журналов выложенных в сети назрели вопросы.
Вопросы:
1. Каким наилучшим образом сохранять страницу? (PDF, DJVU, RTF, JPG, TIFF)
2. В случае сканирование текста оставлять ли шрифт изначальным?
3. Имеет ли смысл делать скан (jpg) а затем рядом с ним выкладывать распознанный текст
PS В общем любые советы и прочее и прочее....
no subject
Date: 2007-06-04 11:58 pm (UTC)Да и вообще он вне конкуренции.
Плюсы пдф:
- Быстрая обработка. Распознавать не нужно. Отсканировал страницу - сразу в пдф. Потом одним движением собираем страницы в одну книгу.
- Мало места. ПДФ использует мощный джпег-алгоритм сжатия изображений.
- Мультистраничность.
- Не требует специальной программы, как джву.
- Адоб Акробат(в котором открывается пдф) заточен под чтение документов. Всё для этого сделано.
Джпег или Тифф для этого неудобны.
Распознавать, имхо, только тратить драгоценное время. Это же журнал, а не книга.
Кому понадобится текст - перепечатает.
no subject
Date: 2007-06-05 12:28 am (UTC)В том же "Смехаче" редкие рассказы Ильфа и Петрова Ардова и прочих..
В "Веселых картинках" стихи загадки и прочее
В "Мурзилке" очаровательнейшие рассказы.
В "Пионере" редкие детские повести потом не издававшиеся
В "Вокруг света" статьи достаточно интересные некторые..+ опять же издававшиеся только там редкие книги.
В общем понятно что придется использовать ПДФ но с распознаванием и полной сборкой страницы..(((
no subject
Date: 2007-06-05 09:22 am (UTC)Безумный объём работы. Не стоит того, поверьте. Представьте, сколько времени вы будете сидеть над каждой страницей?
Скан->пдф. Всё.
no subject
Date: 2007-06-05 04:52 am (UTC)да, компрессия там такая зачастую выставлена, что на картинки при увеличении без слёз не взглянешь.
no subject
Date: 2007-06-05 06:11 am (UTC)no subject
Date: 2007-06-05 02:39 pm (UTC)no subject
Date: 2007-06-05 06:11 pm (UTC)