![[identity profile]](https://www.dreamwidth.org/img/silk/identity/openid.png)
![[community profile]](https://www.dreamwidth.org/img/silk/identity/community.png)
Есть такой формат файлов - Djvu.
В нем обычно книги, скачиваемые с инета. А вот кто знает, как из этого формата книгу перекинуть в .txt ?? А то адобовский файл можно перекинуть , и в КПК запихнуть, а с дижавю мучаюсь...
Спасибо,любимые!
(Кому интересно, что у меня получилось - смотреть коменты!)
UPD КПК-Palm z22
В нем обычно книги, скачиваемые с инета. А вот кто знает, как из этого формата книгу перекинуть в .txt ?? А то адобовский файл можно перекинуть , и в КПК запихнуть, а с дижавю мучаюсь...
Спасибо,любимые!
(Кому интересно, что у меня получилось - смотреть коменты!)
UPD КПК-Palm z22
no subject
Date: 2008-03-19 03:51 pm (UTC)только распознавалкой
no subject
Date: 2008-03-19 03:59 pm (UTC)no subject
Date: 2008-03-19 04:52 pm (UTC)no subject
Date: 2008-03-19 05:44 pm (UTC)после етого в системе появится "виртуальный принтер"
если попытатся на нем что-то распечатать - сосдастся PDF файл
его скопируйте на свои КПК.
а уж PDF-читалок под КПК выбор широкий. Под Windows Mobile и Symbian точно есть
no subject
Date: 2008-03-19 05:45 pm (UTC)no subject
Date: 2008-03-19 04:01 pm (UTC)Программ для прямого преобразования из дежавюшек в тиэксти, скорее всего, в природе нет, поскольку форматы зело разные - дежавю, грубо говоря, графический формат, а txt - текстовый. Для решения задачи перевода из djvu в txt приходит в голову два варианта:
Вариант 1. Воспользоваться прогой DjvuDecode для перевода djvu в другой графический формат, понимаемый какой-либо OCR-программой, например, tif. Полученный tif засунуть в OCR-прогу, распознать и сохранить в txt.
Вариант 2. Практически идентичен варианту номер 1, за тем исключением, что не надо париться с работающей из командной строки DjvuDecode. В этом варианте нужно установить какой-нибудь виртуальный принтер, позволяющий "печатать" в pdf-файлы (PDFPrint, PDF Factory, наверное, и другие есть), из просмотрщика djvu "распечатать" на этот принтер дежавюшку, и подсовывать OCR-программе полученный pdf-файл.
http://forum.ixbt.com/topic.cgi?id=23:30354
В две стадии можно сделать: Djvudecode (freeware) превращает в многостраничный tiff, ну а дальше уже смотря куда надо (например, Image2pdf).
no subject
Date: 2008-03-19 10:44 pm (UTC)no subject
Date: 2008-03-19 04:12 pm (UTC)Если текстового подслоя нет, то только переводить в tiff или pdf и распознавать
no subject
Date: 2008-03-19 04:16 pm (UTC)no subject
Date: 2008-03-19 04:50 pm (UTC)В книжке даж рисунков нет, вот что обидно..
no subject
Date: 2008-03-19 05:18 pm (UTC)no subject
Date: 2008-03-19 06:07 pm (UTC)no subject
Date: 2008-03-19 07:09 pm (UTC)Для pdf кстати тоже есть читалки, и его не обязательно конвертировать. Вот например
http://pocketxpdf.sourceforge.net/
(в отличии от КПКшного Акробата - эта открывает pdf огромных размеров, на которые акробат ругается что памяти нет).
no subject
Date: 2008-03-19 07:13 pm (UTC)Биоматериалы.
Date: 2008-03-19 11:30 pm (UTC)no subject
Date: 2008-03-20 06:25 am (UTC)no subject
Date: 2008-03-19 08:01 pm (UTC)Скачала, прослезилась и зафрендила Вас.
теперь как его поставить...
Date: 2008-03-19 09:00 pm (UTC)пишет
ActiveSync not found on this computer. Setup cannot continue and will now exit.
И чо он хочет от меня..
Re: теперь как его поставить...
Date: 2008-03-20 05:51 am (UTC)Если не ошибаюсь, то если вы запускаете на к-ре cab или exe файл программы, предназначенной для КПК, то он автоматом запускает AS и ставит ее на КПК.
Выход - закачать скаченный cab или exe на кпк и запустить с него.
ActiveSync (http://en.wikipedia.org/wiki/ActiveSync) (вики; англ)
Re: теперь как его поставить...
Date: 2008-03-20 07:47 am (UTC)вот такой синхронизатор уже есть (FastSyncFree), думала, что его хватает..
Re: теперь как его поставить...
Date: 2008-03-20 08:22 am (UTC)Вообще простейший и удобный
Re: теперь как его поставить...
Date: 2008-03-23 04:52 am (UTC)А теперь что получилось!!!
Date: 2008-03-19 10:56 pm (UTC)AdobeReader 7.0 - стояли
FppPro244 -поставила принтер
WinDjvu,
через файл -
печать (выбрать принтер),подождать, пока загрузится,
сохранть копию (откроется окно).
file - save as text (если получится)
У меня получилось примерно 50/50 )))
Нужно проверить, какой текст.Бывает абракадабра))
Итого: проблема решена на 50%.
Пойду читать, для чего tif и в OCR-проги.
И я добью ненавистный дижавю.
no subject
Date: 2008-03-20 07:13 am (UTC)Либо сохранять дежавюху, как набор картинок, потом их скормить ФайнРидеру
Обычные книжки чем, кстати, читаете? Я, как правило, поступаю так — загоняю полученный откуда-нибудь текст (если это уже не хтмл) в Ворд, правлю, плагином doc2html сохраняю в хтмл, из него iSiloX'ом в pdb — и на наладонник, в исиле читать.
no subject
Date: 2008-03-20 07:39 am (UTC)какие можно, обрабатываю WinMakezTxT, а потом pdb
ноут сам ловит кпк и кидает ему,
а там Libra.
А поделитесь што такое doc2html и iSilo у мну тож нет..
Еще непонятен момент - стоит GrxView , который как бы просмотрщик дижавю,
но при попытке перекинуть дижавюшный или пдфный файл почемуто пишет что "неизвестный формат файла" и канечно, не ловиццо..
no subject
Date: 2008-03-20 08:09 am (UTC)iSilo — читалка для КПК и ББ. http://www.isilo.com
Платная, но это поправимо.
К ней есть бесплатный конвертер iSiloX — http://www.isilox.com
Ещё, кстати, вот почитайте, как раз в тему: http://palmz.in/board/index.php?showtopic=34819
Да, по поводу GrxView. Может он достаточно старой версии, чтобы открывать продвинутые дежавюхи? Он формат дежавю только недавно стал поддерживать, сначала умел только простейшие просматривать.
no subject
Date: 2008-03-20 07:53 am (UTC)MobileSales2Setup )))
Re: А теперь что получилось!!!
Date: 2008-03-20 05:51 pm (UTC)Re: А теперь что получилось!!!
Date: 2008-03-21 08:08 am (UTC)Только,наверн, не сегодня. Поработать тож когда-то нужно )))
Мож на выходных
Re: А теперь что получилось!!!
Date: 2008-03-21 08:24 am (UTC)по той причине что текст не всегда будет распознаваться из-за плохого качества "фоток" самой книги(Если, конечно, не стоит речь о ручном колупании в каждой странице).
Моей задачей было оптимально наладить получение знаний через кпк))
Ну что ж, некоторые придется читать с ноута..
На данный момент закачано около 20 книг.
позволю себе процитировать
http://chemister.da.ru/Download/download.htm
тут выложен мануал для самых любознательных.Он меня ,конечно, повеселил!
(по OCR смотреть DjvuOCR for FineReader 7. )
Re: А теперь что получилось!!!
Date: 2008-03-21 03:07 pm (UTC)