[identity profile] keilvision.livejournal.com posting in [community profile] useful_faq
Имеются 10 гиг электронных книг, доков и мануалов. Формат - мусорка. Html, pdf, djvu, txt. Зарарено, за(б)зип(2)лено. Линукс. Ищутся пути превращения мусорки в какую-то монолитную базу информации с поиском и т.д. Ясно, что многие pdf-ники придётся распознавать, из html выкусывать полезный текст, сохраняя минималистическое форматирование, картинки конвертировать в открытые форматы (png, jpg), как-то сваливать в одну кучу...
Вопрос: чо, руками придёца искусственно-интеллегентную компплексную хрень засандаливать или есть такой софт, который в этой куче пороецо и википедию сконструирует?

Date: 2006-10-04 10:09 am (UTC)
From: [identity profile] billybom.livejournal.com
дождаться google desktop for linux