Оцифровка книги - это создание электронной версии печатной книги и сохранение ее в одном из цифровых форматов. Зачем, вообще, оцифровывать книги? Посмотрим на объемы. Средний вес страницы оцифрованной книги составляет 13КБ. Это значит, что книга в 400 страниц займет на носителях около 5 МБ. И тогда, например, в стандартный DVD-диск объемом 4,7ГБ можно записать 900 таких книг.
Издание. Если на создание и выпуск обычной книги уходит полгода, то электронный вариант издается за неделю.
Распространение. Электронные книги могут распространятся по сети или на физических носителях - CD, DVD-дисках, что значительно дешевле пересылки бумажных аналогов.
И еще, электронные книги экономят бумагу, и хочется верить, хотя бы немного сохраняют природу.
Собрания электронных копий книг, картин, фотографий образуют электронные библиотеки на ресурсах сети, к которым может быть открыт самый широкий доступ. В этом плане, в настоящее время в нескольких странах реализуются масштабные проекты по оцифровке фондов крупнейших мировых библиотек. В грандиозном проекте компании Google ставится задача, ни много, ни мало, оцифровать все существующие в мире книги, количество которых по оценкам специалистов компании составляет 130 миллионов штук.
Скорее всего, работая в офисе нам никогда не придется заниматься оцифровкой целой книги. Но бывает, что нужно оцифровать несколько страниц из книги или журнала. Например, извлечь из сборника одну-две статьи и сохранить их в оптимальном формате. Ну, а на бытовом уровне, бывает, что к нам на время попала интересная книга и хотелось бы сделать и сохранить ее копию. Принципиально, оцифровка печатной книги мало чем отличается от оцифровки многостраничного документа. Почитать про оцифровку документов и поучится работать в соответствующих программах можно в теме: Оцифровка документов.
В рунете найдется немало различных методик по оцифровке книг. Если мы не собираемся профессионально заниматься этими делами, а хотим, просто, научится создавать электронные версии книг приемлемого качества, достаточно будет этой темы и вложенных в нее уроков.
Приступим к практической части. Сначала отсканируем страницы книги и сохраним их в единый файл. Это - в уроке: Сканирование книги.
Итак, мы отсканировали страницы книги и сохранили их изображения в файл формата "tif". Только в этом формате мы можем сохранять растровые изображения без потерь в едином файле. Уже сейчас, мы можем просматривать страницы, прокручивая их в графическом редакторе. Однако, книга формата "tif" лишена навигации и имеет очень большой вес. Для создания, хранения и распространения электронных версий книг, рукописей, журналов была разработана специальная технология сжатия изображений - формат DjVu. Дежавю - это высокая точность сохранения первоисточника и большая степень сжатия изображений. Сегодня, дежавю является оптимальным решением при оцифровке книг.
Продолжаем практикум и, теперь, преобразуем заготовку нашей книги - несжатый файл: "Book.tif" в корректный DjVu-формат. Как это сделать и что для этого будет нужно, читаем в уроке: Кодирование в DjVu.
Итак, мы сделали нашу первую электронную книгу или, может быть, оцифровали несколько страниц из книги: рассказ или статью и сохранили наши труды в формате DjVu.
А теперь, немного об этом формате.
Большинство книг в сети распространяется в формате DjVu или PDF. Формат PDF разрабатывался с целью сохранения электронных документов, их распространения и последующего точного печатного воспроизведения. "PDF" хорошо сжимает текст и графику. Точно воспроизводит на различных устройствах документы, созданные электронным способом. А DjVu-формат создавался для получения в качестве конечного продукта только оптимальной электронной версии печатного документа. "DjVu" - это очень высокая степень сжатия данных, высокая точность воспроизведения источника, возможность поиска информации в файлах. Электронная DjVu-книга сильно выигрывает у своего PDF-аналога в качестве и весит значительно меньше. Можно сказать, что "DjVu" - это идеальное решение при оцифровке книги. "DjVu" уступает в качестве изображений "PDF" при кодировании насыщенных иллюстрациями журналов, детских книг, фотокаталогов, альбомов.
Другое дело, что сегодня "PDF" - один из наиболее популярных форматов в мире. Исторически сложилось так, что "PDF" был раньше разработан - в 1991 году, и был стандартизирован ISO. Написано множество приложений для работы с документами "PDF".
Формат DjVu был создан позже - в 1996 году и не имеет международной стандартизации. Программ для работы с DjVu-документами значительно меньше. Так что, если мы решили поделиться DjVu-книгой, не забываем, из любезности, дать в придачу и программку к ней. Чтобы комфортно пользоваться DjVu- документами, понадобится бесплатный WinDjView'ер. Нетрудно найти и скачать эту программу в рунете. Это приложение замечательно еще и тем, что в нем реализована функция печати. Вдруг, захочется распечатать книгу,- "...хорошо, когда на полке стоит!". В другом просмотрщике: DjVuReader'е функции печати нет.
Заканчивая темы оцифровки, можно сказать, что для хранения электронных версий бумажных документов хорошей альтернативой популярному PDF является замечательный формат DjVu, развитию которого мешает лишь инерция мышления.