Тема: оцифровка книги.

Печатная 
книга

Оцифровка книги - это создание электронной версии печатной книги и сохранение ее в одном из цифровых форматов. Зачем, вообще, оцифровывать книги? Посмотрим на объемы. Средний вес страницы оцифрованной книги составляет 13КБ. Это значит, что книга в 400 страниц займет на носителях около 5 МБ. И тогда, например, в стандартный DVD-диск объемом 4,7ГБ можно записать 900 таких книг.

Издание. Если на создание и выпуск обычной книги уходит полгода, то электронный вариант издается за неделю.

Распространение. Электронные книги могут распространятся по сети или на физических носителях - CD, DVD-дисках, что значительно дешевле пересылки бумажных аналогов.

И еще, электронные книги экономят бумагу, и хочется верить, хотя бы немного сохраняют природу.

Собрания электронных копий книг, картин, фотографий образуют электронные библиотеки на ресурсах сети, к которым может быть открыт самый широкий доступ. В этом плане, в настоящее время в нескольких странах реализуются масштабные проекты по оцифровке фондов крупнейших мировых библиотек. В грандиозном проекте компании Google ставится задача, ни много, ни мало, оцифровать все существующие в мире книги, количество которых по оценкам специалистов компании составляет 130 миллионов штук.

Скорее всего, работая в офисе нам никогда не придется заниматься оцифровкой целой книги. Но бывает, что нужно оцифровать несколько страниц из книги или журнала. Например, извлечь из сборника одну-две статьи и сохранить их в оптимальном формате. Ну, а на бытовом уровне, бывает, что к нам на время попала интересная книга и хотелось бы сделать и сохранить ее копию. Принципиально, оцифровка печатной книги мало чем отличается от оцифровки многостраничного документа. Почитать про оцифровку документов и поучится работать в соответствующих программах можно в теме: Оцифровка документов.

В рунете найдется немало различных методик по оцифровке книг. Если мы не собираемся профессионально заниматься этими делами, а хотим, просто, научится создавать электронные версии книг приемлемого качества, достаточно будет этой темы и вложенных в нее уроков.

Приступим к практической части. Сначала отсканируем страницы книги и сохраним их в единый файл. Это - в уроке: Сканирование книги.

Итак, мы отсканировали страницы книги и сохранили их изображения в файл формата "tif". Только в этом формате мы можем сохранять растровые изображения без потерь в едином файле. Уже сейчас, мы можем просматривать страницы, прокручивая их в графическом редакторе. Однако, книга формата "tif" лишена навигации и имеет очень большой вес. Для создания, хранения и распространения электронных версий книг, рукописей, журналов была разработана специальная технология сжатия изображений - формат DjVu. Дежавю - это высокая точность сохранения первоисточника и большая степень сжатия изображений. Сегодня, дежавю является оптимальным решением при оцифровке книг.

Продолжаем практикум и, теперь, преобразуем заготовку нашей книги - несжатый файл: "Book.tif" в корректный DjVu-формат. Как это сделать и что для этого будет нужно, читаем в уроке: Кодирование в DjVu.

Итак, мы сделали нашу первую электронную книгу или, может быть, оцифровали несколько страниц из книги: рассказ или статью и сохранили наши труды в формате DjVu.

А теперь, немного об этом формате.

Большинство книг в сети распространяется в формате DjVu или PDF. Формат PDF разрабатывался с целью сохранения электронных документов, их распространения и последующего точного печатного воспроизведения. "PDF" хорошо сжимает текст и графику. Точно воспроизводит на различных устройствах документы, созданные электронным способом. А DjVu-формат создавался для получения в качестве конечного продукта только оптимальной электронной версии печатного документа. "DjVu" - это очень высокая степень сжатия данных, высокая точность воспроизведения источника, возможность поиска информации в файлах. Электронная DjVu-книга сильно выигрывает у своего PDF-аналога в качестве и весит значительно меньше. Можно сказать, что "DjVu" - это идеальное решение при оцифровке книги. "DjVu" уступает в качестве изображений "PDF" при кодировании насыщенных иллюстрациями журналов, детских книг, фотокаталогов, альбомов.

Другое дело, что сегодня "PDF" - один из наиболее популярных форматов в мире. Исторически сложилось так, что "PDF" был раньше разработан - в 1991 году, и был стандартизирован ISO. Написано множество приложений для работы с документами "PDF".

Формат DjVu был создан позже - в 1996 году и не имеет международной стандартизации. Программ для работы с DjVu-документами значительно меньше. Так что, если мы решили поделиться DjVu-книгой, не забываем, из любезности, дать в придачу и программку к ней. Чтобы комфортно пользоваться DjVu- документами, понадобится бесплатный WinDjView'ер. Нетрудно найти и скачать эту программу в рунете. Это приложение замечательно еще и тем, что в нем реализована функция печати. Вдруг, захочется распечатать книгу,- "...хорошо, когда на полке стоит!". В другом просмотрщике: DjVuReader'е функции печати нет.

Заканчивая темы оцифровки, можно сказать, что для хранения электронных версий бумажных документов хорошей альтернативой популярному PDF является замечательный формат DjVu, развитию которого мешает лишь инерция мышления.

тема написана 06.02.2013

Яндекс.Метрика

Темы и статьи