Инструкция по оцифровке библиотечных фондов

Почему библиотека является наиболее ярким образом системологии – фундаментальной науки, изучающей организацию процессов и явлений в мире? Ответ кроется в фонде и справочно-поисковом аппарате библиотеки. Для обычного читателя книги на полках и есть фонд, но это не совсем так. Библиотечный фонд – это сложная по структуре совокупность документов, представленных на различных носителях информации, соответствующая определенным отраслям знаний и связанная со специализированным поисковым механизмом на основе карточного каталога.

Даже размещение журналов на стеллажах библиотеки основываются на научном подходе: информетрический закон Брэдфорда объясняет закономерность распределения статей по изданиям и тем самым позволяет с большой вероятностью спрогнозировать востребованность материалов, исходя из специфики информации.

Иначе говоря, библиотекам удалось создать идеальную систему классификации и структурирования информации, которая позволила решить проблему хранения и поиска огромных объемов данных из любых источников. Для этого были разработаны специализированные библиотечные классификаторы, регламентирующие распределение и расстановку фондов, методы организации систематических каталогов, стандарты оформления и учета документов.

Об оцифровке

Когда мы говорим об оцифровке книг любой библиотеки, то, помимо сохранности оригиналов и обеспечения аутентичности электронной копии, необходимо помнить о сохранении идентичности структуры классификации и поиска информации в бумажном и электронном фонде. Другими словами, сканирование книг требует обязательного создания электронного каталога и формирования индексно-поисковой базы данных с максимальной полнотой наполнения.

Проекты по созданию электронных ресурсов библиотек
являются одними из самых сложных и насыщенных с точки зрения трудозатрат,
применяемых методологий и технического исполнения.

Возникает естественный вопрос – зачем? Зачем при такой сложности реализации подобных проектов затевать оцифровку библиотечных материалов, ведь «книги могут храниться веками», да и «вообще в библиотеку уже никто не ходит»?

Это ошибочное мнение. В последние годы библиотеки активно меняются, внедряют современные технологии и стандарты обслуживания для удовлетворения потребностей нового поколения читателей, воспитанных на свободе использования цифрового контента. Принимаются программы по переоснащению, в практику работы вводятся индексы эффективности деятельности, создаются единые каталоги, региональные и краеведческие электронные коллекции. В 2015 г. запущена Национальная электронная библиотека (НЭБ), для развития которой проводится регулярная оцифровка фондов российских библиотек.

Не стоит забывать и о сохранности бесценных знаний и культурных ценностей, накопленных в книгохранилищах по всей стране. Для этих целей оцифровка – самый эффективный способ сохранения изданий и обеспечения безопасного доступа к содержащейся в них информации.

Электронный каталог

Проект в одной крупной библиотеке продолжался с 2003 по 2011 гг. В ходе проекта было выполнено сканирование и индексирование более 2 млн карточек систематического каталога на русском и иностранных языках. В АБИС перенесены данные по 17 полям с каждой карточки.

Основа основ автоматизации современных библиотек – создание электронного
каталога и наполнение автоматизированной библиотечно-информационной
системы (АБИС). АБИС необходима для автоматизации учета фондов. А
полноценный электронный каталог значительно увеличивает эффективность и скорость поиска информации, значительно повышая общее качество
обслуживания читателей.

Как правило, в библиотеке ведутся несколько видов каталогов: алфавитный, в котором все карточки расставлены по алфавиту; систематический, где карточки расставлены по отраслям знаний. Существуют каталоги, разделяющиеся по охвату фонда: генеральный или отдельных частей фонда; по назначению: читательский или служебный; по многим другим признакам: краеведческий, предметный и т.д.

При большом количестве фондов
оцифровка всего каталога – довольно длительный процесс,
который обычно проводится поэтапно.

Основа каталога – это библиотечная карточка, содержащая информацию об издании, индексы классификации, номер книги (ISBN) и другие данные. Ввиду большого объема специфической информации, карточка является сложнейшим документом для извлечения индексных данных. Еще больше затрудняют обработку информации записи на иностранных языках, рукописный текст или диакритические знаки (различные надстрочные, подстрочные, реже внутристрочные символы).

Одна библиографическая запись может содержать до 24 разных полей. Перенос записей в систему напрямую с бумажных носителей нецелесообразен из-за низкой скорости и риска потери/пропуска ключевой информации, поэтому работы по созданию электронного каталога подразумевают обязательное предварительное сканирование библиотечной картотеки, формирование и проверку индексной базы данных перед загрузкой в АБИС.

Даже в небольшой библиотеке количество карточек исчисляется тысячами единиц. В таких условиях искать собственные кадровые и технические ресурсы и самостоятельно заниматься формированием электронного каталога практически невозможно, поэтому для экономии времени и денег привлекаются профессиональные подрядчики, которые специализируются на обработке библиотечной информации и готовы гарантировать итоговый результат.

Типовой технологический процесс создания электронного каталога

Оцифровку целесообразно производить на территории библиотеки, чтобы не изымать библиотечные карточки из использования и не нарушать работу с читателями. Процесс делится на несколько этапов:

Экспертиза. Оценивается физическое состояние карточек и объемов картотеки. Определяется состав библиографического описания и требуемый формат машиночитаемых записей. Исходя из полученных данных, составляется дальнейшая технологическая цепочка работ. На перечень работ и методы извлечения данных влияют нюансы в написании символов, формате и даже составе материала (картон, бумага). Ниже приведены возможные типы карточек:

Современное оборудование позволяет достигать скорости сканирования 170 карточек в минуту, при этом выбор профессионального сканера позволяет избежать повреждения самих карточек.

  • добавочная карточка. Особенность: печатные и рукописные символы,
  • разделитель. Особенность: отличный от стандартного формат карточки,
  • ссылочная карточка. Особенность: только рукописные символы,
  • описание. Особенность: старорусский текст.

Сканирование. Поточное сканирование бумажных карточек осуществляется на высокоскоростных документных сканерах. Стандартные требования к оцифровке: разрешение 300 dpi, черно-белый режим сканирования, формат файлов TIFF или JPEG. Большинство карточек типового размера 130х80 мм, но встречаются до формата А6 (148х105 мм) включительно. Иногда перед сканированием производится склейка поврежденных карточек. Часто проводится двустороннее сканирование карточек, где на обратной стороне содержатся инвентарные номера, разбивка по филиалам. Незначимые карточки-разделители не сканируются.

После оцифровки бумажный массив картотеки приводится в исходное состояние.
Все последующие работы проводятся с полученными
графическими образами карточек.

Обязательно должны проводиться поворот перекошенных изображений, удаление фона, проявление слабоконтрастных символов и т.д.

Свойства электронных копий должны исключать потерю информации и не ухудшать читаемость документа по сравнению с бумажным оригиналом. В случае плохого состояния исходного материала допускается использование программных средств улучшения качества изображений.

Вся обработка изображений выполняется в автоматическом режиме. Возможна ручная коррекция геометрии образов, очистка от шумов и следов сгиба при необходимости обработки небольшого количества поврежденных документов.

Даже в случае набора текста на печатной машинке, далеко не все символы распознаются корректно. Автоматическое распознавание рукописного текста, карандашных пометок и карточек, созданных до середины 20 века практически невозможно.

Количество графических образов должно совпадать с числом листов бумажного массива. Нормой стало сканирование в порядке следования карточек каталога. Пропуск страниц считается браком.

Ретроконверсия: ввод информации с отсканированных карточек и формирование базы данных. Карточки могут содержать машинопечатный и рукописный текст, карандашные пометки, нечеткие символы и иметь другие особенности заполнения.

В редких случаях, при хорошем качестве документа, содержащего печатный текст, можно использовать программные средства распознавания для автоматического извлечения определенных полей карточки.

Перед ретроконверсией производится сепарация (сортировка) изображений с целью группировки отдельных частей массива по типам карточек и другим признакам индексирования (сцепка составных карточек, создание блоков данных для томов, разделение по языкам и т.д.). Производится разметка блоков для удобства извлечения данных оператором.

На выходе формируется база данных в требуемом для библиотеки формате (RUSMARC, UNIMARK, MARC21 и др.). В некоторых случаях при создании электронного каталога предметом обработки могут служить напрямую графические образы книг. Тогда к работе привлекаются операторы, владеющие знаниями правил составления библиографических описаний.

Требования к минимальному проценту ошибок в базе данных очень высоки, так как это напрямую влияет на качество поиска информации в электронном каталоге. Поэтому после ввода данных присутствует этап проверки по различным параметрам опытными верификаторами.

Для ускорения процесса ретроконверсии используется технология заимствования,
упрощающая ввод информации за счет автоподбора заполнения полей
на основе ранее введенных данных.

Сканирование книг

Многие библиотеки уже обладают профессиональными планетарными сканерами для ежедневной оцифровки книг. Но собственными силами в основном сканируется поступающая литература. Для массовой качественной оцифровки обычно заказываются аутсорсинговые услуги. Так, в одной крупной федеральной библиотеке с 2008 по 2014 гг. оцифровано более 16,5 млн страниц библиотечных и архивных фондов силами привлеченного подрядчика.

После создания электронного каталога или параллельно этому процессу библиотеки решают задачи по обеспечению сохранности и доступности книжного фонда путем оцифровки книг. Работы по оцифровке проводятся для наполнения национальных электронных проектов, создания коллекций редких книг и полнотекстовых ресурсов, собраний тематических иллюстрированных материалов и много другого.

Библиотеки могут проводить работы по оцифровке фондов самостоятельно. Например, в крупных библиотеках организованы целые отделы сканирования, располагающие парком профессионального оборудования.

Важным аспектом являются характеристики цифровых копий. Если решаются локальные задачи, библиотека может самостоятельно определять требования к выходным электронным ресурсам. Но при реализации национальных проектов, где используются фонды различных библиотек, необходим общий стандарт, регламентирующий основные характеристики работы.

При создании НЭБ электронные ресурсы, созданные техническим исполнителем
и библиотеками самостоятельно, имели разные параметры оцифровки,
что усложняло работу по обработке и загрузке цифрового контента.

Поэтому отраслевым экспертным советом были подготовлены «Рекомендации по оцифровке материалов из фондов библиотек»*, которые показывают принцип создания электронных библиотечных ресурсов. В рекомендациях указаны три вида цифровых копий. Мастер-копия – эталонная копия оригинала в полиграфическом качестве (разрешение не ниже 600 dpi). Пользовательская копия – для создания электронных коллекций и предоставления читателям (разрешение не ниже 300 dpi). Служебная копия используется для внутренних задач библиотеки и размещения на web-сайтах (разрешение не ниже 150 dpi).

Особенности сканирования книг

При оцифровке книг этапы работ повторяют процесс создания электронного каталога. Действует библиотека самостоятельно или нанимает подрядчика, но так или иначе в первую очередь необходимо определить цель проекта и провести экспертизу книжного фонда для понимания стоимости и трудоемкости работы. В дальнейшем формируется состав подлежащих оцифровке изданий, согласовываются технические требования, и производится окончательная оценка проекта.

Рассмотрим несколько особенностей оцифровки книг, которые влияют на стоимость и сроки проектов. Большое значение имеет формат и состояние книг, а также объем бумажного фонда. Исходя из этих особенностей, определяется вид сканирующего оборудования и технологии оцифровки.

Ветхая, рваная бумага, а также толстый переплет многих книг позволяет применять только бесконтактное сканирование – профессиональные планетарные (книжные) сканеры. Использование планшетных сканеров исключено.

После сканирования полученные цифровые копии проходят процесс программной коррекции, приводятся к наиболее удобному для чтения качеству изображений. Зачастую при использовании профессиональных книжных сканеров для этого достаточно встроенных программных средств обработки. После получения массива цифровых копий при необходимости составляются библиографические описания отсканированных изданий.

Отдельно стоит выделить работы по высококачественному сканированию коллекций редких книг, книжных памятников, фолиантов и других ценных экземпляров. Для этого используются специализированные комплексы высококачественного сканирования, обеспечивающие уникально высокие показатели оптического разрешения.

Особенности формирования полнотекстовых PDF-книг

*В Гражданском кодексе РФ (ч. IV в ред. 2006 г.) статьями 1274 и 1275 допускается без согласия автора предоставление экземпляров произведений, правомерно введенных в гражданский оборот во временное безвозмездное пользование. Но цифровые экземпляры произведений могут предоставляться только в помещениях библиотек при условии исключения возможности создать копии этих произведений в цифровой форме. Для предоставления доступа к ограниченным изданиям в среде национальной электронной библиотеки был разработан специальный защищенный просмотровщик для удаленной работы граждан с произведениями в электронной форме.

Но цифровых копий порой бывает недостаточно. Существуют задачи по превращению изображения в полноценную электронную книгу. На основе графических образов формируются электронные книги в формате PDF. Этот формат наиболее универсален и позволяет осуществлять полнотекстовый поиск и навигацию по оглавлению и гиперссылкам. Электронные книги, не ограниченные авторским правом, можно публиковать в интернете или давать «защищенный» доступ в читальном зале библиотеки*.

Для создания таких книг проводится полнотекстовое распознавание с дальнейшей верификацией текста и проверкой орфографии. Для окончательной вычитки документа привлекаются профессиональные корректоры.

В результате макетирования формируется электронная книга,
полностью идентичная бумажному оригиналу — с точным расположением страниц,

иллюстрациями, сохранением языка и стиля.

Оцифровка книг и каталогов библиотек, особенно при существенном объеме, разнородности фондов по формату и состоянию оригиналов, – сложнейший производственный процесс, осуществить который качественно могут только специализированные компании, обладающие всей необходимой инфраструктурой и большим опытом в создании электронных ресурсов.

Короткая ссылка на материал: //cnews.ru/link/a4439

Библиотека специальной литературы содержит большое количество научно-технических и справочных материалов для профессионалов из различных отраслей знания. Часто эти данные уникальны, существуют на единственном бумажном носителе, поэтому сохранить доступ к этой информации – крайне важно.

Что может случиться, если своевременно не перевести уникальные документы, книги и книжные памятники в электронный вид? Многие, наверное, помнят пожар в ИНИОН РАН в 2015 году, когда одномоментно было уничтожено более 5 млн изданий, свыше 2 млн 300 тыс. из которых — утрачены навсегда или с трудом могут быть восстановлены.

Оцифровать специальные библиотеки важно в связи с активным развитием информационного общества и нарастающей ценностью машиночитаемых данных: когда с информацией можно работать в автоматическом режиме, осуществляя её поиск и анализ. Сейчас появилось специализированное программное обеспечение, предназначенное именно для оцифровки документов. Об этом процессе лучше рассказать детально.

Как осуществляют процедуру оцифровки?

Оцифровка книг, методических пособий и технической документации/чертежей — весьма продолжительный и сложный процесс, требующий высокого профессионализма и многоступенчатой проверки распознанных данных.

Вот общий пошаговый план, который в своей работе используют эксперты рынка оцифровки данных:

Определить содержание библиотеки, создав их каталог или дополнив уже существующий. Каталог содержит информацию обо всех документах в библиотеке. Каталог должен содержать информацию о названии, авторе, годе публикации, издателе и актуальности. По сути, это стандартная библиотечная карточка, только в электронном виде. Не стоит умалять значения каталога: без него найти нужный материал будет очень сложно.

Выбрать оптимальный формат. Оцифровка библиотеки специальной литературы может быть выполнена в PDF, DjVu и TIFF форматах. Каждый имеет свои особенности и преимущества. Например, формат PDF обеспечивает отличную читаемость и сохраняет оригинальное качество материала. DjVu — самый компактный формат, что делает его идеальным для хранения и передачи больших объемов информации. Формат TIFF обеспечивает наивысшее качество изображения и может быть рекомендован для сохранения ценных и уникальных документов, однако такие файлы «весят» весьма существенно и занимают много место в системе хранения данных.

Подготовить документы. Это включает очистку их от пыли, выявление отсутствующих, деформированных страниц и других повреждений. Если вы работаете с раритетными книгами, старинными документами (планом здания XVII столетия, к примеру), то рекомендуется обратиться к профессионалам, которые могут оказать помощь в подготовке, возможно, предварительно отреставрируют документ, во избежание порчи оригинала и утраты ценных исторических данных навсегда.

Отсканировать документы. Скан образ – первый шаг к созданию цифровой копии документа. Для сканирования документов и книг разных форматов и разной ценности существуют разные виды оборудования – потоковые, планшетные, планетарные сканеры, камеры с очень высоким разрешением, специальные столы и др. Важно отметить, что состояние документа может повлиять на качество сканирования. Улучшить качество отсканированного изображения можно с помощью специального ПО, хотя и не всегда.

Оцифровать документы. Дальнейшая работа осуществляется с цифровыми копиями документов. Отсканированную информацию переводят в электронный машиночитаемый вид – распознают данные – с помощью специализированного программного обеспечения и оборудования. В качестве примера ПО и сервиса для распознавания можно привести платформу Beorg Smart Vision. Система извлекает и классифицирует данные отчетов, чертежей и других документов с использованием искусственного интеллекта, нераспознанные данные верифицируют люди, операторы, подключенные к облачной части платформы.

Архивация электронных документов. Для технических данных можно использовать программное обеспечение вроде «Смарт Архив», которое имеет в себе все необходимые функции для хранения, удобного поиска и работы с электронными версиями документов, а также позволяет настроить защищенный доступ или уровни доступа, в том числе установить специальные электронные метки, ограничения на печать (при попытке распечатать такие документы последние будут испорчены) и т. д. Главное — сделать всё так, чтобы в электронный архив можно было получить доступ максимально быстро и только тем людям, которые имеют на это право.

Проверить результаты. После оцифровки библиотеки специальной литературы необходимо проверить результаты, чтобы убедиться в их качестве и читаемости. Наличие ошибок и неточностей выявляют в несколько этапов – и программным и ручным способом. Верификация, проверка итоговых данных —  это контроль качества, то есть важнейший этап оцифровки. Ведб неверные, искаженные данные, получившиеся в результате непрофессиональной оцифровки, перечеркивают весь титанический труд по перевод документов в электронный вид. В чем смысл оцифровки, если на выходе данные искажены? Если речь идет, например, о неточностях в специальных чертежах, то цена ошибки чрезвычайно высока.

Какое решение выбрать для оцифровки?

В современных реалиях применять для оцифровки данных лучше отечественный софт, импортонезависимое программное обеспечение. Особенно это касается узкоспециализированной информации или данных высокой важности.

В то же время должна быть возможность быстрого контроля и доработки распознанной информации. Просто изображение сложного чертежа, по сути, ничего не даст. Его надо распознать, а результат распознанного программными средствами изображения надо проконтролировать, желательно с привлечением эксперта-человека. Почему так сложно? Причина в том, что нейросети и алгоритмы хорошо справляются только с типовыми данными – распознавание печатного паспорта, структурированных документов с неизменяемой формой и пр. А с рукописными и нестандартными данными эффективность нейросетей до сих пор под вопросом. Выбранное решение должно быть технологичным и достаточно гибким: автоматическое распознавание и верификация должны происходить в едином контуре.

Последовательное и ответственное выполнение всех шагов обеспечивает сохранность, быстрый и удобный доступ к информации.

Да, оцифровка специальных библиотек, как и любых нестандартных документов — процесс довольно сложный и требуюет существенных затрат времени и денег. Лучший вариант — доверить оцифровку профессионалам, имеющим обширный опыт такой работы и экспертизу.

Как в России оцифровывают запасники библиотек и архивов

Как устроено законодательство об оцифровке книг, сколько стоит оцифровка одной книги и в каком состоянии находятся электронные фонды основных российских библиотек и архивов.

«К нам приходят с
овощной базы и говорят, что могут оцифровать издания»

После пожара в библиотеке ИНИОН РАН правительство
России начало готовить законопроект об обязательных электронных копиях
новых печатных изданий. По просьбе «
Медузы»
журналист Илья Рождественский узнал, как устроено законодательство
об оцифровке книг сейчас, сколько стоит оцифровка одной книги
и в каком состоянии находятся электронные фонды основных российских
библиотек и архивов.

Законодательство

Долгое время свободно оцифровать материалы,
не получая чьего-либо согласия, можно было лишь в том случае,
если книга не охранялась авторским правом или если сроки охраны авторских
прав уже истекли. В противном случае необходимо было заключать
с автором отдельный договор. В 1993 году был принят закон, согласно
которому авторские права действовали в течение 50 лет после смерти автора.
В 2006-м одобрили поправки к Гражданскому кодексу, которые увеличили
этот срок до 70 лет. Это практически полностью остановило оцифровку книг
в российских библиотеках. Ситуация изменилась сравнительно недавно.
В 2010 году по инициативе президента Дмитрия Медведева был
опубликован проект закона, который позволил бы библиотекам, архивам
и другим образовательным организациям создавать электронные копии книг без
согласия авторов. Такие экземпляры могли предоставляться читателям только
в помещении библиотеки. Закон вызвал яростное сопротивление
со стороны писателей и издателей. Так, некоторые литераторы
и общественные деятели направили письмо главе государства, призвав его
остановить «процесс легализации книжного пиратства». Среди подписавшихся под обращением
были, в частности, Дарья Донцова, Андрей Макаревич и Александра
Маринина.

В результате в Госдуму закон был внесен
в апреле 2012 года и подписан
только спустя два года спустя.

В документ были внесены изменения, согласно которым
библиотеки получили право оцифровывать лишь те книги, которые
не переиздавались на территории Российской Федерации в последние
десять лет. Также библиотекам было запрещено обмениваться электронными копиями
книг. Закон вступил в силу с 1 октября 2014-го.
А согласно майским указам президента, не менее 10% издаваемых
в России книг должны включаться в Национальную
электронную библиотеку.

Разрушенное пожаром
здание библиотеки ИНИОН

Фото: Павел Головкин
/ AP / Scanpix

После пожара в ИНИОН РАН правительство России начало
подготовку законопроекта об обязательных электронных копиях новых печатных
изданий. Поправки могут быть рассмотрены до 15 февраля, после чего
их направят в Госдуму. Сейчас издательства направляют по одному
бумажному экземпляру в 16 российских библиотек. Новый закон сокращает
число этих экземпляров до шести. Взамен издатели должны будут передавать
еще по три электронных копии изданий на материальном носителе
в Российскую государственную библиотеку, Российскую национальную
библиотеку и Президентскую библиотеку им. Бориса Ельцина.

Оцифровка

В первую очередь библиотеки сканируют каталоги, чтобы
у читателей была возможность удаленно ознакомиться со справочным
аппаратом.

Практический смысл оцифровки книг состоит
не в том, чтобы защитить их от пожара: сделать это
невозможно, если только не оцифровать все книги, которые есть
в фондах. Поэтому библиотеки руководствуются другим принципом. Сканируются
прежде всего редкие и уникальные издания, сохранность которых вызывает
опасения. Во-вторых, сканируется перемещенное наследие: вывезенные ранее
коллекции, которые государство возвращает другим странам; так, например, была оцифрована в «Иностранке»
коллекция Эстергази, чтобы у российских ученых осталась возможность
изучать эти книги. Кроме того, библиотеки сканируют книги, которые пользуются
наибольшей популярностью у читателей. Для этого сотрудники библиотек
анализируют заказы посетителей, выбирая издания для оцифровки, а также
предлагают заполнить специальные анкеты на сайте (так поступают
в «Ленинке»). Как отмечает директор Института научной информации
по общественным наукам (тот самый ИНИОН) Юрий Пивоваров, ни одна
библиотека мира не стремится к тотальной оцифровке, потому что
«бессмысленно цифровать в каждой библиотеке одну и ту же книгу»:
«Если в Колумбийском университете оцифровали, значит, уже можно
пользоваться».

Затраты

Стоимость сканирования одной страницы документа зависит
от того, в каком состоянии находится книга. Оцифровка страницы
диссертации обойдется в два рубля. Однако часто книги приходится очищать
от пыли (процесс называется «обезпыливание») и реставрировать.
В этом случае только реставрация одной страницы может стоить около пяти
тысяч рублей. Последующая оцифровка — еще по 50 рублей
за страницу.

В федеральном бюджете не предусмотрено отдельной
статьи расходов, посвященной исключительно сканированию изданий. Однако
в документе указано, что на подключение библиотек к интернету
и оцифровку книг в 2015–2017-м из федерального бюджета будет
выделено по 80 миллионов рублей в год. В среднем библиотеки
получают около полутора миллионов рублей в год. Так, на оцифровку
Российской государственной библиотеке выделятся пять миллионов, но эта
сумма не покрывает затраты, поэтому разница компенсируется за счет
внебюджетных средств. Библиотека иностранной литературы получила в прошлом
году два миллиона, но эти средства предназначены на закупку
оборудования, а работы по оцифровке оформляются как штатные задания
сотрудников. Библиотека им. Маяковского в Петербурге получает
ежегодно от миллиона до 1 миллиона 200 тысяч рублей.
По словам директора учреждения Зои Чаловой, этого хватает
на оцифровку 500–600 книг.

Технология

Сканирование книг в
Президентской библиотеке им. Бориса Ельцина

Фото: Петр Ковалев /
Интерпресс / PhotoXPress

Оцифровка осуществляется с помощью специальных
сканеров. Самые простые — планшетные, используются в городских
библиотеках. Крупные библиотеки закупают планетарные сканеры, оснащенные V-образной колыбелью,
куда кладется книга. Подобная форма позволяет не раскрывать книгу
на 180 градусов и, таким образом, свести к минимуму вредное
воздействие на издание. В сложных случаях библиотеки обращаются
к сторонним организациям, которые оцифровывают книги с помощью
роботизированных сканеров, способных самостоятельно переворачивать страницы.
Подобные сканеры могут работать до 24 часов в сутки, сканируя
до трех тысяч страниц в час.

Библиотеки: сколько оцифровано

Российская государственная библиотека

Объем фондов — 45,5 миллионов единиц хранения,
из них 300 тысяч редких книг и 500 тысяч рукописей. Оцифровано около
миллиона изданий, из них 150 тысяч — это рукописи и редкие
книги.

Оцифровка каталогов РГБ началась еще
в конце 1980-х годов за счет гранта Евросоюза.
К оцифровке документов сотрудники библиотеки приступили десять лет спустя.
После вступления в силу поправок к Гражданскому кодексу РГБ
запланировала оцифровать 50 тысяч изданий, по тысяче книг в месяц.

Национальная электронная библиотека

Проект возник в 2004 году. В 2014-м портал
НЭБ объединил ресурсы шести федеральных и 27 региональных библиотек. Также
в 2014 году были оцифрованы около 10 тысяч книг. Сейчас на сайте
НЭБ доступны около 1 миллиона 700 тысяч книг.

Президентская библиотека им. Бориса Ельцина

Задумана как крупнейшее национальное электронное хранилище
документов. Фонд библиотеки полностью оцифрован и насчитывает 380 тысяч
единиц хранения, из них 150 тысяч выставлены на портале, отмечает
директор по общественным связям библиотеки Валентин Сидорин.
В 2014-м было отсканировано 70 тысяч единиц хранения. Оцифровка
проходит не только в Петербурге, где располагается основное здание
библиотеки, но и в региональных отделениях (всего 120 отделений
в 62 субъектах Федерации).

Российская национальная библиотека

Российская Национальная
Библиотека

Фото: Елена Пальм /
Интерпресс / PhotoXPress

В фонде — 37 миллионов единиц хранения,
из них оцифровано 530 тысяч документов. В год в библиотеке
сканируют 40 тысяч наименований. Последний проект по оцифровке —
сканирование «Изданий русского авангарда», книг 1910-го —
начала 1930-х годов. Сюда относятся сочинения представителей
различных течений футуристической литературы и искусства, включая
Владимира Маяковского, Казимира Малевича, Велимира Хлебникова.

Российская государственная библиотека искусств

Фонд составляет два миллиона единиц хранения, оцифровано 17,5
тысяч документов.

Государственная публичная историческая библиотека

Фонд — 6 миллионов экземпляров, оцифровано около
пяти тысяч книг, включая Полное собрание законов Российской империи, Военно-статистическое обозрение,
«Живописную Россию», «Описание Российской империи» Семенова-Тяньшанского,
ряд генеалогических изданий.

Всероссийская государственная библиотека иностранной литературы им. М.
И. Рудомино

Фонд — пять миллионов экземпляров, оцифровано
от пяти до семи тысяч позиций. По словам директора библиотеки
Екатерины Гениевой, сотрудникам учреждения нет необходимости сканировать
классическую иностранную литературу, поскольку многие издания оцифрованы
в других библиотеках. Поэтому в «Иностранке» помимо популярных
изданий и редких книг сканируют литературные переводы.

«У государства должна быть политическая воля —
относиться к своим хранилищам как к национальному достоянию. Чтобы
были выделены деньги на современные системы пожаротушения. Чтобы нас
не мучили тендерами, когда к нам приходят представители плодоовощной
базы и утверждают, что могут оцифровать уникальные издания», —
отмечает Гениева.

Городские библиотеки

Городские библиотеки также занимаются оцифровкой книг,
однако делают это куда в меньших масштабах. Так, Центральная городская
публичная библиотека им. В. В. Маяковского оцифровала весь фонд
редкой литературы — шесть тысяч экземпляров (общий фонд библиотеки
составляет 2,5 миллиона единиц хранения). Оцифровка началась четыре года
назад, сканируются уникальные книги, представляющие интерес с точки зрения
истории города, например, книги блокадного Петербурга, говорит директор
библиотеки Зоя Чалова.

Объем сканирования в библиотеках Москвы совсем скромен.
В библиотеке им. И. С. Тургенева из 125 тысяч единиц
хранения оцифровано лишь 12, в библиотеке им. Ф. М.
Достоевского из 37 тысяч единиц — около 100. По словам
директора библиотеки им. Достоевского Алексея Бородкина, сканируется фонд
редких книг (хотя по его собственному признанию, редкими эти издания можно
назвать весьма условно): это ветхие книги конца XIX века, которые нельзя выдать
читателям на руки. Библиотеки Маяковского и Достоевского оснащены
планетарными сканерами.

Архивы: сколько оцифровано

Архивы в первую очередь занимаются оцифровкой
описей — справочного аппарата, который позволяет читателям разобраться,
какие документы находятся в различных делах. Архивы федерального значения
отсканировали большую часть описей. Полностью завершили этот процесс ГАРФ
и Российский государственный архив военно-морского флота
в Петербурге. По данным Росархива, на 1 января 2014 года было
оцифровано 51 827 тысяч заголовков дел — в основном, это описи
и какое-то количество документов, но раздельной статистики
у ведомства нет. За 2014-й федеральные архивы отсканировали
2,8 миллиона описей. По остальным архивам официальных данных пока
нет. Сбор статистики затруднен еще и в связи с тем, что одно
дело может насчитывать как один лист, так и несколько тысяч, что
не позволяет с уверенностью сказать, сколько именно листов переведены
в электронный формат.

Сканирование документов
в Ценральном государственном архиве Санкт-Петербурга

Фото: Елена Пальм /
Интерпресс / PhotoXPress

В архивах сетуют, что для оцифровки самих документов
им не хватает финансирования, поэтому нередко сканирование
определенных коллекций проводится в рамках проектов или на гранты.
Так, к празднованию 70-летия Победы РГАСПИ должен оцифровать
материалы госкомитета обороны в период Великой отечественной войны. Также
оцифровываются самые востребованные документы.

Общий фонд архивов России составляет более
609 миллионов единиц хранения. Для сохранения документов вместо оцифровки
чаще применяется другой метод — микрофильмирование, при котором документы
фотографируются и отпечатываются на микрофильмах и микрофишах.
Для последующего просмотра требуется специальная аппаратура.

Государственный архив Российской Федерации

Из шести миллионов единиц хранения оцифрованы 30 тысяч.
Среди них фонды совета народных комиссаров, фонд А. И. Деникина, документы
юриста А. Ф. Кони. Также оцифрован архив фондов Советской военной
администрации в Германии за 1945–49 годы: это около 9700 описаний
рассекреченных дел, более 210 тысяч заголовков документов и около 1,1 миллиона
оцифрованных листов дел.

Российский государственный архив литературы и искусства

Оцифровка архива проводится с 2003 года, финансирование
из бюджета учреждение начало получать лишь несколько лет назад, отмечает
директор РГАЛИ Татьяна Горяева. До этого момента архив получал гранты
на сканирование. Сейчас средства выделяются на оцифровку описей,
на полнотекстовое сканирование и на создание электронного
каталога. За последний год архив получил около миллиона рублей.

Фонд — 3,5 миллиона единиц хранения. Оцифровано
75% описей и половина всех документов. Так, полностью оцифрован
изобразительный фонд Сергея Эйзенштейна, это более пяти тысяч рисунков.

Российский государственный архив древних актов

Фонд — почти 3,5 миллиона единиц хранения. Оцифрованы
«Ландратские книги и ревизские сказки» — 2 миллиона 100 тысяч
листов.

Источник: Медуза

Технологии оцифровки для сохранности библиотечного фонда

Источник статьи

Автор24
— учеба по твоим правилам

Скачать статью

Оцифровка библиотечного фонда, ее задачи и преимущества

Работа научных и публичных библиотек по преобразованию фондов в цифровой формат выступает как одна из долгосрочных перспективных целей их деятельности, регламентированной на государственном уровне.

Определение 1

Оцифровка фонда представляет собой организационно-техническую процедуру перевода печатного документа в электронный формат путем сканирования текста и последующего его распознавания и обработки с помощью специального программного обеспечения и оборудования.

Необходимость в создании электронных фондов документов возникла в последнее время в связи с переходом предоставления государственных, а также муниципальных услуг в электронный формат. Оцифровка фондов связана с решением и других задач:

  1. Сохранение фондов печатной книги за счет уменьшения их физического износа при использовании.
  2. Возможность получения неограниченного числа копий оригинала без ухудшения качества.
  3. Расширение возможностей одновременного доступа пользователей к одному и тому же источнику информации.
  4. Предоставление виртуальных услуг доступа к информации в удаленном формате е без необходимости посещать библиотеку, что является особенно актуальным для мало мобильных лиц, а также жителей отдаленных территорий.
  5. Легкость восстановления документа при утрате физического оригинала за счет распечатывания копии.

Помимо данных задач оцифровка фондов имеет также ряд иных преимуществ, способствующих повышению качества библиотечного обслуживания:

  1. Развитие сервисов электронной доставки документов.
  2. Расширение возможностей информационного поиска, в том числе и поиска по полнотекстовым базам данных с использованием разных параметров поиска: по ключевым словам; по отдельным словоформам.
  3. Создание полнотекстовых баз данных в Интернете с возможностью доступа к ним через сервисы электронного каталога.
  4. Возможность использования цифровых копий для популяризации информации о фонде, коллекциях документов и их использовании в работе библиотеки.

«Технологии оцифровки для сохранности библиотечного фонда» 👇

Технологии оцифровки для сохранности библиотечного фонда

При оцифровке документов действуют следующие принципы:

  1. Соблюдение норм действующего законодательства в области охраны информационных и интеллектуальных прав.
  2. Следование приоритетным направлениям оцифровки, которые предполагают, что первоочередными документами, подлежащими переводу в электронный формат, являются редкие книги, периодика до 1945 года издания, краеведческие ресурсы, востребованные у пользователей материалы, а также иные издания, представляющие большую культурно-историческую, научную или региональную ценность.
  3. Использование современного оборудования, исключающего или минимизирующего риск повреждения оригинала при оцифровке.
  4. Постоянное повышение квалификации сотрудников, проводящих оцифровку документов.

В настоящее время в практике библиотечной работы с фондами существуют два вида оцифровки документов:

  1. Контактная оцифровка, предполагающая физическое взаимодействие оригинала со сканирующим оборудованием. Данный вид применяется для тех документов, где требуется высокое качество выходного изображения, а также для тех источников, которые не могут быть повреждены в результате сканирования.
  2. Бесконтактная оцифровка, исключающая физическое соприкосновение поверхностей оригинала и сканирующего устройства. Этот вид осуществляется с помощью цифрового аппарат и применяется по отношению к изданиям, которые необходимо беречь от воздействия света, контакта с повреждающими поверхностями и проч.

Для оцифровки используется следующий минимальный набор оборудования:

  1. Персональный компьютер с необходимым программным обеспечением.
  2. Сканирующее устройство.
  3. Цифровой фотоаппарат.

Для центров, занимающихся оцифровкой в значительных масштабах, приобретается дорогостоящее широкоформатное сканирующее оборудование, позволяющее работать с печатными изданиями разного размера (картами, газетами, плакатами и проч.). В качестве программного обеспечения используются программы для распознавания документов, программы-конвертеры для перевода файла с оцифрованным документом в различные форматы, определяемые техническим заданиям, а также программы для чтения отсканированных документов, системные драйверы и приложения, обеспечивающие функционирование внешнего оборудования.

Для копий документов существует ряд требований, которые предъявляются к их виду и качеству. В частности, копии должны соответствовать следующим критериям:

  1. Соблюдение полей и разметки оригинала, отсутствие обрезанных частей текста или иллюстраций.
  2. Достаточно высокий уровень разрешения для просмотра на экране монитора (размер 1280х1024 пикселей).
  3. Сохранение текстовых документов в формате PDF при сканировании.
  4. Оптимизация файла с текстом для использования в качестве WEB-ресурса.
  5. Отсутствие нераспознанных частей текста, нечитаемых символов или иных дефектов распознавания.
  6. Учет электронных копий документов в фонде как полноценных информационных ресурсов с внесением данных в электронный каталог.

Таким образом, технологии оцифровки для сохранности библиотечного фонда позволяют уменьшить физический износ и порчу фонда от постоянного использования, а также помогают продвигать новые форматы библиотечного обслуживания с использованием сети Интернет.

Дата последнего обновления статьи: 11.12.2024

Понравилась статья? Поделить с друзьями:
0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest

0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии
  • Как открыть магазин вконтакте с нуля пошаговые инструкции
  • Неостим инструкция по применению
  • Little marcel колонка инструкция
  • Polar verity sense инструкция
  • Инструкция по эксплуатации стелс росомаха