Время проведения: 22 августа 2012 года в 11:00
Место проведения: зал заседаний РГБ
В РГБ при информационной поддержке Российской ассоциации электронных библиотек прошел научно-практический семинар «Оцифровка документов и долгосрочное хранение: опыт работы председателя секции газет ИФЛА Фредерика Зарндта (США)». Фредерик Зарндт — председатель секции газет IFLA, DL Консалтинг, советник по конвертированию контента (США). Гости семинара познакомились со спецификой оцифровки газет, узнали, как этот процесс сегодня идет в национальных библиотеках мира, задали свои вопросы.
Фредерик Зарнд более десяти лет назад создал свою компанию, занимающуюся оцифровкой газет. По образованию нынешний председатель секции газет IFLA — физик и специалист по компьютерным технологиям. По мнению г-на Зарндта, с технической точки зрения среди всех печатных материалов газеты оцифровать сложнее всего. Многие национальные библиотеки сегодня не располагают статистикой посещений своих газетных читальных залов, оцифрованные газеты, в основном, интересны тем, кто увлекается историей, социологией и политикой. Объемы трафика, который привлекают к себе библиотеки, конечно, несопоставимы с трафиком поисковых систем, например, Google Search, которая в рейтинге Alexa (сервис оценки объемов интернет-трафика) находится на первом месте (для сравнения — библиотека Конгресса США на 3122 месте). Однако, Фредерик Зарндт уверен, что именно усилия по оцифровке газет привлекают к сайтам национальных библиотек максимальное количество пользователей, несмотря на то, что национальные библиотеки во всем мире больше заинтересованы в оцифровке своих фондов редких и ценных изданий.
По мнению г-на Зарндта, оцифрованная копия намного лучше по качеству, чем микрофильм. Существует два вида цифрового копирования газеты: оцифровка постраничная или постатейная. Страницу оцифровать дешевле и проще с точки зрения авторского права. Так, национальная библиотека Сингапура заключила соглашение с издателями и оцифровала архив своих газет за период 1940—1990 гг. Правда, в Сингапуре это сделать проще: по неуточненным данным, правительство Сингапура обязало издателей предоставлять библиотекам право на оцифровку, к тому же там у каждого издателя выходит не более 1—2 газет. Сложнее ситуация в других странах, где авторское право имеет свои особенности: так, по словам г-на Зарндта, в США, даже несмотря на законодательно закрепленную возможность получения библиотеками лицензии на оцифровку любых газет, издатели весьма независимы. С учетом всего этого, в настоящее время большинство национальных библиотек во всем мире занимается по большей части оцифровкой газет, которые по тем или иным причинам больше не являются объектами авторского права и попадают в категорию общественного достояния (public domain).
С точки зрения читателей, по мнению Фредерика Зарндта, удобнее постатейная оцифровка, поскольку читатели обычно ищут конкретные материалы по определенной теме. Наилучшее качество оцифровки обеспечивается, если копию делать без сжатия либо с возможностью возврата к размерам оригинала. Но это не всегда можно себе позволить. Например, в настоящее время в Британской национальной библиотеке реализуется проект по сканированию 40 млн газетных страниц. Каждая из них требует более 20 МБ памяти. В сумме это предполагает очень большое количество памяти, поэтому каждая копия сжимается без возможности возврата к размерам оригинала и занимает всего 3 МБ. Затраты, необходимые на оцифровку газет, варьируются по странам: например, Латвийской национальной библиотеке потребовалось чуть более 1 млн евро, выделенных Евросоюзом, на оцифровку 4 млн страниц за 2 года.
Оцифровка включает несколько этапов: обработку изображения, создание мастер-копии, применение фильтров, распознавание типов оптических изображений на странице, создание и наполнение метаданных, формирование цифровых объектов. «Человеческий фактор играет особую роль при оцифровке газет, поскольку результаты работы программы по оцифровке в случае с газетами всегда необходимо корректировать», — отметил г-н Зарндт. По его словам, на Западе к этому активно привлекаются волонтеры. Например, национальная библиотека Австралии для редактирования и тегирования оцифрованных газетных страниц активно использует именно краудсорсинг: в этом году волонтеры отредактировали 2 млн 200 тыс. страниц. Таким образом, в этой части работы над оцифровкой возможна экономия. «Это увлеченные люди, которым интересна история, краеведение или просто люди, которым хочется заниматься чем-то общественно полезным», — рассказал г-н Зарндт. По его мнению, краудсорсинг как идея сегодня очень привлекателен в обществе: так, над проектом о генеалогии, включающем 1,5 млрд записей, сегодня работает 70 тыс. волонтеров со всего мира.
Conversion of historic newspapers to digital objects. Презентация