Электронный каталог

как искать?

8 (800) 100-5790
8 (499) 557-0470
8 (495) 695-5790
На главную /  События /  Лекции, встречи, концерты /  2012 год  /  Оцифровка газет: мировой опыт и частная практика

Оцифровка газет: мировой опыт и частная практика

Время проведения: 22 ав­гу­ста 2012 го­да в 11:00
Место проведения: зал заседаний РГБ

 

В РГБ при ин­фор­ма­ци­он­ной под­держ­ке Рос­сий­ской ас­со­ци­а­ции элек­трон­ных биб­лио­тек прошел на­уч­но-прак­ти­че­ский се­ми­нар «Оциф­ров­ка до­ку­мен­тов и дол­го­сроч­ное хра­не­ние: опыт ра­бо­ты пред­се­да­те­ля сек­ции газет ИФЛА Фредерика Зарндта (США)». Фре­де­рик Зарндт — пред­се­да­тель сек­ции га­зет IFLA, DL Кон­сал­тинг, со­вет­ник по кон­вер­ти­ро­ва­нию кон­тен­та (США). Гости семинара познакомились со спецификой оцифровки газет, узнали, как этот процесс сегодня идет в национальных библиотеках мира, задали свои вопросы.

Фредерик Зарнд более десяти лет назад создал свою компанию, занимающуюся оцифровкой газет. По образованию нынешний председатель секции газет IFLA — физик и специалист по компьютерным технологиям. По мнению г-на Зарндта, с технической точки зрения среди всех печатных материалов газеты оцифровать сложнее всего. Многие национальные библиотеки сегодня не располагают статистикой посещений своих газетных читальных залов, оцифрованные газеты, в основном, интересны тем, кто увлекается историей, социологией и политикой. Объемы трафика, который привлекают к себе библиотеки, конечно, несопоставимы с трафиком поисковых систем, например, Google Search, которая  в рейтинге Alexa (сервис оценки объемов интернет-трафика) находится на первом месте (для сравнения — библиотека Конгресса США на 3122 месте).  Однако, Фредерик Зарндт уверен, что именно усилия по оцифровке газет привлекают к сайтам национальных библиотек максимальное количество пользователей, несмотря на то, что национальные библиотеки во всем мире больше заинтересованы в оцифровке своих фондов редких и ценных изданий.

По мнению г-на Зарндта, оцифрованная копия намного лучше по качеству, чем микрофильм. Существует два вида цифрового копирования газеты: оцифровка постраничная или постатейная. Страницу оцифровать дешевле и проще с точки зрения авторского права. Так, национальная библиотека Сингапура заключила соглашение с издателями и оцифровала архив своих газет за период 1940—1990 гг. Правда, в Сингапуре это сделать проще: по неуточненным данным, правительство Сингапура обязало издателей предоставлять библиотекам право на оцифровку, к тому же там у каждого издателя выходит не более 1—2 газет. Сложнее ситуация в других странах, где авторское право имеет свои особенности: так, по словам г-на Зарндта, в США, даже несмотря на законодательно закрепленную возможность получения библиотеками лицензии на оцифровку любых газет, издатели весьма независимы. С учетом всего этого, в настоящее время большинство национальных библиотек во всем мире занимается по большей части оцифровкой газет, которые по тем или иным причинам больше не являются объектами авторского права и попадают в категорию общественного достояния (public domain).

С точки зрения читателей, по мнению Фредерика Зарндта, удобнее постатейная оцифровка, поскольку читатели обычно ищут конкретные материалы по определенной теме. Наилучшее качество оцифровки обеспечивается, если копию делать без сжатия либо с возможностью возврата к размерам оригинала. Но это не всегда можно себе позволить. Например, в настоящее время в Британской национальной библиотеке реализуется проект по сканированию 40 млн газетных страниц. Каждая из них требует более 20 МБ памяти. В сумме это предполагает очень большое количество памяти, поэтому каждая копия сжимается без возможности возврата к размерам оригинала и занимает всего 3 МБ. Затраты, необходимые на оцифровку газет, варьируются по странам: например, Латвийской национальной библиотеке потребовалось чуть более 1 млн евро, выделенных Евросоюзом, на оцифровку 4 млн страниц за 2 года.

Оцифровка включает несколько этапов: обработку изображения, создание мастер-копии, применение фильтров, распознавание типов оптических изображений на странице, создание и наполнение метаданных, формирование цифровых объектов. «Человеческий фактор играет особую роль при оцифровке газет, поскольку результаты работы программы по оцифровке в случае с газетами всегда необходимо корректировать», — отметил г-н Зарндт. По его словам, на Западе к этому активно привлекаются волонтеры. Например, национальная библиотека Австралии для редактирования и тегирования оцифрованных газетных страниц активно использует именно краудсорсинг: в этом году волонтеры отредактировали 2 млн 200 тыс. страниц. Таким образом, в этой части работы над оцифровкой возможна экономия. «Это увлеченные люди, которым интересна история, краеведение или просто люди, которым хочется заниматься чем-то общественно полезным», — рассказал г-н Зарндт. По его мнению, краудсорсинг как идея сегодня очень привлекателен в обществе: так, над проектом о генеалогии, включающем 1,5 млрд записей, сегодня работает 70 тыс. волонтеров со всего мира.

Conversion of historic newspapers to digital objects. Презентация

 

Сайт создан при финансовой поддержке Федерального агентства по печати и массовым коммуникациям РФ
Официальный сайт Российской государственной библиотеки
Новый сайт
Электронная почта
Свидетельство о регистрации средства массовой информации:
Эл № ФС 77-20215 от 13 декабря 2004 года.

При использовании материалов прямая ссылка
на сайт www.rsl.ru обязательна.