Мировая цифровая библиотека. Открытая лекция А. И. Вислого
14—15 ноября в Мюнхене собрались партнеры проекта «Мировая цифровая библиотека» (World Digital Library). Вторая ежегодная встреча участников была организована Библиотекой конгресса США и собрала делегации из 54 стран мира. Российскую государственную библиотеку представлял генеральный директор РГБ Александр Вислый. А уже 17 ноября Александр Иванович выступил на V Международной конференции и выставке LIBCOM и рассказал об истории и современных направлениях развития Всемирной цифровой библиотеки. Предлагаем вашему вниманию самые интересные отрывки из его лекции.
— Добрый день, уважаемые коллеги! Прежде всего я хочу рассказать немного об истории Мировой цифровой библиотеки, которая началась в 1999 году. Тогда Библиотека конгресса США получила достаточно большие деньги на организацию оцифровки документов по проекту, который назывался «Встреча на границах» (Meeting of Frontiers) и предполагал оцифровку материалов о том, как американцы через Аляску и Дальний Восток узнавали российскую территорию и как подданные Российской империи так же — через Дальний Восток и Аляску — подбирались совсем вплотную к Канаде. Предполагалась оцифровка материалов, которые есть в крупнейших российских библиотеках, таких как РГБ и РНБ, того, что есть в екатеринбургских библиотеках, в библиотеках Дальнего Востока. Деньги были по тем временам выделены совсем неплохие.
Часть оборудования, которое было куплено в рамках проекта, успешно стоит, скажем, в нашей библиотеке и, что самое удивительное, работает. Это хороший планетарный сканер, и только в последнее время он начал сдавать. Было оцифровано много интересных материалов, потом финансирование проекта закончилось, и он остановился. До сих пор существует сайт, который не обновлялся уже лет пять или шесть, но туда можно зайти и посмотреть, каким он был.
Изучив этот опыт, Библиотека конгресса вышла с новой инициативой. Началось все с письма директора библиотеки Джеймса Биллингтона (James Billington) в ЮНЕСКО о намерении создать Мировую цифровую библиотеку. В нем указывалось несколько понятных принципов ее существования и формирования.
Первый принцип — участники проекта сами определяют, какие интересные материалы есть в их странах, на которые не распространяется авторское право, либо правообладатель дал все права на размещение и доступ к этим материалам в Интернете. Они и передаются в Мировую цифровую библиотеку. К началу проекта сформировался небольшой список, куда вошли и две российские национальные библиотеки, участники проекта «Встреча на границах». Основные материалы, которые первоначально поступали на сайт Мировой цифровой библиотеки, были взяты именно оттуда. На сегодняшний день в Мировой цифровой библиотеке русскоязычных документов чуть больше двухсот. И полные тексты книг, и красивые открытки, и карты — это все можно посмотреть на сайте Мировой цифровой библиотеки.
Наибольшую активность в начале проекта проявили страны, которые находились на периферии автоматизации, такие как Египет и Бразилия. Вокруг проекта сформировалось около тридцати национальных библиотек из стран, которые до этого стояли в стороне от процесса оцифровки. Европа была сначала представлена Россией и Италией. Вопрос о необходимости создания интернет-сайта Мировой цифровой библиотеки встал не так давно. Первый вариант сайта появился в 2008 году. И тогда же было принято решение, что интерфейс будет представлен на семи основных языках: английском, русском, испанском, французском, португальском, арабском и китайском.
|
|
|
|
|
|
К странам-участницам Мировая цифровая библиотека предъявляет два основных требования. Первое: материалы, которые туда предоставляются, должны быть в свободном доступе в Интернете. Второе: все материалы, которые представлены на сайте Мировой цифровой библиотеки, должны быть переданы по соответствующему соглашению в Библиотеку конгресса США. Дело в том, что как некоего юридического лица Мировой цифровой библиотеки не существует, и при заключении соглашений стороной выступает Библиотека конгресса. По сути дела, все материалы, которые поступают в Мировую цифровую библиотеку, передаются ей.
После создания сайта проект перешел в новое качество. К тому времени сформировались некие технические требования к материалам, которые предоставляются на сайт. Это должен быть 24-битный цвет и разрешение от 300 dpi. Библиографическое описание должно быть максимально полным, сделано в формате MARC 21, составлено на национальном языке. Библиотека конгресса же обязалась переводить эти метаданные на все семь основных языков, которые поддерживаются Мировой цифровой библиотекой. Вот тут-то все и встало. Каждое библиографическое описание необходимо перевести на шесть языков, включая китайский. А недавно к ним добавилось еще два — немецкий и японский. Все это входит в обязанности двадцати сотрудников Библиотеки конгресса. Что эти двадцать человек успевают сделать, то они и делают. Причем во главу угла ставится качество метаданных, соответственно, процесс идет очень медленно.
Важно понимать, о каком объеме фонда Мировой цифровой библиотеки идет речь. С момента более или менее серьезного старта в 2008 году до настоящего времени на сайте размещено шесть тысяч объектов. Это даже не шесть тысяч книг. Объектом считается все — открытка, выпуск газеты и т. д. Но мы должны понимать, что шесть языков помножить на шесть тысяч объектов — это уже практически сорок тысяч библиографических описаний, потому что они должны быть переведены на разные языки. Много усилий было приложено для создания удобного интерфейса. Эта задача выполняется достаточно хорошо, но, только по моим наблюдениям, интерфейс за эти три года менялся раза четыре. В ближайшие планы входит устроить на сайте полнотекстовый поиск там, где он возможен, — как по любому слову из библиографического описания, так и по тому, что удалось распознать из самого издания.
И еще об основных показателях. Сейчас в состав партнеров Мировой цифровой библиотеки входит 117 организаций. Это те организации, которые подписали соглашение о сотрудничестве с Библиотекой конгресса. Они представляют 64 страны. Из России официальных партнеров в настоящий момент три — РГБ, РНБ и Президентская библиотека.
В этом году Библиотека конгресса получила примерно такие же деньги, какие были выделены на проект «Встреча на границах», и у нее есть возможность закупить для некоторых стран оборудование для оцифровки. Тут интересен выбор тех стран, куда Библиотека конгресса будет поставлять это оборудование. Прежде всего, продолжается активное сотрудничество с Египтом — с Александрийской библиотекой, а также с Национальной библиотекой и архивом Каира. Новый центр строится в Уганде, поскольку считается, что Африка представлена в проекте очень слабо. И третий центр по оцифровке, который сейчас создается, будет находиться в Ираке.
У библиотеки также есть планы увеличить количество стран-участниц с 65 до 80. Причем в основном это не будут страны Европы или Азии. Это либо Латинская Америка, либо Африка. Во всем этом есть пусть малозаметный, но элемент влияния. Когда на Россию можно было влиять, то были такие проекты, как «Встреча на границах». Когда на Россию влиять стало невозможно, никаких проектов в Россию не идет.
Планируется довести в ближайшие три года количество представленных материалов до ста тысяч единиц. Я специально сохраню этот отчет, чтобы посмотреть, как с таким подходом, когда каждую запись надо будет переводить не на шесть языков, а на восемь, то есть, по сути дела, будет девять официальных языков, удастся собрать сто тысяч единиц и обеспечить их хранение.
Нужно, чтобы все материалы Мировой цифровой библиотеки искались через Google. Очень много говорилось на встрече о том, что Google проиндексировал материалы Мировой цифровой библиотеки так, что найти их там очень сложно, они далеко не на первых страницах в результатах поиска. Но вроде бы месяц назад эти проблемы были решены.
|
|
|
|
|
|
Назначена дата, и в 2015 году Мировая цифровая библиотека наконец заявит о том, что она выходит из фазы экспериментального существования и превращается в постоянно работающий представительный ресурс. Единственное, что всех волнует, это то, что на сегодняшний день среднее время пребывания посетителя на сайте библиотеки составляет 2,4 минуты. Если бы человек хотя бы что-то начал читать, он бы задержался на странице значительно дольше. Я уж не говорю о хождении по перекрестным ссылкам. Все понимают, что необходимо сделать сайт таким, чтобы оттуда не уходили пользователи. Для этого надо, во-первых, наращивать объем размещенных материалов. И, во-вторых, представлять документы, которые интересны для чтения, то есть те, которые способствуют профессиональному росту, выполнению дипломной работы, реферата. А тут начинаются сложности. Если это текстовые материалы, из тех, что представлены сейчас, то русские книги представлены в старой орфографии, которую и русский-то не прочитает. Но оказывается, что и с другими языками то же самое. Испанцы рассказывали, что за предыдущие двести лет их язык изменился так, что те книги, которые были написаны в то время, с трудом читаются современными посетителями. Поэтому речь шла о том, что надо представлять и современные документы. Пусть книга будет, например, по истории Египта, но написанная недавно, и лучше на английском языке. Но тут вступает в действие вопрос авторского права. Представители Мировой цифровой библиотеки через своих партнеров в разных странах начали переговоры с издательствами, чтобы их книги были бы представлены на сайте. Но как только издатель узнавал, для кого в конечном итоге этот материал, цена на электронные копии уходила в заоблачные высоты. На сегодняшний момент этот вопрос как-то нужно решать.
Как управляется Мировая цифровая библиотека? Есть список партнеров, из их состава по достаточно простым принципам формируется совет — важно, чтобы было равномерное представительство от регионов. Председателем совета в настоящее время является директор Александрийской библиотеки. Есть еще самый большой человек — директор Библиотеки конгресса доктор Биллингтон, который сейчас достаточно мало уделяет внимания проекту, и есть реально действующие лица — Джон Ван Оденарен (John Van Oudenaren), директор Мировой цифровой библиотеки, и двадцать человек штата. На самом деле решения все принимаются внутри Библиотеки конгресса, и только после долгих уговоров удается эти решения в какую-то сторону развернуть. Что касается материалов от России, то считается, и это справедливо, что сейчас и так есть перекос в сторону материалов, которые получены отсюда. Поэтому приоритетами сейчас стали Уганда, Ирак, Бразилия, латиноамериканские страны. Может быть, это и правильно.
Для примера хочу дать сравнение с европейскими проектами. В Европе существуют два больших проекта — Европейская библиотека (TEL) и Европеана (Europeana). И они построены на принципах, полностью обратным проектам Мировой цифровой библиотеки. Вроде бы стоит та же задача предоставить как можно больше полнотекстовых ресурсов в открытом доступе. Подходы же совершенно разные. И Европейская библиотека, и Европеана не предполагают, что где-то создается единое хранилище оцифрованных материалов. Кто оцифровал, тот их у себя и хранит. По сути дела, это хорошо разработанная, далеко продвинутая точка доступа к большому количеству материалов, распределенных по странам Европы.
Какие есть минусы в подходе Мировой цифровой библиотеки? Первый минус — это необходимость отдать все Библиотеке конгресса, что не всегда хочется. А второй — вся обработка происходит внутри Библиотеки конгресса, поэтому скорость исполнения достаточно маленькая.
А какие минусы европейских проектов? Чтобы стать партнером Европейской библиотеки, я должен выбрать те коллекции, которые хочу представить, и внести ежегодный членский взнос пятнадцать тысяч евро. За эти пятнадцать тысяч я не получаю никаких прав, одни обязанности. Я должен установить определенное оборудование и программное обеспечение. У меня должен стоять сервер OIE, который будет правильно отвечать на вопросы центрального сервера Европейской библиотеки. После этого коллекции, которые я выбрал, начинают быть видны пользователям. Но если русского языка в интерфейсе нет, то возникает следующий вопрос — интерфейс англоязычный, а материалы, которые нужно показать пользователю, на русском языке. Насколько велика вероятность, что кто-то пойдет таким путем за русским текстом? Мы видим, что обращений через Европейскую библиотеку к нам исчезающее мало — меньше процента от общего числа обращений к нашим ресурсам.
Российская государственная библиотека сейчас является партнером и Мировой цифровой библиотеки, и Европейской библиотеки, но каждый год, когда приходит время посылать сотрудников в командировку, либо платить ежегодный взнос, понимаешь, что хотя и нужно участвовать в подобных проектах, но реальной выгоды для библиотеки пока не очень много.
23.11.2011