Через цифровое наследие в «умную» экономику

Цифровые коллекции расширяют возможности печатных фондов, обеспечивая широкий масштаб использования текстов, помогая библиотекам взаимодействовать в сетевой системе, обмениваться ресурсами на разных уровнях: местном, национальном и международном. Всё это позволяет создать новую среду, в которой библиотека является центром доступа к различным источникам информации.

Об эффективном управлении электронными ресурсами, системах по обслуживанию процесса оцифровки, создании инфраструктуры для долговременного хранения контента и метаданных, а также о форматах предоставления их читателям говорили эксперты на сессии «Цифровые коллекции и цифровые библиотеки» в рамках ИФЛА-2017.

СОВРЕМЕННЫЕ ТЕХНОЛОГИИ И ЦИФРОВЫЕ КОЛЛЕКЦИИ ПОЛЬШИ

Агнешка ЛИШЕНСКА (Agnieszka Leszynska), Национальная библиотека Польши

Польские цифровые библиотеки, как и во всём мире, переживают этап серьёзной трансформации. Совместная работа с музеями, архивами, неправительственными организациями, органами власти позволяет создать базу для социального и культурного развития, обеспечивает доступ к культурному наследию. Закончилась «эра тысячи цветов», когда в Польше «расцвели» более 320 цифровых библиотек и было оцифровано около 5 млн разных объектов. Сейчас настало время для того, чтобы проанализировать ситуацию и понять, какие перспективы открываются для развития национальных цифровых ресурсов.

В начале XXI в. стартовал проект «Польская интернет-библиотека» (PBI). Инициативу профинансировало правительство страны: библиотека должна была стать центральной платформой для цифрового национального наследия. Фонд включал фотографии, графические работы, публикации для людей с ограниченными возможностями, архивы, научно-исследовательские материалы и шедевры польской литературы. Проект неоднократно менял ведомственную принадлежность (МВД, министерство культуры), а в 2008 г. был передан Национальной библиотеке Польши. На тот момент фонд насчитывал 25 тыс. оцифрованных объектов — в основном тексты и сканированные копии. Собрание характеризовалось достаточно низким уровнем качества, что было связано с нарушениями авторских прав и трудностями технологического характера. Пользователи часто жаловались на нестабильность работы системы, и в 2015 г. было принято решение о закрытии PBI. Этот пример стал хорошим уроком для всех, потому что проекты такого уровня не должны зависеть от меняющейся политической ситуации.

Проект «ДеЛибра» был разработан Познанским компьютерным сетевым центром, его целью стало предоставление электронных публикаций цифровым библиотекам. Разработчики проекта создали прекрасную базу для развития сетевых библиотек в Польше. Система поиска и агрегации электронных объектов получила название Федерация цифровых библиотек. Проект объединял 132 цифровые коллекции, принадлежащие библиотекам и музеям, и до сих пор вносит свой вклад в библиотеку Europeana. Но в 2016 г. правила распределения информации изменились. Потребовалась другая платформа, и без ИТ-поддержки и соответствующего финансирования большинство цифровых библиотек закрылось, пришлось искать альтернативные решения.

В настоящий момент к наиболее значимым электронным сервисам Национальной библиотеки Польши можно отнести национальную электронную библиотеку Polona, информационную систему межбиблиотечного абонемента Academica, электронный репозиторий для издателей и сервис e-ISBN.

НАЦИОНАЛЬНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА POLONA*

* Выступление эксперта дополнено статьёй Катажины Щляска, заместителя директора Национальной библиотеки Польши. Открытый доступ: Библиотеки за рубежом 2017: IFLA 2017, Wroclaw, Poland сборник / ред. кол.: Д.А. Белякова, М.В. Береславская, Ю.Е. Черничкина; Всеросгос. б-ка иностр. лит-ры имени М.И. Рудомино, Группа международного библиотековедения. – М.: Центр книги Рудомино, 2017. – 176 с.

Программа плановой оцифровки фондов Национальной библиотеки Польши начала реализовываться в 2002 г. Её основной задачей стало обеспечение сохранности фондов, имеющих серьёзную историческую, культурную и художественную ценность. Поэтому было принято решение начать оцифровку со специализированных коллекций, книжных фондов XIX и XX вв., периодических и сериальных изданий, и возникла необходимость разработать основные технические и технологические требования. Прежде всего было решено, что оригинал документа может быть отсканирован только один раз — с учётом требований безопасности, с высоким разрешением, без каких-либо изменений и манипуляций на скане за исключением возможных исправлений, обеспечивающих читабельность цифровой копии. При этом для основных фондов создавались базовые файлы (архивы) TIFF с разрешением 300 dpi, а для особенно ценных фондов, представляющих собой памятники культуры, — с разрешением 600 dpi. Для презентации в Интернете и оказания репрографических услуг используется сжатая копия в формате JPЕG.

Процесс подготовки к оцифровке, включающий разработку стандартов, тестирование и внедрение процедур, положил начало созданию в 2006 г. Национальной электронной библиотеки Polona, основной целью которой стало обеспечение широкого, универсального и бесплатного доступа к цифровым фондам и к информации о них. Электронная библиотека Polona является подразделением Национальной библиотеки, координация всей деятельности осуществляется Отделом электронных фондов.

cherez-tsifr-nasledie-2

В январе 2007 г. Polona присоединилась к Европейской библиотеке, а с 2008 г. — к ресурсам портала Europeana. В настоящее время Polona является самой большой цифровой библиотекой Польши. В ней насчитывается более 1,5 млн оцифрованных объектов из собственных фондов НБ и коллекций других библиотек, в том числе документы, являющиеся общественным достоянием, и материалы, остающиеся под защитой авторского права. Фонды представлены в виде файлов jpeg с высоким разрешением, а также — если применялся процесс оптического распознавания текста, — в виде файлов pdf с текстовым слоем. Фонды, не защищённые авторским правом, доступны для копирования и повторного использования на сетевых платформах. Этой возможностью пользуются читатели не только из Польши, но и со всего мира. В 2013 г. библиотека стала доступной на новой платформе polona.pl, позволяющей искать и фильтровать цифровые объекты, выделять фрагменты текста, записывать комментарии, делиться контентом с другими пользователями, создавать свои библиотеки и управлять ими.

СИСТЕМА ЭЛЕКТРОННОГО МЕЖБИБЛИОТЕЧНОГО АБОНЕМЕНТА ACADEMICA

В 2010 г. Национальная библиотека начала работу над системой электронного межбиблиотечного абонемента научных публикаций Academica. Наиболее важным моментом стала пересылка заказов электронным путём и использование центральных каталогов для локализации материалов. Научные публикации, необходимые в процессе академической подготовки, составляют значительную долю документов, пересылаемых по межбиблиотечному абонементу в Польше. В связи с ростом числа высших учебных заведений, появлением новых направлений и факультетов доступ к малотиражным книгам и научным журналам оказался затруднён во многих вузовских и публичных библиотеках небольших городов. Учитывая это, Национальная библиотека Польши решила обеспечить доступ к изданиям, необходимым в научной работе и в вузах, через компьютерные терминалы в библиотеках, подписавших соглашение о присоединении к системе электронного межбиблиотечного абонемента.

Согласно действующему в Польше законодательству современные книги и журналы, находящиеся под защитой авторских прав, не могут быть свободно доступны в электронных библиотеках. В системе Academica представлены прежде всего публикации 1990–2015 гг.: вузовские учебники и научная периодика по всем отраслям знаний. Таким образом, эта система обеспечивает широкий доступ к текстам, необходимым в процессе обучения в вузе, в особенности к малотиражным книгам и научным журналам, а также к научным публикациям, отсутствующим в библиотечных фондах и в продаже. Правовой основой деятельности системы Academica является ст. 28 Закона об авторском праве и смежных правах от 4 февраля 1994 г. в той её части, которая касается разрешения публично использовать произведения в библиотечном обслуживании. В третьем абзаце этой статьи говорится, что библиотеки, архивы и школы могут «предоставлять фонды для исследовательских либо познавательных целей посредством конечных устройств информационной системы (компьютерных терминалов), находящихся на территории этих учреждений». Кроме того, подразумевается, что, поскольку межбиблиотечный абонемент оперирует в данном случае цифровыми версиями книг и периодических изданий, увеличения количества экземпляров, доступных на рынке, не происходит (что могло бы быть интерпретировано как нарушение авторских прав, вытекающее из ст. 35 Закона об авторском праве). Межбиблиотечный абонемент Academica позволяет получить доступ к одной публикации в тот или иной момент времени только одному пользователю, как это имеет место в межбиблиотечном абонементе печатных изданий. Для того чтобы облегчить пользователям доступ к изданиям, защищённым авторским правом, была введена система резервирования публикаций, позволяющая в выбранное время в определённой библиотеке получить доступ к научным документам.

В декабре 2014 г. в день открытия абонемента Academica в его каталоге насчитывалось 470 тыс. публикаций по всем отраслям знаний, в том числе более 220 тыс. — научных. В настоящее время Academica располагает более чем 1,7 млн изданий, включая свыше миллиона изданий, охраняемых авторским правом.

ЦИФРОВОЙ РЕПОЗИТОРИЙ ДЛЯ ИЗДАТЕЛЕЙ

На книжном рынке появляется всё больше электронных книг и журналов, не существующих в традиционном печатном формате. Национальная библиотека Польши получает обязательный экземпляр всех электронных изданий и компьютерных программ. Для удобства издателей, передающих свои электронные публикации в качестве обязательного экземпляра, Национальная библиотека в 2009 г. открыла Цифровой репозиторий. Издатели, зарегистрировавшие аккаунт в репозитории, могут присылать файлы, содержащие книги или журналы, непосредственно на сервер библиотеки. Пересылка зашифрована, что обеспечивает безопасность передаваемых данных. После отправки файла издатели получают от библиотеки подтверждение, что обязательный экземпляр получен. Это сокращает время передачи файлов, упрощает всю процедуру, а издателям даёт возможность управлять ресурсами.

Библиотекам, которые не имеют опыта работы с собственными электронными коллекциями, планируется дать возможность пользоваться платформой polona.pl и абонементом Academica для представления в Сети цифровых версий собственных фондов.

СЕРВИС e-ISBN

В 2014 г. начал функционировать сервис e-ISBN. Он используется для присвоения международных стандартных книжных номеров ISBN и управления ими и метаданными, с ними связанными. Это первая в Польше предназначенная для издателей публичная электронная услуга, которая направлена на облегчение обмена метаданными на книжном рынке и обеспечение публичного сектора более качественной информацией. Благодаря сервису e-ISBN была усовершенствована процедура присваивания номеров. Издатели теперь тратят гораздо меньше времени на оформление заявок на очередной ряд номеров ISBN и на передачу информации об уже использованных номерах. Применение сервиса e-ISBN не навязывается: издатели могут при желании пользоваться традиционным способом присвоения номеров. Однако сервис настолько удобен, что по истечении двух лет к нему стало прибегать большинство издателей. Дополнительным достоинством электронной системы является возможность текущего мониторинга динамики издательского рынка в стране, а также отслеживания издательских новинок, что доступно также внешним пользователям (книготорговцам и библиотекарям).

ПАРТНЁРСКИЕ ПРОЕКТЫ

Харри ВЕРВЭЙН (Harry Verwayen), цифровая библиотека Europeana, Нидерланды

Культура объединяет Европу, а цифровое наследие создаёт «умную» экономику.

Europeana — европейская цифровая библиотека, целью которой является обеспечение доступа к отсканированным страницам книг, отражающих различные аспекты европейской культуры. Проект официально стартовал 20 ноября 2008 г. На тот момент были оцифрованы 2 млн различных объектов культурного наследия Европы, а к 2015 г. — уже более 15 млн. Сейчас доступна информация на французском, немецком и английском языках. В дальнейшем предполагается представить источники на всех европейских языках, а главная задача разработчиков — обеспечить лёгкий доступ к этим данным.

Эксперт рассказал о ходе реализации интересного проекта, который стартовал в сентябре 2011 г. и осуществляется совместно с Оксфордским университетом. Инициаторы проекта через библиотеки попросили людей поделиться их личными дневниками о Второй мировой войне. Тема рассматривалась в общеевропейском контексте. В проекте приняли участие 180 библиотек, было привлечено более 10 тыс. человек, почти 200 тыс. единиц материалов: в коллекцию вошли дневники, почтовые открытки, фотографии, вырезки из газет.

На веб-сайте представлен набор данных, описание целевого исследования и видеоматериал, в котором организаторы проекта попытались отразить человеческую сторону этой инициативы, опросив 3,9 тыс. респондентов. Главный вывод — люди выступают за то, чтобы грядущие поколения имели свободный доступ к собранным данным. 70% респондентов отметили, что проект способствует осознанию европейской идентичности, пониманию общей истории.

cherez-tsifr-nasledie-3

Однако возникли проблемы. На ресурсе представлены письма солдат, написанные ими на 24 языках. Конечно, прочитать это сможет не каждый. Поэтому был инициирован новый проект, направленный на внедрение машинного чтения. Несколько рабочих групп расшифровывали оригиналы, это было своего рода соревнование. Личный рекорд (Карл Пино из Национальной библиотеки Франции) — 109 документов общим объёмом 60 тыс. знаков менее чем за месяц работы. К проекту активно подключилась молодёжь.

— Безусловно, в этом есть элемент игры, но главное — неспешное вдумчивое погружение в контент, которое для многих оказалось интереснее, чем чтение книги. В 2018 г. исполняется 100 лет с момента окончания Первой мировой войны, планируется ещё один грандиозный проект, в котором сможет принять участие каждый. Подобные инициативы усиливают значимость библиотек в обществе. Важно, что люди являются неотъемлемой частью этих историй, — сказал в завершение эксперт.

Лин Норин ВАЙЛИ (Lynn Norine Wiley), Библиотека университета Иллинойс, США

Фонд библиотек в Университете Иллинойса насчитывает 24 млн единиц хранения, а их общее число превышает 20. Университет является членом Альянса академических организаций. В 2007 г. Альянс стал партнёром Gоogle по оцифровке 10 млн томов научных книг. Эта коллекция знакома учёным по всему миру и отражает десятилетнюю политику предоставления доступа к исследовательским ресурсам. После того как Альянс стал партнёром Hathi Trust в 2010 г., начались инвестиции в построение цифрового репозитория для обеспечения онлайн-доступа к оцифрованным печатным ресурсам, включающим более 11,5 млн копий. Всего в партнёрскую сеть Hathi Trust входят пять консорциумов и 125 учреждений, которые предлагают коллекции, содержащие сегодня почти 16 млн объектов. В физическом выражении это 187 миль библиотечных полок и 12 тыс. тонн бумаги, в цифровом — более 700 Тб. В них включены 600 тыс. уникальных материалов.

В процессе реализации проекта были обеспечены необходимые условия сохранения контента; материалы хранятся в защищённой среде в соответствии с принципами охраны окружающей среды, что позволяет увеличить продолжительность использования этих ресурсов. При этом сэкономлено библиотечное пространство, а расходы на поддержку материальных носителей сократились. Подписаны соглашения о предоставлении доступа к научным ресурсам, в соответствии с которым библиотеки Альянса финансируют сохранение печатных журналов с резервными копиями. На первом этапе для сохранения были определены 240 тыс. томов, на втором добавятся 250 тыс.

Университет Иллинойса стал участником федеральной депозитарной библиотечной программы, которая охватывает разные материалы, касающиеся инженерных вопросов, водных ресурсов и т.д. Была проведена беспрецедентная работа, с тем чтобы обеспечить доступ к полным текстам документов для исследовательских целей, а также запущена программа, которая охватывает печатные монографии. Рабочая группа решает вопрос, как можно делиться подобными ресурсами со всеми библиотеками, для того чтобы учёные могли иметь к ним доступ.

Кроме того, эксперты библиотеки определили относящиеся к ценным и редким фондам материалы, которые требуют особого обращения, разработали руководство о том, как работать с повреждёнными книгами, как их сканировать, делать на них ссылки. В прошлом году более 5 тыс. таких изданий было добавлено в Hathi Trust.

Так же разработано положение, касающееся доступа слабовидящих людей к материалам Hathi Trust. Это, в частности, касается конверсии текста. Проект направлен на создание файлов в специальных форматах (дейзи-файлов), метаданных полных текстов. На сегодняшний день тестируется рабочий поток и определяются возможности доступа. Выделены специальные прокси-ID, чтобы студенты могли читать полные тексты. Постоянно ведётся работа над предоставлением доступа людям с другими видами инвалидности.

По мнению выступающей, сотрудничество библиотеки университета с Hathi Trust дало серьёзный стимул для изменений, внедрения новых сервисов, инноваций, расширения возможностей пользователей.

Жан-Люк ЯНКОВСКИЙ (Jean-Luc Jankowski), Flatirons Jouve, Франция

Конверсия старых книг в формат ePub 3 позволяет значительно расширить фонды. Библиотеки уже давно сохраняли контент, переводя его сначала на микроплёнку, а с 1990-х — в цифру. Постоянное улучшение серверов, совершенствование и стандартизация метаданных, кодирование текста в различных форматах и обмен между библиотеками позволяют открывать доступ к документам для многих пользователей и добиться новых результатов.

Национальная библиотека Франции более 20% собственного фонда перевела в формат, подходящий для мобильных устройств. Подавляющее большинство издателей конвертировало свои книги в цифровой формат, что серьёзно усилило их позиции и роль на рынке э-книг. Предпринимаются усилия по стандартизации подходов: хотя основные игроки предпочитают собственные форматы, многие из них внедряют ePub 3.

Одним из совместных проектов Flatirons Jouve и Национальной библиотеки Франции стал ресурс ReLIRE, позволивший открыть бесплатный доступ к книгам XX в. Специальный комитет, состоящий из издателей, учёных, библиотекарей, разработал принципы оцифровки этого контента. Проект позволял правообладателям видеть, есть ли их издание в списке, и обозначить форматы доступа к нему. 70% коллекций этого ресурса конвертировано в ePub 3, остальное — в pdf.

Проект управлялся коллективно: издателями и представителями общественности. Национальная библиотека Франции была в центре этой работы — как с научной точки зрения, так и с технической. Оцифровка изданий осуществлялась в течение полугода после публикации в реестре. Если автор в течение шести месяцев не возражал против оцифровки, то книгу передавали компании Flatirons Jouve, которая сканировала книги, вносила метаданные в каталог и контролировала качество изображений.

cherez-tsifr-nasledie-4

Однако 16 ноября 2016 г. Суд Евросоюза постановил, что авторы имеют эксклюзивное право разрешать или запрещать репродукцию, оцифровку и предоставление общественности их книг. В определённых условиях информация может быть предоставлена в доступ, но при этом обязательно нужно информировать автора о его праве запретить это, если он пожелает. Решение Госсовета Франции 7 июня 2017 г. относительно электронных версий книг XX в. поставило точку в инициативе ReLIRE. Но несмотря на то что проект был остановлен по правовым причинам, массовая оцифровка старых книг продолжилась в масштабах фонда Национальной библиотеки Франции.

Конверсия новых изданий в ePub 3 реализуется успешно, и компания Flatirons Jouve делает это в массовом порядке. В отношении старого фонда возникали серьёзные технические проблемы. Поскольку здесь важно высокое качество сканирования, необходима регулярная калибровка оборудования. Большие трудности связаны с транспарентностью бумаги и в ситуациях, когда текст накладывается на иллюстрации. Но все проблемы были разрешены благодаря собственным оригинальным методикам, разработанным ещё 25 лет назад и усовершенствованным на данный момент. Система умеет распознавать и обрабатывать слова, устранять ошибки. Оптимизация этого сервиса позволила получить решения для работы с литературным наследием и сделать его более доступным. На эту цель был направлен проект «Леку Плето» — специальный сервис, позволяющий работать с мультимедийными документами, задействовать мобильные платформы. По мнению эксперта, это достойная альтернатива дорогостоящим компьютерным решениям, ограничивающимся отдельными типами мобильных устройств. Платформа Flatirons Jouve позволяет осуществлять поиск, анимировать плоские изображения, использовать игры и т.д.


Рубрика: Формирование библиотечных фондов

Год: 2017

Месяц: Ноябрь

Теги: Агнешка Лишенска Харри Вервэйн Лин Норин Вайли