В 2016 г. Нью-Йоркская публичная библиотека (NYPL) предоставила доступ к более чем 187 тыс. новых электронных материалов, содержание которых является общественным достоянием.
Всего же коллекция оцифрованных материалов содержит 673 451 документ. Сбор коллекции начался в 2005 г., когда NYPL запустила сайт «Цифровая галерея» (Digital Gallery) с 275 тыс. изображений из библиотечного собрания. С тех пор к ним добавлены сотни тысяч изображений вместе с метаданными, описывающими контекст.
Со временем сотрудники библиотеки осознали, что сайт не отвечает всем потребностям читателей, особенно исследователей или художников, желающих использовать в своих работах фрагменты культурного наследия. Поэтому летом 2013 г. команда цифрового хранилища объединила свои усилия с NYPL Labs, чтобы создать новый, современный проект. Так появился портал «Цифровые коллекции» (Digital Collections).
Сегодня в работе портала участвуют следующие подразделения NYPL:
• Отдел специальных коллекций;
• Главный исследовательский отдел;
• Отдел технологий NYPL;
• Отдел защиты авторского права;
• Группа цифровых экспериментов;
• NYPL Labs (производство и R&D*, группа обработки метаданных, группа обработки изображений, группа администрирования прав).
* Research and Development, R&D – совокупность работ, направленных на получение новых знаний и практическое применение при создании нового изделия или технологии.
Для удобства пользователей все материалы цифрового архива классифицированы по четырём признакам: время создания, жанр, коллекция, цвет.
По времени создания материалы коллекции относятся к XI–XX вв. (некоторые отнесены и к XXI в.). Самым большим разделом в этом каталоге оказался XIX век (более 70 тыс. материалов), далее следуют XX и XVII вв. с более чем 33 тыс. и 10 тыс. документов соответственно. Почти 7 тыс. документов относится к XV в. Дата происхождения свыше 64 тыс. информационных материалов неизвестна.
В жанровом отношении документы распределены по 29 группам, из которых самыми массовыми являются: стереоскопические виды (более 42 тыс. материалов), меню (около 18 тыс. ресурсов), карты (более 12 тыс. единиц). Почти 59 тыс. материалов не отнесены к какому-либо жанру.
Распределение по коллекциям отчасти повторяет распределение по жанрам, поскольку часто причиной формирования коллекции становился источник её происхождения. Так, самая объёмная – коллекция Роберта Н. Денниса, включающая более 42 тыс. стереоскопических видов материалов. На втором месте собрание эстампов и рисунков из коллекции Х.Г. Винхузена, содержащей почти 31 тыс. материалов. Третье место занимает коллекция меню Батольфа из почти 18 тыс. материалов.
Разделение по цветам сделано, видимо, с целью помочь художникам. Более всего материалов, в которых преобладает коричневый цвет, – свыше 124 тыс., на втором месте оранжевый (более 22 тыс.), на третьем – жёлтый (более 18 тыс.).
Дополнительный способ классификации материалов – распределение по подразделениям библиотеки. Наиболее массовыми являются материалы, относящиеся к отделам, работающим с документами о театре.
На портале цифрового архива можно скачать изображения в различных разрешениях, при этом для материалов, относящихся к общественному достоянию, доступны большие размеры и возможность получить их в формате tiff.
Что интересно, значительная часть программного кода, с помощью которого реализован цифровой архив, опубликована в открытом доступе на известном сервисе Github. |