В рамках работы по созданию Электронной библиотеки произведений великих русских учёных ХVII–XIX вв. перед исполнителями проекта ставилась задача разработки такой технологии организации ресурса, чтобы он мог быть использован небольшим коллективом учёных. Следует отметить, что в настоящее время существует много видов программного обеспечения для создания больших и малых электронных библиотек, среди которых как зарубежные (SOLR, Greenstone), так и российские (Tlibra и «Ирбис») системы. Однако все они реализуют только библиотечные процессы – каталогизацию полных текстов и организацию поиска на сайте электронной библиотеки. В случае создания электронной библиотеки специалистами и для специалистов в определённой предметной области возникают дополнительные задачи. Попробуем на примере нашего проекта выявить круг этих задач и возможные методы их решения.
ТРЕБОВАНИЯ К БИБЛИОТЕКЕ
АНАЛИЗ И ОЦЕНКА СИСТЕМ
Для выбора нужного инструмента было оценено несколько систем. Поскольку самым существенным и ограничивающим авторов проекта условием было совмещение функций CMS и электронной библиотеки, анализ начался с портальных систем, для которых разработаны библиотечные модули. На сегодняшний день наиболее распространёнными являются MS SharePoint, к которому можно подключать внешние модули, Joomlа с модулем BookLibrary и Drupal с модулем Biblio. Опыт работы с MS SharePoint показал нецелесообразность рекомендации его коллективу историков для внедрения из-за сложности установки и настройки. Joomlа с модулем BookLibrary довольно успешно применяется в Российской государственной детской библиотеке для электронного каталога «Детям и о детях: издательства России сегодня» [2]. Опыт использования Drupal имеется в Институте вычислительных технологий СО РАН. В статье Ю.В. Леоновой и А.М. Федотова [3] приведено сравнение Joomlа с Drupal и дано подробное описание второй системы. Отметим, что обе системы имеют очень мощные компоненты для создания сайта и довольно развитые, но типично библиотечные составляющие, которые являются отдельными, закрытыми для внешнего разработчика плагинами. Сложность установки, настройки и отсутствие ряда необходимых функций не позволили выбрать эти системы для решения поставленной задачи. Поэтому авторы остановились на разработке «Oмека» Центра истории и новых медиа Роя Розенцвейга, находящегося в Фаерфаксе, Вирджиния, США (Roy Rosenzweig Center for Historyand New Media, http://chnm.gmu.edu/).
«Омека» – это бесплатная, гибкая и открытая платформа для представления цифровых данных в сети Интернет. Она достаточно проста в использовании и подойдёт для библиотек, музеев, архивов. Слово «омека» на суахили означает «разложить товар для продажи». Система спроектирована с учётом использования её нетехническими специалистами и позволяет сосредоточиться на данных и их представлении, а не на программировании.
ОБЛАСТИ ПРИМЕНЕНИЯ
«Омека» рассчитана на различных пользователей и используется во многих проектах (рис. 1). Нередко учёные используют её для публикации эссе или диссертаций, для использования оригиналов коллекций, а также для совместной работы в создании цифрового контента, например Digital Worcester (www.digitalworcester.org) или The World at the Fair (www.uclawce.ats.ucla.edu).
Специалисты музейного дела пользуются ею для создания онлайн-коллекций, которые не могут быть показаны в обычных условиях. Посетители могут проставить метки на образцах или пометить их как «любимые» и отправить информацию о них в различные социальные сети. В качестве примеров можно упомянуть проекты Inventing Europe: Technology and the Making of Europe (www.inventingeurope.eu), Gulag: Many Days, Many Lives (www.gulaghistory.org).
Для библиотекарей целесообразно её использование для представления каталогов онлайн или для публикации цифровых выставок. Например, это проект The Ringwood Public Library «Upper Ringwood» (www.upperringwood.org/index.php) или проект библиотеки университета Орегона Fighters on the Farm Front (www.scarc.library.oregonstate.edu/omeka/exhibits/show/fighters).
Преподавателям она может быть интересна при создании проверочных тестов для студентов, они могут разрабатывать учебные планы и создавать учебные модули.
Примеры таких проектов – Laurel Grove School в Вирджинии (www.chnm.gmu.edu/laurelgrove), Children and Youth in History (www.chnm.gmu.edu/cyh/) [5].
Таким образом, функционал «Омеки» позволяет осуществлять управление веб-сайтом, создавать электронные библиотеки и виртуальные музеи (рис. 2).
РЕШЕНИЕ ПОСТАВЛЕННОЙ ЗАДАЧИ
В качестве исходных материалов у разработчиков Электронной библиотеки произведений великих русских учёных ХVII–XIX вв. имелся набор из 300 библиографических записей в формате MARC 21 и отсканированные, нераспознанные книги в формате pdf, соответствующие этим записям. Необходимо было разработать и внедрить технологию, при помощи которой силами виртуального научного коллектива можно было бы создать электронную библиотеку, способную интегрироваться в мировое научное пространство и соответствующую основным требованиям к электронной библиотеке, изложенным выше. Остановимся на сегодняшних результатах, поскольку говорить об итогах рано – система постоянно дорабатывается. По адресу http://195.74.82.67/omekaPortal представлен интерфейс электронной библиотеки для читателей (рис. 3).
В соответствии с идеологией «Омеки», в системе существует три вида сущностей:
Оценивая поставленные задачи и возможности дальнейшего использования «Омеки», мы пришли к выводу, что для разрабатываемого проекта наиболее подходит режим выставки с возможностью включения трудов каждого учёного и информации о них. Кроме этого, читателям доступны такие средства навигации, как временная лента, в которой отражаются годы создания работ, географическое распределение работ по местам их создания (рис. 4) и возможности комментирования каждой записи.
Понравившиеся записи пользователи могут выделить средствами большого количества социальных сетей, список которых настраивается дополнительно, а также отправить по почте.
Одно из наиболее полезных и интересных свойств «Омеки» – возможность организации коллективных работ по распознаванию текста. Для этого, кстати, также как и для полнотекстового поиска, используется технология MediaWiki, которая устанавливается на том же сервере, что и «Омека», и хранит все изменения распознанного текста. Для каждой страницы хранимой книги можно назначить отдельный процесс распознавания. На экран одновременно выводятся изображение и окно текстового редактора для ввода (редактирования) текста (рис. 5).
В любой момент можно посмотреть, кто внёс последние изменения в текст, и при необходимости вернуть исходный вид.
Для ввода информации в ЭБ предусмотрены следующие методы.
Одна из важных задач, которая ставилась перед системой, – это возможность обогащения наших метаданных информацией из других библиотек. К сожалению, «Омека» такой сервис не предоставляет, но при этом есть возможность написания дополнительных плагинов на PHP. Поэтому авторами проекта был разработан дополнительный плагин, который обращается с HTTP-запросом в библиотеку Europeana и на языке SPARQL во всем известное хранилище Linked Open Data – Dbpedia (текст запроса автоматически составляется на основе содержимого поля Subject). Полученные результаты записываются в библиографические записи в поле Relation в виде ссылок на документы в Europeana и Dbpedia (рис. 6). Пример запроса, отправляемого в Dbpedia, приведён ниже.
SELECT ?person
WHERE {
?person <http://xmlns.com/foaf/0.1/surname> ?sName.
FILTER (REGEX(STR(?sName), \”$sName\”)).
?person <http://xmlns.com/foaf/0.1/givenName> ?gName.
FILTER (REGEX(STR(?gName), \”$gName\”)). }
LIMIT 100
Подобным образом можно получать информацию из различных источников. Следует отметить, что, несмотря на всеобщее обсуждение на международных конференциях технологии Linked Open Data (LOD) и восторгов по поводу её применения, мы столкнулись с тем, что многие источники публикуют далеко не всю информацию по LOD, некоторые периодически отключаются без предупреждений, а в других формат SPARQL-запроса требует особенного синтаксиса, который не очень просто выяснить.
В заключение можно сказать, что технология «Омека» оправдала наши ожидания. Действительно, это простая система, лёгкая в установке, настройке и эксплуатации. Документация достаточно подробная [6], для испытания этой системы нет необходимости устанавливать её у себя на сервере. Можно попробовать бесплатно создать свою электронную библиотеку для экспериментов на сервере www.omeka.net. У «Омеки» нет больших возможностей по конструированию сайтов, но всё необходимое для сайта электронной библиотеки присутствует. Создатели ЭБ могут вводить данные, экспортировать и импортировать их, комментировать описания и совместно редактировать плохо распознанные тексты. Они могут обогащать свою коллекцию сведениями из других источников и разделять итог своего труда со всем миром. Не обходится, конечно, и без недостатков. Так, мы столкнулись c тем, что ряд готовых плагинов конфликтуют между собой, одна запись может принадлежать только к одной коллекции, большая часть плагинов, которые были сделаны для первой версии «Омеки», не совместимы со второй версией. То есть мы ещё раз убедились, что нет в мире совершенства.
Литература:
1. Бандурина И.А. Научная мобильность как фактор профессионального развития учёного в эпоху глобализации [Электронный ресурс] / И.А. Бандурина // Преподаватель высшей школы в ХХI веке». Юбилейная международная научно-практическая интернет-конференция. Секция «Профессионально-педагогическая культура преподавателя вуза, его компетенции и оценка эффективности педагогической деятельности» (октябрь 2013, Ростов-на-Дону). Материалы. – Режим доступа: http://www.t21.rgups.ru/sections/prof-pedag_kultura_prepod_vuza.
2. Сайт проекта «Детям и о детях: издательства России сегодня» www.cat.rgdb.ru.
3. Леонова Ю.В., Федотов А.М. Подход к построению электронных библиотек для поддержки коллективной работы сотрудников // Труды 12-й Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» – RCDL’2010. – Казань, 2010.
4. Kucsma J., Reiss K., Sidman A. Using Omeka to build digital collections: The METRO case study // D-Lib Magazine. – Volume 16. – Issue 3-4, 2010. – Режим доступа: www.dlib.org/dlib/march10/kucsma/03kucsma.html.
5. Allison C. Marsh. Omeka in the classroom: The challenges of teaching material culture in a digital world // Lit Linguist Computing (2013) 28 (2): 279–282 doi:10.1093/llc/fqs068.
6. Сайт системы «Омека» www.omeka.org.
Авторы Михаил Ефремович ШВАРЦМАН, начальник отдела исследования компьютерных систем Российской государственной библиотеки; Олег Павлович НАЙДИН, ведущий программист отдела исследования компьютерных систем Российской государственной библиотеки
Рубрика: Электронные библиотеки
Год: 2014
Месяц: Март
Теги: Михаил Шварцман Олег Найдин