Книжный рынок и издательства   Библиотеки   Образование
и наука
  Конкурс
“Университетская книга”

Сентябрь 2019
"Революция Гутенберга 2.0 и будущее библиотек"

  • Сергей МАКАРЕНКОВ: «Издателю важно быть читателем...»
  • Библиотека университета 4.0
  • Российский книжный рынок: торжество non-fiction
  • Крымская пятилетка: обретения, потери, надежды



МультиВход

t8

 

Интервью

Книжный рынок

Вузовские издательства

Искусство издавать

Библиотеки

Образование

Инновационные технологии

Электронные библиотеки

Культура книги

Библиогеография

Библиотехнологии

Выставки и конференции

Конкурсы и премии

Документы

Copyright.ru

КНИГА+

Год литературы

Журнал Онлайн

 

obnar-zaimstv-2019

 

ufimskiy-salon-2019

 

lit-flagman1




 

rgdb-podari-rebenku


Рассылка


«Омека» как инструмент коллективного создания электронной библиотеки
06.04.2014 16:02

В рамках работы по созданию Электронной библиотеки произведений великих русских учёных ХVII–XIX вв. перед исполнителями проекта ставилась задача разработки такой технологии организации ресурса, чтобы он мог быть использован небольшим коллективом учёных. Следует отметить, что в настоящее время существует много видов программного обеспечения для создания больших и малых электронных библиотек, среди которых как зарубежные (SOLR, Greenstone), так и российские (Tlibra и «Ирбис») системы. Однако все они реализуют только библиотечные процессы – каталогизацию полных текстов и организацию поиска на сайте электронной библиотеки. В случае создания электронной библиотеки специалистами и для специалистов в определённой предметной области возникают дополнительные задачи. Попробуем на примере нашего проекта выявить круг этих задач и возможные методы их решения.


1. Работа подготовлена при поддержке РФФИ (грант 11-07-00750-а).

ТРЕБОВАНИЯ К БИБЛИОТЕКЕ

  • Распределение экспертов во времени и пространстве. Как правило, специалисты по истории науки – люди, занятые во множестве проектов. Соответственно, они должны иметь возможность работать там, где им удобно, и тогда, когда им удобно. Поэтому система должна иметь достаточно простой веб-интерфейс для ввода данных. Нужно сказать, что это условие самое простое, и ему удовлетворяют почти все системы, но хотелось бы подчеркнуть, что мы планировали работать именно с виртуальным исследовательским коллективом.
  • Созданная электронная библиотека должна быть включена в соответствующий сайт, на котором кроме поисковых форм должны присутствовать информация о проекте, система навигации и прочие элементы дизайна. Среди историков немного ИТ-специалистов, способных объединить в одно целое систему для создания сайта (CMS) и электронную библиотеку. Поэтому нам нужна была система для создания электронной библиотеки со встроенными возможностями CMS.
  • Как показывает опыт, каждый эксперт может иметь своё собственное мнение по поводу любого документа, включаемого в электронную библиотеку, поэтому необходимо обеспечить возможность обсуждения каждого документа, а система должна иметь сервис комментирования.
  • Много информации о российских учёных уже есть в различных базах, каталогах и электронных библиотеках. Поэтому для обогащения нашей библиотеки система должна уметь отправлять запросы по различным протоколам (OAI-PMH, LOD и т.п.) в многочисленные внешние источники для получения дополнительной информации.
  • Основными объектами, хранящимися в создаваемой электронной библиотеке, являются книги и статьи. Чаще всего они поступают в виде отсканированных и нераспознанных образов. Для возможности проведения поиска и частичного копирования необходим сервис распознавания. Однако книги ХVII–XIX вв. не очень хорошо распознаются средствами FineReader и их результаты нуждаются в корректировке. Процесс этот довольно трудоёмкий, и необходимо иметь возможность разделить обязанности по исправлению книги среди нескольких создателей библиотеки. Иными словами, нужен инструмент для коллективной работы по корректировке текста. Важность коллективной работы в виртуальной среде отмечала И.А. Бандурина [1], и авторы данной статьи совершенно с ней согласны.
  • Система должна поддерживать полнотекстовый поиск.

АНАЛИЗ И ОЦЕНКА СИСТЕМ

Для выбора нужного инструмента было оценено несколько систем. Поскольку самым существенным и ограничивающим авторов проекта условием было совмещение функций CMS и электронной библиотеки, анализ начался с портальных систем, для которых разработаны библиотечные модули. На сегодняшний день наиболее распространёнными являются MS SharePoint, к которому можно подключать внешние модули, Joomlа с модулем BookLibrary и Drupal с модулем Biblio. Опыт работы с MS SharePoint показал нецелесообразность рекомендации его коллективу историков для внедрения из-за сложности установки и настройки. Joomlа с модулем BookLibrary довольно успешно применяется в Российской государственной детской библиотеке для электронного каталога «Детям и о детях: издательства России сегодня» [2]. Опыт использования Drupal имеется в Институте вычислительных технологий СО РАН. В статье Ю.В. Леоновой и А.М. Федотова [3] приведено сравнение Joomlа с Drupal и дано подробное описание второй системы. Отметим, что обе системы имеют очень мощные компоненты для создания сайта и довольно развитые, но типично библиотечные составляющие, которые являются отдельными, закрытыми для внешнего разработчика плагинами. Сложность установки, настройки и отсутствие ряда необходимых функций не позволили выбрать эти системы для решения поставленной задачи. Поэтому авторы остановились на разработке «Oмека» Центра истории и новых медиа Роя Розенцвейга, находящегося в Фаерфаксе, Вирджиния, США (Roy Rosenzweig Center for Historyand New Media, http://chnm.gmu.edu/).

«Омека» – это бесплатная, гибкая и открытая платформа для представления цифровых данных в сети Интернет. Она достаточно проста в использовании и подойдёт для библиотек, музеев, архивов. Слово «омека» на суахили означает «разложить товар для продажи». Система спроектирована с учётом использования её нетехническими специалистами и позволяет сосредоточиться на данных и их представлении, а не на программировании.

ОБЛАСТИ ПРИМЕНЕНИЯ

omeka1«Омека» рассчитана на различных пользователей и используется во многих проектах (рис. 1). Нередко учёные используют её для публикации эссе или диссертаций, для использования оригиналов коллекций, а также для совместной работы в создании цифрового контента, например Digital Worcester (www.digitalworcester.org) или The World at the Fair (www.uclawce.ats.ucla.edu).

Специалисты музейного дела пользуются ею для создания онлайн-коллекций, которые не могут быть показаны в обычных условиях. Посетители могут проставить метки на образцах или пометить их как «любимые» и отправить информацию о них в различные социальные сети. В качестве примеров можно упомянуть проекты Inventing Europe: Technology and the Making of Europe (www.inventingeurope.eu), Gulag: Many Days, Many Lives (www.gulaghistory.org).

Для библиотекарей целесообразно её использование для представления каталогов онлайн или для публикации цифровых выставок. Например, это проект The Ringwood Public Library «Upper Ringwood» (www.upperringwood.org/index.php) или проект библиотеки университета Орегона Fighters on the Farm Front (www.scarc.library.oregonstate.edu/omeka/exhibits/show/fighters).

omeka2Преподавателям она может быть интересна при создании проверочных тестов для студентов, они могут разрабатывать учебные планы и создавать учебные модули.

Примеры таких проектов – Laurel Grove School в Вирджинии (www.chnm.gmu.edu/laurelgrove), Children and Youth in History (www.chnm.gmu.edu/cyh/) [5].

Таким образом, функционал «Омеки» позволяет осуществлять управление веб-сайтом, создавать электронные библиотеки и виртуальные музеи (рис. 2).

РЕШЕНИЕ ПОСТАВЛЕННОЙ ЗАДАЧИ

В качестве исходных материалов у разработчиков Электронной библиотеки произведений великих русских учёных ХVII–XIX вв. имелся набор из 300 библиографических записей в формате MARC 21 и отсканированные, нераспознанные книги в формате pdf, соответствующие этим записям. Необходимо было разработать и внедрить технологию, при помощи которой силами виртуального научного коллектива можно было бы создать электронную библиотеку, способную интегрироваться в мировое научное пространство и соответствующую основным требованиям к электронной библиотеке, изложенным выше. Остановимся на сегодняшних результатах, поскольку говорить об итогах рано – система постоянно дорабатывается. По адресу http://195.74.82.67/omekaPortal представлен интерфейс электронной библиотеки для читателей (рис. 3).

omeka3В соответствии с идеологией «Омеки», в системе существует три вида сущностей:

  • библиографические записи – описания основных единиц хранения в ЭБ (в нашем случае книги и статьи), в формате Dublin Core (простом или расширенном);
  • коллекции – описание совокупности библиографических записей в формате Dublin Core. В каждой записи проставляется признак принадлежности к той или иной коллекции, которые могут иметь отношение «выше – ниже» относительно друг друга, и на главной странице они могут быть представлены в виде дерева коллекций;
  • выставки – это совокупность предварительно отобранных библиографических записей и элементов дизайна, в котором они представляются пользователю.

Оценивая поставленные задачи и возможности дальнейшего использования «Омеки», мы пришли к выводу, что для разрабатываемого проекта наиболее подходит режим выставки с возможностью включения трудов каждого учёного и информации о них. Кроме этого, читателям доступны такие средства навигации, как временная лента, в которой отражаются годы создания работ, географическое распределение работ по местам их создания (рис. 4) и возможности комментирования каждой записи.

omeka4Понравившиеся записи пользователи могут выделить средствами большого количества социальных сетей, список которых настраивается дополнительно, а также отправить по почте.

Одно из наиболее полезных и интересных свойств «Омеки» – возможность организации коллективных работ по распознаванию текста. Для этого, кстати, также как и для полнотекстового поиска, используется технология MediaWiki, которая устанавливается на том же сервере, что и «Омека», и хранит все изменения распознанного текста. Для каждой страницы хранимой книги можно назначить отдельный процесс распознавания. На экран одновременно выводятся изображение и окно текстового редактора для ввода (редактирования) текста (рис. 5).

omeka5В любой момент можно посмотреть, кто внёс последние изменения в текст, и при необходимости вернуть исходный вид.

Для ввода информации в ЭБ предусмотрены следующие методы.

  • Заполнение форм в формате Dublin Core. Этот метод довольно стандартный, но следует обратить внимание на интересную возможность: при заполнении ряда полей имеется возможность автоматически обратиться в нормативную базу Библиотеки Конгресса США для получения подсказки о стандартной формулировке предметной рубрики, наименовании места, языке и т.п.
  • Импорт библиографических записей в формате Dublin Core. Следует отметить, что для импорта нужно представить данные в структуре CSV. Это необычная практика, и нам оказалось проще самим написать конвертер из Dublin Core в CSV, чем искать готовый.
  • Получение данных по протоколу OAI-PMH. «Омека» может работать как OAI-PMH-харвестер и как OAIPMH-провайдер. Метаданные нашей электронной библиотеки можно получить по адресу http://195.74.82.67/omekaPortal/oai-pmh-repository/request.

omeka6Одна из важных задач, которая ставилась перед системой, – это возможность обогащения наших метаданных информацией из других библиотек. К сожалению, «Омека» такой сервис не предоставляет, но при этом есть возможность написания дополнительных плагинов на PHP. Поэтому авторами проекта был разработан дополнительный плагин, который обращается с HTTP-запросом в библиотеку Europeana и на языке SPARQL во всем известное хранилище Linked Open Data – Dbpedia (текст запроса автоматически составляется на основе содержимого поля Subject). Полученные результаты записываются в библиографические записи в поле Relation в виде ссылок на документы в Europeana и Dbpedia (рис. 6). Пример запроса, отправляемого в Dbpedia, приведён ниже.

SELECT ?person

WHERE {

?person <http://xmlns.com/foaf/0.1/surname> ?sName.

FILTER (REGEX(STR(?sName), \”$sName\”)).

?person <http://xmlns.com/foaf/0.1/givenName> ?gName.

FILTER (REGEX(STR(?gName), \”$gName\”)). }

LIMIT 100

Подобным образом можно получать информацию из различных источников. Следует отметить, что, несмотря на всеобщее обсуждение на международных конференциях технологии Linked Open Data (LOD) и восторгов по поводу её применения, мы столкнулись с тем, что многие источники публикуют далеко не всю информацию по LOD, некоторые периодически отключаются без предупреждений, а в других формат SPARQL-запроса требует особенного синтаксиса, который не очень просто выяснить.

В заключение можно сказать, что технология «Омека» оправдала наши ожидания. Действительно, это простая система, лёгкая в установке, настройке и эксплуатации. Документация достаточно подробная [6], для испытания этой системы нет необходимости устанавливать её у себя на сервере. Можно попробовать бесплатно создать свою электронную библиотеку для экспериментов на сервере www.omeka.net. У «Омеки» нет больших возможностей по конструированию сайтов, но всё необходимое для сайта электронной библиотеки присутствует. Создатели ЭБ могут вводить данные, экспортировать и импортировать их, комментировать описания и совместно редактировать плохо распознанные тексты. Они могут обогащать свою коллекцию сведениями из других источников и разделять итог своего труда со всем миром. Не обходится, конечно, и без недостатков. Так, мы столкнулись c тем, что ряд готовых плагинов конфликтуют между собой, одна запись может принадлежать только к одной коллекции, большая часть плагинов, которые были сделаны для первой версии «Омеки», не совместимы со второй версией. То есть мы ещё раз убедились, что нет в мире совершенства.

Литература:

1. Бандурина И.А. Научная мобильность как фактор профессионального развития учёного в эпоху глобализации [Электронный ресурс] / И.А. Бандурина // Преподаватель высшей школы в ХХI веке». Юбилейная международная научно-практическая интернет-конференция. Секция «Профессионально-педагогическая культура преподавателя вуза, его компетенции и оценка эффективности педагогической деятельности» (октябрь 2013, Ростов-на-Дону). Материалы. – Режим доступа: http://www.t21.rgups.ru/sections/prof-pedag_kultura_prepod_vuza.

2. Сайт проекта «Детям и о детях: издательства России сегодня» www.cat.rgdb.ru.

3. Леонова Ю.В., Федотов А.М. Подход к построению электронных библиотек для поддержки коллективной работы сотрудников // Труды 12-й Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» – RCDL’2010. – Казань, 2010.

4. Kucsma J., Reiss K., Sidman A. Using Omeka to build digital collections: The METRO case study // D-Lib Magazine. – Volume 16. – Issue 3-4, 2010. – Режим доступа: www.dlib.org/dlib/march10/kucsma/03kucsma.html.

5. Allison C. Marsh. Omeka in the classroom: The challenges of teaching material culture in a digital world // Lit Linguist Computing (2013) 28 (2): 279–282 doi:10.1093/llc/fqs068.

6. Сайт системы «Омека» www.omeka.org.

Авторы Михаил Ефремович ШВАРЦМАН, начальник отдела исследования компьютерных систем Российской государственной библиотеки; Олег Павлович НАЙДИН, ведущий программист отдела исследования компьютерных систем Российской государственной библиотеки

Опубликовано в номере март 2014

 

Комментарии 

 
#1 Арсен Боровинский 27.04.2014 12:24
Не соглашусь, что модули для Drupal закрыты для разработчика. Они имеют открытый исходный код. Чтобы код под PHP закрыть - это надо еще постараться.
Однако, в чистом виде я бы не стал использовать модули Drupal т.к. конечный результат не соответствует современным ожиданиям пользователей.
К примеру, модуль MARC https://drupal.org/project/marc хранит метаданные в ноде drupal, что приведет к проблемам при работе с большими каталогами.
По моему мнению, библиографическ ая информация должна храниться в документо-ориентированных базах данных.

По поводу ревизионности: есть такая функция и в Drupal из коробки. Но в MediaWiki функционала заметно больше. Сам когда-то написал вики-парсер на 1500 строк для drupal, потом плюнул и стал использовать MediaWiki.

Omeka - система интересная. И хорошо, что на ZendFramework, под который легко найти разработчиков. Т.е. Omeka может стать отправной точкой для создания локального проекта с хорошим финансированием разработки.
Цитировать
 



Какие форматы доступа на электронную периодику для вас наиболее интересны?
 

 


webbanner-08-video

 

 webbanner-07-nacproekt

 

 webbanner-01-neb

 

 webbanner-02-fz-o-kulture

 

webbanner-red-03-ebs

 

webbanner-red-04-kn-rynok

 

 webbanner-red-05period-pechat

 

 webbanner-red-06-ros-poligrafiya

 

webbanner-red-10-sost-kultury

 
Copyright © ООО Издательский дом "Университетская книга" 2011
Все права защищены.
Студия Web-diamond.ru
разработка сайтов и интернет-магазинов.