авторефераты диссертаций БЕСПЛАТНАЯ БИБЛИОТЕКА РОССИИ

КОНФЕРЕНЦИИ, КНИГИ, ПОСОБИЯ, НАУЧНЫЕ ИЗДАНИЯ

<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ


Pages:     | 1 |   ...   | 23 | 24 || 26 |

«Электронные библиотеки: Перспективные Методы и Технологии, Электронные коллекции English Труды RCDL 2010 ...»

-- [ Страница 25 ] --

зователь фокусируется на публикациях за некото 5 Архитектура ПС ПЭБ рый период времени или осуществляет выборку публикаций определённых авторов. На рис. 1 приведена схема архитектуры ПС ПЭБ, поясняющая принципы взаимодействия компонен тов системы с пользователем и внешними информа- преобразование документов к внутреннему ционными ресурсами. представлению (поддерживаются все распро ПС ПЭБ состоит из следующих функциональных странённые форматы текстовых документов, подсистем: имеется возможность добавления поддержки но наполнения и актуализации коллекций вых форматов).

электронных документов;

В подсистеме реализованы описанные выше индексации электронных документов;

функции фильтрации целевых электронных доку информационного поиска;

ментов, содержащих тематическую информацию, от интерфейса пользователя. промежуточных документов, а также выделение Система является многопользовательской;

все значений метаданных документов.

подсистемы имеют распределённую многокомпо 5.2 Подсистема индексации электронных доку нентную внутреннюю структуру. Распределённость ментов компонентов ПС ПЭБ позволяет масштабировать их для создания обширных тематических коллекций В подсистеме индексации электронных доку (до десятков миллионов электронных документов) ментов реализован комплексный лингвистический путём введения в её состав дополнительных серве- анализ, содержащий этапы морфологической, син ров. таксической и семантической обработки. В резуль тате текст преобразуется во внутреннее представле 5.1 Подсистема наполнения и актуализации кол ние в соответствии с реляционно-ситуационной мо лекций электронных документов делью представления текста [5, 7]. Результат преоб Функции подсистемы наполнения и актуализа- разования сохраняется в хранилище индексатора.

ции коллекций электронных документов схожи с Использована структура данных, известная как «об аналогичными функциями веб-краулеров поиско- ратный индекс», которая модифицирована для эф вых систем интернета. фективной выборки документов с учётом метадан Подсистема осуществляет: ных и семантической информации слов.

обход внешних информационных ресурсов Оригинальные версии электронных документов (веб-сайтов, хранилищ документов);

сохраняются в хранилище коллекций.

получение электронных документов;

помещение полученных документов в кол лекцию, Рис. 1. Архитектура ПС ПЭБ фоновом режиме параллельно с обработкой поиско 5.3 Подсистема информационного поиска вых запросов пользователей.

На этапе поиска производится лингвистический анализ текста запроса пользователя по схеме, анало 7 Заключение гичной анализу текста документа. При обработке запроса рассчитывается релевантность документов Разработанные программные инструментальные запросу на основе статистической и семантической средства предназначены для создания и автоматиче информации [7] с учётом выборки документов, со- ского наполнения полнотекстовых электронных ответствующих заданным значениям метаданных. библиотек с сервисами высокоточного информаци Реализованный в системе семантико- онного поиска. Эти средства позволяют формиро статистический подход доказал свою эффектив- вать тематические коллекции электронных доку ность в рамках семинара РОМИП-2008 [6]. Подход ментов и автоматически пополнять их из различных даёт возможность поиска ситуаций, описываемых источников, включая сетевые ресурсы – сайты элек фразами и предложениями на естественном языке, тронных изданий. Автоматическое выделение авто включая вопросно-ответный режим поиска. ров, названий и дат публикации загружаемых доку ментов обеспечивает структурированность элек 5.4 Подсистема интерфейса пользователя тронных коллекций и более быстрый доступ к ис комым документам. Семантический поиск докумен Пользовательский интерфейс ПС ПЭБ представ тов и поиск по полям обеспечивают высокоточный ляет собой веб-форму и программный модуль обра поиск информации в электронной библиотеке.

ботки запроса. Интерфейс пользователя содержит Представляемые программные средства функ элементы, необходимые для ввода текста запроса и ционируют в распределенной вычислительной среде выбора значений метаданных. Для текстовых полей с возможностью масштабирования и обладают ря ввода предусмотрена интерактивная терминологи дом дополнительных особенностей:

ческая подсказка на основе тезаурусов предметной области (с учётом таксономии терминов, переводом работа со всеми распространенными фор на другие языки). матами текстовых документов;

Результаты поиска предоставляются пользовате- работа с документами на русском, англий лю в виде списка ссылок на найденные документы с ском, немецком языках с возможностью поддержки краткими аннотациями. Сохранённые полнотексто- других языков;

вые копии доступны пользователю на этапе про- уточнение поисковых запросов с помощью смотра результатов поиска (если это не противоре- тезаурусов и словарей;

чит лицензионному соглашению об использовании для работы с полнотекстовой электронной материалов информационного ресурса – источника библиотекой используется веб-интерфейс;

электронных документов).

интеграция с системой автоматизации биб лиотек ИРБИС – поиск по библиографическим опи 6 Развёртывание ПС ПЭБ саниям.

С помощью разработанных программных Развёртывание электронной библиотеки на ос средств была создана медицинская электронная нове ПС ПЭБ включает следующие шаги:

библиотека, включающая коллекцию медицинских 1. Установка программных модулей ПС ПЭБ журналов (400 тыс. документов), коллекцию клини на серверы и их конфигурирование.

ческих руководств (30 тыс. документов) и коллек 2. Определение тематики коллекций, в кото цию авторефератов (900 документов). Все докумен рых будет производиться поиск и выбор информа ты загружались в коллекции автоматически из ин ционных ресурсов (веб-сайтов, хранилищ электрон тернета с выделением полей метаданных. МЭБ вне ных документов) – доверенных источников инфор дрена в библиотеке Медицинского центра Банка мации.

России и активно используется медицинскими ра 3. Анализ структуры информационных источ ботниками при поиске профильной информации.

ников, определение множества выделяемых мета Демонстрационная версия полнотекстовой элек данных электронных документов и настройка под тронной библиотеки доступна в интернете по адре системы наполнения и актуализации коллекций су http://elib.isa.ru. Библиотека содержит коллекции электронных документов.

по нанотехнологиям, медицине и генетике (более 4. Настройка подсистемы интерфейса пользо тыс. документов).

вателя с учётом выбранных метаданных, по кото рым будет выполняться поиск, подготовка инфор Литература мационно-справочных ресурсов – тезаурусов пред метных областей – и их интеграция в подсистему [1] Абросимов А.Г., Зуев Д.С. Научно-образова интерфейса пользователя.

тельная электронная библиотека ВУЗа // Труды Впоследствии в систему могут быть добавлены RCDL-2008. – http://rcdl.ru/doc/2008/374_379_ как новые информационные ресурсы в уже сущест paper46.pdf.

вующие коллекции, так и новые тематические кол [2] Золотова Г.А., Онипенко Н.К., Сидорова М.Ю.

лекции. Актуализация коллекций производится в Коммуникативная грамматика русского языка. – М., 2004. – 544 с. of linguistic knowledge to search precision im [3] Паринов С.И. Развитие электронных библиотек provement // Proc. of 4th Int. IEEE Conf. on Intel – путь к открытой науке // Труды RCDL-2009. – ligent Systems, 2008. – V. 2. – P. 17-2-17-5.

http://rcdl.ru/doc/2009/225_234_Invited-2.pdf.

[4] Тихомиров И.А, Смирнов И.В. Интеграция лин гвистических и статистических методов поиска Software for creation and filling full-text в поисковой машине Exactus // Труды межд. electronic libraries конф. Диалог'2008. – С. 485-491.

G.I. Nazarenko, V.A. Plotnikova, I.V. Smirnov, [5] Осипов Г.С. Приобретение знаний интел I.V. Sochenkov, I.A. Tikhomirov лектуальными системами: Основы теории и технологии. – М.: Наука, Физматлит, 1997. – The paper presents software tools for full-text electronic 112 с.

libraries with automatic filling with documents, detec [6] Смирнов И.В., Соченков И.В., Муравьев В.В., tion of documents’ meta-fields and high-precision Тихомиров И. А. Результаты и перспективы по search in the e-library. The software provides rapid cre искового алгоритма Exactus // Труды российско ation of thematic collections of electronic documents го семинара по оценке методов информацион from several network resources and high-relevant ного поиска РОМИП'2007-2008. – Санкт search results.

Петербург: НУ ЦСИ, 2008. – С. 66-76.

[7] Osipov G., Smirnov I., Tikhomirov I. Application Программные средства создания и наполнения полнотекстовых электронных библиотек © Г.И. Назаренко1, В.А. Плотникова1, И.В. Смирнов2, И.В. Соченков2, И.А. Тихомиров Медицинский центр Банка России Учреждение Российской академии наук Институт системного анализа РАН, г. Москва ivs@isa.ru граммные средства полнотекстовых электронных Аннотация библиотек (ПС ПЭБ), и медицинская электронная В работе представлены программные сред- библиотека (МЭБ), функционирующая на их основе.

ства полнотекстовых электронных библио- ПС ПЭБ, обеспечивает автоматическое наполнение тек с сервисами автоматического наполне- коллекций электронной библиотеки документами из ния документами, автоматического опреде- различных источников и высокоточный поиск до ления полей метаданных документов и вы- кументов в электронной библиотеке.

сокоточного семантического поиска ин 2 Автоматическое наполнение полно формации. Указанные программные сред текстовой электронной библиотеки ства позволяют быстро сформировать тема тические коллекции электронных докумен Электронная библиотека состоит из коллекций тов из различных сетевых источников и электронных документов. Каждая коллекция содер обеспечивают высокорелевантные резуль жит документы по одной теме. Документы загру таты поиска документов.

жаются автоматически из сетевых ресурсов (интер 1 Введение нет, интранет) или заносятся вручную. Как уже бы ло отмечено, перспективным является способ авто Полнотекстовые электронные библиотеки явля- матического наполнения, когда для каждой коллек ются эффективным инструментом для поиска ин- ции задаётся набор сетевых и локальных ресурсов, формации в научной и образовательной среде. На- из которых необходимо автоматически загружать учные знания делятся на узконаправленные облас- документы (обычно это веб-сайты) для пополнения ти, по каждой из которых существует множество коллекции.

электронных источников информации, включая Для автоматического наполнения электронной специализированные журналы, сборники трудов библиотеки из сетевых ресурсов разработан про научных конференций и другие информационные граммный модуль – краулер, который обходит веб ресурсы. Электронные библиотеки с тематическими сайты по гипертекстовым ссылкам и загружает коллекциями полнотекстовых документов позволя- электронные документы в библиотеку.

ют получать достоверную информацию в одной Сложность автоматического наполнения коллек определенной области человеческой деятельности, ций электронной библиотеки электронными доку исключая недостоверную и рекламную информа- ментами из источников в интернете заключается в цию, что отличает их от традиционных поисковых том, что на сайтах содержится много сопутствую машин. В связи с этим актуально создание темати- щей информации – новости, содержание выпусков ческих коллекций электронных документов и объе- журналов, контактная информация и проч., в то динение их в электронные библиотеки с сервисами время как в электронную библиотеку должны по полнотекстового поиска. пасть только целевые документы. Для решения этой Известно, что большинство научных и научно- задачи в краулере реализована специальная проце популярных изданий размещают в свободном дос- дура, которая на основании HTML-структуры и тупе электронные версии публикаций. Это даёт других характеристик страниц сайта определяет, возможность автоматически наполнять электронные какие документы необходимо загружать в библио коллекции документами из ресурсов интернета. При теку, а какие нет. Эта процедура использует шабло этом могут быть отобраны только достоверные про- ны на основе регулярных выражений и XPath веренные ресурсы, соответствующие тематике элек- выражений, которые применяются к URL и к DOM тронной коллекции. В то же время при работе с деревьям HTML-документов соответственно.

большими объёмами полнотекстовых документов Шаблоны формируются вручную на основе ана возникают задачи обеспечения точности поиска лиза структуры сайта и выделения подразделов, информации. содержащих целевые документы, и хранятся в кон Институтом системного анализа РАН совместно фигурационном файле, создаваемом отдельно для с Медицинским центром Банка России созданы про- каждого сайта.

Подключение нового источника загрузки доку- 4 Высокоточный полнотекстовый поиск ментов заключается в создании конфигурационного документов и поиск по метаданным файла, что занимает от 10 до 30 минут в зависимо Поисковые сервисы являются неотъемлемой ча сти от сложности структуры сайта. Для каждого стью полнотекстовой электронной библиотеки. Из сетевого ресурса задаётся периодичность обхода, вестно, что традиционные подходы к поиску ин что позволяет автоматически пополнять коллекции формации основываются на статистических харак новыми публикуемыми документами и поддержи теристиках слов документов (используются, напри вать их в актуальном состоянии.

мер, TFIDF веса слов), при этом поиск документов Таким образом, уже на этапе наполнения элек сводится к поиску по ключевым словам, в лучшем тронной библиотеки производится отсечение неце случае с учётом морфологии языка. Очень часто левой информации, что впоследствии способствует такой подход даёт слаборелевантные результаты.

повышению точности информационного поиска и В течение последних лет были созданы ориги значительному уменьшению объёмов хранимых нальные методы информационного поиска, которые данных.

объединяют статистические и лингвистические 3 Автоматическое определение метадан- подходы к обработке текстов на естественном языке ных документов: авторов, названий, дат [4, 5, 7]. В частности, эти методы позволяют выпол нять семантический поиск информации, т. е. поиск публикации по смыслу запросов.

Документы в электронных коллекциях структу- Семантический поиск информации основан на рированы по метаданным. Это означает, что для лингвистической теории, описывающей законы пе каждого документа, как правило, известны авторы, редачи осмысленной информации в естественном название, дата публикации, источник публикации. языке [2]. Опираясь на эту теорию, смысл высказы Структурированность документов обеспечивает ваний на естественном языке можно представить с более точный поиск информации и позволяет созда- помощью неоднородных семантических сетей, ко вать систематические каталоги по авторам, изда- торые позволяют реализовать смысловое сравнение тельствам, названиям документов. текстов запроса и документов и определить смы При автоматическом наполнении электронной словую близость между ними. Для выполнения се библиотеки документами из сетевых ресурсов воз- мантического поиска все документы электронной никает задача автоматического определения значе- библиотеки подвергаются морфологическому, син ний метаданных загружаемых документов. Решение таксическому и семантическому анализу.

этой задачи основывается на анализе структуры Использование методов семантического поиска в целевых документов и промежуточных гипертек- электронной библиотеке обеспечивает высокоточ стовых страниц, содержащих оглавления выпусков ный поиск документов по их полным текстам по журналов, подборок статей и т. п. Обычно эти стра- запросам на естественном языке [6]. Кроме того, ницы имеют регулярную HTML-структуру и пред- семантический полнотекстовый поиск позволяет ставляют собой списки публикуемых документов с находить не только документы в электронной биб указанием авторов, названий и другой информации, лиотеке, но и непосредственно ответы на интере включая ссылки на сами документы. Это позволяет сующие пользователя вопросы по выбранной теме краулеру автоматически выделять значения полей (коллекции). При этом у пользователя сохраняется документов на основании правил, которые также возможность формулировки запроса в виде набора задаются в конфигурационном файле для каждого ключевых слов, если он считает этот вид поиска отдельного ресурса. наиболее подходящим для удовлетворения собст Для выделения значений метаданных докумен- венной информационной потребности.

тов реализована специальная процедура, которая В разработанных ПС ПЭБ существует возмож определяет значения полей двумя путями: ность поиска документов не только по полнотексто • непосредственно из целевых документов;

вому содержанию, но и по автору, названию, дате • из промежуточных документов в формате публикации и источнику, с которого был получен HTML, содержащих ссылки и описания целевых документ. Авторы и название задаются в поисковом документов. запросе в произвольной форме на естественном Работа процедуры основана на применении языке, при этом результаты поиска по этим полям XPath-шаблонов к DOM деревьям HTML- объединяются логикой «И».

документов. Таким образом, средства полнотекстового се Автоматическое выделение полей метаданных мантического поиска и поиска по метаданным до позволяет организовать в электронных коллекциях кументов повышают эффективность поиска необхо не только эффективный полнотекстовый поиск ин- димой информации в полнотекстовой электронной формации, но также такой вид поиска, когда поль- библиотеке.

зователь фокусируется на публикациях за некото 5 Архитектура ПС ПЭБ рый период времени или осуществляет выборку публикаций определённых авторов. На рис. 1 приведена схема архитектуры ПС ПЭБ, поясняющая принципы взаимодействия компонен тов системы с пользователем и внешними информа- преобразование документов к внутреннему ционными ресурсами. представлению (поддерживаются все распро ПС ПЭБ состоит из следующих функциональных странённые форматы текстовых документов, подсистем: имеется возможность добавления поддержки но наполнения и актуализации коллекций вых форматов).

электронных документов;

В подсистеме реализованы описанные выше индексации электронных документов;

функции фильтрации целевых электронных доку информационного поиска;

ментов, содержащих тематическую информацию, от интерфейса пользователя. промежуточных документов, а также выделение Система является многопользовательской;

все значений метаданных документов.

подсистемы имеют распределённую многокомпо 5.2 Подсистема индексации электронных доку нентную внутреннюю структуру. Распределённость ментов компонентов ПС ПЭБ позволяет масштабировать их для создания обширных тематических коллекций В подсистеме индексации электронных доку (до десятков миллионов электронных документов) ментов реализован комплексный лингвистический путём введения в её состав дополнительных серве- анализ, содержащий этапы морфологической, син ров. таксической и семантической обработки. В резуль тате текст преобразуется во внутреннее представле 5.1 Подсистема наполнения и актуализации кол ние в соответствии с реляционно-ситуационной мо лекций электронных документов делью представления текста [5, 7]. Результат преоб Функции подсистемы наполнения и актуализа- разования сохраняется в хранилище индексатора.

ции коллекций электронных документов схожи с Использована структура данных, известная как «об аналогичными функциями веб-краулеров поиско- ратный индекс», которая модифицирована для эф вых систем интернета. фективной выборки документов с учётом метадан Подсистема осуществляет: ных и семантической информации слов.

обход внешних информационных ресурсов Оригинальные версии электронных документов (веб-сайтов, хранилищ документов);

сохраняются в хранилище коллекций.

получение электронных документов;

помещение полученных документов в кол лекцию, Рис. 1. Архитектура ПС ПЭБ фоновом режиме параллельно с обработкой поиско 5.3 Подсистема информационного поиска вых запросов пользователей.

На этапе поиска производится лингвистический анализ текста запроса пользователя по схеме, анало 7 Заключение гичной анализу текста документа. При обработке запроса рассчитывается релевантность документов Разработанные программные инструментальные запросу на основе статистической и семантической средства предназначены для создания и автоматиче информации [7] с учётом выборки документов, со- ского наполнения полнотекстовых электронных ответствующих заданным значениям метаданных. библиотек с сервисами высокоточного информаци Реализованный в системе семантико- онного поиска. Эти средства позволяют формиро статистический подход доказал свою эффектив- вать тематические коллекции электронных доку ность в рамках семинара РОМИП-2008 [6]. Подход ментов и автоматически пополнять их из различных даёт возможность поиска ситуаций, описываемых источников, включая сетевые ресурсы – сайты элек фразами и предложениями на естественном языке, тронных изданий. Автоматическое выделение авто включая вопросно-ответный режим поиска. ров, названий и дат публикации загружаемых доку ментов обеспечивает структурированность элек 5.4 Подсистема интерфейса пользователя тронных коллекций и более быстрый доступ к ис комым документам. Семантический поиск докумен Пользовательский интерфейс ПС ПЭБ представ тов и поиск по полям обеспечивают высокоточный ляет собой веб-форму и программный модуль обра поиск информации в электронной библиотеке.

ботки запроса. Интерфейс пользователя содержит Представляемые программные средства функ элементы, необходимые для ввода текста запроса и ционируют в распределенной вычислительной среде выбора значений метаданных. Для текстовых полей с возможностью масштабирования и обладают ря ввода предусмотрена интерактивная терминологи дом дополнительных особенностей:

ческая подсказка на основе тезаурусов предметной области (с учётом таксономии терминов, переводом работа со всеми распространенными фор на другие языки). матами текстовых документов;

Результаты поиска предоставляются пользовате- работа с документами на русском, англий лю в виде списка ссылок на найденные документы с ском, немецком языках с возможностью поддержки краткими аннотациями. Сохранённые полнотексто- других языков;

вые копии доступны пользователю на этапе про- уточнение поисковых запросов с помощью смотра результатов поиска (если это не противоре- тезаурусов и словарей;

чит лицензионному соглашению об использовании для работы с полнотекстовой электронной материалов информационного ресурса – источника библиотекой используется веб-интерфейс;

электронных документов).

интеграция с системой автоматизации биб лиотек ИРБИС – поиск по библиографическим опи 6 Развёртывание ПС ПЭБ саниям.

С помощью разработанных программных Развёртывание электронной библиотеки на ос средств была создана медицинская электронная нове ПС ПЭБ включает следующие шаги:

библиотека, включающая коллекцию медицинских 1. Установка программных модулей ПС ПЭБ журналов (400 тыс. документов), коллекцию клини на серверы и их конфигурирование.

ческих руководств (30 тыс. документов) и коллек 2. Определение тематики коллекций, в кото цию авторефератов (900 документов). Все докумен рых будет производиться поиск и выбор информа ты загружались в коллекции автоматически из ин ционных ресурсов (веб-сайтов, хранилищ электрон тернета с выделением полей метаданных. МЭБ вне ных документов) – доверенных источников инфор дрена в библиотеке Медицинского центра Банка мации.

России и активно используется медицинскими ра 3. Анализ структуры информационных источ ботниками при поиске профильной информации.

ников, определение множества выделяемых мета Демонстрационная версия полнотекстовой элек данных электронных документов и настройка под тронной библиотеки доступна в интернете по адре системы наполнения и актуализации коллекций су http://elib.isa.ru. Библиотека содержит коллекции электронных документов.

по нанотехнологиям, медицине и генетике (более 4. Настройка подсистемы интерфейса пользо тыс. документов).

вателя с учётом выбранных метаданных, по кото рым будет выполняться поиск, подготовка инфор Литература мационно-справочных ресурсов – тезаурусов пред метных областей – и их интеграция в подсистему [1] Абросимов А.Г., Зуев Д.С. Научно-образова интерфейса пользователя.

тельная электронная библиотека ВУЗа // Труды Впоследствии в систему могут быть добавлены RCDL-2008. – http://rcdl.ru/doc/2008/374_379_ как новые информационные ресурсы в уже сущест paper46.pdf.

вующие коллекции, так и новые тематические кол [2] Золотова Г.А., Онипенко Н.К., Сидорова М.Ю.

лекции. Актуализация коллекций производится в Коммуникативная грамматика русского языка. – М., 2004. – 544 с. of linguistic knowledge to search precision im [3] Паринов С.И. Развитие электронных библиотек provement // Proc. of 4th Int. IEEE Conf. on Intel – путь к открытой науке // Труды RCDL-2009. – ligent Systems, 2008. – V. 2. – P. 17-2-17-5.

http://rcdl.ru/doc/2009/225_234_Invited-2.pdf.

[4] Тихомиров И.А, Смирнов И.В. Интеграция лин гвистических и статистических методов поиска Software for creation and filling full-text в поисковой машине Exactus // Труды межд. electronic libraries конф. Диалог'2008. – С. 485-491.

G.I. Nazarenko, V.A. Plotnikova, I.V. Smirnov, [5] Осипов Г.С. Приобретение знаний интел I.V. Sochenkov, I.A. Tikhomirov лектуальными системами: Основы теории и технологии. – М.: Наука, Физматлит, 1997. – The paper presents software tools for full-text electronic 112 с.

libraries with automatic filling with documents, detec [6] Смирнов И.В., Соченков И.В., Муравьев В.В., tion of documents’ meta-fields and high-precision Тихомиров И. А. Результаты и перспективы по search in the e-library. The software provides rapid cre искового алгоритма Exactus // Труды российско ation of thematic collections of electronic documents го семинара по оценке методов информацион from several network resources and high-relevant ного поиска РОМИП'2007-2008. – Санкт search results.

Петербург: НУ ЦСИ, 2008. – С. 66-76.

[7] Osipov G., Smirnov I., Tikhomirov I. Application Система управления электронными библиотеками LibMeta © А.А. Захаров, В.А. Серебряков ВЦ РАН, г. Москва andreya@sufler.ru, serebr@ccas.ru касающихся разных аспектов ЭБ, однако нет тако Аннотация го всеобъемлющего стандарта, который описывал бы такие системы со всех точек зрения;

кроме Представлена система управления элек того, в настоящее время во многих системах ЭБ тронной библиотекой (СУЭБ) LibMeta, зачастую стандарты не применяются вовсе либо предназначенная для научных институ применены в ограниченном или изменённом виде.

тов РАН, входящих в ЕНИП. Описана её архитектура, рассмотрены стандарты, В Вычислительном центре РАН на протяжении положенные в её основу, а также решае- нескольких лет ведётся исследование вопросов, мые ею основные проблемы. Также пере- связанных с ЭБ, и как результат этих исследова лагается вниманию электронная библио- ний в данной статье представлена СУЭБ LibMeta.

тека «Научное наследие России», осно- В первой части статьи более подробно рас ванная на СУЭБ LibMeta. смотрены основные проблемы и требования к ЭБ, во второй части обсуждаются наиболее полезные 1 Введение стандарты в сфере ЭБ и в третьей части представ В течение последних лет, в связи с бурным ляется СУЭБ LibMeta.

развитием интернета и экспоненциальным увели 2 Требования к электронной библиоте чением количества информации в нем, всё больше ке и больше ощущается потребность в наличии средств поиска и каталогизации информации, ко Современный мир предъявляет повышенные торые позволили бы находить информацию не требования ко всем информационным системам: с только по ключевым словам, как это делают уни точки зрения пользователей они должны быть версальные поисковые системы, но и по семанти удобными в использовании, простыми в изучении;

ке и отношениям её с другой информацией. Одной а с технической точки зрения должны быть тесно из мер по удовлетворению такой потребности яв связаны с другими информационными системами ляется появление и всё большее распространение и предоставлять стандартизованные службы. Все различного рода электронных библиотек (ЭБ).

эти требования в полной мере относятся и к элек Зачастую понятие ЭБ смешивают с уже давно тронным библиотекам.

существующими электронными каталогами – ин Мы будем рассматривать требования к ЭБ в формационными системами, предназначенными контексте ЕНИП, поскольку СУЭБ LibMeta разра для использования в обычных библиотеках, со батывалась как СУЭБ, в первую очередь предна держащими только метаинформацию и служащи значенная для научных институтов в составе РАН ми средствами поиска. ЭБ – это совершенно дру и других организаций, пожелавших предоставить гой класс систем: они хранят не только метадан свои ресурсы в ЕНИП.

ные, но и полные тексты информационных ресур сов. Ещё одним важным отличием ЭБ от элек- 2.1 Интеграция с информационными система тронных каталогов является то, что в качестве ми информационного ресурса может пониматься Фактически любая современная информаци фактически всё, что угодно, например, музейные онная система и, в частности, ЭБ должна быть предметы или архивные материалы. В связи с интегрирована с другими информационными сис этим можно говорить о сближении задач ЭБ, элек темами. Такой подход даёт сразу несколько серь тронных архивов и цифровых музеев – все эти ёзных преимуществ:

информационные системы фактически являются • отсутствие дублирования данных: исход ЭБ с различной специализацией.

ные данные хранятся только в одной информа Однако на пути развития ЭБ как в мире, так и в ционной системе, в других системах они ис России до сих пор есть множество препятствий.

пользуются по ссылкам того или иного вида либо Главным из них является отсутствие стандартиза реплицируются и автоматически обновляются при ции в данной области. Конечно же, существует обновлении оригинала;

большое количество стандартов, так или иначе • централизованные сервисные службы, на Труды 12й Всероссийской научной конференции пример, служба аутентификации и авторизации «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» – RCDL’2010, Казань, Россия, пользователей: пользователи системы вводят лет стала разработка распределённых информаци свою идентификационную информацию и прохо- онных систем. Причинами такого бурного роста дят аутентификацию единожды для всей группы стали достижения одновременно в нескольких связанных информационных систем;

областях, среди них отметим следующие:

• • интеграция информационных ресурсов: значительный рост пропускной способно ресурсы, даже хранящиеся в разных системах, сти каналов связи;

скорость обмена по ним при представляются связанными друг с другом единой ближается к скоростям внутренних шин компью системой навигации. теров;

• Естественно, чтобы снизить сложность разра- рост производительности компьютеров ботки таких интегрированных информационных как по скорости, так и по объёмам памяти, и опе систем, имеет смысл строить их на одной общей ративной, и внешней;

архитектурной и технологической основе. Одним • широкое проникновение компьютеров и из таких архитектурных решений является единое компьютерных технологий в повседневную дея научное информационное пространство (ЕНИП) тельность как большинства организаций и учреж РАН. Оно призвано удовлетворить потребность дений, так и граждан;

научных сотрудников в необходимости как поис- • развитие интернета, обеспечивающего ка качественной информации, так и выставления простой и надёжный доступ к невероятному числу собственной информации в интернете. информационных ресурсов;

Основу ЕНИП РАН составляют, прежде всего, • развитие самих информационных техно стандарты на метаданные информации, циркули- логий;

с этой точки зрения можно сказать, что рующей в ЕНИП [1]. Эти стандарты должны отве- программирование находится на четвёртой фазе чать следующим требованиям: своего развития: 1) «классическое» программиро • включать в себя основные типы информа- вание (сначала в кодах, затем на ассемблере, затем ции, требующейся для поддержки работы научно- на языках высокого уровня) для больших ЭВМ;

2) го сотрудника;

«классическое» программирование для персо • быть открытыми, то есть обеспечивать нальных ЭВМ;

3) программирование с использо доступ к соответствующей информации по этим вание визуальных и CASE-средств;

4) «сетевое»

описаниям;

программирование.

• быть расширяемыми, то есть обеспечи- Тенденция по увеличению доли распределён вать возможность детализации описаний;

ных систем не обошла и Российскую академию • обеспечивать возможности интеграции наук, которая имеет разветвлённую структуру, информации;

объединяет большое число научно • исследовательских учреждений и коллективов, обеспечивать возможности уникальной расположенных на всей территории России и во идентификации информации;

влечённых во все многообразие видов научной • обеспечивать возможности размещения и деятельности. Эти учреждения обладают уни поиска информации в распределённой среде;

кальными научными информационными ресурса • обеспечивать возможности интеропера ми, среди которых: опубликованные результаты бельности с внешней средой.

научных исследований и экспериментов, библио Кроме перечисленного, рекомендуется, чтобы графические и фактографические базы данных, схемы метаданных были ориентированными на сведения об учёных, их научной деятельности, семантический веб (Semantic Web) [2, 3].

публикациях, проектах и т. п. Эти ресурсы пред Схемы метаданных играют в ЕНИП двоякую ставляют значительный интерес для сотрудников роль. С одной стороны, они служат «обменными научных и административных учреждений, чле схемами», с разными уровнями детализации, для нов мирового научного сообщества, представите обмена данными между системами, входящими в лей промышленности и предпринимателей, кото ЕНИП. С другой стороны, в рамках ЕНИП стоит рые заинтересованы во внедрении результатов задача не только предложить обменные схемы, но научных исследований.

и разработать конкретные типовые информацион В связи с перечисленными факторами при раз ные системы для научных институтов, библиотек, работке современной ЭБ, в особенности, в среде издательских отделов и пр., которые дали бы сти ЕНИП, повышенное внимание следует уделять мул к информационному наполнению ЕНИП. Ка созданию средств взаимодействия ЭБ друг с дру ждую конкретную предметную область предлага гом, а также средств организации распределённых ется описывать отдельной схемой, точнее, набо ЭБ, в которых данные, объём которых зачастую ром схем (профилем метаданных), соответствую может быть настолько велик, что их нельзя хра щим образом ссылающихся друг на друга.

нить в одной ЭБ, «размазаны» между отдельными 2.2 Распределённость хранилищами, При этом существуют специальные средства поиска и каталогизации, работающие над Одним из наиболее бурно развивающихся на всеми данными такой распределённой ЭБ.

правлений информационной индустрии последних 2.3 Следование стандартам многих участников. За простотой пользователь ского интерфейса скрывается целая подсистема Когда говорят о стандартизации в сфере ЭБ, подготовки ресурсов, включающая в себя сле зачастую приходят к трём основным проблемам:

дующие компоненты:

• отсутствие единых взглядов на архитек • службы оцифровки – службы, создавае туру ЭБ;

мые при библиотеках, музеях и других поставщи • наличие большого количества стандартов ках данных, там, где возможен непосредственный на форматы метаданных и данных;

доступ к оцифровываемым материалам;

• слабая реализация стандартов в сущест- • служба контроля качества оцифровки – вующих ЭБ. единая служба контроля качества оцифровывае Оправданием обычно служит то, что каждая мых данных, в которой задействованы специали ЭБ по своей сути уникальна, и все они не могут сты по оцифровываемым предметам;

несмотря на опираться на одни и те же стандарты. Тем не ме- то, что первичный контроль качества выполняется нее, следует отметить, что в мире обычных биб- при самой оцифровке, зачастую происходит утеря лиотек метаданные (картотека) достаточно хоро- какой-либо части оцифровываемых данных либо, шо формализованы и стандартизованы, по край- с точки зрения специалиста по оцифровываемым ней мере на уровне национальных стандартов. данным оцифровка выполнена в не полном объё Таким образом, можно считать, что необходим по ме;

крайней мере единый и достаточный стандарт на • служба подготовки метаданных – иногда метаданные.

может быть объединена со службой оцифровки, Со стандартизацией форматов данных ситуа однако следует учесть, что ввод метаданных дол ция гораздо сложнее: в настоящее время сущест жен осуществлять не специалист по оцифровке, а вует огромное количество «стандартов» их пред специалист в предметной области;

ставления. В связи с этим возникает вопрос, в ка • служба окончательной подготовки ресур ком формате данные должны храниться в ЭБ и сов и контроля качества, которая выполняет объе должны ли они в том же самом формате предос динение данных и метаданных, следит за обнов тавляться конечным пользователям. Зачастую лением данных и метаданных и осуществляет об оказывается, что формат, удобный для хранения в щий контроль качества подготавливаемых ресур хранилищах данных (обеспечивающий целост сов.

ность данных, лёгкость доступа к ним, содержа Перечисленные службы должны обладать щий минимальный набор метаинформации), не своими информационными системами, обеспечи слишком удобен для пользователей, поскольку вающими выполнение их задач и предоставляю требует от них установки специального про щими друг другу данные, необходимые для рабо граммного обеспечения, либо не приспособлен к ты. В результате работы подсистемы подготовки передаче по сети, так как не обеспечивает необхо ресурсов получаются готовые к публикации в ЭБ димой степени сжатия. Таким образом, возникает ресурсы, которые по каналам связи автоматически необходимость поддержки как минимум двух представляются к публикации.

форматов представления данных для каждого ви да ресурсов (аудио, видео, статические изображе 3 Стандартизация в электронных биб ния). Также не следует забывать, что с течением лиотеках времени существующие стандарты устаревают и возникают новые, что приводит к необходимости Проблемой стандартов для электронных биб перехода на новые форматы.

лиотек занимаются многие сообщества и органи Что касается единого архитектурного стандар зации, но, несмотря на значительные усилия и та, то здесь существует два основных предложе имеющиеся достижения, единства мнений до ния по архитектуре ЭБ: DELOS DLRM и OAIS, биться пока не удаётся. Необходимость стандар рассмотренные далее. Эти стандарты покрывают тизации в этой области ощущается, пожалуй, разные области архитектуры ЭБ и могут быть ис сильнее, чем для других видов информационно пользованы совместно, однако следует отметить, поисковых систем, так как многие проекты элек что они не описывают ни логическую, ни тем бо тронных библиотек стараются объединить ресур лее физическую модель ЭБ, поэтому результат их сы нескольких существующих библиотечных применения в разных реализациях ЭБ может и/или архивных систем.

сильно различаться.

Стандарты, имеющие отношение к ЭБ, услов но можно разделить на три большие группы:

2.4 Подготовка ресурсов • архитектурные стандарты, описывающие В большинстве случаев, когда ЭБ не предна- принципы и крупные компоненты, применяемые значена для размещения так называемых «изна- при построении ЭБ;

чально цифровых» (born-digital) ресурсов, подго- • стандарты метаданных и их представле товка ресурсов к публикации является достаточно ния, описывающие наборы метаданных и, воз сложным и трудоёмким процессом, вовлекающим можно, способы их представления при передаче и ционной системы открытого архива. В нём опи хранении;

сывается подход к долговременному хранению • данных, в частности, освещается проблема уста стандарты информационного обмена, ревания форматов данных и физических носите описывающие протоколы передачи метаданных и лей информации. Также описываются схемы данных между системами в различных целях.

взаимодействия участников архивной системы 3.1 Архитектура электронных библиотек при различных сценариях работы. Кроме техниче ской стороны работы открытого архива, рассмат Архитектурные стандарты описывают, как ривается также работа административно должна быть устроена ЭБ. Такие описания могут управленческих отделов при ЭБ, занимающихся касаться как интерфейсов взаимодействия с дру планированием хранения информации, предостав гими системами и пользователями, так и состава и лением доступа и другими задачами.

назначения компонентов системы. Также стандар ты этой группы пытаются дать чёткое определе- 3.2 Представление метаданных нию самому термину ЭБ и всех связанных с ним Стандарты метаданных играют очень важную терминов. Также к данной группе могут относить роль – они описывают, в каком формате данные ся и стандарты и предложения, связанные с ЭБ, но передаются из одной информационной системы в напрямую не посвящённые им.

другую. Следует заметить, что не все стандарты 3.1.1 DELOS DLRM метаданных кроме самого описания сущностей, их связей и атрибутов представляют описание Группа DELOS [4] (существует под различны контейнера для метаданных, однако большая ми названиями с 1996 года) является одной из часть стандартов подразумевает использование наиболее известных и старых организаций, зани XML как одного из видов контейнеров. В данном мающихся стандартизацией в области ЭБ. Основ разделе описаны как универсальные стандарты ными направлениями деятельности организации метаданных, такие, как Dublin Core, так и специа являются исследования и создание стандартов в лизированные, например, CIDOC-CRM.

области архитектуры ЭБ, их интеграции и отчуж дения данных. 3.2.1 Dublin Core Самым интересным результатом работы Стандарт Dublin Core [8, 9] состоит из двух DELOS является образцовая модель ЭБ – Digital частей – «минимальной» Dublin Core Metadata Library Reference Model (DELOS DLRM) [5]. В Element Set (DCES), имеющей статус междуна данной модели большое внимание уделяется от родного стандарта (ISO 15836:2009), и полной – делению цифровых объектов (содержимого ЭБ) от DCMI Metadata Terms. Обе версии стандарта не ЭБ и от СУЭБ (рис. 1). Также вводятся различные привязаны ни к какой конкретной предметной классы пользователей ЭБ, решающие свои задачи области и могут описывать ресурсы любых видов.

в рамках ЭБ, которым ЭБ (и СУЭБ ) должна пре Минимальная версия содержит только 15 атрибу доставлять соответствующую функциональность, тов, применяемых к любым сущностям, в которых приводится весьма обширная концептуальная мо можно описать название объекта, его описание, дель данной области, с тщательными определе автора, административные метаданные и ссылку ниями важнейших представлений об архитектуре, на источник. Полная версия содержит все атрибу ресурсах и функциональности ЭБ, в частности, в ты минимальной, а также набор дополнительных UML-представлении.

сущностей для описания различных атрибутов, набор словарей и дополнительное множество ат рибутов. Чаще всего используется именно мини мальный набор, поскольку именно он позволяет максимально абстрагироваться от предметной области, но при этом, конечно же, проигрывая в деталях.

Также существует рекомендация DCMI Abstract Model, содержащая сведения по расшире Рис. 1. СУЭБ, ЭБ и содержимое нию DCMI Metadata Terms для нужд различных предметных областей.

Кроме описания схемы метаданных стандарты 3.1.2 OAIS Dublin Core содержат описание контейнеров, в Open Archival Information System (OAIS) [6] – частности, описываются формат DC-Text для хра это разрабатываемый и поддерживаемый органи нения в чисто текстовом формате, формат DC зацией Consultative Committee for Space Data XML для XML-представления и DC-RDF для Systems (CCSDS) [7] международный стандарт представления в RDF-подмножестве XML.

(ISO 14721:2003) на образцовую модель информа 3.2.2 CIDOC-CRM фикации MARC 21 [16] (США и Канада) и нацио нальные модификации (например, RUSMARC [17] С 1994 года в составе International Council of в России). Также существует отображение MARC Museums (ICOM) существует комитет Committee на XML, называемое MARCXML [18]. Хотя on Documentation of the International Council of MARC основан на устаревших технологиях, он Museums (ICOM-CIDOC) [10], который занимает достаточно широко используется, и многие со ся стандартизацией в области музейных метадан временные информационные системы заявляют ных. Основной целью данного комитета является свою с ним совместимость.

создание образцовой концептуальной модели (CRM) для описания сущностей и связей, исполь- 3.3 Стандарты информационного обмена зуемых в документировании культурного насле В последнее время в связи с общей направлен дия. В 1999 году была выпущена первая версия ностью на децентрализацию и распределённость CIDOC-CRM [11], а в 2006 модель получила ста всё большую значимость приобретают стандарты тус международного стандарта (ISO 21127:2006).

информационного обмена. К ним относятся стан Модель CIDOC-CRM чрезвычайно подробно дарты распределённого поиска, репликации мета описывает предметную область и поэтому на данных и репликации данных.

практике в полном объёме практически никогда не применяется. Тем не менее, отображение мета 3.3.1 OAI-PMH данных ЭБ на эту модель представляется полез ным, так как многие музейные системы заявляют Стандарт Open Archives Initiative – Protocol for свою совместимость с CIDOC-CRM. Metadata Harvesting [19] является признанным лидером среди стандартов распределённого поис 3.2.3 FRBR и FRBRoo ка и репликации метаданных. В основу такой по пулярности положено то, что он достаточно прост Изначально разрабатывавшийся The для реализации и может инкапсулировать мета International Federation of Library Associations and данные в любом XML-формате. Каждая OAI Institutions (IFLA) [12] стандарт Functional PMH-совместимая система должна поддерживать Requirements for Bibliographic Records (FRBR) [13] метаданные в формате Dublin Core (см. п. 3.2.1).

играет примерно такую же роль в области описа ния публикаций, какую имеет CIDOC-CRM в опи 3.3.2 OAI-ORE саниях предметов культурного наследия. С года при содействии комитета CIDOC разрабаты- Object Reuse and Exchange [20] – Semantic-Web вается объектно-ориентированный стандарт ориентированный стандарт описания и обмена FRBRoo [14], заимствующий часть сущностей и агрегированными ресурсами. Стандарт описывает идей из CIDOC-CRM. способы объединения частей объекта (данных, метаданных) в один агрегированный ресурс, дос 3.2.4 PRISM тупный по единому URL, а также способы обра ботки и предоставления частей объекта по такому Стандарт Publishing Requirements for Industry URL.

Standard Metadata (PRISM) [15] разработан изда тельскими организациями, входящими в 4 СУЭБ LibMeta IDEAlliance (International Digital Enterprise Alliance) для обмена метаданными о публикациях.

C 2007 года в ВЦ РАН ведутся работы по соз PRISM основан на DCMI, но в большей степени данию системы управления ЭБ [5] под названием ориентирован на библиографические ресурсы. В «СУЭБ LibMeta», которая позволила бы библио стандарте предлагаются среда обмена и хранения текам, архивам и музеям РАН иметь унифициро данных и метаданных и ряд словарей значений ванное решение, позволяющее размещать полные этих элементов. В ЕНИП используются схема тексты публикаций и разнообразные мультиме контролируемых словарей PRISM и основной на дийные материалы, быть интегрированной с су бор элементов PRISM.

ществующими информационными системами РАН, а также соответствовать стандартам в облас 3.2.5 MARC ти ЭБ.

Стандарт MARC (MAchine-Readable Портал проекта «Научное наследие России»

Cataloging) по праву может считаться одним из [21] является первой установкой СУЭБ LibMeta, а самых старых стандартов в информационных тех- также площадкой для обкатки технологических и нологиях. Он был разработан в начале 1960 годов архитектурных решений.

в Библиотеке Конгресса США. Основное предна значение стандарта – хранение библиографиче- 4.1 Архитектура СУЭБ LibMeta ских записей для электронных каталогов. В на Поскольку предполагается использование СУ стоящее время оригинальный MARC (USMARC) ЭБ LibMeta в научных институтах различной на уже не используется, на смену ему пришли моди правленности, невозможно предоставить одну единственную схему метаданных, подходящую он поддерживается большей частью библиотеч абсолютно под все задачи. Данная проблема мо- ных и архивных систем.

жет быть решена двумя способами: внесением Основой для обмена данными и семантической избыточности в схему метаданных и предоставле- интероперабельности в ЕНИП служат технологии нием администратору системы возможности до- Semantic Web, соответственно, существенным определять схему. Оба подхода не лишены своих является применение в ЕНИП существующих недостатков. Так, например, избыточная схема предложений по стандартизации наборов элемен приводит к тому, что в каждой конкретной уста- тов метаданных для Semantic Web. В технологиях новке ЭБ используется только часть схемы, зачас- Semantic Web широко используются язык RDF, а тую достаточно небольшая. Это приводит к нера- также его специализация для описания онтологий циональному использованию ресурсов СУБД и, в OWL. Логично было выбрать именно OWL как целом, к уменьшению быстродействия. Кроме язык описания метаданных в СУЭБ LibMeta, а того, внесение такой избыточности требует глу- RDF – как язык обмена метаданными между сис боких исследований в предметной области, а так- темами.

же наличия общепринятых стандартов на подоб- В качестве инфраструктурного решения для ные метаданные. Второй подход также не лишён реализации СУЭБ LibMeta была выбрана про недостатков: основным является то, что по мета- граммная платформа «Научный Институт» [22], данным, определённым администратором, поиск разработанная ВЦ РАН. Эта платформа представ может осуществляться только с большими затра- ляет собой типовой программный комплекс авто тами ресурсов. Кроме того, уменьшаются воз- матизации информационной деятельности науч можности по связыванию ресурсов друг с другом, ного института в составе Российской академии так как администратор может определять только наук, обеспечения научной деятельности его со содержательные атрибуты. трудников, взаимодействующий с другими ин В СУЭБ LibMeta применяются оба подхода: формационными системами в составе ЕНИП.


для ресурсов типа публикация и персона приме- «Научный Институт» изначально разрабатывается няется избыточная схема, разработанная на основе как модульная расширяемая система, позволяю библиотечных стандартов, а для музейных пред- щая гибко подбирать наиболее подходящий набор метов используется второй подход. Такое реше- функциональных возможностей для каждой кон ние основывается на том, что для музейных пред- кретной организации. Основу информационной метов практически невозможно создать единую системы составляют ядро системы («платформа»), (избыточную) схему, поскольку каждый музей программное решение, предназначенное для соз обладает своей спецификой. Естественно, что для дания распределенных информационных систем, музейных предметов существует и фиксированная веб-порталов и интеграции данных, а также набор часть схемы, позволяющая связать их с другими функциональных модулей, предоставляющих спе ресурсами и включающая основные содержатель- циальные функции. Для СУЭБ LibMeta «Научный ные метаданные. Институт» является слоем абстракции от СУБД и При разработке СУЭБ LibMeta были проанали- контейнера приложений. Кроме того, в СУЭБ зированы мировые стандарты в области ЭБ а так- LibMeta используется библиографический про же обобщён опыт их использования в других биб- филь метаданных ЕНИП, предоставляющий лиотечных системах. На основе этого анализа бы- большую часть схемы метаданных в части опре ли выдвинуты предложения по использованию деления таких ресурсов, как публикации, персо стандартов. В качестве архитектурных стандартов ны, проекты и организации. Также в состав «На были использованы как DELOS [5], так и OAIS учный Институт» входит большое количество [6]. Из DELOS взяты общие концепции и вариан- подключаемых модулей, которые могут быть лег ты использования ЭБ. Из OAIS почерпнуты све- ко включены в установки СУЭБ LibMeta, к при дения о процессах, происходящих внутри ЭБ, а меру, для организации форума.

также её взаимодействии с внешними системами.

4.2 Профиль метаданных СУЭБ LibMeta Из стандартов метаданных были использованы Dublin Core (unqualified) [9], CIDOC-CRM [11], Одним из самых существенных недостатков RUSMARC [17] и другие. На эти стандарты суще- многих схем метаданных ЭБ является то, что они ствует отображение схемы метаданных СУЭБ рассматривают метаданные только в контексте LibMeta и возможен информационный обмен по описываемых ими данных и только как набор по протоколам, поддерживающим инкапсуляцию лей для поиска информации и индексирования данных в этих форматах. Перечисленные стандар- ресурсов. В случае, когда ЭБ содержит один вид ты являются наиболее распространёнными в мире ресурсов, например, только книги, такой подход, ЭБ и их использование позволяет достичь макси- возможно, является оправданным, однако совре мальной совместимости с существующими систе- менные ЭБ содержат разнообразные ресурсы, и в мами. связи с этим такой подход неприемлем. Метадан В качестве основного стандарта информаци- ные разных ресурсов должны содержать ссылки онного обмена выбран OAI-PMH [19], поскольку Описанная компонента настроена для работы с друг на друга, но при этом, тем не менее, оста системой подготовки публикаций, применяемой в ваться достаточно независимыми. Одним из наи ЭБ «Научное наследие России», однако её архи более удобных подходов к описанию такого рода тектура рассчитана на простое добавление моду метаданных является использование OWL-онто лей для любых других систем подготовки публи логий. Основной частью профиля метаданных в каций. В плане развития СУЭБ LibMeta стоит раз ЕНИП и «Научном институте» являются как раз работка системы подготовки публикаций началь такие онтологии. Общая схема профилей мета ного уровня, которая естественно будет интегри данных, применяемых в СУЭБ LibMeta, а также рована с СУЭБ LibMeta.

основных сущностей в данных профилях приве дена на рис. 2.

4.3.2 Интеграция с универсальными агрегато рами Для интеграции с универсальными агрегато рами в СУЭБ LibMeta полностью реализованы стандарты OAI-PMH [19] и Dublin Core [8]. Кроме того, для интеграции с музейными системами су ществует отображение метаданных системы на концептуальную модель CIDOC-CRM [11]. Для использования других протоколов и форматов обмена данными и метаданными, в особенности, основанными на XML, не представляется сложной реализация модулей обмена данными.

В табл. 1 показано отображение содержатель ных метаданных СУЭБ LibMeta на Dublin Core и CIDOC-CRM. Отображение административных метаданных, фактически, тривиально, и поэтому не приводится. Также в таблице не приводится медиа-объект, поскольку в нём нет содержатель Рис. 2. Профили метаданных СУЭБ LibMeta ных метаданных.

Подробно профиль метаданных СУЭБ LibMeta был представлен на конференции в 2009 году [23]. 4.4 Требования СУЭБ LibMeta к аппаратно Базовая часть профиля ЕНИП представлена в ра- программной платформе боте [1].

Требования к аппаратной платформе при уста новке СУЭБ LibMeta варьируются в широких 4.3 Интеграция СУЭБ LibMeta с другими ин пределах в зависимости от выполняемых задач.

формационными системами Например, для ЭБ уровня школьной библиотеки Интеграция СУЭБ LibMeta с другими инфор- требуется один x86 или x64 сервер с двумя про мационными системами осуществляется несколь- цессорами, объёмом оперативной памяти 2 Гб и кими путями: во-первых, это интеграция в рамках системой хранения данных объёмом 500 Гб. В ЕНИП, которая описана в разделе 4.1;

во-вторых, случае более крупных ЭБ требуется наращивание это интеграция с системами подготовки публика- в первую очередь системы хранения данных, и, во ций;

и, в-третьих, интеграция с универсальными вторую – процессорной мощности.

агрегаторами. Так как СУЭБ LibMeta реализована на кросс платформенном языке Java, то она может быть 4.3.1 Интеграция с системами подготовки пуб установлена практически на любую операцион ликаций ную систему. Фактически единственным требова Для обеспечения интеграции с системами под- нием к ОС является возможность установки среды готовки публикаций в СУЭБ LibMeta существует Java и сервера приложений Apache Tomcat. В ка компонент загрузки и обновления данных и мета- честве СУБД может быть использована практиче данных из внешних источников. Данный компо- ски любая JDBC-совместимая СУБД, например, нент ставит в соответствие каждому ресурсу, за- Microsoft SQL Server или PostgreSQL.

гружаемому в библиотеку извне, «состояние раз- Следует отметить что установка СУЭБ Lib мещения», в зависимости от которого с ресурсом Meta возможна на основе бесплатных ОС семей производятся действия по размещению и его пе- ства linux в сочетании с бесплатной СУБД Post риодическому обновлению. Также, когда ресурс greSQL, что позволяет снизить стоимость аппа уже размещён, возможно обновление ресурса по ратно-программной платформы до стоимости её запросу от обновляющей (размещающей) сторо- аппаратной части.

ны.

Таблица 1. Отображение свойств метаданных СУЭБ LibMeta на Dublin Core и CIDOC-CRM LibMeta Dublin CIDOC-CRM Core Публикация Название title P102 Has title Альтернативный заголовок title P102 Has title E35 Title Аннотация description P3 Has note E62 String Ключевые слова subject – Источник source – Авторские права rights P104 Subject of E30 Right Web-адрес – – Язык language P72 Has language E69 Language Выпущен date – Идентификатор identifier P1 Identified by E41 Appelation Авторы creator P108 Produced by Издатель publisher – Редактор contributor – Входит в состав – P46 Forms part of E18 Physical object Включает – P46 Composed of E18 Physical object Кол-во страниц – P57 Has number of parts E60 Number Реферат – – Библиографическое описание escription – Полный код УДК – P2 Has type E55 Type Примечания – P3 Has note E62 String ББК – – Основной код УДК – – Персона Домашняя страница – – Дата рождения date P97 Was born by E67 Birth Адрес – P53 Has location E53 Place Имя title P1 Identitied by E41 Appelation Пол – – Фото – – Учёная степень – – Учёное звание – – Дата смерти date P100 Died in E69 Death Место рождения – P97 Was born by E67 Birth Место смерти – P100 Died in E69 Death Электронная почта – – Телефон – – Факс – – Веб-страница – – FTP-адрес – – Музейный предмет Название title P102 Has title Альтернативный заголовок title P102 Has title E35 Title Аннотация description P3 Has note E62 String Ключевые слова subject – Источник source – Держатель (место хранения) – P49 Has keeper E39 Actor Состав – P46 Composed of E18 Physical object LibMeta Dublin CIDOC-CRM Core Автор описания – – Состояние (сохранность) – P44 Has condition E3 Condition state Количество предметов – P57 Has number of parts E60 Number Номер identifier P1 Identitied by E41 Appelation Автор сбора contibutor P51 Has owner E39 Actor Дата сбора date – Дата поступления date – География – P53 Has location E53 Place Размеры – P43 has dimension E54 Dimension Возраст – P92 Brought into existence E63 Beginning of existence Способ поступления – – Коллекция Название title P102 Has title Тип коллекции – – Ключевые слова subject – Описание description P3 Has note E62 String Количество элементов в коллекции – P57 Has number of parts E60 Number Место хранения – P53 Has location E53 Place Примечание description P3 Has note E62 String Элементы коллекции – P46 Composed of E18 Physical object 4.5 Опыт внедрения СУЭБ LibMeta 5 Заключение Наиболее ярким примером внедрения СУЭБ В настоящее время идёт становление ЭБ как в LibMeta является проект ЭБ «Научное наследие России, так и в мире. До сих пор не существует России» [21], который разрабатывается в рамках всеобъемлющего стандарта на ЭБ либо реализации одноимённой программы Президиума РАН с це ЭБ, удовлетворяющей всем существующим миро лью обеспечения сохранности и предоставления вым стандартам. В статье рассмотрены основные публичного доступа к научным трудам известных требования, выдвигаемые к современным инфор российских и зарубежных учёных и исследовате мационным системам и, в частности, ЭБ. Также лей, работавших на территории России. Также приведён обзор наиболее распространённых стан некоторые из подсистем электронной библиотеки дартов, на которые следует ориентироваться при (системы хранения и представления электронных разработке ЭБ.


изданий конечным пользователям) создаются в Созданная в ВЦ РАН ЭБ наиболее полно удов рамках программы Президиума РАН «Информати летворяет приведенным выше требованиям, а по зация». Общая координация и управление проек строенная на её основе СУЭБ LibMeta позволяет том осуществляются Межведомственным супер научным институтам РАН, имеющим свои биб компьютерным центром РАН. Задачами подготов лиотечные, архивные или музейные фонды, созда ки электронных изданий и сопровождающей ин вать свои ЭБ и легко выставлять данные ресурсы в формации для размещения в хранилище данных интернет как для научного, так и для широкого электронной библиотеки занимаются ведущие круга пользователей. На текущий момент работы библиотеки РАН, среди которых БАН, БЕН (Цен по СУЭБ LibMeta практически завершены.

тральная библиотека и её отделения), ИНИОН.

Важной задачей ЭБ «Научное наследие Рос Литература сии» являются интеграция существующих биб лиотечных ресурсов в ЕНИП РАН и обеспечение [1] Бездушный А.Н., Бездушный А.А., Серебря возможности централизованного доступа к ресур- ков В.А., Филиппов В.И. Интеграция метадан сам существующих хранилищ электронных изда- ных Единого Научного Информационного ний и метаданных об учёных и их научных трудах. Пространства РАН. – М.: ВЦ РАН, 2006.

Данная задача решается путём определения еди- [2] Berners-Lee T., Hendler J., Lassila. The seman ной инфраструктуры распределённой системы, tic web // Scientic Am. – 2001, May. – P. 3443.

унификации форматов данных и протоколов взаи- [3] Berners-Lee T., Shadbolt N., Hall W. The seman модействия компонентов системы, разработки tic web revisited// IEEE Intelligent Systems. – единых регламентов подготовки и сопровождения 2006, June.

электронных изданий.

[4] DELOS an Association for Digital Libraries. – Digital library management system http://www.delos.info. LibMeta [5] The DELOS Digital Library Reference Model – Foundations for Digital Libraries. Version 0.98 / A.A. Zakharov, V.A. Serebryakov L. Candela, D. Castelli, N. Ferro et al. – GEIE The article presents digital library management sys ERCIM, 2008.

tem (DLMS) LibMeta which is dedicated for science [6] Reference model for an open archival information institutes in RAS. Its architecture is described along system (OAIS): recommendation for space data with standards which form its foundation. Also digital system standards Blue book. CCSDS Secretariat, library "Russian scientific Heritage" based on DLMS Program Integration Division (Code M-3). – Na libMeta is presented.

tional Aeronautics and Space Administration, 2002, January.

[7] Consultative committee for space data systems. – http://public.ccsds.org/default.aspx.

[8] Dublin core. – http://dublincore.org/.

[9] The Dublin Core Metadata Element Set: an American national standard. – NISO Press, 2001.

[10] CIDOC CRM Home page. – http://cidoc.ics.

forth.gr/index.html.

[11] Crofts N., Doerr M., Gill T., Stead S., Stiff M.

Definition of the CIDOC Conceptual Reference Model. – January 2010.

[12] The International Federation of Library Associa tions and Institutions. – http://www.ia.org/.

[13] Functional Requirements for Bibliographic Re cords. – http://www.ia.org/VII/s13/frbr/frbr.htm.

[14] Functional Requirements for Bibliographic Re cords Object-Oriented Definition and Mapping to FRBR_ER. – http://www.cidoc-crm.org/ frbr_inro.html.

[15] Publishing requirements for industry standard metadata. – http://prismstandard.org.

[16] Library of Congress. Network Development and MARC Standards Office. MARC 21 concise for mats. – Cataloging Distribution Service, Library of Congress, 2006.

[17] Система форматов rusmarc. – http://www.rba.

ru/rusmarc/.

[18] Marc 21 xml schema. – http://www.loc.gov/ stan dards/marcxml/.

[19] Open archives initiative protocol for metadata harvesting. – http://www.openarchives.org/ pmh.

[20] Open archives initiative object reuse and ex change. – http://www.openarchives.org/ore.

[21] Портал ЭБ «Научное Наследие России». – http://sci-heritage.ras.ru/.

[22] Бездушный А.Н., Бездушный А.А., Нестерен ко А.К. и др. Информационная Web-система «Научный институт на платформе ЕНИП». – М.: ВЦ РАН, 2007.

[23] Захаров А.А., Филиппов В.И. Логическая мо дель цифровых библиотек в онтологии ЕНИП // «Электронные библиотеки: перспективные методы и технологии, электронные коллек ции». Труды XI Всерос. науч. конф.

RCDL'2009 (Петрозаводск, Россия, 17 – сентября 2009 г.). – Петрозаводск: КарНЦ РАН, 2009. – Р. 487.

Архитектура и реализация системы управления контентом Internet-библиотеки CitCMS © Е.Е. Сальникова1, С.А. Сальников1, С.Д. Кузнецов ЦИТФорум, 2ИСП РАН, г. Москва elev@citforum.ru, serg@citforum.ru, kuzloc@ispras.ru Одним из показательных примеров Российского Аннотация сегмента мирового компьютерного интернет На конференции RCDL’2009 был представ- сообщества является Internet-библиотека информа лен доклад [1], в котором обосновывалась ционных технологий CITForum [4]. Эта библиотека потребность к созданию новой системы существует уже более 15 лет и содержит публика управления контентом для поддержки пол- ции разного объема (от небольших заметок до нотекстовых научно-технических Internet- крупных книг), посвященные различным аспектам библиотек (Web Content Management информационных технологий: теория и средства System, WCMS), формулировались требо- программирования, операционные системы, сетевые вания к такой системе и обсуждались тех- технологии, системы баз данных, информационные нологии, которые можно использовать при системы и т. д. Контент библиотеки непрерывно ее построении. За прошедший год было развивается и обновляется за счет как перепечатки проведено несколько экспериментов, по- (законным образом) материалов других компьютер строено несколько опытных вариантов ных изданий, так и публикации оригинальных мате WCMS, которые испытывались на реальном риалов, специально написанных для CITForum. Оба контенте. В данной статье описываются вида публикаций полностью себя оправдывают. В выводы, которые можно сделать на основе частности, накопление в библиотеке «вторичных»

полученного опыта, и обсуждаются основ- материалов позволяет обеспечить их доступность и ные компоненты, используемые в результи- надежность хранения, а публикация «первичных»

рующей WCMS CitCMS. статей и книг позволяет предельно быстро донести их до читательской аудитории.

1 Введение Аудитория CITForum широка и разнообразна:

преподаватели университетов и вузов, аспиранты и Чем дальше, тем больше веб становится основ студенты;

начинающие программисты, системные ным источником информации в различных областях администраторы и менеджеры проектов;

профес науки, техники, производственной деятельности, сионалы в области информационных технологий и искусства и т. д. С каждым годом в Internet доступ т. д. Число подписчиков, которым регулярно рассы но все большее число публикаций журнальных ста лаются новости библиотеки, составляет около тей, книг, а также материалов, которые написаны тысяч. На публикации библиотеки CITForum име специально для электронной публикации (напри ются многочисленные ссылки в других журнальных мер, блогов). Будучи одним из продуктов информа статьях и книгах.

ционной технологии, Web активно способствует ее Как и во многих других интернет-изданиях, об дальнейшему развитию, IT-публикации все в боль разовавшихся на заре веб-технологий, в библиотеке шей степени перекочевывают в среду Internet. Хо CITForum материалы публикуются в формате рошими примерами являются электронные библио HTML, что делало и делает их легко доступными на теки ведущих мировых компьютерных сообществ любых веб-клиентах, позволяет использовать лю IEEE Computer Society [2] и Association for Computer бые операционные системы и браузеры, не требует Machinery (ACM) [3], в которых содержатся мате большой пропускной способности сети и т. д. Одна риалы всех журналов, издаваемых этими сообщест ко эта полная изначальная ориентация на HTML вами, и труды ведущих мировых конференций. Во привела к тому, что публикуемые материалы и со многих случаях труды этих конференций вообще не храняются в формате HTML. По мере развития биб издаются в бумажной форме, доступны только в лиотеки, появления многочисленных форматов, в Web и вовсе не утрачивают при этом авторитетно которых представляются перепечатываемые мате сти.

риалы (XML с таблицами стилей, TeX, PDF, Word и т. д.), повышения уровня требований к редактор скому качеству публикаций и т. д. «унаследован Труды 12й Всероссийской научной конференции ная» от эпохи становления веба примитивная сис «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» – тема управления контентом становится все более RCDL’2010, Казань, Россия, 2010 обременительной для редакторов, администраторов и авторов публикаций. Следует отметить, что эта кации) или отбираются редакцией библиотеки среди ситуация свойственна всем долгоживущим Web- материалов, уже опубликованных в электронном репозиториям публикаций, из которых в Рунет в виде другими Internet-изданиями («вторичные» пуб области информационных технологий, кроме CIT- ликации). В последнем случае, естественно, соблю Forum, можно выделить, например, электронные даются все формальности, связанные с защитой ин библиотеки издательства «Открытые системы» [5] и теллектуальной собственности и авторских прав.

компании «Интерфейс» [6], создателям которых Поскольку CITForum – это библиотека инфор также приходилось сталкиваться с подобными про- мационных технологий, и публикуемые материалы блемами. Как отмечалось в [1], по мере развития носят технический характер, публикации обычно Internet-библиотеки: имеют достаточно большой объем и сравнительно • все труднее обеспечивать ее должное качество;

четкую структуру. В основном документы поступа ют в редакцию в формате HTML или каком-либо • велика трудоемкость подготовки первичных и варианте Word. Их обработка сводится к примерно вторичных материалов к публикации;

одинаковому форматированию текстов с примене • трудно менять рубрикацию материалов, вводить нием ряда существующих скриптов, после чего вы новые разделы и т. д.;

полняется небольшое «причесывание» получаемого • нелегко обеспечивать абсолютную гарантию HTML-представления. Основная проблема этой час сохранности и доступности ранее опубликован ти сценария состоит в том, что в ряде случаев авто ных материалов;

ры материалов позже присылают исправленные • все более сложной становится задача общего версии своих материалов, и в этом случае отсутст администрирования библиотеки.

вует возможность автоматически учесть эти ис В нашем докладе [1] на конференции правления в имеющихся «причесанных» версиях RCDL’2009 приводился и обосновывался полный материалов.

список требований к WCMS, пригодной для качест Зачастую материалы готовятся к публикации со венной поддержки современной Internet вместно авторами и редакторами CITForum. Для библиотеки, пояснялись причины, по которым для этого в настоящее время приходится использовать этих целей невозможно использовать существую «ручной» механизм синхронизации доступа к доку щие коммерческие и свободно доступные системы ментам на сервере, что неудобно и авторам, и ре управления контентом, а также обосновывался вы дакторам, а также часто приводит к возникновению бор технологий, на основе которых можно было бы трудно исправляемых ошибок. Особенно затрудне построить такую WCMS.

на совместная работа над материалами большого За прошедший год при выполнении проекта объема, такими, как книги и руководства. Для уст было проведено несколько экспериментов, построе ранения этой проблемы требуется механизм, под но несколько опытных вариантов WCMS, которые держивающий удобную и надежную коллективную испытывались на реальном контенте библиотеки работу над документами, вообще говоря, произ CITForum. Были выявлены наиболее настоятельные вольно большого объема.

потребности, и для их удовлетворения была по Решению этих первоочередных проблем и по строена первая действующая версия WSMC CitCMS свящается первая версия разрабатываемой WCMS [7], которая находится в состоянии опытной экс CitCMS.

плуатации. Общая архитектура системы позволяет безболезненно ее расширять, добиваясь удовлетво- 3 Архитектура и основные компоненты рения остальных требований, сформулированных в системы [1].

Основная часть статьи организована следующим В общей архитектуре разработанной версии образом. В разделе 2 обсуждается сложившийся WCMS CitCMS обеспечиваются компоненты, под сценарий поддержки библиотеки CITForum и выяв- держивающие хранение документов, их совместную ляются основные возникающие проблемы. В треть- подготовку, импорт документов, подготовленных с ем разделе описывается общая архитектура разра- использованием других средств, форматирование ботанной WCMS CitCMS и обосновывается исполь- документов для их публикации и редактирование зование технологий, на которых она базируется. крупных документов.

Раздел 4 содержит заключение, в котором рассмат 3.1 Основа системы – ikiwiki ривается текущее состояние дел и описываются планы на ближайшее будущее. В [1] отмечалось, что следует более детально ис следовать возможность использования в качестве 2 Сложившийся сценарий поддержки основы требуемой WCMS какую-либо из систем библиотеки CITForum и основные поддержки Wiki. В результате изучения и сравнения проблемы разных подобных систем, а также создания дейст вующих прототипов WCMS выбор пал на систему Основную массу хранимых и публикуемых до ikiwiki [8], разрабатываемую с 2006 г. сообществом кументов библиотеки CITForum составляют техни open source под руководством Джоуи Хесса (Joey ческие и аналитические статьи и книги. Эти мате Hess), одного из ведущих участников проекта De риалы присылаются авторами («первичные» публи bian GNU/Linux [9].

Почему мы решили использовать wiki вообще? соответствующей HTML-страницы может потребо Ответ на этот вопрос прост: основная функция, ваться несколько секунд, что в большинстве случаев поддерживаемая wiki, а именно, функция поддерж- неприемлемо для пользователей Web-сайтов. В дру ки коллективного редактирования документов в гих WCMS с этой проблемой борются с использо режиме онлайн с сохранением истории изменений, ванием кэширования данных, но при использовании очень близка к основной функции, требуемой от техники компиляции такая проблема просто не воз WCMS. Другими словами, при создании новой никает.

WCMS целесообразно как можно более основатель- Еще одной отличительной особенностью ikiwiki но воспользоваться возможностями существующих является то, что вся система и основные плагины wiki. написаны на языке Perl. Как отмечалось в [1], име Почему мы выбрали именно ikiwiki? На этот во- ется ряд доводов в пользу использования Perl при прос можно дать несколько ответов. Во-первых, разработке WCMS. В данном случае наличие ог ikiwiki отличается стилем своей разработки (так ромного репозитория CPAN [12] различных про называемый подход Unix – Unix Way). У ikiwiki грамм, написанных на языке Perl, существенно уп имеется собственное ядро небольшого размера, и рощает создание дополнительных плагинов, кото широко используются другие существующие сво- рые требуются для получения целевой WCMS.

бодно распространяемые инструменты. Допускается 3.2 Хранение документов простое и естественное расширение функциональ ных возможностей системы. Во многих WCMS, предназначенных для управ Как уже отмечалось, система является расши- ления коллекциями небольших документов, для ряемой в силу самой своей организации. Практиче- хранения контента и поддержки его версий исполь ски все функциональные возможности последних зуются SQL-ориентированные СУБД (при этом ре версий системы реализуются в виде подключаемых зультирующие HTML-страницы генерируются ди модулей (плагинов). В частности, на основе реали- намически). Однако в Internet-библиотеках, подоб зации соответствующих плагинов поддерживается ных CITForum, зачастую сохраняющих документы несколько входных форматов документов. При по- объемом в несколько мегабайт, над которыми вы требности можно достаточно просто реализовать полняются сотни незначительных правок, примене новые плагины для поддержки дополнительных ние СУБД оказывается неэффективным. Для этого в входных форматов. большой степени подходят системы управления Во-вторых, доверие вызывает команда разработ- версиями.

чиков ikiwiki, руководитель которой, Джоуи Хесс, Кажется естественным использование одной из хорошо зарекомендовал себя в проекте Debian. В проверенных временем, «зрелых» VCS, таких, как мире open source надежность команды часто играет Subversion [10], git [11], Mercurial [13], Bazaar [14].

не меньшую (а иногда и большую) роль, чем каче- Все эти системы обеспечивают с нашей точки зре ство самого кода. К сожалению, любой программ- ния примерно одинаковые функциональные воз ный продукт с открытыми кодами почти неминуемо можности и различаются в деталях.

обречен на исчезновение, если его перестают со- В настоящее время совершенно неочевидно, что провождать и/или развивать исходные разработчи- в нашей WCMS могут потребоваться какие-либо ки. особые возможности распределенных VCS, к кото Наконец, у ikiwiki имеется ряд технических осо- рым относятся VCS git, рекомендуемая сейчас в бенностей, делающих эту систему особенно привле- документации ikiwiki как «вариант по умолчанию», кательной именно в нашем случае. В отличие от Mercurial и Bazaar. И поэтому в первой версии почти всех остальных wiki и WCMS вообще, для CitCMS используется VCS Subversion. Эта система хранения документов и их версий используются является самой зрелой и одной из самых распро зрелые и полнофункциональные системы управле- страненных из всех VCS с открытыми исходными ния версиями (Version Control System, VCS). В кодами, и её возможностей вполне хватает для ранних версиях системы допускалось использова- удовлетворения потребностей WCMS.

ние только VCS Subversion [10], но впоследствии за Впрочем, как отмечалось выше, в ikiwiki, на ко счет достаточно простого и общего интерфейса с торой основана CitCMS, можно использовать раз VCS и внедрения механизма плагинов появилась ные системы управления версиями, так что ничто не возможность использования разных VCS. В частно- мешает в случае надобности поменять Subversion на сти, в настоящее время среди пользователей ikiwiki другую VCS в следующих версиях CitCMS.



Pages:     | 1 |   ...   | 23 | 24 || 26 |
 





 
© 2013 www.libed.ru - «Бесплатная библиотека научно-практических конференций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.