авторефераты диссертаций БЕСПЛАТНАЯ БИБЛИОТЕКА РОССИИ

КОНФЕРЕНЦИИ, КНИГИ, ПОСОБИЯ, НАУЧНЫЕ ИЗДАНИЯ

<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ


Pages:     | 1 || 3 | 4 |   ...   | 26 |

«Электронные библиотеки: Перспективные Методы и Технологии, Электронные коллекции English Труды RCDL 2010 ...»

-- [ Страница 2 ] --

По своей структуре и функциям данная ИВС в В результате полевых работ в ИВМиМГ был на- рамках современной терминологии может быть от коплен уникальный архив данных экспериментов несена к центрам научных данных. Стиль работы в (около 40), включающий архив файлов волновых таких центрах состоит в посылке запросов прило форм (более 30000 сейсмотрасс) и сопутствующей жениям, выполняемым на сервере, и получении от информации (тип сейсмического источника, пара- ветов, а не в массовом копировании необработан метры излучаемого им сигнала, параметры регист- ных данных на локальный компьютер для дальней ратора, географические координаты источника и шего анализа [6].

регистратора и т. д.). Но архив не был структуриро- ИВС использует СУБД MySQL, картографиче ван, файлы волновых форм имели различный фор- ская подсистема реализована на базе сервиса Google мат, определявшийся различными типами приме- Maps. Вычислительная подсистема представляет няемых регистраторов, сопутствующая информация собой приложение, выполняемое непосредственно в хранилась в произвольной форме. Всё это затрудня- среде операционной системы сервера. Для обеспе ло поиск необходимой информации в архиве. Таким чения достаточного для онлайн-режима быстродей образом, встала задача создания системы, которая ствия приложение написано на языке C++ и исполь могла бы обеспечить быстрый доступ к файлам зует программные библиотеки с низкоуровневой волновых формы по заданным параметрам поиска и оптимизацией Intel Performance Libraries [3].

интерактивный анализ волновых форм в онлайн- Концептуальные основы, заложенные при разра режиме. Эта задача была решена посредством ботке ИВС, позволяют создавать аналогичные сис создания информационно-вычислительной системы темы управления экспериментальными данными в «Вибросейсмическое просвечивание Земли» любой предметной области.

(http://opg.sscc.ru/db). Предоставление в режиме онлайн эксперимен Созданная ИВС существенно расширила круг тальных данных и предлагаемые сервисы ИВС яв исследователей, использующих экспериментальные ляются привлекательной особенностью научно данные для развития методов обработки и интер- информационной системы «Активная сейсмология».

претации вибросейсмических данных, математиче- На наш взгляд, активное формирование круга ского моделирования и т. п. Однако ИВС не обеспе- участников НИС, которое мы сейчас наблюдаем, во чивала доступа к научным результатам этих иссле- многом происходит благодаря заинтересованности дований. Кроме того, ИВС в недостаточной форме коллег в доступе к данным полевых экспериментов.

соответствовала потребностям исследователей, 5 Управление публикациями и организа представляющих различные регионы России, в научных коммуникациях. Таким образом, встала ция социальной сети следующая задача – задача создания НИС, которая Как уже отмечалось, интернет-ресурс, обеспечи бы интегрировала научные знания в области актив вающий функционирование виртуальной рабочей ной сейсмологии и смежных областях и отвечала бы среды, основан на принципах веб 2.0, согласно ко современным требованиям научных коммуникаций.

торым пользователи принимают непосредственное 4 Управление экспериментальными дан- участие как в создании контента (содержимого ре сурса), так и в организации научных коммуникаций.

ными Для создания подобных ресурсов существует спе Организация доступа к экспериментальным дан- циализированное серверное программное обеспече ным в режиме онлайн является важной задачей, ко- ние, называемое системами управления содержи торая была решена при создании виртуальной рабо- мым – CMS (Content Management System).

чей среды. Одним из модулей НИС «Активная В результате сравнительного анализа различных сейсмология» является информационно- систем управления содержимым было решено стро вычислительная система (ИВС) [2], которая обеспе- ить НИС «Активная сейсмология» на базе CMS чивает выполнение следующих основных функций: Joomla [5]. Данная CMS распространяется по лицен • получение из базы данных подробной ин- зии GNU/GPL (свободное программное обеспече формации по любому из проведенных эксперимен- ние) и ориентирована в первую очередь на создание тов;

сайтов электронных публикаций. Для работы Joomla • индексный и параметрический поиск сейс- требуется PHP-интерпретатор и СУБД MySQL – мотрасс одновременно по 18 параметрам вибро- также свободное программное обеспечение. Нали просвечивания;

чие большого количества дополнительных Joomla • автоматическое построение по результатам компонентов позволяет расширять функциональ поиска интерактивных карт с обозначенными на них ность системы в соответствии с требованиями со сейсмическими источниками и регистраторами;

временных информационно-коммуникационных технологий. Ниже перечислены дополнительные вибросейсмической тематике или смежных облас Joomla-компоненты, которые были использованы тях. На сегодняшний день более 40 зарегистриро при создании НИС «Активная сейсмология». ванных участников публикуют свои статьи и участ Community Builder – компонент для управления вуют в обсуждении работ коллег.

пользователями и организации связей между ними, В настоящее время участниками НИС являются используется для создания и поддержки онлайн- ученые и аспиранты не только институтов СО РАН, сообществ. Основные функции компонента: но и ДВО РАН, Камчатской геофизической службы, • ИФЗ РАН, Кубанского госуниверситета, Кабардино расширенное управление регистрацией Балкарского госуниверситета и т. д.

пользователей, создание дополнительных полей в Можно отметить, что в этом списке представле профайле, например, списка опубликованных ны все основные российские научные учреждения, статей;

работающие в данном направлении, что позволит • организация контактов между пользовате обеспечить полноту и актуальность предоставляе лями, создание рабочих групп;

мой информации.

• поддержка систем личных сообщений Особенно важным представляется участие в ра (PMS), почтовых рассылок, блогов пользователей.

боте НИС ученых, которые являются основателями J!Research – компонент для организации биб метода активной сейсмологии. Опубликованные лиографического каталога научных публикаций.

ими статьи дают полное представление о теоретиче Имеется возможность вставлять в статьи НИС ских основах вибросейсмического метода.

ссылки на записи каталога и автоматически генери В разделе «Математическое моделирование»

ровать список литературы. Компонент позволяет опубликован ряд работ, в которых приводятся ре пользователям добавлять записи как через веб зультаты обработки данных вибросейсмических форму, так и импортировать библиографическую экспериментов, сравниваются результаты численно базу данных из bib-файла. Предусмотрен им го и натурного экспериментов.

порт/экспорт из форматов BibTex, MODS, RIS.

В разделах «Вулканология и сейсмология» и Компонент обеспечивает поиск, сортировку, выбор «Экспериментальная геофизика» представлены ре ку по любому из полей: автор, издание, год публи зультаты исследований, многие из которых не свя кации и т. п.

занных с методом активной сейсмологии, но общим JComments – компонент позволяет пользовате является предмет исследования – сейсмичность лям не только оставлять комментарии к опублико Байкальской рифтовой зоны, Таманской грязевул ванным статьям, но и разворачивать обсуждение в канической провинции, вулкана Эльбрус и т. п.

формате форума.

НИС «Активная сейсмология» поддерживает два Mime Tex – компонент для включения в текст вида ввода данных: интерактивный ввод данных статей математических выражений в формате пользователями и административный ввод данных.

LaTeX.

Для интерактивного ввода проблема достоверности Attachments – компонент для загрузки и публи происхождения информации решается ограничени кации материалов в формате PDF. Таким образом, ем ввода документов только аутентифицированны пользователь может в онлайн-редакторе набрать ми пользователями. Администрация НИС оставляет часть статьи или краткую аннотацию, а полный за собой право удалять материалы, не соответст текст статьи или дополнительные материалы «при вующие объявленной тематике.

крепить» в виде файла PDF.

Пользователи НИС «Активная сейсмология»

7 Сравнение с зарубежными и россий имеют возможность в интерактивном режиме пуб ликовать статьи и другие материалы в одном из скими аналогами следующих разделов:

Исторически одним из первых научных интер • Вибросейсмические технологии;

нет-ресурсов, имеющих функции социальной сети, • Математическое моделирование;

может считаться научная библиотека Public Library • Экспериментальная геофизика;

of Science – PloS (www.plosone.org), созданная в • Вулканология и сейсмология;

2003 году в США в ответ на отказ издательств на • Технические средства;

учных журналов открыть свои архивы. Одному из • Информационные технологии. основателей этого ресурса принадлежит характер Структурная схема НИС «Активная сейсмоло- ное высказывание: «Наука развивается не только гия» приведена ниже. потому, что ученые делают эксперименты, но и по тому, что они обсуждают эти эксперименты». Рос 6 Актуальность, полнота, достоверность сийским аналогом этого проекта является Соционет происхождения документов (www.socionet.ru), который на основе открытых Основными пользователями НИС «Активная сейсмология» являются специалисты, работающие в Посетители Разделы Категории Популярные статьи Контакты Встроенные Поиск по сайту Тезисы доклада в Joomla + Каталог ссылок Редактор Статья в сборнике + - Монография + Расширения Меню Community Builder Статья в журнале + JComments Библиография Xmap Препринт Внешние + J!Research Доклад на AddAttachment + конференции + Статья on-line Интернет-ресурс «Активная + Отчет Дополнительная сейсмология»

функциональность Контент + Патент http://opg.sscc.ru + Прочие виды - Вибросейсмические + технологии Карта сайта Регистрация и коммуникации Сервисы доступа к Математическое пользователей + моделирование Расширенный пользовательский экспериментальным Статьи Профайл данным Комментарии Информационные + Библиографический справочник технологии Пополнение пользователями библиографии Технические + Публикация статей пользователями средства Список пользователей Экспериментальная + геофизика Отчеты Файловый + База Google Maps архив данных API Рис. 1. Структурная схема НИС «Активная сейсмология»

стандартов организует процессы обмена знаниями в конгресса «ГЕО-Сибирь-2007».– Новосибирск:

области гуманитарных наук. СГГА, 2007. – Т. 3.

Примером масштабной научно-образовательной [3] Лопатенко А.С. Современные научные инфор сети, использующей самые современные интернет- мационные системы. Перспективы использова технологии, может служить ресурс www.academia. ния. – http://derpi.tuwien.ac.at/~andrei/papers/ edu. В последние несколько лет предпринимаются dl2001-1.htm.

попытки создания аналогичных ресурсов, ориенти- [4] Паринов С.И. Онлайновое будущее науки. – рованных на российских пользователей: www. sci- http://infosoc.ru/2007/thes/part1/Parinov.pdf.

people.ru, www.science-community.org/ru, www. all- [5] Медведев М.М. Наука 2.0. – http://www.strf.ru/ science.ru и другие. science.aspx?CatalogId=222&d_no=13726.

Основным отличием научной информационной [6] Gray J., Liu D.T., Nieto-Santisteban M., Szalay A., системы «Активная сейсмология» от перечислен- DeWitt D., Heber G. Scientific data management in ных выше «глобальных» ресурсов является её ори- the coming decade // SIGMOD Record. – Dec.

ентированность на конкретную область исследова- 2005. – V. 34, No 4.

ний. Мы полагаем, что, находясь в пространстве Research information system (RIS) "Active узкоспециализированной научной сети, пользовате seismology with powerful vibration ли с большей вероятностью могут рассчитывать на sources" налаживание связей и общение с коллегами, на по лучение комментариев и оценок от экспертов в дан A.P. Grigoruk, L.P. Braginskaya ной области.

The paper presents the architecture, interface and basic Литература user services of the research information system (RIS) with social community functions "Active seismology", [1] Активная сейсмология с мощными вибрацион developed by the authors of the article. RIS is designed ными источниками / Отв. ред. Г.М. Цибульчик.

to provide information support of the theoretical and – Новосибирск: ИВМиМГ СО РАН, Филиал applied research in the field of active seismology and «Гео» Издательства СО РАН, 2004.

related fields.

[2] Григорюк А.П., Брагинская Л.П. Управление данными вибросейсмического мониторинга // Мониторинг окружающей среды, геоэкология, Работа выполнена при финансовой поддержке РФФИ дистанционные методы зондирования Земли и (проект 09-07-00515) фотограмметрия. Сб. материалов межд. науч.

Информационно-аналитическая система поддержки и сопровождения научных исследований природных ресурсов региона © А.Ф. Титов, В.Т. Вдовицын, В.А. Лебедев, А.К. Полин Карельский научный центр РАН, г. Петрозаводск krcras@krc.karelia.ru Аннотация 2 Цель создания информационно-анали Представлены основные подходы к созда тической системы нию информационно-аналитической систе мы поддержки и сопровождения научных Научные учреждения (институты) Карельского исследований природных ресурсов региона. научного центра РАН и их подразделения на протя Основное внимание уделено вопросам раз- жении многих лет проводят всесторонние фунда работки комплексной онтологии по естест- ментальные исследования природных комплексов венным наукам, охватывающим предмет- Восточной Фенноскандии. При этом используются ные области исследований участников про- методы математического моделирования, информа екта, которая положена нами в основу тех- ционно-телекоммуникационные и ГИС-технологии.

нологий систематизации и поиска научной В результате этих исследований накоплена очень информации. Также представлено описание большая и уникальная научная информация, значи картографического сервиса, разработанного тельная часть которой может быть представлена в на основе пакета MapServer v.4.10.3 и стан- виде электронных коллекций в интернете. В качест дартов Open Geospatial Consortium с ис- ве отдельных примеров такого рода локальных баз пользованием программной оболочки данных (БД) можно привести: БД «Местообитания P.MAPPER v.3.2. и технологии AJAX. Восточной Фенноскандии» (кол-во описаний – 1100, объем – 195 Мбайт) – Институт леса и Инсти 1 Введение тут биологии КарНЦ РАН);

БД «Паразиты живот ных и растений Карелии» (представлены списки Исследования и разработки в области создания более 800 видов паразитов, объем ресурса – 5, информационных систем для поддержки проведе- Мбайт, Институт биологии КарНЦ РАН;

БД «Спи ния мульти- и междисциплинарных научных иссле- сок видов животных Карелии» (представлено дований ведутся в последнее время как у нас в стра- таксонов для позвоночных и 1800 таксонов для бес не, так и за рубежом. В первую очередь здесь необ- позвоночных животных, объем – 0,3 Мбайт), БД ходимо отметить проект «Электронная Земля: науч- «Перепончатокрылые насекомые Карелии» (в спи ные информационные ресурсы и информационно- ске – 2387 видов, объем – 7,5 Мбайт) – Институт коммуникационные технологии» [14], а также соот- леса КарНЦ РАН;

БД «Зоопланктон озер Карелии»

ветствующие проекты по Программе фундамен- (объем – 15 Мбайт), БД «Гидрофизические характе тальных исследований СО РАН [12]. В качестве ристики Онежского озера» (объем – 85 Мбайт), конкретного примера подобного рода систем можно «Белое море и водосбор» (объем – 5 Гбайт), «Атлас назвать распределенную информационно- Онежское озеро» (объем – 4 Гбайт) – Институт вод аналитическую систему с единой точкой доступа к ных проблем Севера КарНЦ РАН и др.

геоданным и с инструментарием для их обработки и Частично эта уникальная научная информация визуализации [8], а также работы группы специали- уже представлена в виде цифровых коллекций (на стов из Томска [13]. Следует подчеркнуть, что во пример, на портале КарНЦ РАН – http://www.krc.

всех этих информационных системах активно ис- karelia.ru, в электронной библиотеке – http://dl.krc.

пользуются, прежде всего, современные ГИС и веб- karelia.ru), а также локальных БД и отдельных ин технологии. тернет- и ГИС-проектов (например, http://lakemodel.

net, «ГИС – водные объекты Республики Карелия») [2, 6, 7, 11]. Однако большая ее часть (включая зна Труды 12й Всероссийской научной конференции чительное количество картографического материа «Электронные библиотеки: перспективные методы и ла) носит разрозненный характер, требует система технологии, электронные коллекции» – RCDL’2010, Казань, Россия, 2010 тизации, структурирования и перевода в цифровой формат.

Создание информационно-аналитической систе- биологии, сельского и лесного хозяйства, геологии, мы (ИАС) поддержки и сопровождения научной, гидрологии и др. Разрабатываемая онтология поло аналитической и управленческой деятельности не- жена нами в основу систематизации и интеграции обходимо и важно в первую очередь для эффектив- электронных научных информационных ресурсов в ной координации и осуществления комплексных единую комплексную информационно-аналитичес (мульти- и междисциплинарных) научных исследо- кую систему поддержки и сопровождения научных ваний, выполняемых институтами КарНЦ РАН в исследований КарНЦ РАН, а также используется рамках задач инвентаризации природных ресурсов, для разработки системы информационного поиска.

при оценке состояния окружающей среды и эколо- На базе этой онтологии в настоящее время разрабо гических последствий планируемых и проводимых таны и реализованы технологии: предметизации на территории Карелии и сопредельных регионов публикаций по отношению к рубрикам Государст мероприятий в сфере промышленности, лесного, венного рубрикатора научно-технической информа сельского и рыбного хозяйства, а также для более ции (ГРНТИ) с формированием соответствующего успешной интеграции российской науки в мировое электронного каталога (систематизация по ГРНТИ);

научное пространство. Создание такой системы по- индексации публикаций с формированием базы зволит представить в сети (интранет/интернет) ак- данных индексов;

формирования тематического туализированную электронную научную информа- запроса на поиск документов с использованием он цию: по геологии, полезным ископаемым;

гидро- тологии;

поиска документов как по рубрикам графии, гидрохимии и гидробиологии озер, рек и ГРНТИ, так и по сформированному логическому Белого моря;

биологическим ресурсам, о влиянии условию отбора, а также технологии загрузки и ре климатических и антропогенных факторов на био- дактирования онтологии [3, 4].

разнообразие и др. Представление этих научных Основные номенклатуры терминов и названий материалов в виде единой (комплексной) информа- объектов, отображенных на карте и описанных в ционной системы будет способствовать (в т. ч. на соответствующих атрибутивных базах данных, основе картографического моделирования) научно представлены ниже:

обоснованному использованию лесов, земель, водо- – коренная геология, типы геологических тел, емов, болот, месторождений полезных ископаемых, горные породы с разновидностями, геохронологи целенаправленному и планомерному развитию на- ческая шкала;

селенных пунктов и транспортных сетей, учету осо- – тектоника, тектонические циклы, пликативные бенностей ландшафтной структуры растительности, структуры, тип складки, вид складки, форма склад мониторингу изменения растительного покрова по ки, дизъюнктивные структуры, вид разрыва, разло данным дистанционного зондирования и т. п. ма, тип надвига, сброса;

В конечном итоге на основе многоуровневого – четвертичная геология, типы и формы рельефа, мониторинга и предсказательного моделирования с четвертичные отложения;

учетом пространственного распределения иссле- – минерально-сырьевые ресурсы, металлические дуемых объектов будет создана научная основа для полезные ископаемые, неметаллические полезные рационального использования природных ресурсов ископаемые;

и развития региона. – гидрография, названия рек, озер, водохрани лищ, каналов, списки характеристик;

– почвы, типы и виды почв, материнские поро 3 Основные подходы к созданию инфор ды, биопродуктивность;

мационно-аналитической системы – ландшафты, типы ландшафтов;

Систематизация и структуризация электронной – болота, названия болот и систем, типы болот научной информации, полученной сотрудниками ных участков, массивов и болотных систем;

институтов КарНЦ РАН, а также разработка систе- – леса, типы лесов, типы лесных ландшафтов, мы информационного поиска осуществляются с лесные биогеоценозы;

применением методов онтологического моделиро- – биологические ресурсы, виды ресурсов: ресур вания. Различные аспекты применения методов он- сы растительного мира, ресурсы животного мира, тологического моделирования в информационных характеристики;

системах (в т. ч. для организации информационного – особо охраняемые природные территории поиска) рассматривалось в докладах Симпозиума (ООПТ), названия ООПТ, категории ООПТ;

«Онтологическое моделирование» [10]. Среди из- – экологический и научный туризм, виды туриз вестных нам русскоязычных онтологий по естест- ма, список маршрутов, список турбаз;

венным наукам, применяемых для индексации на- – промышленность и экономическое райониро учных публикаций, необходимо отметить разраба- вание, экономические районы, отрасли промышлен тываемый в НИВЦ МГУ под руководством ности, крупнейшие предприятия;

Б.В. Доброва проект лингвистической онтологии – населенные пункты;

[5]. – дороги.

В рамках данного проекта для построения и раз- Онтология состоит из двух частей: таксономии вития комплексной предметной онтологии привле- терминов и совокупности логических условий чены ведущие специалисты КарНЦ РАН в области предметизации электронных публикаций.

Для осуществления эффективного тематического Тем не менее, выбор, разработка и использование поиска релевантных записей в атрибутивных базах экономически обоснованной технологии позволяют данных и коллекциях электронных научных публи- уже сейчас ввести в практику мульти- и междисци каций с использованием онтологии выполняется их плинарных научных исследований разработанные систематизация по отношению к рубрикатору геоинформационные ресурсы. Такая технологиче ГРНТИ, которая осуществляется в два этапа. На ская схема уже использовалась в КарНЦ РАН при первом этапе выполняется анализ метаданных пуб- реализации пилотных проектов «Зеленый пояс Фен ликации: заголовка и, возможно, списка ключевых носкандии» и «Потенциальные объекты экологиче слов (если он имеется). При этом выявленные тер- ского туризма РК» и показала высокую эффектив мины сопоставляются с заданным условием и в по- ность, особенно в отношении малобюджетных про ложительном случае определяется рубрика ГРНТИ, ектов [1].

соответствующая публикации (при этом публикация Для создания картографического сервиса нами может соответствовать более, чем одной рубрике). используется свободно распространяемое про Рубрика определяет фрагмент таксономии терми- граммное обеспечение – Linux, Apache v.2.2.4, нов, по которому будет выполнена индексация дан- MySQL v.5.0.45, PHP v.5.2.3. Картографический ной публикации. Алгоритм индексации осуществ- сервис ИАС разработан на основе пакета MapServer ляет сканирование текста статьи или описания за- v.4.10.3 и стандартов Open Geospatial Consortium с писи базы данных, выявляет термины и названия, использованием на первом этапе программной обо имеющиеся в онтологии, проверяет их соответствие лочки P.MAPPER v.3.2. и технологии AJAX.

определенному фрагменту онтологии и формирует MapServer в настоящее время является наиболее индекс (все термины и названия на русском языке). популярным, весьма скоростным и функциональ Индексы формируются на каждую запись базы дан- ным инструментом для создания картографических ных, содержащую название объекта, которое соот- веб-сервисов, не уступая аналогичному коммерче ветствует названию в онтологии. скому ПО. Это экономически обоснованное техно Таким образом, в результате индексации элек- логическое решение позволило отказаться от ранее тронных научных материалов в ИАС образуется применяемой нами технологии ASP-map [9]. От база индексов, в которой впоследствии осуществля- крытость программных кодов позволяет наращивать ется поиск. При этом база индексов упорядочивает- функциональность MapServer. На основе оболочки ся по рубрикам ГРНТИ, и тем самым осуществляет- P.MAPPER нами были разработаны дополнитель ся систематизация электронных научных материа- ные сервисы, позволяющие, в частности, работать с лов. всплывающими окнами, уделяя основное внимание Поиск необходимой пользователю информации собственно карте.

в ИАС может быть осуществлен (помимо обраще- С помощью разработанных ГИС-сервисов про ния к цифровой карте) по некоторому условию, со- ведена работа по формированию и загрузке в ИАС держащему тематические термины в их логической необходимых тематических слоев и соответствую связи. Построить такое условие не просто. Поэтому щей атрибутивной информации. К настоящему вре предусмотрен сервис, помогающий пользователю мени на картографический сервер ИАС загружены формировать соответствующие тематические запро- следующие тематические слои (масштаба сы с использованием онтологии. При этом пользо- М1:1000000), сформированные специалистами ватель сначала выбирает требуемую рубрику руб- предметниками как из научных учреждений КарНЦ рикатора ГРНТИ, после чего ему визуализируется РАН, так и специалистами сторонних организаций, соответствующий раздел таксономии, в котором он а именно: коренная геология;

тектоника;

четвертич должен отметить интересующие его термины. Этот ная геология;

полезные ископаемые;

геологические список терминов на следующем этапе используется памятники;

почвенная карта;

болота;

водные ресур для построения запроса. сы (кадастр рек, водосборы 1 и 2 порядков);

биото В настоящее время ГИС- и интернет-технологии пы;

топография (озера, реки, транспортная сеть, находят широкое применение в различных странах. населенные пункты, административные границы).

При этом используется как сравнительно дорогое Таким образом, главной особенностью нашей проприетарное программное обеспечение (ПО), так системы (наряду с применением современных и свободно-распространяемое. Как правило, страны, ГИС- и веб-технологий) являются создание и ис использующие проприетарное ПО, имеют и весьма пользование онтологии для систематизации и отлаженную инфраструктуру пространственных структуризации разнородной научной информации данных (ИПД) [13], позволяющую в режиме online и разработка на ее основе эффективной системы получать недостающую и актуализированную про- информационного поиска. При этом предполагает странственную информацию (например, картогра- ся, что по запросу пользователя система сможет фический сервер Геологической службы Финляндии предоставить ему не только соответствующие тема – http://geomaps2.gtk.fi/activemap/). К сожалению, тические слои и атрибутивную информацию из баз такой путь в настоящее время для большинства на- данных, но и другую сопутствующую научную ин учных учреждений РАН весьма затруднен из-за не- формацию (электронные научные публикации по достаточного финансирования, неразвитости ИПД, теме запроса, документы из электронных библиотек различного рода режимных ограничений и т. д.). и т. п.), релевантные его информационным потреб ностям. Для этого разработана оригинальная техно- Работы по созданию системы поддержаны гран логии индексации электронных научных информа- тами РФФИ № 09-07-12074 офи_м и № 08-07 ционных ресурсов, созданных в институтах КарНЦ 00085а. Авторы статьи выражают свою благодар РАН и других научных организациях. Такой подход ность разработчикам основных программных серви к созданию ИАС даст возможность специалистам сов ИАС – Луговой Н.Б., Гушкалову М., Старковой оперативно анализировать большие объемы разно- В.Г., а также всем сотрудникам научных учрежде родной научной информации. Тем самым мы стре- ний КарНЦ РАН, участвующих в формировании мимся добиться повышения уровня информацион- комплексной онтологии, соответствующих темати ного обеспечения исследователей как при проведе- ческих слоев и атрибутивной информации.

нии мульти- и междисциплинарных исследований Литература природных ресурсов и окружающей среды региона, так и при осуществлении различного рода ком- [1] Кошкарев А.В. Инфраструктура пространст плексных научных эколого-социально- венных данных Финляндии //Пространственные экономических экспертиз народно-хозяйственных данные. – 2008. – № 1. – http://www.gisa.ru/ программ и проектов. 44536.html.

[2] Антипин В.К., Токарев П.Н. Разработка мето 4 Заключение дики составления электронных картографиче Поставленные в рамках данного проекта задачи ских баз данных растительных ресурсов болот и подходы к их решению являются, на наш взгляд, Карелии // Труды Карельского научного центра актуальными и представляют как теоретический, РАН. Серия Биогеография. – 2008. – Вып. 12. – так и практический интерес. Во-первых, создана Петрозаводск, 2008. – С. 3-8.

интегрированная база научных данных по природ- [3] Вдовицын В.Т., Лебедев В.А., Луговая Н.Б., ным ресурсам Карелии, включающая картографиче- Сорокин А.Д., Старкова В.Г. Разработка и раз ские материалы, атрибутивные базы данных, элек- витие технологии публикации и поиска доку тронные научные публикации и коллекции. Во- ментов в электронных коллекциях. //Труды вторых, в качестве объединяющей структуры при- Восьмой Всерос. науч. конф. «Электронные менена комплексная онтология по естественным библиотеки: перспективные методы и техноло наукам, которая разработана совместно со специа- гии, электронные коллекции». Суздаль, Россия листами-предметниками из научных учреждений 17 – 19 октября 2006 г. – Ярославль, 2006. – КарНЦ РАН и охватывает предметные области ис- С. 162-167.

следований участников проекта. Эта онтология яв- [4] Вдовицын В.Т., Лебедев В.А. Онтологии для ляется основой разработанных технологий система- тематического поиска данных в коллекциях тизации контента и поиска данных, позволяющих электронной библиотеки. //Труды Десятой Все пользователю получать по запросу комплекс взаи- рос. науч. конф. «Электронные библиотеки:

мосвязанной научной информации, релевантный его перспективные методы и технологии, электрон информационным потребностям. Такой подход к ные коллекции», Дубна, Россия, 7 – 11 октября созданию ИАС дает возможность специалистам 2008. – С. 63-69.

оперативно анализировать большие объемы разно- [5] Добров Б.В., Лукашевич Н.В. и др. Разработка родной научной информации. Тем самым мы стре- лингвистической онтологии по естественным мимся добиться повышения уровня информацион- наукам для решения задач информационного ного обеспечения исследователей как при проведе- поиска //Труды 7 Всерос. науч. конф. «Элек нии мульти- и междисциплинарных исследований тронные библиотеки: перспективные методы и природных ресурсов и окружающей среды региона, технологии, электронные коллекции»

так и при осуществлении комплексных научных RCDL’2005, Ярославль, Россия, 2005.

эколого-социально-экономических экспертиз на- [6] Литинский П.Ю. Трехмерное моделирование родно-хозяйственных программ и проектов. Приме- структуры и динамики таежных ландшафтов. – нение при создании ИАС (наряду с современными Петрозаводск: Карельский научный центр РАН, ГИС- и веб-технологиями) методов онтологическо- 2007. – 107 с.

го моделирования должно способствовать, по на- [7] Меншуткин В.В., Филатов Н.Н., Потахин М.С.

шему мнению, интеграции разнородной научной Разработка экспертной системы «Озера Каре информации в единую информационную систему лии». Порядковые и номинальные характери поддержки и сопровождения мульти- и междисцип- стики озер// Водные ресурсы. – 2009. – Т. 2, линарных исследований природных ресурсов ре- № 36. – С. 160-171.

гиона не только ученых КарНЦ РАН, но и их рос- [8] Молородов Ю.И., Смирнов В.В., Федотов А.М.

сийских и зарубежных коллег. Сервисы геоинформационной системы сбора, Демонстрационный прототип системы представ- хранения и обработки данных натурных наблю лен в интернете – http://ias.krc.karelia.ru. В полном дений // Электронные библиотеки: перспектив объеме возможности ИАС будут доступны пользо- ные методы и технологии, электронные коллек вателям корпоративной сети интранет научных уч- ции: Труды XI Всерос. науч. конф. RCDL'2009.

реждений КарНЦ РАН. – Петрозаводск: КарНЦ РАН, 2009. – С. 419 424.

[9] Полин А.К., Скворцова А.С. Применение ГИС и Интернет-технологий для информационного обеспечения процессов рационального приро допользования Республики Карелия //Проблемы рационального использования природного и техногенного сырья Баренцева региона в техно логии строительных и технических материалов.

Материалы II Межд. науч. конф. – Петроза водск, 2005. – С. 170-172.

[10] Труды Симпозиума «Онтологическое модели рование». //Под ред. Л.А. Калиниченко. – М.:

ИПИ РАН, 2008. – 303 с.

[11] Филатов Н.Н., Меншуткин В.В. Разработка гео информационной и экспертной систем для оценки водных и биологических ресурсов вод ных объектов Карелии// Информационный бюл летень ГИС-Ассоциации. – 2008. – № 4 (66). – С. 1-18.

[12] Шокин Ю.И., Добрецов Н.Н., Пестунов И.А., Молородов Ю.И., Смирнов В.В., Синяв ский Ю.Н. Система сбора, хранения и обработ ки спутниковых и наземных данных Новоси бирского научного центра СО РАН // Вычисл.

технол. – 2008. – Т. 13. – Вестн. КазНУ им. Аль Фараби. Серия: Математика, механика, инфор матика. – № 4 (59). – Совместный вып. по мате риалам межд. конф. «Вычислительные и ин формационные технологии в науке, технике и образовании». – Ч. III. – С. 371-376.

[13] Titov A., Gordov E., Okladnikov I., Shulgina T.

Web-system for processing and visualization of meteorological data for Siberian environment re search //Int. J. of Digital Earth. – 2009. – V. 2, Is sue S1. – P. 105-119.

[14] http://www.scgis.ru/geosinet/geosinet_info.html Information-analytical system for supporting and maintenance of scientific research of natural resources in the region A.F. Titov, V.V. Vdovitsyn, V.A. Lebedev, A.K. Polin The article presents the main approaches to the creation of information-analytical system of support and mainte nance of regional natural resources’ scientific research.

It focuses on developing the comprehensive ontology of the natural sciences, covering the subject areas of pro ject participants’ researches, which was chosen as the basis for the technology of scientific data’s systematiza tion and search. The article also contains the description of the map service of information and analysis system, developed on the basis of MapServer v.4.10.3 and Open Geospatial Consortium standards with usage of P.

MAPPER v.3.2. program shell and AJAX technology.

Работа выполнена при финансовой поддержке РФФИ (проекты 09-07-12074 офи_м и 08-07-00085) Constructing virtual resources for practitioner communities:

a ‘space for all reasons’ © Roger Greenhalgh National Rural Knowledge Exchange, Harper Adams University College, UK further study by the academic community. Such pro Annotation jects have been largely “supply driven”, in the sense The National Rural Knowledge Exchange is a that they have generated digital collections of materials business and community engagement initia- that institutions are already keen to supply and dissemi tive from a consortium of 14 UK universities nate.

and colleges with a particular interest in rural The OpenFields Library has adopted a different set business in the land-based sector, and the ru- of tactics to service the wider rural and land-based busi ral economy. One of the recent deliverables ness community, as this niche serves quite a different of this initiative is the OpenFields online li- community demographic to those of the growing popula brary. OpenFields is an open access reposi- tion of more traditional institutional or subject reposito tory of knowledge transfer materials covering ries. OpenFields sought to be more “demand driven”, in food, farming, the environment, energy and the sense that it seeks to generate collections of materi rural business. This position paper identifies als that its target communities require, are otherwise dif the issues addressed by this initiative, summa- ficult to find or obtuse to obtain, and are readily com rises lessons learned, and places these in the prehendible by their more cosmopolitan audience.

wider and much debated context of achieving sustainability for such digital libraries.

"Digital libraries are organizations that provide the re sources, including the specialized staff, to select, struc ture, offer intellectual access to, interpret, distribute, preserve the integrity of, and ensure the persistence over time of collections of digital works so that they are read ily and economically available for use by a defined community or set of communities."

This is a now long-established working definition used and published by the Digital Libraries Federation (1998) to achieve a common understanding of what a digital library actually is and does. It suggests that there is a set of attributes that gives coherence to the concept of ‘digital libraries’, and recognises the functions of col lection, organization, preservation, interpretation, access Figure and economy.

Previous work in compiling the National Rural Di There is also a further caveat which notes that "digi rectory had elucidated a picture of the rural landscape tal libraries" need to be defined and measured in relation for knowledge transfer. In the post WW2 period, advi to the communities they serve, and that their develop sory support for UK agri-business had largely been de ment should also address the larger institutional and livered through government schemes incurring little of social goals of their participants.

no cost to the beneficiary, until the eventual ‘privatisa Throughout the last decade, the UK academic sector tion’ of the Agricultural Development Advisory Service has been encouraged to develop digital libraries and (ADAS) in 1997. There is thus no long tradition of repositories mostly through a number of funding pro knowledge transfer through private consultancy, and the grammes and support initiatives of the Joint Information role of generic public-sector business support schemes Systems Committee (JISC). This independent advisory (e.g. through ‘Business Link’ and Chambers of Com body works with UK further and higher education by merce) has traditionally had a more ‘urban’ focus. In providing strategic guidance, advice and opportunities to Northern Ireland and Scotland, local agricultural exten use ICT in support of learning, teaching, research and sion programmes have been retained through these administration. As a result, much of the collation of principalities’ colleges, but this is not the case in Eng materials within the resulting digital libraries or reposi land and Wales, and so for the UK as a whole, academi tories has focused on the preservation and dissemination cally-sourced extension programmes for the land-based of scholarly works (such as academic research papers), sector are the exception rather than the rule.

and on digitisation programmes for collections of his torical artefacts for preservation, dissemination and The OpenFields niche to some extent seeks to ‘fill ness of other associated continuing professional devel the ADAS gap’ in providing this sector with free and opment, research and advisory services which may be open access to practitioner-ready materials for business available from contributors, whilst confirming the prov development and improvement, and thus raise aware- enance of these materials’ sources.

Figure 2. Landscape for UK rural knowledge transfer (NationalRural 2010) Figure 3. Land-based subject taxonomy – principal sections (OpenFields 2010) Many knowledge transfer and business support ini- The types of knowledge transfer materials in current tiatives, events and services are associated with farm (paper) circulation and in demand by practitioners in business diversification and changes in agricultural this community are largely ‘grey literature’, pamphlets practice. The scope of the OpenFields subject taxonomy and skills-workshop support materials, a composition reflects this range of diversification and the complexity which is largely at odds with the predominantly aca of issues affecting modern agri-business. demic research focus of the current population of open access repositories.

Academics contributing to these repositories are remarkably low, and despite the availability for several largely writing for the benefit of other academics (as a years of Jorum.ac.uk, a national repository for re healthy academic publication record is of direct benefit purposable learning objects, its current holdings for the to academic career paths), rather than writing for practi- entire subject spectrum stands only at approximately tioners (for which the academic motivation is largely 2,500 objects (JISC, 2010, and Jorum, 2010), and ‘agri only altruistic). Deposit rates for “learning objects” is culture’ is currently particularly poorly represented.

Figure 4. UK content of open repositories (OpenDOAR 2010) Figure 5. UK usage of open repository software (OpenDOAR 2010) The precedent for encouraging open access to schol- lar end, the OpenFields team are currently proactive in arly works has been set in the biomedical sector by seeking the establishment of similar deposition man PubMed Central, the U.S. National Institutes of Health dates from UK agencies funding land-based sector re (NIH) digital archive of biomedical and life sciences search programmes, as a commitment to effective dis journal literature, originally created in 2000, and offer- semination of research findings.

ing free access to its contents. The scale of contribution Repositories of scholarly-produced materials in the to this service, at nearly 2 million articles (PubMed UK have predominantly been constructed using one or Central, 2010), is an indicator of the effect of mandates other of the DSpace or EPrints open source applications.

for open-access deposit from significant funding bodies: Whilst these platforms do facilitate the implementa PubMed is the designated repository for papers submit- tion of cross-site searching (enabling a one-stop search ted in accordance with the NIH Public Access Policy. of a federation or repositories, or the harvesting of me This precedent has been followed in the UK by the tadata, their accessibility for indexing by search engine UKPubMedCentral variant, which includes National ‘crawlers’ has been limited. The presumption has been Health Service (NHS) clinical guidelines and UK bio- made that the principal route to discovery of their arte medical and health PhD theses, and is the focus of simi- facts will be through their native searching or browsing lar UK funding body mandates for deposit. To this simi- interfaces, and thus programmes of Search Engine Op timisation to encourage public discovery and dissemina- a consensus of interest in social media and web 2.0 ra tion have only recently been considered by their opera- ther than conventional, formal repositories;

a focus on tors. understanding purpose and user demand;

and an exhaus Andrew Powell (2008), in a thought-provoking pres- tion with new or evolving repository-specific standards.

entation "Web 2.0 and repositories -have we got our One of the distinctive aspects of Web 2.0 approaches repository architecture right?" reviewed the position is the enabling of the “read-write” web - the recognition with academic digital repositories and highlighted the that a degree of audience engagement comes through disparities between these and successful Web 2.0 asset- interaction, contribution and personalisation. A com sharing applications. Powell considered aspects such as plementary service to the eclectic biomedical metadata implementations, user interfaces, application offerings of the various PubMed Central services are programmer interfaces, scalability and social features, those of the Cochrane Collaboration. The Cochrane and it was based on similar observations by the National Library extends its community focus beyond the re Rural team that these aspects of the OpenFields plat- search community to develop additional ‘research into form was first determined. practice’ strands, such that its content, metadata, and Summarising a recent “Repositories on the Open user interface facilitate an additional range of anticipated Web” workshop of the Centre for Educational Technol- ‘user journeys’.

ogy Information Standards, Phil Barker (2010) reported Figure 6. Signposting for appropriate user factions (Cochrane Library 2010) Chalmers (2010) in a recent editorial for the Coch- tween building in a capability for exhaustive asset de rane Library remarks “One of the common criticisms scription and categorisation (to aid its discovery and made […] is that most of its reviews don’t end with clear representation to a user), and the resulting time and ef instructions for action by professionals, patients and fort barrier to deposition by a potential contributor. The policymakers…” which he qualifies with the observa- extensive metadata schema capabilities offered, for ex tion that this simply reflects situations in which there is ample, through the UK Learning Object Model, (which inadequate research evidence to provide reliable infor- originated in 2004 and are still ‘work in progress’) may mation to guide the healthcare choices which people be laudable, but it remains unclear whether there is real must make. The empowering position of a service like user demand, when a more pragmatic, less wholesome Cochrane, however, is that it makes visible the two approach may suffice. A recent study by David Davies main options: either to sweep the uncertainties under (2010) of academic online searching behaviour when the carpet so that they can be ignored, or to endeavour seeking potential learning resources showed that despite to reduce them by doing additional research: the provision of national and institutional repositories · […] by updating or extending the scope of ex- and despite alleged academic concerns about veracity, isting Cochrane Reviews;

quality and provenance, the primary starting point of · […] by preparing new systematic reviews;

choice was the Google search engine, followed in close · […] by promoting additional ‘primary’ re- succession by Wikipedia (a free online encyclopaedia search because reliable, up-to-date reviews have shown written collaboratively by largely anonymous Internet that that is what’s needed. volunteers who write without pay.) This is a clear statement of community empower- In the physical world, the term “library” and “re ment – if you aren’t a part of the solution, then you must pository” have a possibly clearer distinction than in the be a part of the problem. virtual world, in which “digital libraries” and “digital Providing materials which are appropriate to a com- repositories” are difficult, if at all possible, to distin munity segmented not just by subject interest, but also guish. The distinction may be about our perception of by purpose and by cognitive expectation adds new lay- purpose – if a library exists primarily for access and ers of complexity. There is inevitably a trade-off be- dissemination, and a repository exists primarily for pre servation, posterity and security, the ‘digital open- Meanwhile, in 2004, Blowers Repository (see access’ dimension removes some of this distinction. above) successfully gained funding through the New The perceptions and purposes of contributors to the fa- Opportunities Fund of the National Lottery, and through cility may be entirely different to the perceptions and this programme released some of its content to accessi purposes of its consumers. For its sustainability, how- ble public view through the Secret Shropshire website.

ever, all these aspects may need to me recognised and This website provides a series of discovery themes in catered for. which places and activities are thematically related to It seems ironic, for example, that a nearby real re- artefacts held in the archive, allowing public users to pository, Blowers Repository, (a local government explore aspects of the county's local history, natural funded service operated in Shrewsbury by Shropshire environment and archaeological treasures, online. This County Council), is physically located somewhere be- example is one of several Digital Midlands 'Sense of tween the library and the museum. Indeed, it is an ar- Place' projects, all of which are in reality online ‘reposi chive. It is neither library, nor museum, but it shares tories’, though without the traditional ethos of reposito some of the attributes of both. ries. They vary considerably in their funding and spon Etymologically, the word "repository" does itself no sorship, target audience, and degree of community in favours. We think of a repository being somewhere teraction. Digital Ladywood, for example, from its lay where one stores materials away very safely for preser- out, scope and declared objectives, gives a strong sense vation, but without expectation of a need for anyone to that this resource is actually more about enhancing visit it often.


Recently, a particularly famous London community and communication than about preserva repository of historical art and design artefacts, the Vic- tion. Ladywood is a notably deprived area of the city of toria & Albert, reviewed its corporate image, and in the Birmingham, and the website is funded by a consortium interests of 'widening public participation' came up with of organisations each with a stake in achieving commu this ingenious slogan in a new publicity programme: nity cohesion in an area that has undergone huge hous “An ace caff with quite a nice museum attached” ing redevelopment. NewhamStory.com, similarly, is a The institution lost none of its gravitas - it took a risk community repository intent on gathering and annotat and gained some credibility with a different audience ing oral and photographic history of the community in demographic. the London Borough of Newham, as contributed by its members.

SecretShropshire.org.uk DigitalLadywood.org.uk NewhamStory.com Figure 7. Examples of community repositories These latter repositories are a shared local focus for In the current climate of economic thrift, there is community-gathered artefacts, and provide evolving considerable interest in the risks, benefits and practicali digital social spaces, rather than being electronic bro- ties of offering shared services and utilising cloud com chures of museum collections. puting platforms (JISC 2010). In the smaller academic OpenFields has taken the apparently uncommon step institutions (GuildHE 2010) where in-house ICT teams of combining 'three libraries in one': are already stretched to deliver routine services, devel · "Technical and Business Information" is prag- opment opportunities for novel service offerings are matic, practitioner-focussed material which is straight- comparatively low on the agenda, and more likely to be forward to digest and has a clear commercial relevance. realised through collaborative engagement and utiliza · "Research Papers and Abstracts" are the peer- tion of shared platforms. Awareness and use of simple reviewed outcomes of academic research projects. syndication tools (e.g. RSS), and encouragement of · "Open Learning Materials" are more about open licensing of content (e.g. through Creative Com guiding the learner to grasp techniques, skills and con- mons) are essential to the mix.

cepts. The main OpenFields tenet is that academia need not Each are constructed in rather different styles, and just be a provider of knowledge, but can also be a facili therefore catalogued in rather different ways, yet it is tator of knowledge, sourced from a wide community of entirely possible that a user browsing the OpenFields experts, which may extend beyond traditional academic collections may be open to exploring more than one boundaries. OpenFields is arguably, therefore, a founda type of knowledge asset. tion for subject-focused communities of practice.

In the landbased sector, OpenFields is beginning to [10] http://www.ncbi.nlm.nih.gov/pmc/.

show that a digital library can contribute to the collec- [11] http://ukpmc.ac.uk/.

tion, organization, interpretation, access, economics and [12] http://www.cochrane.org/.

continuity of knowledge transfer, but operating at a [13] Chalmers I. Systematic reviews and uncertain community level. And maybe there we can all be ex- ties about the effects of treatments [editorial]. The perts in some way? Cochrane Library 2010 (12 May). – http://www.thecochranelibrary.com/details/editorial/ References 691951/Systematic-reviews-and-uncertainties-about the-effects-of-treatments-by-Sir-Iain.html (accessed [1] http://www.diglib.org/about/dldefinition.htm.

13 May 2010).

[2] http://www.openfields.org.uk.

[14] http://www.secretshropshire.org.uk.

[3] http://www.opendoar.org.

[15] http://www.digitalladywood.org.uk.

[4] http://www.jorum.ac.uk.

[16] http://www.newhamstory.com.

[5] http://www.jisc.ac.uk/whatwedo/services/jorum.

[17] http://www.jisc.ac.uk/whatwedo/programmes/ aspx.

programme_jos/ssprev.aspx.

[6] http://efoundations.typepad.com/efoundations/2008/ [18] http://www.guildhe.ac.uk/en/about_guildHE/pr 06/web-20-and-repo.html.

ojects/jisc/.

[7] http://david.davies.name/weblog/2010/04/15/what [19] http://www.jisc.ac.uk/publications/reports/ do-people-look-for-when-they-search-online-for 2010/guildhescopingstudy.aspx.

learning-resources/.

[20] http://www.creativecommons.org.

[8] http://wiki.cetis.ac.uk/Cetisrow.

[9] http://zope.cetis.ac.uk/profiles/uklomcore.

Figure 8. The OpenFields shared repository platform (OpenFields 2010) Оптимальное распределение проектов при проведении экспертизы Д.М. Понизовкин, С.А. Амелькин ИПС им. А.К. Айламазяна РАН, г. Переславль meph@pereslavl.ru, sam@sam.botik.ru качестве критерия эффективности распределения Аннотация проектов выбирается соответствие компетенции Одной из важных задач организации про- экспертов тематике проектов. Далее эта задача фор цесса экспертного оценивания является мализована и предложен алгоритм ее решения.

выбор экспертов, приглашенных для оце нивания проектов и распределения проек- 2 Формальная постановка задачи тов между экспертами. В случае, когда Рассмотрим процесс проведения экспертизы требуется создать на множестве проектов проектов. На экспертизу поступает N проектов, ка линейный порядок, а число экспертов чество которых надо оценить. Для оценки качества сравнительно невелико, возникает задача проектов они распределяются по L экспертам;

каж обеспечения наибольшего соответствия дый эксперт получает не более M проектов и оцени проектов, переданных на экспертизу, ком вает их по b-балльной шкале. Экспертные оценки петенциям экспертов, при условиях, на выставляются в порядковой шкале [1], каждое зна ложенных на связность графа экспертизы, чение имеет ориентированное смысловое значение предельные нагрузки экспертов и пр. В (например, 5 – «отлично», 4 – «хорошо» и т. д.). Тем докладе предложен алгоритм решения за не менее, сравнивать оценки двух экспертов не все дачи, основанный на принципе коллабора гда представляется возможным, т. к. семантика оце тивной фильтрации.

нок для эксперта не всегда соответствует предло женной ориентировачной семантике [2], поэтому 1 Введение для обработки результатов экспертного оценивания Важной задачей организации и проведения экс- требуется использование методов, фильтрующих пертной оценки проектов является распределение субъективное возмещение оценок [3 – 5]. С учетом проектов между экспертами. Важность этой задачи того, что MN, основными задачами организации обусловлена субъективностью оценок, выставлен- экспертизы можно считать следующие:

ных экспертами. Действительно, если существует • получить наиболее адекватную оценку про уровень компетенции эксперта, позволяющий ему ектов – область интересов каждого эксперта должна выставить объективную оценку, то для организации быть как можно ближе к тематике проектов, полу эффективной экспертизы было бы достаточно найти ченных им для рецензирования;

для каждого проекта одного компетентного экспер- • обеспечить возможность статистической та. обработки результатов проекта, прежде всего, мето Субъективность оценок экспертов связана с ря- дов коллаборативной фильтрации.

дом факторов и не может быть нивелирована ни Пусть каждый i-й эксперт (i=1,.., L) описывается ( ) специальным обучением экспертов, ни введением характеристиками xi = xi1,..., xin. Каждая характе семантических шкал оценивания проектов. Поэтому ристика является оценкой, выставленной самим важно иметь возможность сравнивать результаты экспертом в r-мерной порядковой шкале. Каждый j экспертизы – либо путем организации дискуссии й проект (j=1,..., N) также описывается n-мерным между экспертами, либо сравнением оценок, вы ( ) вектором характеристик X j = X 1,..., X n, оценки в ставленных ими (сравнением профилей оценок экс- j j пертов). котором выставляются автором проекта в q-мерной порядковой шкале. Характеристики (xiv = X v ) соот Значимость оценки, выставленной экспертом, зависит от компетентности эксперта в области, к j ветствуют друг другу. Например, значение характе которой относится оцениваемый проект. Поэтому в ристик x отражает, в какой степени эксперт раз Труды 12й Всероссийской научной конференции бирается в области математики, а X – в какой сте «Электронные библиотеки: перспективные методы и пени объект принадлежит области математики.

технологии, электронные коллекции» – RCDL’2010, Для расчета близости интересов эксперта, опре Казань, Россия, деляемых значением x i, и тематике проекта X j • если вероятность невелика, то остаемся в точке p и step=step+1;

вводится мера dist(x, X). Такая функция может быть Соседняя точка выбирается следующим спосо задана алгоритмически следующим набором пра бом: случайно выбираются эксперт и проект, при вил:

надлежащий профилю эксперта. Далее выбранный 1. коэффициентом соотносимости характери ( ) проект заменяется на случайный проект, такой, что стик d x i, X j назовем специальное значение (на он не принадлежит профилю эксперта и существу пример, 0.8), которое ставится в соответствие ха- i i ют характеристики x и X, не равные нулю. Ве рактеристике эксперта с номером i (то есть характе роятность перехода рассчитывается по формуле i ристике x ) и характеристике проекта с тем же exp(c weight ) 1, где c – некоторый заданный i номером i (то есть характеристике X );

данная заранее коэффициент.

величина пригодится нам далее;

( ) 4 Заключение n ( ) 2. dist ( x, X ) = d xi, X i, где d x i, X i – ко Разработан алгоритм, решающий задачу опти i= i эффициент соотносимости характеристик x и мального распределения проектов по экспертам.


Сложность алгоритма ограничена сверху функцией X i, n – количество характеристик.

g = N M L n 2. Алгоритм теоретически базируется Решением назовем некоторое распределение проектов по всем экспертам. Профилем эксперта на принципе simulated annealing [6] и вполне может назовем набор проектов, назначенных данному экс- применяться как практическое приложение.

перту. В качестве критерия задачи определения максимальной близости интересов экспертов тема- Литература тике проектов выбрана функция F, представляющая ( ) [1] Орлов А.И. Прикладная статистика. – М.: Экза собой усредненное значение Fij = dist xi, X j по мен, 2004. – 576 с.

множеству всех рецензий k=(i,j), [2] Артемьева Е.Ю. Психология субъективной се N M мантики. – М.: МГУ, 1980. – 76 с.

Fk / N m ax k.

F=M [3] Herlocker J. H. School of electrical engineering and k= computer science, Oregon State University.

На множестве допустимых решений задачи на [4] Konstan J.A., Terveen L.G., Riedl J.T. Group lens кладывается ограничение на связность графа, вер research group, University of Minnesota. Evaluating шинами которого являются эксперты и проекты, а Collaborative Filtering Recommender Systems.

ребра соответствуют всем рецензиям, используе [5] Breese J.S., Hackerman D., Kadie C. Emperical мым в ходе экспертизы.

analysis of predictive algorithms for collabarative Для решения такой задачи разработан алгоритм, filtering, May 1998.

основанный на принципе simulated annealing [6].

[6] Adomavicius G., Tuzhilin A. Toward the next gen eration of recommender systems: a survey of the 3 Пошаговое описание алгоритма state-of-the-art and possible extensions// IEEE Шаг 0. Инициализация алгоритма: Transactions on Knowledge and Data Engineering.

• инициализируем переменную step=0 – – 2005. – V. 17, No 6. – P. 734-749.

счетчик проделанных шагов (пройденных точек);

• инициализируем переменную weight=W – Optimal distribution of projects for expert "вес" шарика (W – параметр, который может подби- examination раться);

D.M. Ponizovkin, S.A. Amelkin • выберем случайную точку из множества всевозможных решений, обозначим ее p;

The first stage of an expert examination is a distribution • установим максимальное количество шагов of project to determinate a set of projects which will be (пройденных точек) S;

examined by each expert. Experts can be described by a Шаг 1. Если (step=S), алгоритм заканчивается. vector of competences. Projects are described by a vec Решением является точка p. tor of key words. The algorithm based on collaborative Шаг 2. Рассчитаем значение = val;

filtering is introduced to minimize the average distance Шаг 3. Выберем соседнюю к точке p точку p';

between experts and projects subject to maintaining Шаг 4. Рассчитаем значение = val';

connectivity of the examination.

Шаг 5. Если (valval'):

• переходим в точку p': p=p';

• weight:=weight+1;

• step:=step+1;

Иначе:

• считаем вероятность перехода в точку p';

• если вероятность велика, то p=p', weight=weight – 1, step=0;

Средство общения виртуальных коллективов AccessGrid – реализация для научных семинаров и рабочих групп © Л.Н. Щур, С.А. Крашаков, А.Ю. Меньшутин, С.К. Шикота, М.В. Григорьева Научный центр Российской академии наук в Черноголовке dep@chg.ru вых информационных технологий, представлено в Аннотация основной части данной статьи.

Излагается опыт реализации системы об щения виртуальных коллективов Access- 2. Концепция виртуальных коллективов Grid в Научном центре в Черноголовке. Реа Концепция виртуальных коллективов является лизована система для проведения видео основополагающей в грид-технологиях. В отличие семинаров. Реализована система общения от общепринятого подхода, когда все ресурсы для распределенных рабочих групп (лаборато решения какой-то конкретной задачи сосредоточе рий). Обсуждаются особенности реализа ны в одном месте, грид-технологии позволяют объ ции и технические детали. Также обсужда единить различные ресурсы, часто распределенные, ются пути развития программного обеспе и использовать их как единое целое. Сообщество чения.

людей, использующих такую распределенную сис тему, и есть виртуальный коллектив [2,3].

1 Введение Результат, полученный от объединения различ В последние годы доля научных исследований, в ных и часто разнородных ресурсов в единое целое, которых принимают участие совместные коллекти- намного превосходит суммарные возможности от вы из разных стран, растет стремительными темпа- дельных подсистем. Определение грид-технологий, ми. Так, с 1986 по 1999 гг. число работ с междуна- представленное в работах Фостера с соавторами [2, родными соавторами выросло с 7 до 17 процентов. 3], является достаточно общим. Так, грид-система – Стремительное развитие междисциплинарных об- это система, которая: координирует доступ к ресур ластей науки также приводит к усилению совмест- сам, не находящимся под централизованным управ ного сотрудничества между учеными. Интересные лением, использует стандартные и открытые прото данные были опубликованы недавно в статье Кенны колы и обеспечивает нетривиальное качество об и Берша [1]. Авторы проанализировали общедос- служивания. При этом построенная система не учи тупные данные о распределении финансирования в тывает наличия административных, географиче Великобритании и Франции между различными ских, политических и прочих границ.

группами ученых, в зависимости от количества че- Виртуальный коллектив – это коллектив, кото ловек в группе. Они обнаружили, что существует рый использует некие распределенные ресурсы и критический размер научной группы, определяю- решает при этом общую задачу. Например, одна из щий научную успешность группы. Так, для чистой лабораторий имеет в своем распоряжении уникаль математики критический размер группы оказался ный прибор для измерений и технически обеспечи равным 2, для прикладной математики – 6, физики – вает удаленный доступ к этому прибору. Через ин 12, а для химии – 18. тернет другая лаборатория проводит совместно с На пути увеличения размеров научных групп первой измерения на своих образцах. Данные, полу возникает много организационных трудностей. Ча- ченные в процессе измерений, сохраняются в хра ще всего нужные специалисты, которые могут со- нилище, предоставленным третьим коллективом, а вместно работать над какой-то одной общей зада- теоретическая лаборатория в четвертой организации чей, находятся в разных местах. Общение является занимается обработкой этих данных, причем все важной частью в совместной работе группы людей. описанные выше действия выглядят для всех участ На сегодняшний день информационные технологии ников процесса так, как будто бы они происходили достигли такого уровня развития, который делает локально на их рабочих местах, в одной лаборато возможным создание виртуальных коллективов. рии.

Обсуждение современных средств, которые позво ляют реализовать такое общение посредством но- 3 Среда AccessGrid Важной составляющей работы любого коллекти Труды 12й Всероссийской научной конференции ва являются не только обмен/обработка полученных «Электронные библиотеки: перспективные методы данных, но и живое общение самих участников ме и технологии, электронные коллекции» – жду собой. Протоколы грид-среды, обеспечиваю RCDL’2010, Казань, Россия, щие взаимодействие виртуальных коллективов при вычным им способом, посредством аудио- оборудованию и услугам, реализующим передачу визуального общения, представлены в разработке multicast-трафика. Для таких пользователей в сис Аргонской национальной лаборатории под названи- теме AccessGrid разработан сервер Bridge, осущест ем AccessGrid [4]. вляющий преобразование Unicast-потоков в Multi Среда AccessGrid представляет собой инстру- cast и обратно. Выбор Bridge-сервера осуществляет ментарий для создания среды по обмену аудио и ся автоматически (самый близкий) или вручную видео между участниками, а также предоставляет пользователем. Пример схемы соединений клиентов программный интерфейс для создания средств кол- и Bridge-серверов показан на рис. 1.

лективной работы. Примерами таких средств явля ются модули для совместного просмотра презента ций, веб-страниц, обмена файлами между участни ками, совместного редактирования документов и т. д.

Средство коллективной работы AccessGrid ис пользует распределенную модель обработки ин формации, что позволяет легко наращивать мощ ность и возможности системы простым включением дополнительных компонент, как аппаратных, так и программных.

Система состоит из одного или нескольких цен тральных Venue серверов и конечных узлов Nodes.

Центральный сервер реализует концепцию вирту альных организаций, поддерживая список комнат (Venue) – аналог независимых мест встречи участ ников. Каждая такая комната может иметь ссылки на Venue, находящиеся на других серверах, перехо дя по которым, пользователь может попасть в нуж ное ему место. С каждым Venue ассоциирована до Рис. 1. Схема обмена данными в системе полнительная информация – запущенные в нем рас AccessGrid пределенные приложения (например, совместный просмотр веб-страниц), общее хранилище файлов, 4 Узел AccessGrid в Черноголовке информация о правах пользователей и т. д.

Система авторизации и идентификации пользо С целью проведения дальнейших исследований вателей целиком заимствована из грид-среды по работе виртуальных коллективов посредством Globus Toolkit и базируется на сертификатах SSL.

грид-среды AccessGrid нашим коллективом обору Пользователь, получивший сертификат в одном дована специальная комната для проведения видео месте, сразу становится идентифицированным и на семинаров [5]. Состав установленного оборудова всех других Venue-серверах.

ния следующий (см. рис. 2):

Конечные узлы – узлы отдельных пользователей, • устройства отображения информации – два осуществляют ввод/вывод аудио-видео информации проектора стандартного разрешения, один проектор и позволяют им взаимодействовать с распределен высокого разрешения;

ными приложениями. Под узлом пользователя по • четыре управляемых видеокамеры;

нимается не отдельный компьютер, а весь комплекс • два компьютера, осуществляющие захват аппаратных средств, который может включать в видео (каждый компьютер обслуживает две каме себя несколько видеокамер, несколько устройств ры);

отображения информации, рабочие станции и т. д.

• два компьютера, осуществляющие вывод Системы видео-конференционной связи, част видео, презентаций и т. п.;

ным случаем которых является и AccessGrid, подра • звуковое оборудование – микрофоны, мик зумевают передачу информации от всех участников шер, система звукоусиления и т. д.;

к каждому. Так, типичный поток с видеокамеры • ввод/вывод звука осуществляет один из разрешения NTSC составляет около 2Mbit/s. При компьютеров, использующихся для вывода изобра числе участников более двух передача видеоинфор жения.

мации между каждой парой участников становится Помимо этого имеются один сервер с работаю неэффективной. Требования к полосе пропускания щим ПО, реализующим функции VenueServer и еще более возрастают при использовании несколь Bridge, а также дополнительный переносной ком ких камер.

пьютер, который используется для удобства управ Для удовлетворения описанным техническим ления показом презентаций с места докладчика.

требованиям основным средством передачи видео В состав комплекса AccessGrid входят, по сути, и аудиоинформации выбран протокол многоадрес изначально независимые приложения Vic и Rat, ной рассылки. К сожалению, на текущий момент разработанные задолго до этого в рамках проекта далеко не все организации имеют доступ к сетевому Mbone [6]. Среда AccessGrid координирует их рабо- доступных для тестирования системы, превышает ту, следя за тем, какие адреса/порты, протоколы, десять единиц.

ключи шифрования используются при этом для пе редачи аудио/видео. 6. AccessGrid на практике Наилучших результатов, как по задержке пере Практическая реализация системы совместной дачи видео, так и по качеству изображения, удалось работы виртуального коллектива построена с уча добиться при использовании современного кодека, стием немецких коллег из Суперкомпьютерного основанного на стандарте H264.

центра в Юлихе, Германия. Начиная с сентября 2009 года, НЦЧ РАН совместно с Научно исследовательским центром в Юлихе проводят ежемесячный семинар по различным аспектам вы числительной физики и компьютерных наук. Не мецкие коллеги имеют специально оборудованное помещение с установленным ПО AccessGrid. В се минаре участвуют с докладами научные сотрудники и аспиранты, работающие в Черноголовке и Юлихе.

Формат семинара – два доклада по 40 минут, на ко торых представляются и обсуждаются научные ре зультаты по вычислительной физике, химии и био логии, методики и алгоритмы проведения крупно масштабных расчетов, физические и алгоритмиче ские принципы построения компьютеров нового поколения [7].

В работе семинара используется по две видеока меры с каждой стороны. Показ презентационных материалов (в формате PowerPoint) осуществляется с использованием приложения SharedPresentation.

Управление показом слайдов возможно с любого из компьютеров в сети AccessGrid. При необходимости показа презентаций в формате PDF возможно ис пользование приложения SharedDesktop, которое осуществляет захват изображения рабочего стола презентационного ноутбука и дальнейшую передачу его другим участникам по протоколу VNC.

НЦЧ РАН, являясь провайдером интернета для всех научных организаций в Черноголовке, имеет выделенное подключение к точке обмена научным трафиком RbnetScience на скорости 100 Мбит/с.

Рис. 2. Схема узла AccessGrid в НЦЧ РАН Таким образом, весь трафик видеоконференций пе редается через высокоскоростной канал. Количество потерянных кадров при передаче видео составляет не более 0.3% в большинстве случаев и редко дос 5 Тестовое оборудование тигает 3 – 4%. Более высокие потери – около 7 – 10% – приводят к значительным искажениям изо Проведение видео-конференций предполагает бражения, однако при совместной работе с научным участие как минимум двух сторон. Для проведения центром Юлиха таких случаев не наблюдалось.

различных тестов в распоряжении нашего коллек Система AccessGrid использовалась авторами тива имеется второе помещение со стационарно для многих мероприятий как в России, так и за ру установленным оборудованием – проектором высо бежом, например, для многоточечной видеоконфе кого разрешения и компьютером с видеокамерой, ренции между МФТИ (Долгопрудный) и тремя уча картой захвата видео, а также с комплектом звуко стниками в Черноголовке для демонстрации дости вого оборудования.

жений Научного центра по нанотехнологиям Программное обеспечение AccessGrid является (рис. 3).

мультиплатформенным решением. Имеются бинар Хотя расстояние между Черноголовкой и Долго ные сборки как под ОС семейства Windows, так и прудным намного меньше, чем между Черноголов под Linux и MacOS. При этом система может рабо кой и Юлихом, качество каналов связи оказалось тать как с картами захвата видео, так и с обычными значительно хуже, и временами наблюдались значи веб-камерами. Последнее позволяет использовать ее тельные потери данных. Это связано с тем фактом, и на обычных компьютерах пользователей.

что работа с МФТИ осуществлялась через точку С учетом имеющихся в распоряжении авторов обмена трафиком в РФ MSK-IX. Маршрутизаторы вычислительных средств общее число видеокамер, этой точки обмена периодически испытывают прак- Так, наиболее часто используется оборудование тически полную нагрузку, что приводит к значи- видео-конференцсвязи фирм Polycom и Tandberg.

тельным потерям в потоке видеоинформации. Очевидно, что узлы, построенные на базе Стоит заметить, что наибольшее влияние потери AccessGrid, не совместимы с такими решениями.

оказывают именно на видео поток, т. к. его объем Однако вряд ли это можно считать серьезным не значительно превышает звуковой поток. достатком, ведь система AccessGrid позволяет сде лать значительно больше. Имеются проекты по раз работке приложений для совместной работы с науч ным оборудованием, когда доступ к данным имеют сразу все участники видеоконференции. Существу ют программы совместного просмотра 3D моделей сложных химических соединений и т. п. Все это недоступно в принципе для коммерческих систем типа Polycom, основная задача которых – передача аудио и видео. Основной адрес коммерческих сис тем – это организация обсуждения в администра тивном стиле. При этом большинство таких систем, по сути, являются системами точка-точка, а под держка многоточечности реализована простым объ единением нескольких потоков в один с наложени ем двух и более картинок друг на друга с уменьше Рис. 3. Видеосеминар по нанотехнологиям нием их размера.

МФТИ – НЦЧ РАН Еще одна трудность, с которой пришлось столк нуться авторам, связана с отсутствием реализации 7 Обсуждение некоторых возможностей. Так, все функции систе мы по авторизации пользователей используют толь Общее количество стационарных узлов ко сервера Аргонской национальной лаборатории.

AccessGrid превышает 300 единиц. Из них в России IP адреса серверов, отвечающих за выдачу сертифи – только один, расположенный в НЦЧ РАН. Наи катов, записаны явно в исходном коде. Для обеспе большее число узлов находится в США и Велико чения возможности использования своих собствен британии, меньшее – в Европе и других странах ных серверов исходный код системы был доработан мира. Одна из причин отсутствия развития данной соответствующим образом, в результате чего мы технологии в России лежит, скорее всего, в низком имеем возможность построения автономной систе качестве сетей связи, отсутствии персонала с необ мы видеоконференций.

ходимой квалификацией и низкой заинтересованно Расширяемость и масштабируемость системы сти со стороны самих научных коллективов.

AccessGrid – это не единственное ее достоинство.

Так, попытка организовать подобный видеосе Дополнительный и наиболее весомый аргумент – минар с Научным центром в Новосибирске наткну это цена системы. Так, начальная стоимость одного лась на проблему отсутствия высокоскоростного узла AccessGrid составляет не более 40000 руб.

подключения к интернету лабораторий Академго Стоимость же аналогичной по функциональности родка и отсутствия выделенных IP-адресов.

коммерческой системы (на базе Polycom, Tangberg и Наиболее часто возникающая проблема при ра т. п.) на порядок больше.

боте AccessGrid – это необходимость использования Все системы совместной работы условно можно выделенных адресов и отсутствие ограничения на поделить на несколько основных классов:

сетевых экранах по пути следования трафика.

1. Видеоконференции уровня точка-точка. На Вторая проблема – отсутствие mutilcast значение – возможность индивидуального общения коннективности между участниками. Для использо через интернет для коллег, соавторов, руководите вания многоадресной рассылки для передачи ви лей и исполнителей проектов. Позволяет проводить део/аудиоданных требуются поддержка данной воз обсуждение научной деятельности, передачу и ото можности всем промежуточным сетевым оборудо бражение графических файлов, совместную работу ванием и его грамотная настройка. В противном над текстами и документами для написания статьи, случае некорректные действия пользователя могут проекта или отчета.

привести к нарушению функционирования сети пе 2. Видеоконференция уровня лаборатория редачи данных.



Pages:     | 1 || 3 | 4 |   ...   | 26 |
 





 
© 2013 www.libed.ru - «Бесплатная библиотека научно-практических конференций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.