авторефераты диссертаций БЕСПЛАТНАЯ БИБЛИОТЕКА РОССИИ

КОНФЕРЕНЦИИ, КНИГИ, ПОСОБИЯ, НАУЧНЫЕ ИЗДАНИЯ

<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ


Pages:     | 1 |   ...   | 8 | 9 || 11 | 12 |   ...   | 26 |

«Электронные библиотеки: Перспективные Методы и Технологии, Электронные коллекции English Труды RCDL 2010 ...»

-- [ Страница 10 ] --

схеме могут быть определены полные специфика coordinate: CoordEQJ2000;

ции функций.

morphology: {enum;

enum_list:

При создании спецификаций концептуальных {point, fuse, elliptic}};

схем на основе онтологии есть возможность сохра magnitudes: {set;

type_of_element: Magnitude;

};

нять связь между онтологическими понятиями и properMotion: real;

элементами концептуальных схем с помощью онто quality: real;

логического аннотирования, как это принято в спе isVariable: {in: function;

цификациях предметных посредников [14]. При params: {-returns/boolean};

этом не теряется онтологическая информация, на };

копленная для данных элементов схем в процессе colorIndex: {in: function;

проектирования.

params: {+firstPB/Passband, В частности, в типе CoordEQJ2000 при замене +secondPB/Passband, типов значений атрибутов ra и de, соответствующих -returns/real};

измеряемым величинам, на скалярный тип теряется };

информация о семантике этих данных с точки зре }, ния онтологии, из которой получена концептуаль { Star;

ная схема. Более того, не известно, что означает тип in: type;

CoordEQJ2000 после уточнения типа Coordinate в supertype: AstronomicalObject;

терминах онтологии.

}, { Standard;

Для того чтобы избежать потери семантики, не- вываться, соответственно, и от требования реализа обходимо, во-первых, при создании прототипа кон- ции в среде посредников. Однако реализация схемы цептуальной схемы их онтологии аннотировать ти- в среде посредников имеет свои особенности. Сами пы, атрибуты, функции, параметры соответствую- спецификации схемы посредника в комплексе с ис щими онтологическими понятиями и, во-вторых, полнительной средой посредника и зарегистриро при трансформациях схемы отслеживать изменение ванными ресурсами уже являются реализацией схе семантики онтологических аннотаций. мы, так как дополнительных действий по реализа В первоначальном прототипе концептуальной ции со стороны посредника производить не нужно.

схемы, созданной для решения задачи поиска звёзд- Те типы и классы концептуальной схемы предмет стандартов, создаются абстрактные типы данных ной области, которые могут использоваться для ре схемы, однозначно соответствующие понятиям, из гистрации представительных ресурсов, попадут в которых они созданы. Так, тип Coordinate анноти- схему посредника. Также туда попадают специфи руется онтологическим понятием Coordinate, атри- кации, которые могут быть реализованы в виде спе буты ra и de в типе EquatorialCoordinateSystem анно- циального информационного ресурса, регистрируе тируются понятиями, соответсвующими их типам мого в посреднике как обычные ресурсы. Остальная значений, соответственно RightAscension и Declina- часть концептуальной схемы предметной области tion. должна быть реализована традиционным способом В процессе трансформации типа Coordinate в тип в виде программы над предметным посредником.

CoordEQJ2000 и передвижения в него атрибутов ra и de отслеживаются и изменения их семантики с 7 Заключение точки зрения онтологии. Они будут принадлежать В статье кратко описан процесс проектирования классам понятий, выраженных формулами.

спецификаций предметной области, необходимых Тип CoordEQJ2000 соответствует подпонятию для определения предметного посредника и реше понятия Coordinate, у которого эпоха равна 2000-му ния задач предметной области в его среде с повтор году и система координат экваториальная:

ным использованием внешних информационных ресурсов. Данный подход отличает направленность {x/Coordinate | in(x, coordinate) & x.epoch=J2000 & на выявление и сохранение в концептуальной схеме in(x.coordinateSystem, equatorialCoordinateSystem)} семантики предметной области, независимость от участвующих в решении задачи конкретных ин Атрибуты ra и de при перемещении из типа в тип формационных ресурсов. Указаны особенности реа и изменении типов значений так и остаются при лизации концептуальных схем предметных облас надлежащими понятиям RightAscension и Declina тей в среде посредников.

tion соответственно. Однако путь их принадлежно сти связанным понятиям также можно проследить, Литература уточнив понятия, которым они соответствуют. По нятие для атрибута ra:

[1] Брюхов Д.О., Вовченко А.Е., Захаров В.Н., Же ленкова О.П., Калиниченко Л.А., Марты {x/RightAscension | in(x, rightAscension) & нов Д.О., Скворцов Н.А., Ступников С.А. Архи ex y/Coordinate, z/EquatorialCoordinateSystem тектура промежуточного слоя предметных по ( in(y, coordinate) & средников для решения задач над множеством in(z, equatorialCoordinateSystem) & интегрируемых неоднородных распределённых y.coordinateSystem = z & z.ra = x) } информационных ресурсов в гибридной грид инфраструктуре виртуальных обсерваторий// Аналогично, понятие для атрибута de будет сле Информатика и её применения. – 2008. – Т. 2, дующим:

Вып. 1. – С. 2-34.

[2] Когаловский М.Р., Калиниченко Л.А. Концеп {x/Declination | in(x, declination) & туальное моделирование в технологиях баз дан ex y/Coordinate, z/EquatorialCoordinateSystem ных и онтологические модели// Труды Симпо ( in(y, coordinate) & зиума «Онтологическое моделирование», г. Зве in(z, equatorialCoordinateSystem) & нигород, 19 – 20 мая 2008 г., ред. Калиничен y.coordinateSystem = z & z.de = x)) ко Л.А. – М: ИПИ РАН, 2008. – 303 с. – ISBN 978-5-902030-54-6. – С. 114-148.

На основании отображения понятий из разных [3] Jiang L., Topaloglou T., Borgida A., Mylopou онтологических контекстов и аннотированных ими los J.. Goal-oriented conceptual database design// элементов концептуальных схем можно найти реле Conf. on Requirements Engineering (RE'07), Delhi, вантные элементы схем ресурса и задачи. На этом 2007.

этапе могут быть разработаны функции разрешения [4] Lapouchnian Y.Yu., Mylopoulos J. Requirements конфликтов, в дальнейшем используемые при реги driven design and configuration management of страции ресурсов в посреднике.

business processes||Proc. 5th Int. Conf. on Business Процесс построения концептуальной схемы не Process Management (BPM 2007), Brisbane, Aus зависит от того, каким образом она будет реализо tralia, Sept. 24 – 28, 2007. G. Alonso, P. Dadam, From specifications of requirements and M. Rosemann (Eds.), LNCS. – Berlin – to conceptual schema Heidelberg: Springer-Verlag, 2007. – V. 4714. – A.E. Vovchenko, V.N. Zakharov, P. 246-261.

L.A. Kalinichenko, D.Yu. Kovalyov, [5] Загорулько Ю.А. Методы и методологии разра O.V. Pyabukhin, N.A. Skvortsov, S.A. Stupnikov ботки, сопровождения и реинжиниринга онто логий// Труды Симпозиума «Онтологическое The paper presents an investigation of subject domain моделирование», г. Звенигород, 19 – 20 мая conceptual schema modeling methods for problem solv 2008 г., ред. Л. А. Калиниченко – М: ИПИ РАН, ing using a semantic-based approach to subject domain 2008. – 303 с. – ISBN 978-5-902030-54-6. – specifications development. The development process С. 167-200.

includes analysis of requirements to the subject domain [6] Conesa J., Oliv A. A method for pruning ontolo starting from verbal specifications of the problem, de gies in the development of conceptual schemas of velopment of subject domain ontology and transforma information systems//ER2004, Shangai, China:

tion of the ontology to a conceptual schema. Issues of Springer, 2004.

conceptual schema implementation in a subject media [7] Sugumaran V., Storey V. The role of domain on tor environment are discussed.

tologies in database design – an ontology manage ment and conceptual modeling environment// ACM Работа выполнена при частичной финансовой поддерж Transactions on Database Systems. – V. 31, No 3. – ке РФФИ (проекты 08-07-00157, 10-07-00342) и Програм P. 1064-1094.

мы фундаментальных исследований Президиума РАН [8] Kalinichenko L.A., Stupnikov S.A., Martynov D.O.

№ 15П «Фундаментальные проблемы системного про SYNTHESIS: a language for canonical information граммирования», раздел modeling and mediator definition for problem solv ing in heterogeneous information resource envi ronments. – Moscow: IPI RAN, 2007. – 171 p.

[9] Ступников С.А. Отображение спецификаций ядра канонической модели в нотацию абстракт ных машин// Формальные методы и модели для композиционных инфраструктур распределён ных информационных систем: Системы и сред ства информатики, специальный выпуск. – М:

ИПИ РАН, 2005. – С. 69-95.

[10] IEEE Standard Glossary of Software Engineering Terminology. IEEE Std 610.12-1990.

[11] Sebastiani R., Giorgini P., Mylopoulos J. Simple and minimum-cost satisfiability for goal models// Proc. Int. Conf. on Advanced Information Systems Engineering (CAiSE 2004), Riga, Latvia, 2004.

[12] Helbig H., Gnorlich C. Multilayered extended se mantic networks as a language for meaning repre sentation in NLP systems// Computational Linguis tics and Intelligent Text Processing (CICLing 2002). Ed. by A. Gelbukh. – Berlin:Springer, 2002.

– V. 2276 of LNCS. – P. 69-85.

[13] Лезин Г.В. Онтологическая семантика текста:

форматирование лексики в семантическом сло варе// RCDL'2009, Петрозаводск, 2009.

[14] Скворцов Н.А. Связывание объектных специ фикаций по семантике онтологического уров ня// RCDL'2006, Суздаль. – Ярославль: Ярослав ский государственный университет им.

П.Г. Демидова, 2006. – C. 70-74.

[15] Скворцов Н.А. Специфика подходов к отобра жению онтологий// Вопросы искусственного интеллекта. SCMAI Transactions. – М.: 2010. – № 2.

Сопряжение языков программирования с предметными посредниками для решения научных задач © А.Е. Вовченко ИПИ РАН, г. Москва itsnein@gmail.com ков программирования (ЯП) с декларативным язы Аннотация ком предметных посредников.

Рассматривается проблема определения Несмотря на многочисленные исследования в адекватного связывания процедурных язы области интероперабельных архитектур, сопряже ков программирования с декларативным ния ЯП с базами данных и существующие стандар языком, используемым в предметных по ты (стандарт OMG для сопряжения IDL c ЯП [4], средниках. Предложен набор характеристик стандарт ODMG 3.0 [5], сопряжения C++ с Oracle для оценки различных существующих под (OCCI) [6], сопряжение Java с БД (JDBC) [7], стан ходов по связыванию языков программиро дарт SQLJ для встраивания языка SQL в ЯП Java вания и систем управления ресурсами. По [8, 9], стандарт Sun JDO [10], Microsoft LINQ [11] и казано, какой набор характеристик должен др.), до сих пор не были систематически рассмотре быть выбран для решения проблемы несо ны подходы к проектированию и созданию подоб ответствия импеданса.

ных сопряжений. Это затрудняет оценку сравнения качества различных подходов к сопряжению, а так 1 Введение же создание сопряжения для новых языков и сис Диссертационное исследование, в рамках кото- тем. Целью настоящей статьи является предложение рых подготовлена настоящая статья, выполняется в системы характеристик (features), которыми можно соответствии с концепцией формулирования науч- было бы характеризовать и оценивать разнообраз ных задач и создания информационных систем в ные средства сопряжения ЯП с системами управле среде предметных посредников [1], определяемых в ния различными информационными ресурсами. Ос терминах предметной области независимо от суще- новным мотивом разработки такой систематизации ствующих информационных ресурсов (баз данных, является необходимость обоснованного определе программных сервисов, процессов). Релевантные ния адекватной архитектуры сопряжения средств задаче неоднородные, распределенные информаци- поддержки предметных посредников с языками онные ресурсы регистрируются в посреднике в виде программирования. При такой систематизации мы взаимных отображений классов ресурсов и классов ограничимся классом объектно-ориентированных посредника, выражаемых декларативно при помощи языков.

GLAV взглядов [2]. Спецификации предметных В следующем разделе представлено описание посредников определяются средствами объектно- характеристик для оценки сопряжений ЯП с базами фреймового языка [3] и типизированного языка ло- данных. Затем представлена краткая характеристика гики первого порядка для выражения формул, пра- проблемы несоответствия импеданса при сопряже вил, утверждений и программ на правилах над клас- нии языков запросов и языков программирования.

сами посредника. Поддержка решения задач в среде Затем описан подход к верификации отображений, посредников обеспечивается различными компо- после чего описывается подход, реализуемый в ра нентами – посредниками, информационными ресур- боте.

сами, программируемыми адаптерами, трансформа циями, определяемыми отображениями классов ре- 2 Характеризация сопряжений ЯП с ба сурсов в классы посредников, прикладными про зами данных граммами над посредниками. Диссертационные ис Хотя предметом статьи является сопряжение следования посвящены вопросам эффективной ор средств поддержки предметных посредников с ЯП, ганизации рассредоточенной поддержки решения в этом разделе будет рассматриваться и анализиро задач такими компонентами. Одним из важных во ваться сопряжение ЯП с базами данных в силу по просов такой организации является определение давляющего числа исследований, стандартов и реа архитектуры средств сопряжения процедурных язы лизаций в этой области. Общность рассуждений при этом не нарушается, т. к. предметные посредники Труды 12ой Всероссийской научной конференции могут рассматриваться как системы управления «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» – RCDL’2010, виртуальными ресурсами.

Казань, Россия, Отображение типов ЯОД в типы ЯП, включая private int emp_id;

функции и инварианты типов, должно быть комму- private float salary;

тативным [12]. При этом требуется сохранение от- //getters and setters for emp_id and salart ношений между типами (такими, как тип – подтип). public float give_raise(float amount);

} Под коммутативностью отображения здесь понима DBCollectionEmp empls = new DBCollec ется отображение, которое сохраняет операции и tionEmp();

информацию исходной модели данных (модели ин Type2TypePattern: спецификация типа (класса) формационного ресурса) при ее отображении в це ЯОД представляется значением (объектом) в ЯП, левую (модель данных ЯП). Коммутативность дос изображающим соответствующую спецификацию тигается при условии, что диаграммы отображения типа в ЯП ЯОД (схем) является коммутативной. В частности, //Specification in DDL (SQL) при доказательстве коммутативности отображения CREATE TABLE customer ( типов необходимо устанавливать факт уточнения Name char(50), [16] операций типов исходной модели операциями Birth_Date date) типов целевой модели [13].

Другим важным моментом сопряжения является отображение языка запросов в ЯП. Отображение //Type specification in PL(Java) должно обладать свойством включения Class Attribute {String attName;

String attType;

} (containment) [14]. Для поддержки статического Class DBTable {String tableName;

ListAttribute atts;

} контроля типов требуется расширение ЯП конст //PL Object рукциями языка запросов, в динамике подобного table = {“customer”, atts = { расширения не требуется, и запрос можно воспри {“Name”,”char(50)”}, {“Birth_Date”,”date”}}} нимать как строку.

PL-Type2DDLType: от типов ЯП к типам схемы Манипулирование может осуществляться как базы данных посредством изменения значений долговечных ти //Specification in C# пов, так и посредством специальных операций [Table(Name="People")] ЯМД. Для поддержки статического контроля типов public class Person { ЯП должен быть расширен конструкциями ЯМД. В [Column(DbType="nvarchar(32) not null", динамике этого не требуется, и операции ЯМД Id=true)] можно передавать СУБД в виде строки.

public string Name;

Важным моментом такого отображения является [Column] различение в ЯП долговечных и недолговечных public int Age;

типов (и их экземпляров). Поскольку в ЯП эти по } нятия не определены, ЯП требуют расширения.

Отображение классов ЯОД в коллекции ЯП требует //In DataBase the following table is created:

изменения семантики коллекций (долговечность) – create table People ( фактически изменения ЯП. Важным моментом та Name nvarchar(32) primary key not null, кого отображения является поддержка родовых (ge Age int not null, neric) коллекций. Для поддержки статического кон ) троля типов требуется, чтобы результирующая кол лекция была родовой (SetType). Представление конструкций ЯЗ в ЯП (Query При таких предположениях множество возмож- Mapping):

Query2String: запрос представляется строкой.

ных сопряжений ЯП и СУБД будем определять сле //QL – SQL, Programming Language – Java дующим набором ортогональных характеристик.

OQLQuery query = impl.newOQLQuery();

Представление конструкций ЯОД в ЯП (DDL query.create( Mapping):

"select t.assists.taughtBy from t in TA where t.salary Type2Type: спецификация типа (класса) ЯОД $1 and t in $2 ");

представляется спецификацией типа (долговечной Query2QueryPattern: запрос представляется зна (persistent) коллекцией) ЯП //Specification in DDL (SQL) чением (объектом) в ЯП.

CREATE TYPE emp UNDER person AS ( //QL – Declarative JDOQL, Programming Language EMP_ID INTEGER, – Java SALARY REAL ) INSTANIABLE NOT Query q = pm.newQuery(org.jpox.Person.class, FINAL REF ( EMP_ID ) "lastName == \"Jones\" && age age_limit");

INSTANCE METHOD GIVE_RAISE ( q.declareParameters("double age_limit");

AMOUNT REAL ) RETURNS REAL;

List results = (List)q.execute(20.0);

CREATE TABLE empls OF emp_type;

Query2PL-Query: ЯП расширяется конструкция ми языка запросов.

//Type specification in PL(Java) //QL – SQLJ, Programming language – Java Class Emp extends Person implements Persisten- #sql ordIdIter = { SELECT OrderId FROM tObject { otn_deliverydetail };

while (ordIdIter.next()) { TransientObjects: долговечные данные не под id = ordIdIter.orderid();

держиваются, изменение объектов не влечет за со gui.addToList(id);

бой изменения данных в БД.

} Поддержка generic коллекций (Collections):

Generic-SetType: коллекции SetType поддер Полнота отображения ЯЗ (Full Query Sup живаются.

port):

ClassCompositionQuery: язык запросов отобра- Strict-SetType: generic коллекции не поддержи жается полностью. Предоставляется возможность ваются.

выразить любой запрос, допустимый в информаци- Мы покажем полезность введенной характериза онном ресурсе, средствами ЯП. ции сопряжений, применяя ее к определению набо OneClasslQuery: язык запросов сильно ограни- ра характеристик сопряжения, достаточных для чен. Обеспечивается только извлечение объектов обеспечения статического или динамического кон одного класса по условию. троля типов.

Для обеспечения статического контроля типов Представление конструкций ЯМД в ЯП (Ob достаточно реализовать следующий набор решений ject Manipulation):

DMLoperator2String: операции манипулирова- (статический подход): Type2Type, Query2PL-Query, ния объектами представляются строкой. DMLoperator2PL-operator либо PersistentObjects, DMLoperator2PL-operator: ЯП расширяется кон- Generic-SetType. Для динамического контроля дос струкциями языка манипулирования данными. таточно реализовать следующий набор решений (динамический подход): Type2TypePattern, Поддержка манипулирования долговечными Query2String, DMLoperator2String, Strict-SetTypet.

данными в ЯП (Object Manipulation):

PersistentObjects: долговечные данные поддер- В табл. 1 дана характеризация известных спосо живаются, изменение объектов влечет за собой из- бов сопряжения по предложенным критериям. Под менение данных в БД. ход, выбранный в настоящей работе, включен в таб лицу как Synthesis.

Таблица 1. Характеризация известных способов сопряжения по предложенным критериям DDL Mapping Query Mapping Object Manipulation Full Query Collec Support tions Type2Type No No No No IDL OMG Type2Type Query2String TransientObjects Composed Strict ODMG ClassPlQuery SetTypet 3. PL- Query2String, PersistentObjects One Generic JDO Type2DDLType Query2QueryPattern ClassPlQuery SetType Type2TypePattern Query2String DMLoperator2String, Composed Strict JDBC TransientObjects ClassPlQuery SetTypet Type2TypePattern Query2PL-Query DMLoperator2PL- Composed Generic SQLJ operator, PersistentOb- ClassPlQuery SetType jects Type2Type Query2String DMLoperator2String, One Strict OCCI Transient Objects ClassPlQuery SetType PL- Query2PL-Query DMLoperator2PL- Composed Generic LINQ Type2DDLType operator, PersistentOb- ClassPlQuery SetType jects, TransientObjects Type2Type, Query2String, PersistentObjects, Composed Generic Synthesis Type2TypePattern Query2PL-Query TransientObjects ClassPlQuery SetType языках, например, в Java символ “=” означает при 3 Краткая характеристика проблемы не сваивание, а в SQL – сравнение.

соответствия импеданса при сопряжении • Typing: типы в ЯП, в ЯОД и в языке запросов языков запросов и языков программи- могут сильно отличаться. Коммутативное отобра рования жение типов может оказаться невозможным или неэффективным. Эта проблема актуальна как для Проблемы несоответствия импеданса подробно простых типов, так и для сложных, абстрактных описаны в статье [15]. Наиболее важные проблемы типов данных.

описаны ниже.

• Binding phases and mechanisms (Binding):

• Syntax: специалист должен одновременно ис язык запросов основан на динамическом (времени пользовать два разных (синтаксически) языка. Оди выполнения) связывании имен в запросе, в то время наковые символы могут означать разное в разных как в языках программирования используется ста- данными (хранящимися в памяти). Объекты в язы тическое (времени компиляции) связывание. ках программирования, получаемые из БД, имеют • Name spaces and scope rules (Names): про- образ в базе данных. Таким образом, изменения в объектах должны быть отражены и в БД.

странства имен в языке запросов и языке програм • Queries and expressions (Queries): некоторые мирования различаются. Например, мы не можем использовать переменные из запроса в языке про- запросы и выражения синтаксически могут выгля граммирования и переменные ЯП в языках запро- деть идентично и при этом иметь разную семантику.

сов. При этом важной остается задача параметриза- Например, в языках запросов 2+2 – это запрос, в то ции запросов. Также важно наличие возможности время как в языках программирования – это выра использования результата запроса как переменной жение. Запрос не может быть параметром функции, языка программирования. в то время как выражение может.

• Collections: коллекции в базах данных и язы- • References (Refs): для изменения данных в БД ках программирования семантически отличаются. В нужны ссылки на данные в базе. В языках запросов языках программирования возможности коллекции результат – это таблица, а не ссылка. Таким обра сильно ограничены. Коллекции, возвращаемые в зом, в ЯМД требуется поддержка ссылок на данные качестве результата запросов, не имеют явного ото- в БД, или же должны предоставляться иные воз бражения в языках программирования, и должны можности изменения данных (например Persistent обрабатываться специальными конструкциями со Objects).

• Refactoring: при разработке сложных проектов своим синтаксисом и семантикой.

• Persistence: языки запросов оперируют долго- важным моментом является возможность рефакто вечными данными, в то время как языки програм- ринга. В случае, когда запросы трактуются как мирования обычно оперируют кратковременными строки, рефакторинг невозможен.

Таблица 2. Зависимость решения проблемы несоответствия импеданса от характеристик Syntax Typing Binding Names Collections Persis- Queries Refs Refactoring tence Yes Yes(w) Yes(w) Type2Type Type2TypePattern PL-Type2DDLType Yes Yes(w) Yes Yes Yes Query2PL-Query Query2String Yes Yes Query2QueryPattern Yes DMLoperator2PL operator Yes DMLoperator2String Yes Yes Persistent Objects Transient Objects Generic-SetType Yes(w) Strict-SetType Yes означает, что подход с данной характеристи 4 Верификация отображений кой полностью решает проблему. Yes(w) означает, что проблема решается только в сочетании с другой Для обеспечения необходимых свойств отобра характеристикой. Из таблицы видно, что для реше жения информационной модели предметных по ния всех проблем несоответствия импеданса подход средников в модель ЯП особое внимание уделяется к сопряжению должен обладать следующим набо проведению верификации коммутативности отобра ром характеристик: Type2Type, Query2PL-Query, жения типов. Для этого семантика информационных Persistent Objects, Strict-SetType. Несложно заметить, моделей ЯП и предметного посредника определяет что этот набор характеристик соответствует стати ся формально в рамках логики первого порядка (но ческому подходу. Видно, что ни один из сущест тация абстрактных машин [16]) и обеспечивается вующих подходов (табл. 2) полностью не реализует доказательство коммутативности отображений, де статический подход. Кроме того, из таблицы следу монстрируя уточнение типов посредника типами ет, что предложенный набор характеристик полно ЯП.

стью покрывает проблемы несоответствия импедан Технически отображение моделей реализуется в са, следовательно, набор характеристик достаточен.

стиле MDA при использовании языка ATL и мета модели Ecore для представления абстрактного син таксиса отображаемых моделей. Средства поддерж ки языка ATL реализованы в виде встраиваемого приложения платформы Eclipse, позволяющего ре дактировать и исполнять трансформации моделей. В guages – SQL – Part 10: Object Language Bindings качестве средства доказательства уточнения специ- (SQL/OLB), August 2003.

фикаций используется инструментарий Atelier B, [9] Eisenberg A., Melton J. SQLJ – Part 1: SQL Rou поддерживающий язык спецификаций AMN (Ab- tines using the Java TM Programming Language// stract Machine Notation [16]). ACM SIGMOD Record. – December 1999. – V. 28, No 4.

[10] JDO documentation. – http://java.sun.com/jdo/.

5 Заключение [11] LINQ to SQL User Guide. – http://msdn. mi В работе предложена система характеристик (fea- crosoft.com/ru-ru/library/bb386976.aspx.

tures), которыми может характеризоваться и оцени- [12] Kalinichenko L.A. Methods and tools for ваться способ сопряжения ЯП с системами управле- equivalent data model mapping construction// Proc.

ния информационными ресурсами. В терминах of the Int. Conf. on Extending Database Technology предложенной системы дана характеризация извест- EDBT'90. LNCS 416. – Berlin – Heidelberg: Sprin ных способов сопряжения ЯП с СУБД. Показано, ger-Verlag, 1990. – P. 92-119.

как следует выбирать характеристики сопряжения [13] Kalinichenko L.A., Stupnikov S.A. Construct для решения тех или иных проблем несоответствия ing of mappings of heterogeneous information mod импеданса. Осуществлен обоснованный выбор на- els into the canonical models of integrated informa бора характеристик для развитого способа сопряже- tion systems// Advances in Databases and Informa ния процедурных ЯП с декларативным языком tion Systems (ADBIS): Proc. of the 12th East предметных посредников. Предлагается одновре- European Conf. – Pori: Tampere University of менно реализовать как статический подход, преодо- Technology, 2008. – P. 106-122.

левающий несоответствие импеданса, но наклады- [14] Millstein T., Halevy A., Friedman M. Query вающий ряд ограничений на возможности посред- containment for data integration systems// J. of ников, так и динамический подход, никак не ограни- Computer and System Sciences. – 2003. – V. 66, Is чивающий возможности посредников. sue 1. – P. 20-39.

Рассмотренные в статье вопросы возникают в [15] Subieta K. Impedance mismatch. – http://www.

контексте общей проблемы рассредоточенной реа- ipipan.waw.pl/~subieta/SBA_SBQL/Topics/ Im лизации информационных систем в среде предмет- pedanceMismatch.html.

ных посредников. [16] Abrial J.-R. The B-book: assigning programs to meanings. – Cambridge University Press, 1996.

Литература [1] Briukhov D., Kalinichenko L., Martynov D., Skvort sov N., Stupnikov S., Vovchenko A., Zakharov V., Binding of programming languages with Zhelenkova O. Application driven mediation mid subject mediators for scientific problem dleware of the Russian virtual observatory for scien solving tific problem solving over multiple heterogeneous distributed information resources// Scientific Infor A.E. Vovchenko mation for Society – from Today to the Future: Proc.

of the 21st CODATA Conf., 2009. – P. 80-85.

Definition of an architecture of a procedural program [2] Friedman M., Levy A., Millstein T. Navigational ming language (PL) binding with the declarative lan plans for data integration // National Conf. on Artifi guage used for specification of mediators is discussed in cial Intelligence (AAAI) Proc., 1999.

the paper. A set of features to be used for characteriza [3] Kalinichenko L.A., Stupnikov S.A., Martynov D.O.

tion and evaluation of different approaches of PL bind SYNTHESIS: a language for canonical information ings to information resource management systems is modeling and mediator definition for problem solv proposed. It is shown how a set of supported features ing in heterogeneous information resource environ should be selected to solve impedance mismatch prob ments. – Moscow: IPI RAN, 2007. – 171 p.

lems.

[4] OMG, IDL to Java Language Mapping, Version 1.3, January 2008.

Работа выполнена при частичной финансовой поддерж [5] Cattell R.G.G., Barry D.K. et al. The object data ке РФФИ (проекты 08-07-00157 и 10-07-00342) Standard: ODMG 3.0. – Morgan Kaufmann Publish ers, San Francisco, California.

[6] OCCI User Guide. – http://download.oracle.com/ docs/cd/B28359_01/appdev.111/b28390/toc.htm [7] White S., Hapner M. JDBC 2.1 API, Novermber 30, 1999. – http://www.informatik.uni-frankfurt.de/ ja va/ JDK/JDK_doku/jdk1.3.1/docs/guide/jdbc/spec2/ jdbc2.1.frame.html.

[8] Melton J. (ISO-ANSI Working Draft) Object Lan guage Bindings (SQL/OLB), American National Standard, Information technology – Database lan Электронные коллекции информационных ресурсов электронной библиотеки вуза © Л.И. Халиков Казанский государственный университет культуры и искусств i_lenar@mail.ru ных библиотечных систем.

Аннотация Все вышеизложенное, естественно, вызывает не Одним из важных направлений разработок обходимость создания полноценной вузовской систем электронных библиотек (ЭБ), актив электронной библиотеки, аккумулирующей все соб но развивающихся в последние годы, явля ственные ресурсы, а также внешние ресурсы, дос ется создание для них коллекций информа туп к которым вуз приобрел или получил бесплатно.

ционных ресурсов. В работе излагаются Эти ресурсы существенно влияют на интенсивность возможные подходы и технологии форми процессов обучения и научных исследований, по рования электронной коллекции учебно этому обеспечение публичного (в том числе уда методических материалов ЭБ вуза культуры ленного) доступа к ним стало одной из первооче и искусств.

редных задач информационного обслуживания об разования, науки и культуры.

1 Введение В общем случае электронная библиотека – это В настоящее время в российских вузах накопле- гетерогенная система, объединяющая самые разно но значительное количество разнообразных научно- образные данные. С другой стороны, обязательны образовательных информационных ресурсов (ИР), ми свойствами ЭБ являются структурированность, представляющих результаты научной и педагогиче- систематизированность содержания, что приводит к ской деятельности сотрудников данного вуза и ор- необходимости разделить ресурсы электронной ганизованных, как правило, в виде электронных библиотеки на группы, объединив в них электрон собраний ресурсов образовательной направленно- ные документы по какому-либо признаку. Такие сти. группы по самой своей сути соответствуют опреде Становится очевидным путь повышения эффек- лению коллекций информационных ресурсов [2].

тивности использования электронной образователь- В научной литературе методы и средства фор ной информации в вузе, основанный на создании мирования электронных коллекций уже достаточно соответствующих информационных систем (ИС), хорошо разработаны (см., например, [4]). В них, в способных надежно сохранять информацию и обес- частности, рассматриваются основные общие свой печивать ее целенаправленное использование. Но- ства коллекций информационных ресурсов, методы вым и наиболее интенсивно развивающимся видом систематизации, применяемые при их формирова подобных систем являются электронные библиоте- нии, рассматриваются вопросы генезиса коллекций, ки (ЭБ) – распределенные ИС, «позволяющие на- роль в них метаданных, специфические особенности дежно накапливать, сохранять и эффективно ис- научных и образовательных коллекций, а также пользовать разнообразные коллекции электронных перспективные информационные технологии и документов, доступные в удобном для пользовате- стандарты, которые могут применяться для созда лей виде через глобальные сети передачи данных» ния, поддержки и использования коллекций.

[1]. Существует также ряд готовых программно Развитие системы вузовских ЭБ формирует ус- инструментальных средств, используемых в на ловия для упрощения публикации образовательных стоящее время для создания и сопровождения ЭБ и ИР в электронном виде и обеспечения доступа к электронных коллекций информационных ресурсов, ним, организации поиска ИР и мониторинга их со- например: Web ИРБИС, АБИС Virtua, EPrints, Li стояния, дистрибуции и обмена информационными bOnline 1.0, GreenStone, ИСХИ-М и др.

ресурсами. К тому же Минобрнауки и Рособрнад- Все названные инструментальные средства схо зор, со своей стороны, издали приказы, обязываю- жи по своей структуре и предоставляемому функ щие высшие учебные заведения обзавестись в бли- ционалу. Программные продукты Greenstone и жайшее время электронными библиотеками и ак- EPrints являются свободно распространяемыми (на тивно подключиться к внедрению в вузах электрон- пример, на базе программного обеспечения проекта Greenstone http://greenstone.org создана электронная Труды 12ой Всероссийской научной конференции библиотека социологического факультета МГУ «Электронные библиотеки: перспективные методы и (http://lib.socio.msu.ru/l/library)). Остальные про технологии, электронные коллекции» – RCDL’2010, граммы распространяются по платной лицензии.

Казань, Россия, Стоимость программных продуктов зависит от на- Ниже рассматриваются возможные методы и бора предоставляемых сервисов и их настройки. средства формирования учебно-методической кол лекции как составной части ЭБ вуза.

2 Цели и задачи 3 Анализ ситуации Сегодня активно развиваются ЭБ вузов различ ных профилей, и, разумеется, Казанский государст- Основу учебно-методической коллекции состав венный университет культуры и искусств (КГУКИ) ляют учебно-методические комплексы (УМК) [2].

не является исключением. В настоящее время в Ученым советом КГУКИ принято «Положение об КГУКИ по решению Ученого совета принята кон- учебно-методическом комплексе» [5], в котором цепция создания ЭБ вуза и начата разработка ее УМК определяется как многофункциональный ком модели. плект учебных материалов, а также разработана его Целью формирования этой ЭБ являются созда- структура.

ние тематических коллекций электронных докумен- Согласно данному положению, УМК дисципли тов и обеспечение их доступности всем категориям ны, вводимой в учебный план КГУКИ, включает:

• пользователей (локальным и удаленным). Как из- учебную программу курса (дисциплины);

вестно [3], коллекции представляют собой наиболее • аттестирующие и обучающие тесты;

распространенную форму организации информаци- • экзаменационные билеты;

онных ресурсов в электронных библиотеках. • аннотированную тематику рефератов, вы С учетом специфики вуза культуры и искусств в ступлений;

его ЭБ предполагается формирование следующих • методические рекомендации по изучению управляемых полнотекстовых электронных коллек- курса;

ций: • методические рекомендации по выполне • авторефератов диссертаций, защищенных в нию контрольных работ;

КГУКИ;

• учебно-теоретические и учебно • трудов сотрудников университета;

практические материалы.

• материалов конференций, проводимых в Учебные программы (УП) являются важной и КГУКИ;

необходимой компонентой учебно-методических • учебно-методических материалов;

комплексов по дисциплинам учебных планов. Их • нотных и мультимедийных материалов;

особенностями по сравнению с другими учебно • электронной версии научного журнала методическими ресурсами являются четкая струк «Вестник КГУКИ». тура и необходимость наличия определенных обяза Таким образом, создаваемая электронная биб- тельных разделов. В связи с этим в КГУКИ в рамках лиотека вуза представляет собой иерархическую работ по созданию в соответствии с решением Уче систему – она не монолитна, и основной ее струк- ного совета электронной библиотеки учебно турной единицей выступают коллекции, централь- методических комплексов были проведены уточне ными из которых являются научная и образователь- ние и унификация структуры учебных программ и ная, объединяют близкие по типу электронные до- составляющих их обязательных разделов.

кументы. В свою очередь электронные коллекции На сегодняшний день образцы единого оформ тоже могут разделяться и составлять иерархическую ления компонентов учебных программ представле структуру, например, коллекция Учебно- ны в виде файлов-шаблонов (заготовок) текстового методических комплексов (УМК) дисциплин. редактора Word для заполнения их соответствую С точки зрения методологии разработки элек- щими данными (контентом) с компьютера препода тронных коллекций в электронных библиотеках вателями вуза. Применение сложного форматирова перечисленные выше коллекции создаваемой ЭБ ния позволяет добиться полного сходства электрон различаются по типу хранимых электронных доку- ного документа (ЭД) УП с соответствующей фор ментов, профилю метаданных, программным сред- мой на бумажном носителе, что существенно упро ствам, реализующим основные функции коллекции, щает работу пользователя. К тому же формат и другим признакам. Для этого необходимо решить Microsoft Word является наиболее популярным на следующие концептуальные задачи: сегодняшний день способом представления элек • изучение принципов организации, техноло- тронных документов, и текстовый редактор Word гии формирования электронных коллекций, форма- установлен практически на каждом персональном тов метаданных как инструмента описания и иден- компьютере.

тификации электронных документов и принципов Создаваемые таким образом электронные доку создания лингвистического обеспечения коллекций;

менты УП представляют собой статичные докумен • ты формата Word (с расширением *.doc), хранящие создание электронных коллекций и разра ся на разных компьютерах и плохо поддающиеся ботка принципов их включения в ЭБ вуза;

дальнейшей их обработки программными средства • разработка принципов организации про ми.

граммного обеспечения, ориентированного на поиск Актуальным становится вопрос представления и представление информации пользователю по всем образовательного контента конечных документов тематическим коллекциям.

(УП) в электронном виде. Сегодня применение со- ние «УП КГУКИ», функционирующее в среде веб временных технологий разработки и создания элек- (рис. 1). Основными задачами разработанного при тронных документов предполагает отделение со- ложения являются разметка текстов (формального держательных данных документа (контента) от ин- описания содержимого) учебных программ дисцип формации, описывающей форматы его представле- лин КГУКИ и организация учебных материалов в ния. соответствии со стандартами оформления элек Также важным моментом при создании учебно- тронных образовательных ресурсов – специфика методической коллекции является решение вопро- циями международного консорциума IMS и Уни сов рубрикации и подготовки метаописаний инфор- версальной модели описаний образовательных ре мационных образовательных ресурсов (ИОР) на сурсов [6].

этапе их разработки. Единообразие форматов опи- Приложение предназначено для реализации сле сания ИОР служит основой, на которой базируются дующих основных функций (рис. 2):

• поисковые механизмы для массивов образователь- обеспечение унифицированного ввода опи ной информации, а также сервисы, обеспечивающие сательной и содержательной частей учебных про обмен описаниями информационных ресурсов [3]. грамм по дисциплинам, преподаваемым в универси Таким образом, электронный УМК – это слож- тете;

ный составной электронный документ, и для работы • формирование выходных файлов учебных с ним необходимо обеспечить в ЭБ и возможность программ в формате, пригодном для автоматиче аналитического описания, и эффективные средства ской конвертации в формат загрузки в качестве навигации в самом электронном документе с разде- электронного документа (ИР) в электронную биб лением прав доступа различным пользователям. лиотеку КГУКИ и для формирования в формате В связи с этим возникает актуальная задача раз- xml-файла, содержащем информацию об описании работки нового технического решения, сочетающе- ресурса в информационной модели RUS LOM;

го в себе преимущества «интеллектуальных доку- • отображение метаописаний учебных про ментов» и интерфейс, хорошо знакомый пользова- грамм в формате Dublin Core и RDF для целей телям (преподавателям). Semantic Web;

• выгрузка метаописаний учебных программ 4 Формирование коллекции в формате RUSMARK для загрузки в БД АБИС ИР БИС, функционирующей в КГУКИ;

Учитывая большое количество дисциплин, для • упаковка контента (содержания) и метаопи облегчения последующей загрузки содержания и сания учебной программы в архив для возможной описания учебных программ в электронную биб загрузки в LMS.

лиотеку КГУКИ для их формирования было разра ботано специализированное программное приложе Рис. 1. Программное приложение «УП КГУКИ»

Приложение выполнено в виде веб-интерфейса (преподаватели кафедр) имели возможность ввода для того, чтобы составители учебных программ своих материалов и формирования выходных фай лов в локальной университетской сети и в интерне- этого Word-файла с текстом программы (рис. 3).

те, например, у себя дома. При этом для ввода такой информации, как код и Приложение позволяет осуществлять ввод ин- наименование специальности, факультет, кафедра и формации в соответствующие поля формы ввода т. д., предусмотрен выбор соответствующих значе непосредственно с клавиатуры или импортируя ний из справочников (рис. 4).

данные путем копирования из подготовленного для Рис. 2. Функционал приложения «УП КГУКИ»

Рис. 3. «Титульный лист» предназначен для ввода общих сведений о программе Окно метаописания, в котором происходит за- RUS LOM об образовательном ресурсе (УП), пред полнение информации в информационной модели ставляет собой набор категорий, каждая из которых, в свою очередь, группирует некоторую совокуп- осуществляется в соответствии с правилами запол ность полей, описывающих определенную сторону нения полей метаописания электронного образова образовательного ресурса (рис. 5). Настройка спе- тельного ресурса (рис. 6).

цификации элементов информационной модели Рис. 4. Поля формы и справочники Рис. 5. Окно заполнения метаописания информационной модели RUS LOM Рис. 6. Настройка спецификации RUS LOM В настоящее время параллельно разрабатывают- [4] Когаловский М.Р. Систематика коллекций ин ся и формируются другие коллекции ЭБ КГУКИ, формационных ресурсов в электронных библио например, коллекция электронной версии научного теках // Программирование. – 2000. – № 3. – журнала «Вестник КГУКИ», где для разметки ис- С. 31-52.

пользуется готовый XML-формат для электронных [5] Информационная инфраструктура гуманитарного журналов и книг – Sarcticle, разработанный в рамках вуза: качество образования и интеграция в миро проекта НЭБ (Научная электронная библиотека, вое информационное пространство: коллектив.

www.elibrary.ru) и находящийся в свободном досту- моногр. / Р.З. Богоутдинова, Ю.Н. Дрешер, пе. Т.И. Ключенко, Р.Р. Юсупов [и др.];

науч. ред.

Р.С. Гиляревский, В.А. Цветкова;

Казан. гос. ун-т Заключение культуры и искусств. – М.: ВИНИТИ, 2007. – 224 с.

Подводя итог вышесказанному, можно сделать [6] Универсальная модель представления информа вывод, что проект создания модели ЭБ вуза и элек ции в образовательных системах. – М.: РГИОО, тронных коллекций для нее ориентирован на объе 2004 (электронное издание). – http://www.openet.

динение данных, имеющих распределенный харак ru.

тер, в единую информационную систему, предос тавляющую возможность не только аккумулирова Electronical collections of informational ния информации о научных трудах и работах препо resources of electronical library of the uni давателей вуза, но их единого учета, классификации и анализа. versity Литература L.I. Khalikov [1] Хохлов Ю.Е., Ершова Т.В. Межведомственная программа «Российские электронные библиоте- The creation of the collection of informational resources ки»: подходы и перспективы// Электронные биб- is one of the most important directions of electronical лиотеки. – 1999. – Т. 2, Вып. 2. libraries development. The work offers the possible ap [2] Абросимов А.Г., Зуев Д.С. Научно-образователь- proaches and technologies to the formation of electronic ная электронная библиотека вуза. Труды 10-й collection of study and methodological materials in the Всерос. науч. конф. «Электронные библиотеки: electronic libraries of the universities of culture and art.

перспективные методы и технологии, электрон ные коллекции» – RCDL’2008, Дубна, Россия, 2008.

[3] Башмаков А.И., Старых В.А. Каталогизация об разовательных ресурсов //В сб. «Интернет порталы: содержание и технологии»: Выпуск 1. / Редкол.: А.Н. Тихонов (пред.) и др.;

ГНИИ ИТТ «Информика». – М.: Просвещение, 2003. – С. 511-558.

Полуавтоматическое GLAV-отображение спецификаций в канонической информационной модели предметных посредников © О.В. Рябухин Московский государственный университет, Институт проблем информатики РАН ovr@ipi.ac.ru биология). Посредник определяется своей концеп Аннотация туальной моделью. В нее входят концептуальная Предметный посредник представляет собой схема посредника (включающая спецификации аб компонент промежуточного слоя, он зани- страктных типов данных, классов, атрибутов, ассо мает место между ресурсами и пользовате- циаций, функций), а также онтология предметной лем (приложением) и предоставляет уни- области.

фицированный доступ к множеству зареги- В данной работе рассматриваются виртуальные стрированных в нем ресурсов. Предметный посредники, движимые приложением (или классом посредник строится для решения класса за- задач). В виртуальном посреднике не происходит дач конкретной предметной области (в та- материализации данных реальных ресурсов. Вирту ких научных областях, как, например, нау- альный посредник связывается с ресурсами с помо ки о Земле, астрономия, биология). Данная щью декларативных правил, определяющих, каким работа посвящена полуавтоматическому образом информация в ресурсе должна соответство построению GLAV (Global-Local-As-View)- вать информации, предоставляемой посредником.

отображений между спецификациями ин- Запрос к посреднику с помощью указанных правил формационных ресурсов и посредника. В переписывается в подзапросы к ресурсам (на соот работе сформулирована задача отображе- ветствующих им языках), после чего они исполня ния спецификаций как часть процесса реги- ются, и объединенный результат возвращается страции ресурса в посреднике и описана пользователю. Виртуальная интеграция имеет пре идея ее полуавтоматического решения;

имущества перед интеграцией с материализацией приведен обзор существующих решений;

данных, т. к. не отстает от состояния ресурсов. По представлен прототип системы поддержки средники, движимые приложением, строятся неза процесса регистрации, реализующий опи- висимо от существующих информационных ресур санный подход к полуавтоматическому по- сов. Это позволяет создавать системы, масштаби строению отображений спецификаций. руемые по числу ресурсов. Подход, движимый ре сурсами, таким достоинством не обладает, т. к. при 1 Введение появлении нового ресурса с большой вероятностью схема посредника должна быть модифицирована.

1.1 Предметные посредники 1.2 Контекст исследований В настоящее время наблюдается значительный рост количества разнообразной информации, накап- Данная работа является частью проекта ливаемой в информационных ресурсах (базах дан- SYNTHESIS [11] (СИНТЕЗ (Система ИНТЕграции ных, сервисах, потоках работ). Решение задач в та- Знаний)), исследования которого, в частности, на ких условиях требует совместного использования правлены на применение подхода виртуальных по информации в ресурсах, ее интеграции. Среда по- средников, движимых приложениями, для решения средников предоставляет возможность решения задач над множеством неоднородных распределен задач над множеством неоднородных информаци- ных ресурсов. При этом рассматриваются разнооб онных ресурсов. Посредник является компонентом разные ресурсы: базы данных различных моделей промежуточного слоя и занимает место между ре- данных, сервисы, потоки работ. Для того чтобы сурсами и пользователем (приложением), предос- иметь возможность построить посредник, позво тавляя унифицированный доступ к множеству заре- ляющий работать с таким многообразием информа гистрированных в нем ресурсов. Предметный по- ционных моделей (реляционных, объектных, сер средник строится для решения класса задач кон- висных моделей, моделей потоков работ), была раз кретной предметной области (в таких научных об- работана каноническая объектно-фреймовая ин ластях, как, например, науки о Земле, астрономия, формационная модель, определяемая языком СИНТЕЗ [1].


Единицей описания в языке СИНТЕЗ Труды 12й Всероссийской научной конференции является фрейм. На базе языка фреймов создана «Электронные библиотеки: перспективные методы и объектная модель языка. В основе объектной моде технологии, электронные коллекции» – RCDL’2010, ли лежит понятие абстрактного типа данных, слу Казань, Россия, жащее для описания типов данных любой природы. Одной из отличительных черт СИНТЕЗа являет Его описание включает спецификации атрибутов, ся подход к регистрации, при котором необходимо, инвариантов и функций. Иерархия типов задается чтобы регистрируемые спецификации ресурса отношением подтипа. В СИНТЕЗе определен набор уточняли спецификации посредника. Говоря не базовых типов. Классы в языке СИНТЕЗ представ- формально, можно утверждать, что спецификация A ляют совокупности однородных объектов. Каждый уточняет спецификацию B, если пользователь не объект из совокупности является экземпляром дан- замечает подмены при использовании A вместо B.

ного класса. Классы принадлежат иерархии, осно- Т. к. не каждая спецификация ресурса уточняет спе ванной на отношении обобщения/специализации. цификацию посредника, в процессе регистрации Спецификации ресурсов и посредника представ- необходимо произвести поиск фрагментов отобра ляют собой совокупность их типов, классов и функ- жаемых спецификаций, находящихся в отношении ций. В проекте СИНТЕЗ применяется техника соот- уточнения (в эти фрагменты могут входить как ти несения спецификаций ресурсов со спецификация- пы, классы и функции, так и их композиции).

Определение 2. Спецификация S1 называется ми посредников на основе взглядов [6] – специфи фрагментом спецификации S2, если:

кации связываются правилами, выражающими • взгляды (views). Посредникам, движимым прило- множество классов S1 является подмно жениями, соответствует техника LAV (Local-as- жеством множества классов S2 и/или их компози View), при которой классы ресурса выражаются при ций;

помощи классов посредника и их композиций. Ее • множество функций S1 является подмно противоположностью является техника GAV (Glob- жеством множества функций S2;

al-As-View), при которой классы посредника выра- • множество типов (или редуктов типов) S жаются при помощи композиций классов ресурсов. является подмножеством типов (или редуктов В проекте СИНТЕЗ используется комбинированный типов) S2 и/или их композиций.

подход, объединяющий преимущества упомянутых Определение 3. Задачей отображения специ техник и именуемый GLAV (Global-Local-As-View). фикаций R (ресурса) и M (посредника) в канониче В этом случае преобладающей является техника ской информационной модели называется задача LAV, однако выражения взглядов могут содержать поиска отображения (Sr, Sm, V), такого, что:

конструкции из классов ресурсов (что соответствует • Sr, Sm – фрагменты спецификаций R и M GAV), а также дополнительные функции, с помо- соответственно;

щью которых возможно разрешение структурных • типы и функции Sr уточняют типы и конфликтов. функции Sm;

Выражения взглядов описываются с помощью • ограничения целостности, определенные в языка формул СИНТЕЗа, который является вариан- Sr, удовлетворяют ограничениям целостности, оп том типизированного языка логики первого поряд- ределенным в Sm (в ограничения целостности вхо ка. Предикаты в формулах соответствуют классам и дят инварианты классов и утверждения функциям. Правила (взгляды) GLAV имеют вид: (assertions), вынесенные за рамки типов и классов).

Композиционное исчисление спецификаций [2] Cr1(vr1/Tvr1),..,Crn(vrn/Tvrn),F1(t1,y1),..,Fm(tm,ym),Br: используется для формализации процесса компози Cm1(vm1/Tvm1),..,Cmn(vmn/Tvmn), Bm, ции и декомпозиции их фрагментов. Важнейшими где Cri (Cmi) – предикат класса ресурса (посредни- здесь являются понятия редукта типа и наибольше ка), Fi – функциональный предикат, Br, Bm – огра- го общего редукта двух типов, а также операций ничения (условия). Переменные vr1, …, vrn, vm1, …, композиции типов.

vmn, типизированы Tvr1, …, Tvrn, Tvm1, …, Tvmn соот- Определение 4. Редукт RT типа T определяется ветственно. как подсигнатура сигнатуры типа, при этом мно жество атрибутов редукта является подмноже 2 Задача отображения спецификаций ством множества атрибутов типа, множество Как отмечалось выше, посредник строится неза- функций редукта является подмножеством мно висимо от ресурсов. Для того чтобы наполнить его жества функций типа, множество предикатов информацией, ресурсы необходимо зарегистриро- редукта является подмножеством множества вать в нем. Основной операцией при регистрации предикатов типа.

является отображение спецификаций ресурса в спе- Определение 5. Наибольший общий редукт цификации посредника (предполагается, что специ- RMC(T1,T2) для типов T1, T2 есть редукт RT1 типа фикации уже выражены в канонической информа- T1, такой, что существует редукт RT2 типа T2, ционной модели). который является уточнением редукта RT1, и не Определение 1. Отображением спецификаций в существует другого редукта R’T1, такого, что канонической информационной модели называется RMC(T1,T2) является редуктом R’T1, R’T1 не равен тройка (R, M, V), где R – спецификации ресурса, RMC(T1,T2) и существует R’T2, являющийся уточне выраженные в канонической модели, M – специфи- нием редукта R’T1. Редукт RT2 называется сопря кации посредника, V – множество взглядов GLAV, женным по отношению к RT1.

связывающих классы спецификаций R и M. Определение 6 (Операция meet). Операция об разует тип T как пересечение спецификаций типов операндов. Тип T образуется слиянием двух наи- //по результатам Match(R,M) формируется множе ство наибольших общих редуктов MCReducts(R,M) больших общих редуктов типов T1 и T2: RMC(T1,T2) и RMC(T2,T1). Слияние двух редуктов включает в V = Views(R,M,MCReducts(R,M)) = {v | v - GLAV себя объединение множеств их функций. Если в взгляд} //по результатам конструирования наибольших объединении имеется две функции, находящиеся в общих редуктов формируется набор GLAV-взглядов отношении уточнения, то только одна из них – более абстрактная – включается в результирую- Result = (R, M, V) щий тип T. Инвариант результирующего типа //искомое отображение Подход является полуавтоматическим, т. к. на формируется как дизъюнкция инвариантов, взятых каждом шаге эксперт должен подтвердить либо ре из спецификаций наибольших общих редуктов.

дактировать предложенное системой решение. Для Определение 7 (Операция join). Операция об сопоставления спецификаций применяются техники разует тип T как объединение спецификаций ти сопоставления схем (schema matching [8]), которые пов-операндов. Тип T образуется слиянием специ используют эвристики (например, сравнение имен фикаций типов T1 и T2. Общие элементы специфи или описаний элементов) для определения похожих каций типов T1 и T2 включаются в результирующий частей спецификаций. Алгоритмизация операций тип только один раз. Общие элементы определя взятия наибольшего общего редукта и композиций ются посредством слияния сопряженных редуктов типов приведена в работе [5]. Теоретическая часть двух наибольших общих редуктов типов T1 и T2:

данной работы рассматривает заключительный шаг:

RMC(T1,T2) и RMC(T2,T1). Слияние сопряженных ре формирование взглядов.

дуктов включает в себя объединение множеств их функций. Если в объединении имеется две функции, 4 Формирование выражений взглядов находящиеся в отношении уточнения, то только одна из них – более точная – включается в резуль- Необходимо развитие известных алгоритмов тирующий тип T. Инвариант результирующего формирования выражений взглядов (например, [4]) типа формируется как конъюнкция инвариантов, в следующих направлениях:

взятых из спецификаций типов операндов T1 и T2. • формирование выражений взглядов в слу Таким образом, подход СИНТЕЗа к отображе- чае сложных связей между классами посредника в нию спецификаций [3] состоит из следующих ша- правилах (например, если класс ресурса выражается гов: выделение фрагментов отображаемых специ- при помощи конъюнкции нескольких классов по фикаций, находящихся в отношении уточнения, при средника при некотором условии);

помощи операции взятия наибольшего общего ре- • формирование условий во взглядах (по дукта;

формирование композиций фрагментов спе- строение условий может быть автоматизировано цификаций, находящихся в отношении уточнения (с путем анализа ограничений целостности).

помощью операций композиции типов, применяе 4.1 Формирование взглядов при наличии слож мых к редуктам, построенным на предыдущем ша ных связей между классами ге);

формирование взглядов GLAV.

В случае, если один класс ресурса выражается 3 Полуавтоматическое отображение при помощи композиции нескольких классов по спецификаций средника, необходимо определить, для каких клас сов из них требуется задать во взгляде конъюнкцию, Построение отображения спецификаций вруч а для каких – объединение. Для каждой из объеди ную – трудоемкий процесс, поэтому необходимы няемых частей формулы формируется отдельный программные средства его поддержки. Идея автома взгляд (формирование такого взгляда соответствует тизации построения отображений в подобной сис операции объединения, т. к. все множество взглядов теме такова: между спецификациями ресурса и по (правил) интерпретируется как их объединение (се средника необходимо найти элементарные соответ мантика UCQ)). Конъюнкции классов интерпрети ствия (например, некий атрибут ресурса соответст руются как соединение, если у типов их экземпля вует атрибуту посредника), исходя из которых воз ров есть общий редукт, или как декартово произве можно построить наибольшие общие редукты, по дение при отсутствии общего редукта.


которым сформировать взгляды. Таким образом, В качестве примера рассмотрим следующую си полуавтоматическое построение отображения про туацию: пусть посредник предоставляет интегриро исходит согласно следующему процессу:

ванную информацию о музейных экспонатах. В по Input = (R,M) среднике определены классы creator (хранит данные //R - спецификации ресурса, M - спецификации о создателях экспонатов: имена и дополнительную посредника информацию) и painting (данные о картинах: назва Match(R,M) = { (a,b) | a R, b M, a ~ b } ния, имена художников и др.):

//сопоставление спецификаций и формирование {Creator;

in: type;

множества пар релевантных (a~b) элементов name: string;

Match(R,M) culture_race: string;

MCReducts(R,M) = MCReducts(R,M,Match(R,M)) = { }, Rmc(t1,t2) | t1 ADT(R), t2 ADT(M), t1~t2} {Painting;

in: type;

title: string;

4.2 Автоматизация формирования условий во created_by: string;

взглядах place_of_origin: string;

Формирование условий во взгляде может быть date_of_origin: date;

частично автоматизировано путем анализа ограни general_info: string;

чений целостности. В качестве примера рассмотрим } следующую ситуацию: пусть в некоторой компании Также имеется ресурс, который содержит ин имеется посредник, предоставляющий интегриро формацию о полотнах некоторого музея (класс can ванную информацию о ее сотрудниках из разных vas – данные о полотнах: название, имя художника, филиалов. В посреднике присутствует класс new описание и др.):

comer с атрибутами name и yearOfEmpoyment, кото {Canvas;

in: type;

рый соответствует новичкам, недавно пришедшим в title: string;

компанию. Тип Newcomer является типом его эк painter: string;

земпляров и содержит инвариант:

culture: string;

all x/Newcomer(x.yearOfEmployment 2009), date: date;

который говорит о том, что новичком считается place: string;

сотрудник, пришедший в компании позднее description: string;

года. Тогда, если мы регистрируем базу данных со } трудников филиала, содержащую класс employee с В данном случае класс ресурса canvas соответст атрибутами name, yearOfEmployment, который соот вует соединению классов посредника creator и paint ветствует всем сотрудникам филиала, то взгляд, ing по условию creator.name = painting.created_by, связывающий эти два класса, может иметь следую т. е. canvas выражается следующим образом:

щий вид:

canvas(x[…]) :- creator(y/[name, …] & paint employee(x/[name, yearOfEmployment]) & yearOfEm ing(z/[created_by, …] & y.name = z.created.by.

ployment 2009 :- newсomer(x/[name, yearOfEm Одним из способов автоматизации формирова ployment]).

ния взглядов в таком случае является анализ огра Таким образом, ограничения целостности, вер ничений целостности, сформулированных в посред ные для всех экземпляров класса (т. е. ограничения нике или ресурсе [7] (например, внешних ключей).

на переменные, связанные квантором всеобщности), Этот подход позволяет определить как вид опера могут быть вынесены во взгляд в качестве условий.

ций (соединение, объединение), необходимых для При этом, если ограничение целостности сформу композиции классов, так и наибольший общий ре лировано в посреднике, то оно выносится в голову дукт в случае, если необходимо соединение. На взгляда, а если в ресурсе, то в тело взгляда.

пример, если между двумя классами определено ограничение внешнего ключа, то это может служить 5 Обзор существующих решений основанием для их соединения по соответствующим В результате анализа работ, близких к проводи атрибутам: например, если в рассматриваемом при мым исследованиям, к рассмотрению были выбраны мере в посреднике имеется ограничение внешнего проекты Clio и Automed.

ключа вида:

Clio [12] – система интеграции информационных all x/Painting(ex y/Creator (x.created_by = y.name)) ресурсов, содержащих реляционные или XML (для каждой картины также имеется информация данные. Для отображения схем (реляционных и xml о художнике, нарисовавшем ее).

схем) используется подход GLAV. Clio имеет свой Мы можем сделать вывод о том, что классы аналог системы поддержки регистрации – систему painting и creator можно соединить по условию управления отображением схем (Schema Mapping painting.created_by = creator.name.

Management System), в которой возможно сопостав В качестве алгоритма для анализа ограничений ление спецификаций и формирование взглядов. На целостности можно использовать адаптацию алго этапе сопоставления спецификаций выделяются ритма прогонки (chase [9]): рассматривая последо пары релевантных элементов, после чего по полу вательно ограничения целостности, мы можем оп ченным соответствиям и ограничениям целостности ределить группы логически связанных классов.

формируются выражения взглядов.

Если из анализа ограничений целостности необ Automed [13] – инструментарий, в основе кото ходимых выводов сделать не удалось, эксперт мо рого лежит подход BAV (both as view). Automed жет самостоятельно указать вид операций, необхо способен интегрировать ресурсы широкого класса димых для композиции классов. Далее система моделей (реляционные, объектные и др.), что дости строит наибольшие общие редукты типов экземпля гается за счет использования модели HDM (Hyper ров классов, для которых требуется соединение.

graph Data Model) для описания спецификаций ре Также система может хранить результаты реги сурсов. Automed предоставляет систему для сопос страции ресурсов и при регистрации нового ресурса тавления и слияния схем (Schema Matching And предлагать для композиции классов посредника те Merging Tool). По результатам сопоставления схем операции, которые использовались ранее.

система формирует новую схему, полученную в результате их слияния, а также правила BAV, кото рые описывают соответствующие трансформации В системе реализован алгоритм конструирования данных. наибольших общих редуктов, описанный в работе В рассмотренных решениях (Clio, Automed) ал- [5]. Построение искомых редуктов происходит по горитм формирования взглядов принимает на вход результатам сопоставления спецификаций. При на результат сопоставления спецификаций, т. е. набор личии структурных конфликтов на этом шаге фор пар элементарных соответствий между их элемен- мируются функции разрешения конфликтов.

тами. Таким образом, семантическая правильность В системе возможно конструирование компози отображения определяется правильностью выбора ционных типов. При этом эксперт выбирает пару соответствий. Хотя такой подход дает хорошие ре- типов, указывает необходимую операцию исчисле зультаты для таких моделей данных, как реляцион- ния спецификаций (соединение или объединение), ная, его оказывается недостаточно в случае объект- после чего система строит композиционный тип, ной модели. Для отображения функций (заданных исходя из формального определения этих операций своими пред- и пост-условиями) необходим фор- [5].

мальный аппарат, который предоставляет компози- Формирование взглядов происходит в соответст ционное исчисление спецификаций. Таким образом, вии с вышеописанным алгоритмом.

в семантическом плане подход, используемый в 7 Направления дальнейших исследова СИНТЕЗе, является более богатым, т. к. вносит до ний полнительный этап – построение наибольших об щих редуктов и их композиций, в ходе которого 7.1 Сопоставление спецификаций с использова определяются фрагменты спецификаций ресурса, нием онтологий уточняющих фрагменты спецификаций посредника.

В настоящее время активно развиваются методы, При этом сопоставление спецификаций с помощью в основе которых лежит использование онтологий.

эвристик используется лишь как предварительный Применение этих методов при сопоставления спе шаг, помогающий эксперту получить начальное цификаций может улучшить результат работы сис приближение в формировании наибольших общих темы. Примером является аннотирование элементов редуктов. Позднее эксперт может расширить пред концептуальной схемы понятиями онтологии. При ложенное решение (например, описать дополни наличии таких онтологических аннотаций в специ тельные функции разрешения конфликтов), а также фикациях ресурса и посредника возможно исполь формально доказать факт уточнения спецификаций.

зовать методы онтологической интеграции для оп 6 Система поддержки процесса регист- ределения релевантных элементов [10].

рации 7.2 Проверка ограничений целостности В рамках данной работы была разработана сис При формировании взглядов необходима про тема поддержки процесса регистрации, являющаяся верка того, что ограничения целостности (инвари полуавтоматическим инструментарием. Для каждо анты классов, утверждения), определенные для ото го шага регистрации система предлагает возможные бражаемых фрагментов спецификаций ресурса, решения, которые эксперт подтверждает либо ре удовлетворяют соответствующим ограничениям дактирует. Для определения спецификаций в систе целостности посредника. Такая проверка возможна, ме используется собственный графический редак например, с помощью алгоритма прогонки (chase тор, который представляет конструкции языка [9]). Алгоритм прогонки применим в случае опреде СИНТЕЗ в графическом виде. При регистрации ре ленного вида ограничений целостности и гаранти сурса система поддерживает следующие этапы: со рованно завершается только при определенных ус поставление спецификаций ресурса и посредника;

ловиях. К настоящему времени класс допустимых сопоставление структуры объектных типов ресурса ограничений довольно широк и его достаточно для и посредника (поиск релевантных атрибутных пу описания большинства ограничений, которые могут тей);

конструирование наибольших общих редук быть сформулированы при проектировании.

тов;

конструирование композиций типов;

формиро вание выражений взглядов. 7.3 Сервисы и потоки работ При сопоставлении спецификаций система срав Как было отмечено выше, подход СИНТЕЗа нивает имена элементов и их текстовые описания на подразумевает возможность регистрации сервисов и естественном языке.

потоков работ. Для решения такой задачи представ При сопоставлении структур объектных типов ленных методов и средств недостаточно. Для серви используется понятие релевантного пути [5]. Спе сов и потоков работ необходимо разработать спе цификации пары типов (ресурса и посредника) цифические техники сопоставления и техники фор представляются в особой форме (в виде дерева, ко мирования взглядов.

торое может быть получено из представления спе цификаций типов в виде графа с помощью введения 8 Заключение дублирующих вершин). После этого по правилам, В данной работе рассмотрены проблемы и неко сформулированным в работе [5], устанавливается торые результаты исследования задачи отображения релевантность атрибутных путей.

спецификаций как подзадачи, возникающей при регистрации информационных ресурсов в предмет- [7] Miller R.J., Haas L., Hernandez M.A. Schema ном посреднике. Приведен обзор существующих mapping as query discovery// Proc 26th Int. Conf.

решений и выделены преимущества подхода СИН- on Very Large Data Bases (VLDB), 2000. – P. 77 ТЕЗа к отображению спецификаций, выраженных в 88.

канонической информационной модели. Основной [8] Shvaiko P., Euzenat J. A survey of schema-based вклад данной работы заключается в следующем: matching approaches// J. on Data Semantics. – 2005. – • No IV. – P. 146-171.

определена формальная постановка задачи [9] Deutsch A., Nash A., Remmel J.. The chase revis отображения спецификаций в канонической инфор ited// Proc. of the twenty-seventh ACM SIGMOD мационной модели;

SIGACT-SIGART symposium on Principles of da • предложена модификация алгоритма фор tabase systems, 2008.

мирования взглядов [4], расширяющая его на слу [10] Скворцов Н.А. Связывание объектных специ чай, когда один класс ресурса выражается при по фикаций по семантике онтологического уров мощи композиции нескольких классов посредника;

ня// Тр. 8-й Всерос. науч. конф. «Электронные • предложен метод автоматизации формиро библиотеки: перспективные методы и техноло вания условий во взглядах на основе анализа огра гии, электронные коллекции» – RCDL'2006.

ничений целостности, определенных в отображае Ярославль: Ярославский государственный уни мых спецификациях;

верситет им. П.Г. Демидова, 2006. – С. 70-74.

• реализован прототип системы поддержки [11] Synthesis Project. – http://synthesis.ipi.ac.ru/ syn процесса регистрации, реализующий описанный thesis/ projects/SYNTHESIS.

подход к отображению спецификаций ресурса и [12] Clio Project. – http://dblab.cs.toronto.edu/project/ посредника с помощью техники GLAV.

clio.

Также в работе приведены направления даль [13] AutoMed Project. – http://www.doc.ic.ac.uk/ au нейших исследований, с учетом которых будут раз tomed.

виваться описанный подход и прототип системы [14] Eclipse Project. – http://www.eclipse.org.

поддержки регистрации.

[15] Eclipse Graphical Editing Framework. – Литература http://www.eclipse.org/gef.

[16] Eclipse Modeling Framework Project. – [1] Kalinichenko L.A., Stupnikov S.A., Martynov D.O. http://www.eclipse.org/emf.

SYNTHESIS: a language for canonical information Semiautomatic GLAV mapping of modeling and mediator definition for problem solv ing in heterogeneous information resource envi- specifications in a canonical information ronments. – Moscow: IPI RAN, 2007. – 171 p.

model of subject mediators [2] Kalinichenko L.A. Compositional specification calculus for information systems development ad- O.V. Ryabukhin vances in databases and information systems// Proc.

Subject mediator is a component of the middleware of the Third East European Conf. LNCS 1691. – located between resources and users (application) to Berlin-Heidelberg: Springer-Verlag, 1999. – provide a unified access to multiple resources registered P. 317-331.

in it. Subject mediator is constructed for solution of a [3] Briukhov D.O., Kalinichenko L.A., Stupnikov S.A.

class of problems in particular domain (in such scien Compositional approach for heterogeneous sources tific fields as, for example, the Earth sciences, astron registration at a subject mediator. Emerging data omy, biology, and others). This work is devoted to base research in Eastern Europe// Proc. of the Pre semi-automatic construction of GLAV (Global-Local Conference Workshop of VLDB 2003. – Cottbus:

As-View) mappings between specifications of informa Brandenburg University of Technology, 2003. – tion resources and mediator. We define the problem of P. 5-11.

specifications mapping as a part of the resource regis [4] Рябухин О.В., Брюхов Д.О., Калиниченко Л.А.

tration process and describe the idea of semiautomatic Формирование выражений взглядов в задаче ре solution for this problem;

we provide an overview of гистрации ресурсов в предметных посредниках// existing solutions and present a prototype of the regis Труды 11-й Всерос. науч. конф. «Электронные tration process support system, which implements the библиотеки: перспективные методы и техноло described approach to semiautomatic specifications гии, электронные коллекции» – RCDL'2009.

mapping.

Петрозаводск: Петрозаводский государствен ный университет, 2009.

Работа выполнена при финансовой поддержке РФФИ [5] Брюхов Д.О. Конструирование информацион- (проекты 08-07-00157, 10-07-00342, 10-07-00640) и Про ных систем на основе интероперабельных сред граммы фундаментальных исследований Президиума информационных ресурсов. – Канд. дис. – Мо- РАН № 3 «Фундаментальные проблемы системного про сква: ИПИ РАН, 2003. – 158 с. граммирования», раздел 4 – Системы управления базами [6] Ullman J.D. Information integration using logical данных, проект «Исследование методов и средств проме жуточного слоя предметных посредников, обеспечиваю views// Proc. of the 6th Int. Conf. on Database щего решение задач над множеством неоднородных рас Theory, January 08 – 10 1997. – P. 19-40.

пределенных информационных ресурсов»

Технология автоматизированного формирования понятийной структуры научного контента © О.В. Окропишина Национальный исследовательский ядерный университет «МИФИ»

kvizar@rambler.ru ного представления текста в виде понятийной Аннотация структуры, представленной на уровне терминов и Рассматривается технология автоматизиро- связей между ними, разработан в рамках задач пол ванного формирования понятийных струк- нотекстового поиска научной информации: форму тур (представляющих предметные области лирования и реформулирования поискового запроса, на разных описательных уровнях) в виде по- создания поискового образа документа, представле следовательности статистических и лин- ния и формирования предметных областей научных гвистических процедур обработки текста исследований. Предметную область исследований научной работы, основанная на уровневой составляют определенным образом структуриро семиотической модели представления пред- ванные тексты научного стиля (авторефераты дис метной области научного исследования. сертаций, рефераты НИР, аннотации и т. д.).

Формирование набора функциональных отноше 1 Введение ний, которыми связаны термины понятийной струк туры, производилось на основе анализа научно Электронная информация играет все большую производственной деятельности, сведения о процес роль во всех сферах жизни современного общества, сах и результатах которой отражены в научном тек в том числе в процессах образования и научной дея сте.

тельности. Как показывают оценки, около 90 % до Так как методы извлечения фактов при помощи кументированной информации, циркулирующей в сопоставления текста с набором регулярных выра обществе, сосредоточенно в текстах на естествен жений (образцов, шаблонов и т. д.), наиболее часто ных языках, причем объем текстовой информации применяемые в рамках задач информационной раз продолжает расти [4]. Как следствие, возникла по ведки и др., не подходят для решения проблемы всеместная потребность в программных средствах, идентификации содержания научного контента (о способных извлекать и обрабатывать информацию.

чем будет сказано далее), необходимо было разра Основу для создания таких программных средств, ботать технологию, отражающую особенности рас как правило, составляют различные методы форма сматриваемых класса задач и предметной области.

лизованного представления текстовой информации, В основу технологии формирования понятийной связанного с извлечением знаний [1 – 3, 7]. Основ структуры научного контента была положена разра ным назначением таких представлений является ботанная уровневая семиотическая модель дескрип идентификация содержания, т. е. создание таких тивного представления предметных областей науч образов, которые за счет унифицированной формы ных исследований, на которой был основан ключе представления обеспечивают «узнавание» оригина вой этап технологии – этап семантической интер ла в различных его проявлениях.

претации полученных результатов анализа текста, Особенности данного исследования в достиже также отличающий данный подход от других под нии цели идентификации содержания научного кон ходов по построению понятийных структур по тек тента определяются, главным образом, классом за сту.



Pages:     | 1 |   ...   | 8 | 9 || 11 | 12 |   ...   | 26 |
 





 
© 2013 www.libed.ru - «Бесплатная библиотека научно-практических конференций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.