авторефераты диссертаций БЕСПЛАТНАЯ БИБЛИОТЕКА РОССИИ

КОНФЕРЕНЦИИ, КНИГИ, ПОСОБИЯ, НАУЧНЫЕ ИЗДАНИЯ

<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ


Pages:     | 1 |   ...   | 3 | 4 || 6 | 7 |   ...   | 26 |

«Электронные библиотеки: Перспективные Методы и Технологии, Электронные коллекции English Труды RCDL 2010 ...»

-- [ Страница 5 ] --

• В целом весь этап работы с системой можно раз в стенографической записи применяется ме бить на две части:

тод пропуска гласных букв, объединяются в один • значок наиболее часто встречающиеся сочетания создание оригинальной графики символов;

букв или наиболее распространенные слоги;

На данном этапе на основе информации о воз • можной графике символов и оригинальных изобра некоторые значки стенографической записи жений уже распознанных текстов формируется вир очень похожи, но могут иметь разное значение, су туальная клавиатура, состоящая из набора вектор щественное значение имеет размер символа и т. д.

ных символов, встречающихся в исходном материа Распознавание рукописных исторических доку ле, сохраненных как векторные шрифты, например, ментов стало в последние годы одним из бурно раз в формате SVG. Также виртуальная клавиатура со вивающихся научных направлений. Активно разра держит в себе сопоставление между оригинальными батываются методы устранения дефектов и улучше символами (графемами) и буквосочетаниями (лек ния качества цифровых изображений рукописей семами). Данная информация может быть записана [13], а также сегментации строк [12]. Поскольку как конфигурационный файл виртуальной клавиату сегментация символов в рукописных текстах часто ры, например, Keyboard.cfg. С помощью данного оказывается затруднительной, предлагаются специ конфигурационного файла и набора векторных альные алгоритмы распознавания слитных слов [8] и шрифтов можно предоставить пользователю воз целых строк, основанные на скрытых марковских можность набирать текст оригинальными символа моделях [15] и случайных полях [10]. Большое вни ми и при этом параллельно формировать перевод мание уделяется распознаванию древнегреческих текста. Данная система использует векторные текстов [14] и арабских рукописей [11]. Анализ пуб шрифты вместо растровых из-за их масштабируемо ликаций и практических задач в области распозна сти и возможности сравнения векторных символов с вания исторических документов позволяет сделать оригинальными растровыми. На рис. 2 представлена следующие выводы:

схема процесса формирования виртуальной клавиа • не существует алгоритмов распознавания, туры. Данный процесс состоит из следующих по которые могли бы одинаково успешно применяться следовательно выполняемых подпроцессов:

к рукописям разных языков и эпох;

все алгоритмы.1. предобработка;

поскольку для составления ориентированы на определенные типы рукописного полного списка оригинальных символов может письма;

потребоваться извлечение символов из ориги • даже самые признанные алгоритмы не до нальных изображений текстов, последние необ ведены до готовых программных систем распозна ходимо подвергнуть предварительной обработке вания рукописей, которые можно было бы исполь с целью устранения лишнего шума и улучшения зовать в отечественных проектах по оцифровке ис их качества;

торических документов;

.2. сканирование;

обработанные изображения, • практические задачи, требующие распозна полученные как результат выполнения преды вания текстов оцифрованных рукописей, в настоя дущего процесса, подвергаются сканированию;

щее время столь часты и разнообразны, что путь данное сканирование заключается в поиске и вы разработки для каждой такой задачи специализиро делении отдельных графем на изображении так, ванного алгоритмического и программного обеспе чтобы каждому символу текста соответствовала чения оказывается невозможным;

в результате графема;

в результате выполнения данного про единственным универсальным способом на сего цесса получается список первичных растров;

дняшний день остается ручной набор текста в ре.3. коррекция растров;

оператор просматрива дакторе MS Word;

не стоит доказывать, что такой ет первичные растры с целью выявить какие способ крайне неэффективен.

либо ошибки и устраняет их;

в результате полу Поэтому весьма актуальной выглядит задача чается список растровых символов;

создания достаточно универсальной программной.4. векторизация;

растровые символы анализи системы для автоматизированного распознавания руются и из них формируются векторные анало рукописей и других текстов исторических докумен ги;

на выходе – список первичных шрифтов;

тов, для которых автоматическое распознавание.5. коррекция шрифтов;

оператор просматри оказывается пока невозможным. Предлагаемая сис вает список первичных шрифтов и исправляет тема автоматизированной дешифровки рукописных обнаруженные дефекты;

в результате получается источников с возможностью интеллектуальной под список шрифтов;

держки принятия решений при наборе позволит су.6. сопоставление;

на основе набора шрифтов, щественно ускорить процесс перевода рукописного информации о возможной графике символов и текста в текстовый файл и повысит его точность.

распознанных оригинальных текстов оператор создает таблицу соответствия между векторными 2 Описание работы автоматизированной символами и лексемами обычного текста;

системы.7. формирование виртуальной клавиатуры;

на основе таблицы соответствия оператор с помо Блок-схема работы автоматизированной системы щью данной системы формирует конфигураци представлена на рис. 1, а также на детализирующих онный файл клавиатуры Keyboard.cfg.

рисунках 2 и 3.

• Кроме набранных символов верхний слой со набор оригинального текста;

держит также плавающий курсор (символьный кур Набор текста осуществляется оператором с по сор), указывающий место расположения текущего мощью созданной ранее виртуальной клавиатуры. В набираемого символа. Суть ввода заключается в процессе набора символов система формирует и ручном перемещении курсора через специальные отображает пользователю список вариантов текуще клавиши либо попиксельно, либо перемещаясь по го набираемого слова, а также варианты перевода уже набранным символам также через специальные данного слова. Кроме того, система проверяет на клавиши. Таким образом, перемещение курсора бу бранный текст на наличие синтаксических или сти дет занимать только одну руку оператора, оставляя листических ошибок и сообщает пользователю ин вторую свободной для набора символов.

формацию об ошибках. В результате выполнения 2. Область печатного или распознанного текста, данного процесса система формирует текст, набран представляющая собой текстовое поле, содержащее ный оригинальными символами, а также перевод соответствующие лексемы набранных символов, данного текста. На рис. 3 представлена схема про организованные в слова. По мере ввода символов цесса набора текста. Данный процесс состоит из программа автоматически вводит расшифрованные следующих последовательно выполняемых подпро биграммы в текстовое поле на соответствующее цессов:

место (как правило, в конец). Для текстового поля.1. предобработка;

оригинальное изображение существует свой курсор (текстовый курсор), пере перед непосредственным набором проходит предва мещение которого строго соответствует логическим рительную обработку с целью устранения нежела перемещениям символьного курсора, т. е. текстовый тельного шума и повышения его качества;

курсор выполняет перемещение только в том слу.2. набор текста;

обработанное изображение чае, когда символьный курсор перемещается между подается в модуль набора текста системы, и на ос символами. Пиксельные сдвиги символьного курсо новании данного изображения оператор выполняет ра не учитываются. Каждый последующий ввод набор текста;

в процессе набора система предлагает символа за исключением пробела добавляет к теку пользователю различные варианты набора и сооб щему слову соответствующую биграмму или другой щает ему об ошибках;

на основе этой информации набор символов, соответствующий введенному сим пользователь решает, что делать дальше с текущим волу. Область печатного текста логически выделяет словом;

после всех операций набора, выбора вари текущее слово и по запросу пользователя осуществ антов и корректировки на выходе формируется на ляет поиск вариантов слов из специального словаря, бранный оригинальными символами текст в виде соответствующих текущему слову (как правило, изображения и текстовый перевод;

совпадающих либо имеющих различие в одном.3. интеллектуальный набор;

система предла символе;

сравнение слов осуществляется посим гает пользователю возможные варианты набора на вольно, с начала). Пользователь может посмотреть основе введенных символов;

выход данного процес варианты слова в выпадающем списке, расположен са, варианты слова, подаются на вход основному ном ниже текущего слова, с помощью специальной процессу, набору текста;

таким образом, обеспечи клавиши (см. рис. 2). Выбор слова из предложенных вается обратная связь, используемая для коррекции вариантов осуществляется стрелками.

набранного текста;

При выборе нужного слова программа автомати.4. интеллектуальный перевод;

система анали чески определяет недостающие символы и добавля зирует графическое написание целого слова (а не ет их в область рукописного текста, а также исправ отдельных букв) и предлагает пользователю вариан ляет ошибочные символы (если выбранное слово ты его дешифровки (перевода);

отличалось от текущего одним символом). После.5. проверка правильности;

система проверяет этого в конец рукописного текста добавляется про синтаксис и стилистику текста и сообщает пользо бел, и курсор перемещается на новое место. Далее вателю о выявленных ошибках.

пользователь может, перемещая курсор, редактиро 3 Описание интерфейса модуля набора вать набранные символы по отдельности, изменяя текста их расположение и размер или непосредственно изменяя символы. Дальнейший ввод будет добав Интерфейс программы можно разделить на 3 об лять расшифрованные биграммы в новое текущее ласти (см. рис. 4):

слово, и так далее, пока весь текст не будет расшиф 1. Область рукописного текста, которая состо рован.

ит из 2-х наложенных друг на друга слоев:

3. Панель наборных символов, состоящая из не a. нижний слой, содержащий оригинальное скольких рядов кнопок с изображенными символа изображение;

ми ввода. В случае большого количества наборных b. верхний слой, содержащий набранные сим символов и недостаточного размера панели возмож волы.

на прокрутка панели к нужному месту, чтобы сде Прозрачность обоих слоев подбирается так, что лать доступным недостающий набор символов.

бы набранные символы были отчетливо видны на Кроме специальных символов ввода панель содер фоне оригинальных символов. Фон верхнего слоя жит пробел для логического разделения слов.

выбирается прозрачным, чтобы не накладываться на оригинальное изображение.

Информация Результат о графике расщифровки Оригиналь символов текстов ные изобра жения текстов Создание ориги нальной графики символов Шрифты Оператор Keyboard.cfg Набор оригинального текста Набран ный текст Перевод Рис. 1. Схема работы автоматизированной системы Оригиналь- 1. ные изобра- Предобработка Обработанные изображения 1. Сканирование Первичные растры 1. Коррекция рас тров Растровые символы Оператор 1. Векторизация Информация Первичные о графике шрифты символов 1. Коррекция шриф тов Шрифты Перевод ориг. текста 1. Сопоставление Таблица соот ветствия 1. Формирование Оператор виртуальной Keyboard.cfg клавиатуры Рис. 2. Схема формирования виртуальной клавиатуры 2. Интеллект.

Варианты набор слова Ориг. Обраб.

2. изобр. изобр. Варианты БД Интеллект.

перевода перевод словоформ 2. Ошибки Проверка 2. правильности Предобработка 2. Набор текста Состояние набора Оператор Шрифты Набран ный текст Keyboard.cfg Перевод Рис. 3. Схема набора текста пару рукописный символ, буквосочетание, соот ветствующую нажатой кнопке, и затем добавляет элементы этой пары в соответствующий текст.

4 Особенности и преимущества автома тизированной системы Разрабатываемая программная система будет об ладать следующими особенностями:

• ускоренный набор по сравнению с обычным набором;

• связь графического изображения текста и его текстового представления;

• интеллектуализация процесса набора, кото рая включает:

a. поиск набираемого слова среди слов слова ря и предложение возможных вариантов набора;

Рис. 4. Интерфейс модуля набора текста. Пример b. анализ графического написания слова и ввода символов с выпадающим списком предлагаемый вариант его дешифровки (анализ вариантов слов по графическому написанию целого слова, а не его отдельных букв).

Ввод рукописного текста осуществляется путем • возможность организации виртуальной кла комбинированного выбора символов (с помощью виатуры символов, что позволит набирать текст с кликов мышкой) и позиционирования символьного помощью тех символов, которые использовались курсора (с помощью специальных клавиш). Панель при создании источника;

символов ввода формируется динамически с помо • возможность автоматического распознава щью заранее определенного набора символов (де ния в тексте отдельных часто повторяющихся фраз фолтный набор). Дефолтный набор состоит из гли или слов путем поиска похожих фрагментов изо фов символов ввода и соответствующих им симво бражения, что существенно ускорит процесс обра лов печатного текста в виде биграмм или других ботки текста;

кроме того, даже выявление несколь буквосочетаний. Программа формирует матрицу ких ключевых слов в изображении документа по кнопок с динамической привязкой к дефолтному зволит сделать его доступным для поисковых ма набору символов, что позволяет использовать мно шин;

жество различных алфавитов для ввода. В процессе • работы программы при каждом вводе рукописного возможность совместной работы по распо символа программа с помощью привязки определяет знаванию больших коллекций текстов коллективом исследователей с единым словарем и перекрёстной Литература проверкой результатов.

[1] Варфоломеев А.Г. Алгоритмическое и про Блок интеллектуального перевода набранного граммное обеспечение работы сетевых сооб текста на современный язык будет содержать моду ществ исследователей текстов // Компьютерные ли:

науки и технологии. Ч. 1. Сборник трудов пер • распознавания рукописи, то есть перевода вой Межд. науч.-техн. конф., Белгород, 2009. – ее в текстовый формат в графике и орфографии ори С. 30-33.

гинала;

[2] Варфоломеев А.Г., Кравцов И.В., Филатов В.О.

• перевода языка оригинала на современный SVG-визуализация в цифровых библиотеках ру русский (или какой-либо другой) язык.

кописных документов // Электронные библио Модульная структура блока в случае необходи теки: перспективные методы и технологии, мости позволит добавлять другие модули по пере электронные коллекции. Труды Девятой Всерос.

воду текста на современный язык. Работа данного науч. конф. RCDL'2007 (Переславль-Залесский, блока должна основываться на словаре. В нашей Россия, 14 – 18 октября 2007 г.). – Переславль системе по умолчанию используется база данных Залесский, 2007. – С. 230-235.

слов русского языка XIX века, содержащая более [3] Маргулис И.С. Раскладка клавиатуры для рабо 50 000 словоформ. Она содержит написание слов в ты с русскоязычными текстами XVIII – XIX ве современной графике и графике XIX века, частоту ков // Исследования по информатике. – 2005. – употребления словоформ и т. д.

Вып. 9. – С. 133-138.

[4] Полное собрание законов Российской империи.

5 Некоторые особенности реализации Собрание первое, под ред. М.М. Сперанского, системы 1830 г. Формат DJVU. – http://www.pszri.ru.

[5] Соловьев В.Д., Южиков В.С. Автоматизирован Предлагаемая нами автоматизированная система ная система обработки и реставрации изображе может быть реализована как настольное приложе ний старопечатных текстов и рукописей // Вест ние. Но больший интерес, на наш взгляд, вызывает ник КГТУ им. А.Н. Туполева. – 2006. – Вып. 3. – возможность ее реализации в виде веб-приложения.

С. 28-30.

Это позволит, во-первых, добиться ее наибольшей [6] Соловьев В.Д. Проект «Электронная библиотека универсальности и независимости от аппаратного и книг XVIII века» – первый этап // Исследования программного обеспечения (так как веб-браузеры по информатике. – 2005. – Вып. 9. – С. 117-124.

есть на всех компьютерах, подключенных к интер [7] Южиков В.С. Сегментация изображений стра нету), и во-вторых, организовать совместную, рас ниц древних рукописей // Электронные библио пределенную работу сообщества исследователей теки: перспективные методы и технологии, над изображениями документов. Совместные иссле электронные коллекции. Труды Девятой Всерос.

дования текстовых коллекций в рамках сетевых со науч. конф. RCDL'2007 (Переславль-Залесский, обществ уже рассматривались ранее [1], однако ис Россия, 14 – 18 октября 2007 г.). – Переславль пользование подобных технологий на этапе рас Залесский, 2007. – C. 236-240.

шифровки текстов выглядит не менее важным, так [8] Adamek T., O’Connor N.E., Smeaton A.F. Word как позволяет одновременно повысить скорость matching using single closed contours for indexing распознавания и его точность за счет организации handwritten historical documents//Int. J. on Docu перекрёстной проверки.

ment Analysis and Recognition. – 2007. – V. 9, Особое внимание хотелось бы уделить вопросу No 2 – 4. – P. 153-165.

разработки шрифтов и их использования при наборе [9] Codices Electronici Sangallenses (CESG). – текста. Мы предлагаем использовать для этого пе http://www.cesg.unifr.ch.

редовую технологию SVG-шрифтов [16], которая, [10] Feng S., Manmatha R., Mccallum A. Exploring the как ни странно, до сих пор очень редко используется use of conditional random field models and HMMs для адекватного отображения документов в цифро for historical handwritten document recognition// вых библиотеках [2]. Символы SVG-шрифтов опи 2nd Int. Conf. on Document Image Analysis for Li сываются с помощью векторных графических при braries (DIAL), 2006. – P. 8-37.

митивов в текстовом XML-формате. Существуют [11] Lorigo L.M., Govindaraju V. Offline Arabic hand программы для разработки таких шрифтов и их кон writing recognition: a survey// IEEE Transactions вертации из существующих TrueType-шрифтов. Со on Pattern Analysis and Machine Intelligence. – временные версии браузеров Opera и Mozilla ото 2006. – V. 28, No 5. – P. 712-724.

бражают SVG-шрифты без установки дополнитель [12] Malleron V. et al. Text lines and snippets extraction ных плагинов. Наша автоматизированная система for 19th century handwriting documents layout должна включать в себя редактор SVG-шрифтов и analysis// Int. Conf. on Document Analysis and виртуальной клавиатуры, а также обеспечивать вве Recognition. – Barcelone, 2009. – P. 1001-1005.

дение и отображение символов таких шрифтов по [13] Moghaddam R.F., Cheriet M. Low quality docu верх исходного изображения текста.

ment image modelling and enhancement// Int. J. on Document Analysis and Recognition. – 2009. – V. 11, No 4. – P. 183-201.

[14] Ntzios K. et al. An old Greek handwritten OCR system based on an efficient segmentation-free ap proach//Int. J. on Document Analysis and Recogni tion. – 2007. – V. 9, No 2 – 4. – P. 179-192.

[15] Pltz T., Fink G.A. Markov models for offline handwriting recognition: a survey//Int. J. on Docu ment Analysis and Recognition. – 2009. – V. 12, No 4. – P. 269-298.

[16] Scalable Vector Graphics (SVG) 1.1 Specification.

W3C Recommendation 14 January 2003. Part 20.

Fonts. – http://www.w3.org/TR/SVG11/fonts.html.

Automated recognition system for handwritten historical documents A.A. Rogov, A.N. Talbonen, A.G. Varfolomeev This article is devoted to such issue as recognition of handwritten historical documents such as F.M. Dos toyevsky’s records. The article contains description of intended automated decyphering system for handwritten sources, as well as the basic processes associated with handwritten text typing.

Совершенствование системы поиска в Электронной библиотеке Республики Карелия © А.Г. Марахтанов Петрозаводский государственный университет marahtanov@petrsu.ru • Аннотация увеличение скорости обработки поискового запроса;

Рассматриваются подходы к совершенство- • ранжирование результатов поиска по реле ванию поисковых механизмов в Электрон- вантности запросу пользователя;

ной библиотеке Республики Карелия. Об- • реализация новых видов поиска, таких, как суждаются вопросы индексирования хра- поиск по авторам, географическому объекту, терми нящихся документов, применения механиз- нам тезауруса и т. п.

мов поиска и ранжирования согласно реле- Механизм полнотекстового поиска позволит на вантности запросу документов на основе ходить все произведения (и место в тексте), содер векторной модели информационного поис- жащие упоминание какого-либо персонажа, геогра ка, реализации поиска по авторам, геогра- фического места, названия или термина, даже если фическим объектам, персоналиям. Ожида- они не встречаются в метаописании ресурса. Воз ется, что внедрение новой системы поиска можность осуществления такого вида поиска будет приведет к повышению эффективности ис- полезна, например, для изучения Республики Каре пользования ресурсов электронной библио- лия (ее истории, фольклора), в исследовательской теки в учебной, научной и практической деятельности, при построении генеалогических де деятельности посетителей библиотеки. ревьев и т. п.

Реализацию полнотекстового поиска в ЭБ РК за В 2004 году Региональным центром новых ин- трудняют следующие обстоятельства:

формационных технологий Петрозаводского госу • ресурсы, представленные в библиотеке, дарственного университета (ПетрГУ) была разрабо хранятся в различных форматах: наборы jpeg тана и до настоящего времени активно используется изображений,.doc и.rtf файлы,.pdf-файлы, html Электронная библиотека Республики Карелия (ЭБ страницы, текстовые файлы (.txt);

РК). Данная информационная система содержит • в библиотеке представлены издания на раз более 1500 полнотекстовых изданий по различным личных языках: русский (в том числе книги на древ областям знаний, многие из которых используются в нерусском языке, изданные до 1917 года), англий учебном процессе студентами и сотрудниками ский, языки финно-угорской группы (финский, ка ПетрГУ [1].

рельский, вепсский);

Каждое издание в ЭБ РК снабжено набором по • файлы изданий могут храниться на различ лей – метаданных, содержащих краткое описание, а ных серверах (сервера ПетрГУ, Национальной биб также информацию об авторах данного ресурса, его лиотеки РК, ссылки на сайты, хранящиеся на других названии, годе и месте издания, ключевых словах и региональных серверах).

т. п. Эти поля формируются в соответствии со стан Очевидно, что для реализации полнотекстового дартом метаописаний Dublin Core. На основании поиска необходимы извлечение текстовой информа полей метаданных осуществляется поиск ресурсов в ции из файлов изданий (другими словами – извле библиотеке.

чение из файлов набора слов), а также последующая Несмотря на востребованность ЭБ РК в учебной, обработка и хранение этой текстовой информации с научной и практической деятельности, выявлен це целью сокращения времени на дальнейшее обслу лый ряд проблем с организацией поиска и навига живание поисковых запросов пользователей.

ции в ней, что понижает эффективность использо Способ извлечения массивов текста для даль вания библиотеки в целом [2].

нейшей обработки зависит от формата файла, в ко Предложен целый ряд мер, направленных на со тором представлен ресурс.

вершенствование поисковых и навигационных ме •.txt файлы;

открытие файла в режиме чтения ханизмов, в т. ч.:

позволяет работать с ним, как с массивом текста;

• реализация полнотекстового поиска в ЭБ •.html файлы;

считывание содержимого фай РК;

ла, вырезание всех html-тегов, замена специальных символов (html-мнемоник);

Труды 12й Всероссийской научной конференции •.doc и.rtf файлы;

использование специаль «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» – RCDL’2010, ных программ, позволяющих консольно преобразо Казань, Россия, 2010 вывать файлы, подготовленные процессором Micro soft Word, в txt или html-формат;

существуют реше- моделью поиска. Примером такой модели может ния этой проблемы, такие, как интерфейс Docvert быть векторная модель [4].

(http://holloway.co.nz/docvert), которые позволяют Согласно данной модели, все документы коллек осуществлять подобные преобразования на Linux- ции и сам запрос представляются в виде векторов в серверах (ЭБ РК функционирует на платформе с OS n-мерном пространстве терминов, где n – общее OpenSuSE под управлением веб-сервера Apache);

число слов в индексе.

• Значение координаты вектора может опреде.jpeg файлы;

использование программ опти ляться различными способами. Чаще всего исполь ческого распознавания (OCR);

существует большое зуют коэффициент TF*IDF, построенный на базе количество подобных программ, однако не все они естественного статистического наблюдения: чем подходят для распознавания ресурсов из ЭБ РК;

не больше локальная частота термина в документе (TF) которые плохо работают с текстами на русском (и, и больше «редкость» (т. е. обратная встречаемость в особенно, древнерусском) языке;

некоторые не по документах) термина в коллекции (IDF), тем выше зволяют использовать консольный вызов и т. п.;

вес данного документа по отношению к термину.

рассматривалось большое число OCR-программ В общем случае в качестве TF можно взять от (Tesseract от Google, OmniPage, ABBYY FineReader ношение числа упоминаний слова в документе к и пр.), наилучшие результаты были получены при общему количеству слов в документе. Например, использовании ABBYY FineReader;

для исследова если слово «Карелия» встречается 7 раз, а всего из ния использовался серверный вариант программы дание содержит 1000 слов, тогда TF будет равна (под OS типа Linux);

0,007. Для вычисления IDF можно использовать •.pdf файлы;

преобразование pdf-файла в на отношение количество книг, содержащих слово, к бор jpeg-изображений и последующее распознава общему числу книг. Например, «Карелия» встреча ние каждого из них.

ется в 50 документах из 2000, тогда IDF равна 40.

Массивы текста, извлеченные из файлов каждого Иногда полученное значение логарифмируют.

из изданий, могли бы непосредственно использо При представлении документов и запроса в виде ваться для поиска, однако такой вид поиска (его векторов задача поиска релевантности сводится к называют «прямой поиск») будет медленным и не задаче поиска близости между векторами. Мерой эффективным, ведь для каждого запроса необходи такой близости может служить, к примеру, косинус мо будет осуществлять поиск подстрок, соответст ная метрика, то есть косинус угла между векторами:

вующих запросу пользователя, во всем массиве тек W W стов. Для сокращения времени поиска осуществля cos = di qi, i ется построение так называемого «обратного индек ( W W ) 1/ 2 са», то есть списка всех встречающихся слов, с ука- di qi i i занием изданий (и позиций в издании), где слово где Wqi – i-я координата вектора запроса, Wdi – i-я встретилось. Поиск по такому индексу осуществля ется значительно быстрее прямого. координата вектора документа. Нормирование длин Для построения обратного индекса из текстового векторов позволит упростить формулу (знаменатель массива необходимы: = 1).

• выделение из текста отдельных слов без При подсчете косинусной меры используются знаков препинания, переносов и пр. (графематиче- только координаты, соответствующие терминам, ский анализ) [3];

общим для запроса и документа, что снижает время • лемматизация, или преобразование выде- расчета.

ленных слов к начальной форме (морфологический Чем ближе значение косинуса угла к 1, тем выше анализ) [3];

релевантность документа относительно запроса • пользователя. На основании этого значения можно занесение слов, а также позиций их вхожде осуществлять ранжирование найденных докумен ний, в базу данных.

тов, то есть выводить их в порядке уменьшения ре Графематический и морфологический виды ана левантности.

лиза затем должны применяться и к каждому запро При реализации векторной модели в ЭБ РК су пользователя.

предполагается модификация простейшей вектор Кроме полного текста документа в индекс добав ной модели, а именно:

ляются также термины из метаописаний ресурса • (названия, описания, списка ключевых слов и пр.). введение коэффициентов для повышения Связь термина из метаописания и документа поме- значимости слова, если оно встретилось в основных чается отдельно. полях метаданных (заголовке, аннотации, списке Для снижения размера индекса (и, следователь- ключевых слов и т. п.);

но, увеличения скорости обработки поискового за- • нормирование по длинам документа, запро проса) возможно исключение из списка так назы- са и полей метаданных при вычислении частоты, ваемых стоп-слов – слов, часто встречающихся и не для избавления от негативного влияния на результат определяющих семантику текста. Лемматизация поиска очень коротких и очень длинных докумен также способствует снижению размерности. тов.

Поиск по построенному индексу должен реали- При практической реализации векторной модели зовываться в соответствии с некоторой выбранной информационного поиска необходимо осуществлять вычисление векторов документов (и их нормирова- символов (строк) относительно минимального коли ние) в момент добавления документов в библиотеку, чества операций вставки, удаления и замены, необ а при обработке поискового запроса – только вы- ходимых для перевода одной строки в другую.

числять вектор запроса и косинусную меру. Одним из минусов использования расстояния Кроме полнотекстового предполагается реализа- Левенштейна в нашей задаче является то, что при ция и других видов поиска: по автору, географиче- перестановке местами слов или частей слов полу скому объекту, персонажу. Для их реализации также чаются сравнительно большие расстояния. А в на будет использован обратный индекс, в котором зна- шем случае перестановка слов (например, «Виха чимые термины (географические объекты и персо- вайнен Тимо», «Тимо Вихавайнен») будет встре нажи) будут маркированы вручную. чаться достаточно часто. И даже расстояние Левен Поиск по авторам будет осуществляться на осно- штейна – Дамерау, в котором введена дополнитель вании совпадения запроса с соответствующим по- ная операция – перестановка соседних символов лем метаданных. Предполагается, что будет ото- (при условии, что эти символы являются смежными бражаться список всех авторов изданий библиотеки в обоих строках), не будет вполне адекватной мерой (по алфавиту). При нажатии на ФИО автора будет для данных случаев.

отображаться страница со списком его работ. Использования расстояния Хемминга также не Существенной проблемой при реализации по- рекомендуется, поскольку в нашем случае будут добного механизма поиска является отсутствие еди- сравниваться строки различной длины.

ного формата при заполнении поля «авторы». Другим возможным подходом к решению по Встречается более 10 различных способов написа- ставленной задачи является использование N ния ФИО автора, например: граммных расстояний, основанных на вычислении • меры близости по количеству общих подстрок фик Одоевский Владимир Фёдорович (Фамилия сированной длины [7]. Эти подстроки называются Имя Отчество);

N-граммами.

• Бохонский Д. О. (Фамилия И. О.);

Для любого слова или фразы могут быть по • Е.П. Шемилина (И.О. Фамилия);

строены N-граммы различной длины. Например, • Т.Ашер (И.Фамилия);

фамилии Иванов соответствуют 5 биграмм («Ив», • Бергштрессер К. (Фамилия И.);

«ва», «ан», «но», «ов»), 4 триграммы («Ива», «ван», • Boitchenko Larissa (Familia Imja);

«ано», «нов») и т. д. Наличие общих N-грамм повы • и т. п.

шает оценку близости строк, причем, чем больше Таким образом, для реализации поиска по авто порядок совпавшей N-граммы (число N), тем боль рам, необходимо:

ше должна быть эта оценка.

• выбрать единый формат для представления После приведения списка авторов к единому данных об авторе;

формату необходимо внедрение новых интерфейсов • привести уже добавленные в базу авторов ввода метаинформации об издании, которые исклю строки к единому формату;

чали бы возможности некорректного ввода и при • модифицировать интерфейсы ввода и ре- этом упрощали бы ввод за счет возможности выбора дактирования изданий в ЭБ РК с целью упрощения из уже внесенных в систему авторов.

ввода авторов в едином формате и автоматической Практическая реализация подходов, описанных в проверки введенных модераторами данных. данной работе, в частности, извлечение текстов из В качестве единого формата представления дан- файлов ресурсов библиотеки, их индексирование, ных об авторе был выбран следующий: «Фамилия программная реализация механизмов поиска на ос Имя Отчество». Они должны записываться всегда в нове векторной модели, возвращающих ранжиро таком порядке, каждое в начальной форме (имени- ванный список документов, релевантных запросу, тельный падеж, единственное число), начинается с реализация поиска по авторам, географическим объ заглавной буквы. Разделителем служит одиночный ектам, персоналиям существенно улучшат сущест пробел. При отсутствии данных допустимо указание вующие поисковые возможности электронной биб инициалов вместо имени и отчества. лиотеки.

Для приведения уже накопленных данных к еди- В целом подобное совершенствование системы ному выбранному формату предполагается, во- поиска позволит повысить эффективность использо первых, исправить явные ошибки, где это возможно, вания ресурсов электронной библиотеки в учебной, при помощи регулярных выражений (поиск по шаб- научной и практической деятельности посетителей лону и замена) или транслитерации набранных ла- библиотеки.

тиницей имен, во-вторых, воспользоваться матема Литература тическими мерами близости строк для группировки похожих ФИО авторов с целью упрощения даль [1] Рузанова Н.С., Насадкина О.Ю., Байтими нейшей ручной модерации.

ров Л.З., Гушкалова А.Г., Марахтанов А.Г. Элек Одной из наиболее часто используемых в подоб тронная библиотека Республики Карелия// Труды ных задачах мерой близости строк является рас XIV Всерос. науч.-метод. конф. Телематика' стояние Левенштейна (также известное как редак (С.-Петербург, 18 – 21 июня 2007 г.). – С.-Пб., ционное расстояние или дистанция редактирования) 2007. – Т. 2. – С. 390-391.

[5, 6]. Это мера разницы двух последовательностей [2] Байтимиров Л.З., Власова А.Г., Марахтанов А.Г., Document Analysis and Information Retrieval, Las Насадкина О.Ю., Фотина Е.В. О проблеме ин- Vegas, NV, 11 – 13 April 1994. – UNLV Publica формационного поиска в Электронной библио- tions/Reprographics, 1994. – P. 161-175.

теке Республики Карелия// Материалы науч. метод. конф. «Университеты в образовательном Search system development in Digital пространстве региона: опыт, традиции и иннова- library of Republic Karelia ции», Петрозаводск, 16 – 17 февраля 2010 г. – A. Marahtanov Петрозаводск, 2010. – С. 71-74.

[3] Ножов И.М. Морфологическая и синтаксическая In the article approaches to perfection of search mecha обработка текста (модели и программы). – М., nisms in Digital library of Republic Karelia are consid 2003. – http://www.aot.ru/ docs/Nozhov/msot.pdf. ered. Questions of indexing of stored documents, appli [4] Солтон Дж. Динамические библиотечно- cations of search engines and ranging according to rele поисковые системы. – М.: Мир, 1979. vance to inquiry of documents on the basis of vector [5] Левенштейн В.И. Двоичные коды с исправлени- model of information search, realization of search in ем выпадений, вставок и замещений символов// authors, geographical objects, a personnel are consid Докл. АН СССР. – 1965. – С. 845-848. ered. It is expected that introduction of new system of [6] Гасфилд Д. Строки, деревья и последовательно- search will lead to effectivization of resource exploita сти в алгоритмах: Информатика и вычислитель- tion of electronic library in educational, scientific and ная биология / Пер. с англ. И.В. Романовского. – practical activities of visitors of library.

С.-Пб.: Невский Диалект;

БХВ Петербург, 2003.

[7] Cavnar W.B., Trenkle J.M. N-gram-based text cate gorization//Proc. of Third Annual Symposium on Итоги и перспективы разработки информационной системы по биоразнообразию животных России (ZOODIV – BIODIV) © И.С. Смирнов, О.Н. Пугачев, А.Г. Кирейчук, М.Б. Дианов, А.Л. Лобанов, Р.Г. Халиков, А.А. Голиков, В.А. Кривохатский Учреждение Российской академии наук Зоологический институт РАН, г. Санкт-Петербург smiris@zin.ru объектов, объединяемых на основании общих Аннотация свойств и признаков» [18], под макротаксоном – Более шести лет в Зоологическом институте группа выше ранга семейства или отряда. Ранги РАН разрабатывается информационно- таксонов – это универсальные уровни иерархии, поисковая система по биологическому раз- имеющие собственные названия. Всего их исполь нообразию животных России. Основу сис- зуется в биологии более 40. В зоологии обязатель темы составляет таксономический класси- ными являются: вид, род, семейство, отряд, класс и фикатор (специализированная база данных), тип [18].

отражающий систематическое положение Любая информация по биоразнообразию в лю любого из таксонов, включенных в систему. бой ее составляющей части одинаково важна и Традиционный подход с применением должна быть одинаково доступна при обращении к СУБД FoxPro претерпевает изменения, и ней потенциального пользователя. Под биологиче система в последнее время переводится на ским разнообразием понимают видовое богатство в более продвинутую платформу MS SQL том или ином сообществе или биогеографическом Server. регионе [19]. Самый простой и логичный способ Кроме чисто поискового значения и на- организации информации – это таксономический копления разнообразной информации, раз- классификатор, отражающий систематическое по рабатываемая система может использовать- ложение любого из включенных таксонов, который ся в качестве простейшего определителя состоит из частных классификаторов, связанных животных. между собой. Все классификации – авторские;

у разных специалистов они отличаются между собой.

1 Введение Под классификацией понимается процесс группи ровки объектов исследования или наблюдения в В России в начале 2000-х годов делались актив соответствии с их общими признаками. В результа ные шаги для интеграции данных по видовому био те разработанной классификации создаётся класси логическому разнообразию в глобальной сети ин фицированная система (часто называемая так же, тернет. Уже более шести лет на веб-портале Зооло как и процесс, – классификацией). Таксономия – гического института (ЗИН) РАН размещена инфор теория классификации и систематизации сложноор мационно-поисковая система (ИПС) «Биоразнооб ганизованных областей действительности, имею разие России» – БИОДИВ (BIODIV), начальное раз щих обычно иерархическое строение (органический витие которой поддерживалось с 2002 по 2004 годы мир, объекты географии, геологии, языкознания, Федеральной целевой научно-технической про этнографии и т. п.) [18]. Кроме демонстрации кон граммой «Исследования и разработки по приори сенсусных вариантов, система BIODIV предусмат тетным направлениям развития науки и техники»

ривает возможность размещения параллельных аль (государственный контракт № 43.073.11.2510). За тернативных классификаций.

год страницы ИПС БИОДИВ посещает около Биологические базы данных опираются на так миллиона пользователей [14, 12].

сономические таблицы, в которых должны полно Разработка таксономических баз данных (БД) и отражаться сложные многоуровневые иерархиче информационных систем (ИС) началась в ЗИН РАН ские схемы классификации таксонов. Отражение в 1986 г. [7]. Под таксоном в работе понимается иерархий в плоских таблицах реляционных баз дан «группа в классификации, состоящая из дискретных ных является нетривиальной задачей. Несколько способов решения этой проблемы известны в тео Труды 12й Всероссийской научной конференции рии информационных систем [17, 15]. В ЗИН РАН «Электронные библиотеки: перспективные методы и большинство этих способов было разработано неза технологии, электронные коллекции» – RCDL’2010, висимо в ходе многолетних работ по созданию зоо Казань, Россия, логических баз данных [7]. Все эти разработки от- кации некоторых отрядов насекомых, сопровождае ражены в стандарте ZOOCOD, многократно опи- мые коллекционными данными, оригинально рас санном в ряде публикаций [4 – 6, 16, 8]. полагаются на страницах проекта ZInsecta, но от крываются и со страниц ИС «Биоразнообразие Рос 2 Информационно-поисковые системы сии» [3].

БИОДИВ и ЗООДИВ В итоге созданы 32 таблицы баз данных, содер жащие сведения о 45 тысячах таксонов.

Основной классификатор проекта «БИОДИВ» Эта информация доступна на 423 веб-страницах включает 5 таксономических царств, объединяю- портала ЗИН (типы HTML- и ASP-страниц) [9].

щих все живые организмы. Это: бактерии, грибы, Страницы проиллюстрированы – на них демон растения, протисты и животные. Раздел «Бактерии» стрируется 1700 фотографий и рисунков. Создан связан непосредственно с базой данных Всероссий- специальный фотоальбом, включающий галереи ской Коллекции Культур Микроорганизмов (ВКМ). художественных снимков животных и растений Для 4 других царств живых организмов специ- разных авторов.

ально для проекта БИОДИВ были разработаны и Общий объем сайта BIODIV в 2007 г. составил выставлены в интернет следующие макроклассифи- 61 мегабайт.

кации:

1) грибы – 8 макротаксонов и ссылки с них на 2.1 Проблемы разработки ИПС по биоразнообра сайты Ботанического института (БИН) РАН и ВКМ;

зию 2) растения – 15 макротаксонов и ссылки с них Традиционный подход с применением СУБД на сайты БИН РАН;

FoxPro для разработки ИПС по биоразнообразию в 3) протисты – 29 типов и собственные разделы последнее время стал создавать ряд проблем: отсут сайта для каждого из них на сайтах БИН РАН и ствие развитых средств интеграции в интернете, ЗИН РАН (оригинальная классификация С.А. Кар трудности многопользовательского доступа, произ пова (С.-Петербургский государственный универси водительности, масштабируемости и расширяемо тет) и его коллег);

сти;

архаичная структура таблиц: синонимичные 4) животные – совместно со специалистами ЗИН таксоны располагаются строго под валидным таксо РАН В.В. Малаховым (Московский государствен ном;

необходимость использования расчетного поля ный университет) разработана новая оригинальная HIERCOD для удобства отображения многоуровне классификация животных – 227 таксонов, вклю вой иерархии в форме таксономического древа;

чающая 35 типов и 150 классов. Для каждого типа программирование в среде FoxPro: «проблема одно создан собственный иллюстрированный раздел (не го разработчика», закрытая система;

проблемы со которые разделы доведены полностью или частично вместимости баз данных FoxPro с современными до видов).

версиями управляющих элементов и программных Для развития только одной ветви классификато компонентов;

проблема кодировок.

ра, посвященной царству животных (фауна), в ЗИН Синонимы в биологической таксономии – два РАН задействовано более 50 отдельных баз данных, или более названия, относящиеся к одному и тому выполненных в формате ZOOCOD, реализованном в же биологическому таксону. Только один из всех СУБД FoxPro [8]. Доведенные до семейств и далее синонимов может быть названием, под которым до видов, модельные таксоны (наиболее полно даны данный таксон должен быть известен. Этот таксон классификации пауков, насекомых, рыб, птиц и называется валидным. Обычно это тот синоним, млекопитающих) имеют разные назначение, объемы который был обнародован раньше других [18]. Ва информации, географические границы (Мир, СНГ, лидный таксон в зоологии и ботанике – действи Россия) и иллюстративное сопровождение. Под мо тельный, веско обоснованный, реально существую дельными таксонами понимаются группы живот щий или общепризнанный таксон, и его название не ных, представляющие наибольший экономический подлежит сомнению вследствие достаточно точно и экологический интерес, на которых отрабатыва выполненного первоначального описания. Невалид ются вопросы, связанные с быстродействием систе ными (недействительными), например, считаются мы, способами отображения разнообразной инфор таксоны, попавшие в синонимию в качестве млад мации и т. п. В дальнейшем предусматривается раз ших синонимов, т. е. номинальные виды, роды и работка системы фильтров, позволяющих манипу т. п., описанные позже под другими названиями, но, лировать с базами данных таким образом, чтобы по существу, заново описывающие уже известные, отсортировывать демонстрируемые таксоны по оп таксономически обозначенные формы [20].

ределенным заданиям или наборам признаков.

Совокупность недостатков СУБД FoxPro под Пользователь, таким образом, сможет отсортиро вигла обратиться к более совершенному программ вать, например, из классификации мировой фауны ному продукту – СУБД MS SQL Server, который список таксонов фауны России или другого регио характеризуют следующие ключевые особенности:

на.

клиент-серверная СУБД корпоративного уровня:

Для некоторых таксонов от основных классифи многопользовательский доступ с разделяемыми каторов BIODIV сделаны ссылки на классификато правами, высокая производительность, масштаби ры других информационных систем. Так, классифи руемость и расширяемость;

индустриальный стан дарт структуры данных, построения запросов, язык JavaScript, принципиально одинаковый в «сер средств импорта и экспорта данных;

поддержка верной» и «клиентской» частях кода ASP-страниц) производителя и совместимость с новыми версиями [13].

программных компонентов, поддержка юникода;

мощные встроенные средства программирования, 2.2 Перспективы разработки ИПС «ЗООДИВ»

расчета значений полей и автоматического заполне Кроме чисто поискового значения, подобные ния полей, проверки и обеспечения целостности системы могут представлять интерес и с точки зре данных;

средства централизованного управления ния их использования в качестве простейших опре элементами баз данных, пользователями и правами делителей, а затем, после накопления соответст доступа;

развитые средства обеспечения безопасно вующих иллюстраций, и для создания интерактив сти и резервного копирования.

ных определителей биологических объектов [2].

Ограничение финансирования заставило сосре Эти определители, связанные с остальными базами доточиться на создании ИПС только для животных данных, позволят осуществлять быстрый и досто России и сопредельных территорий. С 2006 года верный поиск объектов и эффективное использова начался проект ЗООДИВ (ZOODIV) («Биоразнооб ние всех сведений, распределенных в различных разие животных России»). От проекта BIODIV но базах. В настоящее время отлаживается программ вый проект ZOODIV наследует не одно царство жи ное обеспечение определителей и разрабатываются вотных (Animalia), а еще и царство (скорее, даже алгоритмы, которые обеспечивали бы оптимальную группу еще более высокого ранга) протистов (Pro сортировку признаков для групп с большим числом tista). Это вызвано тем, что самые неясные вопросы видов, в том числе и алгоритм обучения, дающий макроклассификации живых организмов лежат на возможность обратного распространения ошибки самом высоком таксономическом уровне и споры о [1].

числе царств и о взаимоотношениях протистов с В настоящее время общее количество записей в грибами и животными до сих пор не прекращаются, классификаторе проекта ZooDiv составляет поэтому было решено пока оставить «простейших»

(из них синонимов – 23428). Используемых таксо в рамках проекта [10]. Разработки Ботанического и номических рангов – 40, при этом количество так других институтов получили возможность само сонов по основным рангам следующее: Phylum стоятельного развития вне рамок существовавшего (Тип) – 64 (синонимов – 1), Classis (Класс) – проекта BIODIV [9].

(синонимов – 10), Familia (Семейство) – 3609 (сино Преимущества, которые просматриваются в нимов – 396), Genus (Род) – 16238 (синонимов – рамках проекта ZOODIV, таковы: клиент-серверная 3279), Species (Вид) – 79366 (синонимов – 17768) информационная система;

разделение данных (таб [11].

лицы в СУБД – серверная часть) и представления В дальнейшем предполагается обеспечить весь данных (пользовательский интерфейс – клиентская имеющийся массив данных адекватной поисковой часть);

использование единого хранилища унифи системой и связать его с поисковыми системами цированных таксономических данных с разделяе интернета, что должно облегчить работу по напол мым доступом для различных задач и проектов, как нению главных ветвей классификатора животного внутри сети ЗИН РАН, так и в публичном доступе мира и проиллюстрировать основные таксоны.

на веб-портале;

импорт имеющихся разрозненных таксономических данных в единый классификатор, Литература предоставление широкому кругу специалистов средств для внесения исправлений и дополнений, [1] Вахитов А.Т., Граничин О.Н., Кирейчук А.Г., создание удобного пользовательского интерфейса Лобанов А.Л. Параллельный алгоритм обучения для заполнения классификатора новыми данными. для интерактивного определителя биологиче Реализация наработок в рамках проекта ZOODIV ских видов// Труды суперкомпьютерной конфе привела к возникновению новых проблем и поста- ренции «Научный сервис в сети Интернет: мас новке новых задач, диктуемых длительностью раз- штабируемость, параллельность, эффектив работки структуры системы и алгоритмов обработ- ность» (21 – 26 сентября 2009 г., г. Новорос ки данных;


ограниченностью ресурсов у разработ- сийск). – М.: Изд-во МГУ, 2009. – С. 332-334.

чиков;

специфичностью таксономических данных и [2] Кирейчук А.Г., Лобанов А.Л., Смирнов И.С., методов работы с ними;

невозможностью прямого Вахитов А.Т., Воронина Е.П., Пугачев О.Н. Вир использования готовых технических решений и туальные коллекции животных и интерактивные привлечения разработок сторонних специалистов. определители биологических объектов // Элек Огромные объемы данных обусловили необходи- тронные библиотеки: перспективные методы и мость проведения тестов для оценки производи- технологии, электронные коллекции: Труды тельности и масштабируемости реализуемых алго- Одиннадцатой Всерос. науч. конф. RCDL’ ритмов;

создание открытой системы предопредели- (Петрозаводск, Россия, 17 – 21 октября 2009 г.).

ло использование стандартных средств программи- – Петрозаводск: КарНЦ РАН, 2009. – С. 400-407.

рования – MS SQL Server (серверная часть) и уни- [3] Кривохатский В.А., Лобанов А.Л., Медведев версального веб-интерфейса (клиентская часть – Г.С., Белокобыльский С.А., Дианов М.Б., Смир технология ASP;

кросс-платформенный скриптовый нов И.С., Халиков Р.Г. Информационная систе ма по энтомологическим коллекциям в Интер- ги разработки проекта «Информационная сис нете // Труды Русского энтомологического об- тема по биоразнообразию животных России»

щества. – 2003. – Т. 74. – С. 59-70. (ZooDiv) // Отчетная научная сессия по итогам [4] Лобанов А.Л., Зайцев М.В. Создание компью- работ 2007 г. Тезисы докладов. 8 – 10 апреля терных баз данных по систематике млекопи- 2008. –Зоологический институт РАН, 2008. – тающих на основе классификатора названий С. 42-44.

животных ZOOCOD // Вопросы систематики, [14] Смирнов И.С., Лобанов А.Л., Алимов А.Ф., фаунистики и палеонтологии мелких млекопи- Пугачев О.Н., Кривохатский В.А.. Информаци тающих (Труды Зоологического института онная система по биологическому разнообра РАН). – 1991. – Т. 243. – С. 180-198. зию России // Научный сервис в сети Интернет:

[5] Лобанов А.Л., Смирнов И.С. Принципы по- Труды Всерос. науч. конф. (22 – 27 сентября строения и использования классификаторов жи- 2003 г., г. Новороссийск). – М.: Изд-во МГУ, вотных в стандарте ZOOCOD // Базы данных и 2003. – С. 12-14.

компьютерная графика в зоологических иссле- [15] Щеваев П.А. Способы хранения иерархических дованиях (Труды Зоологического института структур в реляционных базах данных // Новые РАН). – 1997. – Т. 269. – С. 66-75. информационные технологии и системы: Труды [6] Лобанов А.Л., Смирнов И.С., Дианов М.Б. VI Межд. науч.-техн. конф. Ч. 2. – Пенза: ПГУ, ZOOCOD – концепция представления зоологи- 2004. – С. 226-233.

ческих иерархических классификаций в реляци- [16] Lobanov A.L., Ryss A.Yu., Smirnov I.S.. A mod онных базах данных // Информационно- ern state of the ZOOCOD concept // Information поисковые системы в зоологии и ботанике (Те- Systems on Biodiversity of Species & Ecosystems.

зисы межд. симпозиума, май 1999). Труды Зоо- Scientific program & Abstracts. – SPb, 2003. – P.

логического института РАН. – 1999. – Т. 278. – 7-8.

С. 66. [17] VanTulder G. Storing hierarchical data in a DB. – [7] Лобанов А.Л., Смирнов И.С. Место и роль ин- http://www.sitepoint.com/print/hierarchical-data формационных технологий в исследованиях database, 2003.

Зоологического института РАН // Фундамен- [18] Статья «Таксон» – http://ru.wikipedia.org/wiki/.

тальные зоологические исследования: теория и [19] Дедю И.И. Экологический энциклопедический методы (по материалам Международной конфе- словарь. – Кишинёв: Гл. ред. МСЭ, 1990. – ренции «Юбилейные чтения, посвященные 170- 408 с.

летию Зоологического института РАН», 23 – 25 [20] Статья «Валидный вид». – http://flores.by.ru/ октября 2002 г.). – М.-СПб: Товарищество на- notes.html.

учных изданий КМК, 2004. – С. 283-318.

[8] Лобанов А.Л., Смирнов И.С., Дианов М.Б., Го- Results and prospects of development of ликов А.А., Халиков Р.Г.. Эволюция стандарта information system on a biodiversity of ZOOCOD – концепции отражения зоологиче animals of Russia (ZOODIV – BIODIV) ских иерархических классификаций в плоских таблицах реляционных баз данных // Электрон I.S. Smirnov, O.N. Pugachev, A.G. Kirejchuk, ные библиотеки: перспективные методы и тех M.B. Dianov, A.L. Lobanov, R.G. Khalikov, нологии, электронные коллекции: Труды Деся A.A. Golikov, V.A. Krivohatsky той Всерос. науч. конф. RCDL’2008 (Дубна, Россия, 7 – 11 октября 2008 г.). – Дубна: ОИЯИ, More than six years at the Zoological institute of the 2008. – С. 326-332.

Russian Academy of Science are developed an informa [9] Портал Зоологического института. Проект Bio tion retrieval system (IRS) on a biological diversity of Div. – http://www.zin.ru/BioDiv/bd_part.htm.

animals of Russia. A basis of IRS is taxonomic classifi [10] Портал Зоологического института. Проект cator (a specialized database), reflecting regular posi ZooDiv. – http://www.zin.ru/ZooDiv/Project.htm.

tion of any included in system taxa. The traditional ap [11] Портал Зоологического института. Проект proach with application DBMS FoxPro undergoes ZooDiv, статистика классификатора. – changes and the system recently is translated on more http://www.zin.ru/ZooDiv/animals_stats.asp.

advanced platform MS SQL Server. Except for cleanly [12] Пугачев О.Н., Алимов А.Ф., Лобанов А.Л., search value and accumulation of the various informa Кривохатский В.А., Смирнов И.С. Первые итоги tion, the developed system can be used as the elemen разработки информационной системы по био tary identification system for animals.

разнообразию России (BIODIV – ZOODIV) // Информационные системы и web-порталы по Работа выполнена при частичной финансовой поддерж разнообразию видов и экосистем. Материалы ке РФФИ (проект 09-04-00789), подпрограммы «Изучение межд. симпозиума, Борок, 28 ноября – 1 декабря и исследование Антарктики» Федеральной целевой про 2006 г. – М.: Тов-во науч. изд. КМК, 2006. – граммы «Мировой океан», проекта № 4 «Определение С. 170-173. состояния антарктических экосистем, оценка окружаю [13] Пугачев О.Н., Дианов М.Б., Лобанов А.Л., щей среды в районе работ Российской Антарктической Смирнов И.С., Халиков Р.Г., Голиков А.А. Ито- Экспедиции», и программы «Биоразнообразие»

Гибкая основа информационной системы для обучения © С.В. Знаменский Институт программных систем имени А.К. Айламазяна РАН, г. Переславль svz@latex.pereslavl.ru Аннотация 1.2 Новое содержание учебной деятельности Пересмотр целей и содержания обучения в Поиск форм учебной деятельности, обеспечи контексте «один ученик – один компьютер»

вающих формирование ключевых компетенций со нуждается в высоконадёжной информаци временного специалиста, находится в начальной онной системе, гибко, эффективно и разно стадии. Наиболее заметные находки, такие, как сторонне организационно обеспечивающей letopisi.ru [2], [3], сконцентрированы в программе разнообразную творческую работу в сме «Intel® Обучение для будущего» и относятся к об шанных группах с опорой на электронные щему образованию. Все они представляют собой библиотеки. Доклад посвящён проблеме различные формы организации творческой проект создания информационной системы с тре ной деятельности на телекоммуникационной осно буемыми качествами. Показывается прин ве.

ципиальная бесперспективность реляцион Для подготовки специалистов это означает уча ных СУБД и описывается альтернативная стие студентов бок о бок с профессионалами в основа.

практически ценных творческих проектах.

Это содержание в Университете города Пере 1 Постановка задачи славля (УГП) имени А.К. Айламазяна реализуется в таких организационных формах, как учебная, про изводственная и преддипломная практики, курсовое 1.1. Изменившиеся цели обучения и дипломное проектирование. В дополнение к клас Традиционные технологии обучения создавались сической базовой части учебный план расширен во времена, когда не было компьютеров, снимаю решениями учёного совета УГП практикой участия щих с человека тяжесть воспроизведения знаний и в научно-практических конференциях и практикой алгоритмических действий, и поэтому были нацеле по разработке информационной системы УГП, ве ны на репродуктивную деятельность. Лекции, семи дущейся всеми студентами младших курсов специ нарские занятия, экзамены в основном ориентиро альности «Прикладная математика и информатика»

ваны на приобретение и воспроизведение регламен под руководством немногих студентов старших тированных стандартом знаний. Практические и ла курсов.

бораторные занятия, контрольные работы форми Дальнейшее развитие информационной под руют умения и навыки решения типовых задач.

держки учебного процесса в УГП направлено на Экспоненциально растущие разнообразие и дос поиск эффективных форм организации творческой тупность специальных технологических знаний и проектной деятельности на аудиторных занятиях на неопределённость содержания будущей деятельно основе полного перевода учебного процесса на схе сти специалиста обесценивают усилия по выделе му «один студент – один компьютеp». Решением нию единой стандартной репродуктивной основы ученого совета университет с 1 сентября 2010 года специального образования. Поэтому новое поколе полностью переходит на разрабатываемую студен ние стандартов в большей степени ориентируется на тами информационную систему.


творческие компетенции, лучше отражающие (см., например, [1]) творческие способности общей при- 1.3 Основания разработки роды.

Творческая проектная деятельность имеет спе Для IT-сферы к таким способностям относятся цифические сложности организации. Ниже выделе умения организовать и вести совместную разработ ны важнейшие из них для проектирования инфор ку программной системы, документировать код и мационной системы.

пользовательский интерфейс, взаимодействовать с пользователями и другими разработчиками. Сход 1.3.1 Система оценок ные творческие компетенции требуются от специа листов и в других сферах. Объективной абсолютной шкалы оценок резуль тативности творческой деятельности не существует.

Реально используемые относительные шкалы типа Труды 12й Всероссийской научной конференции КТУ (коэффициент трудового участия – выражает «Электронные библиотеки: перспективные методы и долю индивидуального вклада в общем продукте) и технологии, электронные коллекции» – RCDL’2010, рейтингового типа (учитывающего, чей вклад Казань, Россия, больше, но игнорирующего, насколько больше) ционных СУБД ореол безальтернативности реали субъективны по своей природе и теряют адекват- зации качественной информационной системы.

ность при попытке перевода в пятибалльную систе- Чтобы увидеть дальше этого ореола, давайте му. рассмотрим реляционную технологию с позиций По-видимому, проблема оценивания результатов математического моделирования.

творческой деятельности в полной общности нераз 2.1 Реляционная модель информационных про решима и должна разрешаться ситуативно. Это оз цессов начает, что сохраняться и использоваться в системе должны не пятибалльные оценки, а содержательный Реляционная модель информационных процес отчёт, рецензии, КТУ, рейтинг и другие осмыслен- сов характеризуется следующими характеристика ные характеристики. ми:

1. В каждый момент система находится в со 1.3.2 Неограниченное разнообразие организаци гласованном (логически непротиворечивом) состоя онных форм нии.

Индивидуальные творческие задания и задания 2. Изменения в данных вносятся исключи малым однородным группам редко имеют столь яр- тельно через механизм транзакций [4], обладающих кий обучающий, воспитательно-ориентирующий и свойствами ACID = (atomicity, consistency, isolation, продуктивный эффект, как работа в продуктивном durability) и обеспечивающий логическую целост творческом коллективе с непростым уникально- ность данных системы в любой момент времени.

специфическим распределением ролей и обязанно- 3. Единая и неизменная на момент осуществ стей. Информационная система должна обеспечить ления транзакции онтология системы в целом фор такие коллективы набором интерфейсов, удобных мально описывает логические структуры данных, для сохранения промежуточной информации, раз- что позволяет контролировать целостность данных боров полёта, оценок и взаимооценок активности и планировать транзакции.

участников. Всего этого невозможно заготовить за- 4. Внутреннее представление данных и язык ранее, система должна постоянно дорабатываться. запросов (SQL, XQuery,...) корректно реализуют ло гику исчисления предикатов.

1.3.3 Сопровождение и развитие системы – тоже Таким образом, реляционная модель – это опи проект сание и обработка информации, базирующиеся на исчислении предикатов.

Сопровождение и развитие системы – это один Поддержание большой сложной системы в со из учебных проектов, и поэтому он должен быть гласованном состоянии затратно. Ситуацию карди полноценно поддержан в этой системе. Требуется нально не меняет даже огромное число последую обеспечить гибкую организацию хорошо защищён щих работ (см., например, [5 – 7]), направленных на ного доступа и авторизацию изменений к коду и оптимизацию планирования параллельной обработ данным, ки транзакций.

2 Границы применимости реляционных Обычно только учёт очевидных априорных предположений о структуре и типах возможных за информационных систем в задаче под просов позволяет резко повысить производитель держки сложного непредсказуемо измен ность системы. Любое отклонение от перечислен чивого взаимодействия ных характеристик усложняет систему. Простей шим вариантом такого отклонения является широко За десятилетия развития и интенсивного исполь используемая денормализация – разделение одно зования реляционные СУБД заслуженно заняли ме родной таблицы на изолированные части. Повышая сто безальтернативной основы для создания слож вероятность ошибки при обработке непредусмот ных информационных систем. Возможность абстра ренного запроса с непредсказуемыми последствия гирования от временной рассогласованности проис ми, такое отклонение угрожает лишить систему ходящих в реальности изменений (например, от то главного козыря – полноценной опоры на исчисле го, что продавец либо сначала пробивает чек, а за ние предикатов – и угрожает логической целостно тем принимает деньги, либо наоборот, но никогда сти данных. Оставаясь иллюзорной и практически не одновременно) резко облегчила разработку, по неправдоподобной для систем, в которых данные зволяя в полной мере опереться на логику предика неизменно разделены на независимо изменяемые тов. Разнообразные средства разработки ориентиро части, эта угроза становится реальной для сложных ваны на систему с фиксированной (в принципе, да целостных систем.

же подменяемой в следующей версии кода, но толь ко не в процессе обработки данных) онтологией, 2.2 Разделение данных на изолированные части стандарты представления и обмена данных, много численные кроссплатформенные высококачествен- Сложная неоднородная система может созда ные реализации СУБД и наличие большого числа ваться только во взаимодействии многих групп раз свободно доступных модулей, учебники и другие работчиков, и поэтому разумная организация их ра ресурсы, созданные лучшими умами в последние бочего взаимодействия также является сложной десятилетия, — всё это придаёт технологиям реля адаптивной системой, нуждающейся в адекватной кусков текста показывалась именно как перестанов информационной поддержке. ка, а не как удаление и вставка.

Главная особенность постановки задачи состоит Преодоление разделённости интерфейсов поль в том [8 – 10], что предметная область для требуе- зователей открыло бы возможности поиска простой мой информационной системы по сути относится к эффективной комфортной организации совместного достаточно интенсивно исследуемому за рубежом редактирования текстов и структур, поскольку для классу социотехнических сложных адаптивных избегания коллизий при совместном редактирова систем (complex adaptive systems). Имеются как ис- нии достаточно показывать пользователю положе следования особенностей обработки информации ния курсора и выделения других активных пользо для таких систем [11 – 15], так и сопоставительный вателей. Имеющие общность цели и не заинтересо анализ различных подходов к их разработке [16 – ванные во взаимных помехах пользователи смогут 20], влекущих новое представление о жизненном при этом вносить неперекрывающиеся изменения цикле такой информационной системы [21, 22]. независимо, может даже вплоть до того, что абзацы Общим в этих работах является безусловное при- текста, правящиеся двумя пользователями, могут знание необходимости разделения системы на мно- быть в это время переставлены третьим.

жество по сути независимо создаваемых и модифи 2.2.3 Проблема перестройки начавшихся процес цируемых частей, заранее не регламентированных сов ограничениями дальнейшего развития и взаимодей ствия. Концептуальная модель такой обработки ин- Система рассматриваемого класса должна иметь формации оказывается заведомо сложной и тре- функциональность WorkFlow, позволяющую созда бующей специальных подходов к разработке. Гиб- вать сложные схемы взаимодействия субъектов и костью и универсальностью выделяется механизм запускать процессы многоступенчатого рассмотре контекстуализации [23, 24], позволяющий с учётом ния – согласования – утверждения и другие бизнес разнообразных специфических особенностей орга- процессы, работающие по заданной схеме. При ори низовывать инкапсуляцию и наследование. ентации разработки на разделение данных каждый Эта идея нашла общепризнанный стандартный такой процесс, точнее, информационная состав путь реализации [19, 20, 25 – 27] в рамках сервер- ляющая каждого такого бизнес-процесса, работает в ориентированной архитектуры (SOA), нацеленной своём пространстве состояний, изменения в которое на объединение независимых сервисов. можно в лучшем случае вносить индивидуально в Изоляция информационных процессов карди- каждый процесс. Если изменение условий требует нально повышает быстродействие реляционной немедленной перестройки начавшихся процессов, СУБД и помогает локализовать временные потери то система с разделёнными данными становится доступа при внесении изменений в онтологию, но крайне неудобной. Перестройка процессов как не сопряжена с серьёзными потерями качества пользо- обходимая функциональность не просто востребо вательского интерфейса. вана, она прописана в стандартах контроля качест ва. Изоляция начатых процессов либо делает её не 2.2.2 Проблема совместного редактирования возможной, либо нерационально усложняет логику Совместный доступ к изменяемой информации системы.

чреват коллизиями. Пользователь может записать Эта проблема решена в системах управления за свои изменения поверх тех, которые были сохране- дачами на основе единого для всех процессов и не ны в момент его редактирования и которых он не изменного множества состояний. При таком подхо мог видеть. Новая технология Google wave разделя- де нет изоляции процессов, но жёсткая унификация ет процессы редактирования данных разными поль- процессов не всегда адекватна требованиям практи зователями, позволяет объединять изменения в ходе ки.

работы и поддерживает индивидуальные много- Таким образом, оба этих близких по назначению кратные undo/redo. Недостатком этой, основанной подхода принципиально ограничены заложенными на операционных преобразованиях, новейшей тех- изначально принципиальными ограничениями, ли нологии является принципиальная невозможность шающими пользователя возможности совместить их добавления в редактор интерфейса выделения и пе- преимущества.

ремещения блоков. Этот недостаток принципиально 2.2.4 Проблема нескольких окон неустраним и крайне существенен: операция пере мещения является важнейшей в редактировании Современные браузеры предоставляют пользо структур, и удовлетворительного решения для тако- вателю удобную возможность открыть несколько го редактирования на пути операционных преобра- окон и расположить их в удобном для работы по зований не предвидится. рядке. Информационные системы традиционно ли Задача выделения и оценки вклада каждого шают его этой возможности на том основании, что пользователя, по-видимому, должна решаться более информация в открытых окнах устаревает и работа адекватными средствами, как минимум учитываю- с несколькими открытыми окнами может привести щими, что перестановка частей текста не тождест- к потере данных. Если, например, пользователь от венна написанию их с нуля. Желательно перерабо- крыл длинную форму в двух окошках, начал запол тать алгоритм diff так, чтобы перестановка больших нять в обоих, в одном заполнил, сохранил и закрыл, уровня. Выше показано, как эта изоляция отзывает а в другом ошибочно сохранил, не глядя и помня, ся принципиально неодолимой недружелюбностью что он её уже заполнял, то основная работа по за- пользовательских интерфейсов на уровне конкрет полнению формы безвозвратно пропала. Современ- ных приложений.

ные AJAX-технологии в принципе позволяют пере- Действительно ли необходимость изоляции ин нести изменения в другое окно, даже если оно от- формационных процессов является общей особен крыто в другом браузере или на другом компьюте- ностью информационных систем? Либо она связана ре, но здесь возникает тот же барьер изолированно- с опорой на переставшую быть адекватной новым сти процессов обработки сессий. постановкам задач реляционную модель обработки данных, и другая модель обработки информации 2.2.5 Проблема межпроцессной коммуникации сможет просто разрешить перечисленные проблемы для рассмотренного класса задач?

Механизм обмена сообщениями (e-mail, систем ные сообщения между изолированными процесса 2.3 Обеспечение надёжности ми), на котором базируются современные коллабо ративные системы, имеет несколько принципиаль- Реляционная модель обоснованно считается ных недостатков: наиболее эффективным средством разработки высо 1. Крайне трудно освободить пользователя от конадёжных информационных систем. Практически удаления сообщений, по тем или иным причинам все современные реляционные СУБД включают в потерявших актуальность. Это легко было бы сде- себя средства резервного копирования (в том числе лать, если бы сообщения не отсылались, а генериро- горячего) и репликации данных, дающие админист вались в момент, когда пользователю доступен со- ратору возможность быстро вернуться к сохранён ответствующий интерфейс. Но как сделать, чтобы ной копии или переключить работу на резервный иконка уведомления о важном сообщении исчезала, сервер.

когда сообщение потеряло актуальность? Если ло- Онтология сложной информационной системы гика отправки сообщений хорошо формализована, должна быть доступна для внесения изменений, по то теоретически можно вычислить и посылать со- требность в которых проясняется в ходе эксплуата общения, отменяющие ранее посланные. Однако та- ции. Некоторые проблемы обеспечения надёжности кой подход недоступно сложен в реализации и от- при многопользовательском доступе к данным и пу ладке. ти их решения описаны, например, в [4, 28, 29].

2. Если у пользователя изменились статус или Кодирование и отладка в работающей реляцион настройки или другие параметры приняли значения, ной системе – это обычно крайне рискованная дея при которых сообщение должно бы было присут- тельность, требующая нескольких тестовых серве ствовать, то сообщение должно вернуться, но оно ров, разделения кода и пользовательских данных, удалено. Чтобы оно появилось, система теоретиче- сложной организации хранения резервных копий ски могла бы сгенерировать аналогичное сообщение кода и данных.

взамен удалённого, но реализация такого поведения Для обеспечения её безопасности полезно пол крайне сложна, и любое изменение в организации ное сохранение всей истории изменений с их автор сообщений в таком случае должно требовать суще- ством и удобный доступ к прошлым состояниям ственной перестройки механизмов генерации. сервисов, заложенные в СУБД на уровне, неподкон Чтобы пользовательские интерфейсы безоши- трольном пользователям-разработчикам.

бочно показывали актуальную информацию на те 2.3.1 Проблема репликации сервиса с целью по кущий момент во всех случаях, механизм сообще вышения безотказности и отзывчивости ний должен быть заменён на процесс сбора и обра ботки текущей информации из различных подсис- Обычным средством достижения высокой отка тем. Такой подход несравненно проще в безупреч- зоустойчивости и реактивности сервиса является ной реализации, но несовместим с изоляцией кон- его дублирование. Для медленно изменяющейся текстов данных. информации этот способ широко используется в поисковых серверах и других web2.0-приложениях 2.2.6 Неизбежность изоляции данных информа [30 – 32], наглядно показывая [33], что дублирова ционных процессов ние информации на многих серверах ускоряет обра Неукоснительное требование полной согласо- ботку стандартных запросов на порядки ценой сни ванности всех данных большой сложной целостной жения согласованности информации на выходе и системы резко усложняет внесение малейшего из- замедления реакции на изменения в данных. На менения просто потому, что предполагает немед- пример, результаты поиска в поисковых серверах ленную диагностику необходимости внесения со- зачастую отражают не сиюминутное, а прошлое со путствующих изменений в остальные данные сис- стояние страничек, а сведения о количестве найден темы и внесение этих изменений. Изоляция инфор- ных ссылок могут многократно измениться по мере мационных процессов является основным путём их просмотра.

резкого снижения этого бремени и повышения про- Общеизвестно, что распределённость информа изводительности системы в целом до приемлемого ционной системы с дублированием информации по тенциально способно кардинально повысить её после нескольких обновлений информационной жизнестойкость. Однако проблема внесения согла- системы.

сованных изменений в распределённо дублирован 2.3.4 Проблема непрерывного гладкого обновле ную информацию не находит прозрачных решений, ния системы пригодных для большой целостной (не разделяемой на изолированные процессы) реляционной системы. Частые обновления системы не должны достав лять помех пользователям. Сложность реализации 2.3.2 Проблема сохранности доступа к старым этого требования также резко возрастает при ус версиям при обновлениях ложнении системы. В реляционной модели переход Проблема поддержки историчности в базах дан- от одной онтологии к другой – это всегда переход к ных не без оснований считается решённой и деталь- новому качеству, и провести этот переход без при но описанной в монографии [34]. Последние иссле- остановки сервиса для перезагрузки процессов не дования адресованы в основном проблемам пред- реально. Время на перезагрузку сложной системы ставления исторической информации в XML [35 – непременно скажется на пользователе. Откат изме 38] и проблеме повышения эффективности запро- нений потребует большего времени. Гладкость об сов в этих рамках [39, 40]. новления означает, что система должна гарантиро В рассматриваемой ситуации важно, чтобы при вать доступность интерфейсов ввода и вводившейся согласованных изменениях в данных и коде данные пользователем информации независимо от установ в запросах обрабатывались соответствующим ко- ки и отката обновлений.

дом. Обеспечить согласованность версий кода и 2.4 Цель статьи данных в реляционной базе достаточно сложно.

Сложность в том, что модуль может включаться в Выше перечислен ряд проблем разработки каче работу в различное время для различных контекстов ственной информационной системы. Некоторые из данных. Чтобы старые данные всегда корректно ин- них предположительно могут быть решены и в рам терпретировались, предоставляющая авторизован- ках реляционной модели ценой значительного ус ный доступ к сохранению и востребованию версий ложнения реализации. Совмещение этих требований кода и данных, подсистема контроля версий должна в традиционных рамках реляционной модели при лежать на более низком логическом уровне архи- водит как минимум к немыслимому усложнению тектуры, чем разделение данных. Например, слия- системы. В интернете не удаётся найти описаний ние или разделение учебных групп должно приво- систем, в которых качественно решена хотя бы дить к слиянию или разделению соответствующих часть этих проблем. Отсюда вывод, что решение таблиц, и эти действия нарушают (либо немыслимо этих проблем в комплексе лежит за гранью возмож усложняют) логику запросов к истории. ностей систем, основанных на реляционной модели.



Pages:     | 1 |   ...   | 3 | 4 || 6 | 7 |   ...   | 26 |
 





 
© 2013 www.libed.ru - «Бесплатная библиотека научно-практических конференций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.