авторефераты диссертаций БЕСПЛАТНАЯ БИБЛИОТЕКА РОССИИ

КОНФЕРЕНЦИИ, КНИГИ, ПОСОБИЯ, НАУЧНЫЕ ИЗДАНИЯ

<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ


Pages:     | 1 || 3 |

«УДК 651:681.322 ББК 65.050 Н62 Никитина Т. П. Электронные системы управления документооборотом. Учеб. пособие. - Ярославль: МУБиНТ, 2002. - стр. ...»

-- [ Страница 2 ] --

Размер шрифта (кегль) - это высота шрифта, заданная в пунктах. Пункт единица измерения, принятая в полиграфии. Обозначается буквами pt = 1/ дюйма (0,352 мм). Кроме пункта используется питч (pitch) - количество символов, которое может быть напечатано на отрезке в один дюйм.

Обозначается буквой р. Интервал - величина, равная 1/6 дюйма или 12 pt.

Размер шрифта на принтере в пунктах определяет расстояние от верхнего края самого высокого символа до нижнего края самого низкого. Обычно кегль шрифта несколько больше самой литеры, так как некоторые буквы выступают над строкой (например, "й"), а некоторые имеют нижний выступ (например, "у" или "ф"). Кегль включает высоту собственно буквы и так называемые заплечики - свободные пространства над и под символом, образующие межстрочные промежутки. При выборе шрифта для матричных принтеров иногда задается количество знаков, печатаемых на одном дюйме.

Все используемые шрифты могут быть разбиты на две категории: шрифты моноширинные (фиксированные), у которых все символы одинаковой ширины, и шрифты пропорциональные, у которых ширина символа определяется особенностью его изображения (например, буква "ш" шире, чем "а"). Операционная система Windows, использует моноширинный шрифт Courier и пропорциональный шрифт Times New Roman.

При выборе шрифта для печати документа основным критерием является его удобочитаемость.

Технология оформления фрагментов (частей) текста позволяет пользо вателю производить форматирование двумя способами:

• либо после набора текста;

• либо задавать нужные атрибуты оформления до процесса набора.

При первом варианте требуется:

• указать (выделить) фрагмент текста, для которого будут установлены новые параметры оформления;

• провести установку значений атрибутов оформления через специальную команду "Формат" меню системы подготовки текстов.

Второй вариант предполагает следующую последовательность операций по форматированию:

• производить набор текста до тех пор, пока не потребуется специальное оформление следующего вводимого фрагмента;

• установить новые параметры оформления с помощью набора средств, предоставляемых программой подготовки текста;

• продолжить набор текста. Установленный формат символов будет применяться ко всем вводимым символам;

• завершив набор, отключить установленное специальное форматирование.

Количество параметров оформления символов отличается для разных текстовых процессоров. Основными параметрами символьного оформления являются.

• тип (гарнитура) шрифта;

• кегль (высота) символов шрифта;

• начертание литер (полужирный, курсив, полужирный курсив, обычный);

• подчеркивание;

• цвет символов;

• расположение символов относительно опорной линии строки (например, верхний и нижний индекс).

Представители более мощных программ в классе подготовки текстовых документов обеспечивают возможность выделения цветом и различные дополнительные эффекты (зачеркивание, подчеркивание, скрытьп текст).

Может быть обеспечена операция автоматического кернинга к разрядки для пар символов. Под кернингом понимается настройка интервала между определенными парами символов при больших кегля* шрифта, когда имеет место увеличение межбуквенного промежутка за счет особенностей написания символа. Разрядка - операция увеличения межбуквенного пространства для улучшения вида строки текста и выравнивания правых границ строк.

Внешний вид документа в большой степени зависит не только от фор матирования символов текста, но и от оформления абзацев текста. Абзац является одним из основных структурных элементов документа. Обычно новый абзац в тексте образуется при нажатии клавиши Enter при наборе текста. При этом курсор ввода переходит на новую строку и устанавливается в позицию левого отступа следующего абзаца. Позиция отступа зависит от параметров настройки конкретной системы текстовой обработки. Набор параметров абзацного форматирования, аналогично набору атрибутов символьного форматирования, зависит от конкретной системы подготовки текстовых документов, в среде которой изготавливается текстовый документ.

К наиболее общим атрибутам можно отнести установку:

• типа выравнивания границ строк;

• отступов для строк;

• межстрочных интервалов;

• расположения текста абзаца на смежных страницах документа.

Под выравниванием понимается способ расположения текста абзаца между заданными левой и правой границами текста. Способ выравнивания вместе с форматом шрифта влияет на удобочитаемость текста. Напомним, что системы подготовки текстовых документов используют четыре способа выравнивания текста абзаца при автоматической верстке строк в процессе набора: влево, вправо, по центру и по ширине- когда каждая строка абзаца, кроме концевой, выравнивается по левой и правой границам за счет расстановки переносов с последующим равномерным расширением пробелов между словами. Следует различать абзацы с отступом от левых и правых полей страниц. Поля определяют общую ширину области основного текста, другими словами, полем называется расстояние между текстом и краем страницы. Отступ абзаца определяет расстояние текста от поля. Отступы абзаца позволяют отделить текст одного абзаца от другого или выделить отдельные абзацы в тексте документа. Выделяют отступ первой строки абзаца - для абзацев с "красной" строкой или с "выступом", отступ для последующих строк абзаца слева и справа. Абзац с "выступом" - это абзац, в котором отступ образуется для каждой строки, кроме первой. Этот тип форматирования используется обычно для создания маркированных или нумерованных списков. Ряд текстовых процессоров, например WordPerfect, допускает установку величины отступа для отдельной строки текста абзаца.

Межстрочный интервал (интерлиньяж), - это расстояние между строками в абзаце. Увеличение интерлиньяжа позволяет легко читать более длинные строки, т.е. позволяет использовать шрифт меньшего кегля. Величина межстрочного интервала задается либо в строках, либо в пунктах для более точной установки.

Стилевое оформление текста получило свое развитие во всех современных текстовых процессорах, предназначенных для подготовки сложных смешанных текстов. Под стилем понимается специальный инструмент для форматирования фрагментов разрабатываемого документа. Стиль - описание оформления текста, которое именуется и запоминается в шаблоне, на котором базируется документ. Стиль состоит из двух частей: его имени и инструкций форматирования.

Если система подготовки текста используется для создания и оформления многостраничного документа, то в тексте могут появиться новые структурные элементы: колонтитулы, сноски, закладки, перекрестные ссылки.

Под закладкой (меткой) понимается определенное место в тексте документа, которому пользователь присваивает имя. В дальнейшем закладка в многостраничном документе может использоваться для быстрого перехода к месту документа, обозначенному закладкой и для создания перекрестных ссылок в документе.

Иногда по ходу чтения документа необходимы дополнения к основному тексту, подстрочные примечания. Подстрочные примечания оформляют сносками. В состав подстрочного примечания входят два неразрывно связанных элемента: знак сноски и текст собственно примечания. Знак сноски располагают в основном тексте у того места, к которому относится примечание, и в начале самого примечания. Рекомендуется в текстовом материале использовать знак сноски в виде арабских цифр, а в цифровом - в виде букв или знаков.

Перекрестная ссылка - это текст, предлагающий читателю документа обратиться к другому фрагменту текста или рисунку, содержащемуся в тексте.

Колонтитулом называется одинаковый для группы страниц текст (гpaфическое изображение), расположенный вне основного текста документа на полях печатной страницы. Различают верхний колонтитул, который обычно расположен над текстом документа, и нижний, располагаемый ниже основного текста. Обычно верхний колонтитул используется для нумерации страниц.

3.5. Компьютерные технологии изготовления табличных документов Создание и обработка табличных документов - это та область инфор мационной поддержки управленческой деятельности, в которой прежде всего началось использование тех или иных средств вычислительной техники. При этом первоначально реализовывались две технологии:

• данные размещаются в таблице на бумаге, а их обработка производится с помощью электронного калькулятора;

• данные размещаются в памяти вычислительного средства, а для их обработки создается и используется соответствующая программа.

Первый вариант рассчитан на рядового пользователя, нагляден, легко проверяется, но расчеты выполняются очень медленно и довольно трудоемки.

Второй вариант отличается более высокой скоростью выполнения расчетов, но может быть использован лишь квалифицированным про граммистом, а не обычным пользователем, что приводит к достаточно высокому уровню затрат.

С появлением персональных компьютеров были созданы прикладные программные средства формирования и обработки табличных документов (табличные процессоры), которые объединили преимущества обоих вариантов технологии и благодаря своей простоте и универсальности получили широкое распространение.

Подготовка табличных документов базируется на двух основных ка тегориях:

• форма представления данных на экране монитора в виде таблицы практически неограниченного размера (собственно электронная таблица как объект обработки);

• программа (или пакет программ) для обработки таких данных (соб ственно табличный процессор как инструмент обработки).

Самую первую программу работы с электронными таблицами разработал Дон Брикклин в 1979 г. Она называлась VisiCalc (Visible Calculator) и широко применялась на компьютерах Apple П. Затем идея разработки табличных процессоров была подхвачена рядом фирм, и в течение нескольких лет появился целый спектр программ данного класса. Так, в 1981 г. фирма Computer Associates выпустила систему, пользовавшуюся долгое время большой популярностью, - SuperCalc (Super Calculator). В нашей стране наибольшее распространение получило именно семейство SuperCalc, и был разработан ряд русифицированных адаптированных пакетов: АБАК, ДРАКОН, ВАРИТАБ-86.

Значительно способствовала развитию программ для работы с элект ронными таблицами разработка пакета Lotus 1-2-3 фирмой Lotus Development.

Этот табличный процессор работает существенно быстрее по сравнению с другими подобными системами.

В начале мая 1985 г. в Нью-Йорке была официально представлена система Excel, которая в настоящее время в нашей стране стала безусловным лидером (по объему продаж, а, следовательно, по популярности у пользователей) среди программ этого класса.

3.5.1. Понятие таблицы и ее структура.

Таблица - это организованный в вертикальные колонки (графы или столбцы) и горизонтальные строки словесно-цифровой материал, образующий своеобразную сетку, каждый элемент которой - составная часть и столбца, и графы. Логически таблица состоит из подлежащего и сказуемого.

Подлежащее - это наименование того явления или объекта, которые рассмотрены в таблице.

Сказуемое - это совокупность характеристик объектов, относящихся к подлежащему.

Структура таблицы:

• нумерационный заголовок;

• тематический заголовок;

• головка (шапка);

• боковик;

• прографка.

Пример, показывающий структуру таблицы, приведен на рис. 6.

Рис. 6. Пример структуры таблицы 3.5.2. Правила построения таблиц.

Чтобы построить таблицу, необходимо:

1. Сформулировать то, что должно быть охарактеризовано в таблице, показатели ее подлежащего;

2. Сформулировать показатели сказуемого, т.е. - озаглавить данные, которыми будут охарактеризованы показатели подлежащего;

3. Определить место показателей подлежащего и сказуемого. Как правило, показатели подлежащего рекомендуется размещать в боковике или в боковике и колонке;

4. Построить в соответствии с намеченным планом размещения по казателей подлежащего и сказуемого макет таблицы и заполнить его данными.

Построение макета в основном способствует получению общего вида и структуры головки и боковика таблицы, оценке ширины граф (столбцов) и высоты строк, предварительному выбору стилевого оформления таблицы;

5. Определить тему таблицы и сделать ее тематическим заголовком;

При построении таблицы необходимо выполнять условия логичности построения, удобства чтения и экономичности.

Логичность построения таблицы означает:

• расположение логического сказуемого таблицы в прографке (не в головке или боковике);

• правильную, логическую соподчиненность элементов таблицы: данных графы - ее заголовку, данных строки - показателю или заголовку боковика, заголовков нижнего яруса головки - объединяющему их заголовку верхнего яруса;

• логичность деления в подчиненных рубриках.

Удобство чтения таблицы обеспечивается выполнением следующих требований:

• расположение сопоставляемых числовых данных по вертикали, при этом они должны быть выровнены по десятичной запятой (точке);

• расположение рядом сопоставляемых граф и строк;

• системное расположение граф и строк (по ниспадающей значимости;

от общих показателей к частным или более конкретным, по алфавиту в случае равнозначности показателей).

Экономичность построения таблицы обеспечивается соблюдением следующих условий:

• построение таблицы из показателей подлежащего, как правило, с однородными характеристиками;

• включение в графы таблицы только обязательных текстов и в огра ниченном объеме;

• включение в таблицу иллюстраций только в тех случаях, когда без них восприятие таблицы невозможно, или когда площадь иллюстрации не намного больше площади, занимаемой текстом в других ячейках таблицы;

• размещение показателей подлежащего большого объема (многострочные или в виде иллюстраций) в головке, а не в боковике, если элементы прографки по объему (числу строк) намного меньше показателей подлежащего;

• объединение соседних однотипных таблиц;

• удаление лишних граф (с одними и теми же сведениями) с перенесением этих сведений в тематический заголовок или в примечание к таблице.

Основные правила оформления граф в головке (шапке) таблицы:

• заголовок должен быть над каждой графой, в том числе и над боковиком, так как упрощает восприятие таблицы, позволяет сделать более лаконичным текст заголовков строк в боковике;

• если заголовок графы состоит из нескольких элементов, то они раз деляются запятыми;

• заголовок графы, как правило, формулируется в именительном падеже, единственном числе;

• заголовок графы пишется без сокращений, за исключением обще принятых или принятых в тексте данного документа;

• заголовок графы может включать в себя обозначения единиц измерения (кг, руб.);

• заголовок графы начинается с прописной буквы в верхнем ярусе, а в нижних ярусах - со строчной буквы;

• если строки таблицы выходят за границы страницы, то в каждой части таблицы повторяется ее головка (шапка);

• таблицы с большим количеством граф допускается делить на части и помещать одну часть под другой на одной странице;

• нумерация или литерация граф применяется только в случае, когда нужны ссылки на них в тексте документа;

• графа "Номер по порядку" оформляется только при необходимости ссылок в тексте документа на строки таблицы.

3.5.3. Общая характеристика современных табличных процессоров Современные табличные процессоры имеют очень широкие функци ональные и вспомогательные возможности, обеспечивающие удобную и эффективную работу пользователя. Перечислим основные возможности, общие для всех систем этого класса.

1. Контекстная подсказка. Вызывается из контекстного меню или нажатием соответствующей кнопки в пиктографическом меню.

2. Справочная система. Организована в виде гипертекста и позволяет легко и быстро осуществлять поиск нужной темы.

3. Многовариантность выполнения операций. Практически все операции могут быть выполнены одним из трех - четырех способов, пользователь выбирает наиболее удобный.

4. Контекстное меню. Разворачивается по щелчку кнопки (обычно правой) "мыши" на выбранном объекте (например, элемент таблицы, с котором в данный момент хочет работать пользователь). В контекстном меню собраны наиболее часто используемые функции обработки, доступные в данной ситуации.

5. Пиктографическое меню. Основным командам соответствуют пик тограммы, расположенные под строкой меню. Они образуют пиктогра фическое меню. Вследствие щелчка "мышью" на пиктограмме выполняется связанная с ней команда. Пиктографические меню могут быть составлены индивидуально.

6. Рабочие группы или рабочие папки. Документы можно объединять в рабочие папки, поэтому они могут рассматриваться как единое целое, если речь идет о копировании, загрузке, изменении или других процедурах. В нижней части электронной таблицы расположен алфавитный указатель (регистр), который обеспечивает доступ к рабочим листам. Пользователь может задавать название листам в папке (вместо алфавитного указателя), что делает наглядным содержимое регистра, а, значит, облегчает поиск и переход от документа к документу.

7. Средства для оформления и модификации экрана и таблиц. Внешний вид рабочего окна и прочих элементов экранного интерфейса может быть определен в соответствии с требованиями пользователя, что позволяет сделать работу максимально удобной. Например, разбиение экрана на несколько окон, фиксация заголовков строк и столбцов и т.д.

8. Средства оформления и вывода на печать таблиц. Для удобства пользователя предусмотрены все функции, обеспечивающие печать таблиц:

выбор размера страницы, разбиение на страницы, установка размера полей страниц, оформление колонтитулов, предварительный просмотр отпечатанной страницы.

9. Средства оформления рабочих листов. Современные табличные процессоры предоставляют широкие возможности по форматированию таблиц: выбор шрифта и стиля, выравнивание данных внутри клетки, возможность выбора цвета фона клетки и шрифта, возможность изменения высоты строк и ширины колонок, черчение рамок различного вида, возможность задания формата данных внутри клетки (например: числовой, текстовый, финансовый, дата и т. д.), автоформатирование (в систему уже встроены различные возможности оформления таблиц, и пользователь может выбрать наиболее подходящий формат из уже имеющихся).

10. Шаблоны. Табличные процессоры, как и текстовые, позволяют создавать шаблоны рабочих листов, которые применяются для создания бланков писем и факсов, различных калькуляций. Если шаблон создается для других пользователей, то можно разрешить заполнять такие бланки, но запретить изменение формы бланка.

11. Связывание данных. Абсолютная и относительная адресации - ха рактерная черта всех табличных процессоров;

в современных системах они дают возможность работать одновременно с несколькими таблицами, которые могут быть тем или иным образом связаны друг с другом. Например, трехмерные связи позволяют работать с несколькими листами, идущими подряд;

с помощью консолидации рабочих листов можно обрабатывать суммы, средние значения и вести статистическую обработку, используя данные разных областей одного рабочего листа, нескольких рабочих листов и даже нескольких рабочих книг;

связанная консолидация позволяет не только получить результат вычислений по нескольким таблицам, но и динамически его пересчитывать в зависимости от изменения исходных значений.

12. Вычисления. Для удобства вычисления в табличных процессорах име ются встроенные функции: математические, статистические, финансовые, фун кции даты и времени, логические и др. Мастер функций позволяет выбрать нужную функцию и, подставив значения аргументов, получить результат.

13. Деловая графика. Более 20 различных типов и подтипов диаграмм можно построить в современном табличном процессе. Возможности оформления диаграмм также многообразны. Доступны вставка и оформление легенд, меток данных;

оформление осей и возможность вставки линий сеток и др. Помимо этого, современные системы работы с электронными таблицами снабжены мощными средствами построения и анализа деловой графики:

вставка планок погрешностей, возможность построения тренда и выбор функции линии тренда.

14. Выполнение табличными процессорами функций баз данных. Эта возможность обеспечивает заполнение таблиц аналогично заполнению базы данных, т. е. через экранную форму, защиту данных, сортировку по ключу или по нескольким ключам, обработку запросов к базе данных, создание сводных таблиц. Кроме того, все современные программы работы с электронными таблицами включают средства обработки внешних баз данных, которые позволяют работать с файлами, созданными, например, в формате dBase или PARADOX, или других форматах.

15. Моделирование. Подбор параметров и моделирование - одни из самых важных возможностей табличных процессоров. С помощью простых приемов можно находить оптимальные решения многих задач. Методы оптимизации варьируют от простого подбора (при этом значения ячеек - параметров изменяются так, чтобы число в целевой ячейке стало равным заданному) до метода линейной оптимизации со многими переменными и ограничениями.

При моделировании иногда желательно сохранять промежуточные результаты и варианты поиска решения. Это можно делать, создавая сценарии, которые представляют собой описание решаемой задачи.

16. Макропрограммирование. Для автоматизации выполнения часто повторяемых действий можно воспользоваться встроенным языком про граммирования макро-команд. Существуют макрокоманды и макрофункции.

Применяя макрокоманды, можно упростить работу с табличным процессором и расширить список его собственных команд. При помощи макрофункций можно определять собственные формулы и функции, расширив, таким образом набор функций, предоставляемый системой. В простейшем случае макрос - это записанная последовательность нажатия клавиш, перемещений и щелчков кнопками "мыши". Эта последовательность может быть воспроизведена, как магнитофонная запись. Современные программы обработки электронных таблиц позволяют создавать и использовать диалоговые окна, которые по своему внешнему виду и удобству работы не отличаются от существующих в системе, что делает диалог с макрокомандой максимально удобным.

3.6. Компьютерные технологии поиска документальной информации 3.6.1. Общая характеристика автоматизированных технологий поиска.

Цель документального поиска - нахождение и выдача соответствующих запросу пользователя документов или их описаний. Документы, отвечающие запросу пользователя, называются релевантными.

При автоматизации поиска документальной информации важнейшими являются задачи формализации содержания документа и запроса. При решении этих задач могут использоваться различные подходы.

Первый подход состоит в том, что содержание документа, а также его характеристики (дата издания документа, автор и т.п.) отображаются в некую структурированную информацию, представляющую собой, например, запись реляционного файла. В этом случае поиск документа сводится к поиску структурированной информации средствами системы управления базами данных (СУБД).

Второй подход состоит в том, что поиск происходит по всему тексту доку мента или по его поисковому образу. При этом в качестве запроса чаще всего выступают отдельные ключевые слова или их логические комбинации.

Эффективность документального поиска оценивают на основе показателей полноты и точности. Полнота поиска определяется как отношение числа выданных в ответ на запрос релевантных документов к числу всех имеющихся в поисковом массиве релевантных документов. Точность поиска определяется как отношение числа релевантных документов в выдаче к общему числу выданных документов.

Автоматизированный документальный поиск может быть организован на основе различных технологий:

• поиска по поисковому образу документа, • поиска по полному тексту документа, • поиска документов по гипертекстовым ссылкам.

Технология полнотекстового поиска является неотъемлемой составляющей таких современных и перспективных информационных технологий как:

• системы управления документами (Document management system, DMS);

• технологии групповой работы над документами (groupware);

• технологии поиска в Internet/intranet.

На технологии гипертекста базируется самый известный сервис Internet World Wide Web (WWW).

3.6.2. Документальные информационно-поисковые системы (ДИПС).

В документальных информационно - поисковых системах, их также называют библиографическими, поиск документа происходит по краткому формализованному описанию его содержания - так называемому поисковому образу документа (ПОД). Важнейшей структурной составляющей документальной информационно поисковой системы является информационно - поисковый язык.

Информационно-поисковый язык (ИПЯ) - искусственный язык для выражения содержания документов или запросов с целью последующего поиска. Основное назначение ИПЯ - установить принадлежность того или иного документа к определенной группе понятий. Перевод текстов документов и запросов на ИПЯ называется индексированием. В результате индексирования содержание документа отображается в ПОД, а содержание запроса - в поисковое предписание (ПП).

Различают ручное и автоматическое индексирование. При ручном ин дексировании этот процесс осуществляет информационный работник. На основе анализа содержания документа специалист отображает текст документа в набор ключевых слов (дескрипторов). Преимущество ручного индексирования состоит в его качестве. Недостатком является низкая про изводительность и, следовательно, высокая стоимость. Кроме того, при ручном индексировании вполне возможна ситуация, когда один и тот же документ, обработанный различными специалистами, может получить различные индексы.

При автоматическом индексировании (АИ) индексирование осуще ствляется компьютерной системой. Формально текст документа представляет собой множество символов, разделенных пробелами. Эти отрезки текста называют словоформами. Основная задача автоматического индексирования состоит в распознавании в словоформе соответствующего словарного слова. С этой целью используют автоматический морфологический анализ текста. В некоторых системах автоматической индексации вместо словарей для нормализации слов используются алгоритмы, предназначенные для преобразования слов в различные грамматические формы. При этом исчезает необходимость заносить в словарь все возможные формы слов, уменьшается объем словарей, увеличивается эффективность поиска, так как в тексте могут быть найдены все грамматические формы слова, заданного в запросе.

В ИПС используют две принципиальные схемы информационного массива:

прямую и инверсную.

При прямой организации каждому документу соответствует перечень слов, составляющих текст или поисковый образ документа. При этом отыскание нужных документов производится путем поочередного сравнения поисковых образов документов со словами, составляющими информационный запрос, т.е. реализуется принцип последовательного доступа к данным.

Достоинства прямой схемы состоят в простоте организации и использования, например, для включения нового документа в массив достаточно добавить новую запись в файл. Недостатком прямой организации поиска является необходимость последовательного просмотра поискового образа всех документов, что ведет к большим затратам времени, поэтому в современных текстовых базах применяют инверсный способ. Инверсный способ организации поискового массива предусматривает создание инвертированной матрицы, в которой и происходит поиск (ее называют инвертированным матричным индексом). Инвертированная матрица напоминает предметный указатель в книге, где слова, размещенные в алфавитном порядке, сопровождаются перечислением номеров страниц, на которых они встречаются. Документальный поиск сводится к просмотру соответствующих записей файла инвертированного матричного индекса. Таким образом, отпадает необходимость в последовательном просмотре всего информационного массива, и значительно сокращается время поиска.

В дополнение к прямой и инвертированной схемам в информационно поисковых системах используется атрибутный индекс. Он позволяет хранить данные о документе, не содержащиеся непосредственно в его тексте, например, имя автора, дату создания, наименование темы и другие фактические данные. Данные могут автоматически извлекаться из документа либо вноситься вручную при вводе документа в систему. Структура атрибутного индекса соответствует стандарту представления струк турированной информации, т.е. это таблица с заранее заданными полями.

Поиск по атрибутному индексу выполняется быстрее, чем по инвер тированному матричному индексу, но имеет значительно меньше поисковых возможностей. Однако атрибутный индекс позволяет находить информацию, не являющуюся составной частью текста документа. Кроме того, файлы атрибутных индексов значительно меньше по размеру файлов инвертированных матричных индексов с полным текстом, поскольку в этом случае с каждым документом связано гораздо меньше хранимой информации.

3.7. Гипертекстовые технологии поиска В 1945 г. В. Буш, научный советник президента Г. Трумэна, проанали зировав способы представления информации в виде отчетов, докладов, проектов, графиков, планов и поняв неэффективность такого представления, предложил способ размещения информации по принципу ассоциативного мышления. Позднее Т. Нельсон реализовал этот принцип на ЭВМ и назвал его гипертекстом.

Обычно любой текст представляется как одна длинная строка символов, которая читается в одном направлении. Гипертекстовая технология заключается в том, что текст представляется как многомерный, т.е. с иерар хической структурой типа сети. Материал текста делится на фрагменты.

Каждый видимый на экране ЭВМ фрагмент, дополненный многочисленными связями с другими фрагментами, позволяет уточнить информацию об изучаемом объекте и двигаться в одном или нескольких направлениях по выбранной связи [4].

Под гипертекстом понимают систему информационных объектов (статей), объединенных между собой направленными связями, образующими сеть.

Каждый объект связывается с информационной панелью экрана, на которой пользователь может ассоциативно выбирать одну из связей. Объекты не обязательно должны быть текстовыми, они могут быть графическими, звуковыми, с использованием средств мультипликации, аудио- и видеотехники. Гипертекстовая технология ориентирована на обработку информации не вместо человека, а вместе с человеком, т.е. становится авторской. Удобство ее использования состоит в том, что пользователь сам определяет подход к изучению или созданию материала с учетом своих индивидуальных способностей, знаний, уровня квалификации и подготовки.

Гипертекст содержит не только информацию, но и аппарат ее эффективного поиска. По глубине формализации информации гипертекстовая технология занимает промежуточное положение между документальными и фактографическими информационными системами.

Структурно гипертекст состоит из информационного материала, тезауруса гипертекста, списка главных тем и алфавитного словаря.[4] Информационный материал подразделяется на информационные статьи, состоящие из заголовка статьи и текста. Заголовок содержит тему или наименование описываемого объекта. Информационная статья содержит традиционные определения и понятия, должна занимать одну панель и быть легко обозримой, чтобы пользователь мог понять, стоит ли ее внимательно читать или перейти к другим, близким по смыслу статьям. Текст, включаемый в информационную статью, может сопровождаться пояснениями, примерами, документами, объектами реального мира. Беглый просмотр текста статьи упрощается, если эта вспомогательная информация визуально отличается от основной, например, подсвечена или выделена другим шрифтом.

Тезаурус гипертекста - это автоматизированный словарь, отображающий смысловые отношения. Тезаурус гипертекста состоит из тезаурус-ных статей.

Тезаурусная статья имеет заголовок и список заголовков родственных тезаурусных статей. Заголовок тезаурусной статьи совпадает с наименованием информационной статьи и является наименованием объекта, описание которого содержится в информационной статье. Полнота связей, отражаемых в тезаурусной статье, и точность установления этих связей, в конечном итоге, определяют полноту и точность поиска при обращении к данной статье гипертекста. Существуют следующие типы родства или отношений: вид - род, род - вид, предмет - процесс, процесс - предмет, целое - часть, часть - целое, причина - следствие, следствие - причина и т.д. Список заголовков родственных тезаурусных статей представляет собой локальный справочный аппарат, в котором указываются ссылки только ita ближайших родственников.

Тезаурус гипертекста можно представить в виде сети: в узлах находятся текстовые описания объекта (информационные статьи), ребра сети указывают на существование связи между объектами и на тип родства. В гипертексте поисковый аппарат не делится на тезаурус и массив поисковых образов доку ментов, как в обычных информационно-поисковых системах. В гипертексте весь поисковый аппарат реализуется как тезаурус гипертекста.

Список главных тем содержит заголовки всех справочных статей, для которых нет ссылок типа: род - вид, часть - целое. Желательно, чтобы список занимал не более одной панели экрана.

Алфавитный словарь включает в себя перечень наименований всех информационных статей в алфавитном порядке.

Итак, гипертекст (нелинейный текст) - это организация текстовой информации, при которой текст представляет собой множество фрагментов с явно указанными ассоциативными связями между этими фрагментами.

Движение в гипертекстовой сети, совершаемое в процессе чтения гипертекста, называется "навигацией".

Если гиперсеть имеет сложную, разветвленную структуру, возникает проблема ориентации пользователя, т.е. определения, в каком месте сети в данный момент он находится. Проблема ориентации присутствует и при работе с традиционным линейным текстом большого объема, но в этом случае пользователь имеет только два направления поиска - "выше" или "ниже".

Гипертекст предоставляет больше возможностей в выборе направлений движения, поэтому многие гипертекстовые системы облегчают проблему ориентации в гипертексте, предоставляя наглядное изображение структуры связей. В некоторых современных гипертекстовых системах существует возможность запоминания направлений поиске пользователя в процессе навигации. Гипертекстовая технология реализуется в конкретной гипертекстовой системе, которая состоит из двух частей: гипертекста (базы данных) и гипертекстовой оболочки.

Гипертекстовая оболочка осуществляет следующие основные функции:

• поддержка ссылочных связей;

• создание, редактирование и наращивание гипертекста;

• прямой доступ;

• поддержка ссылочных связей;

• просмотр (browsing);

• выделение виртуальных структур.

Поддержка ссылочных связей позволяет поддерживать ранее зафик сированные связи между узлами сети.

Функция создания, редактирования и наращивания гипертекста прин ципиально отличает технологию гипертекста от технологии баз данных, в которых концептуальная схема данных заранее задана, позволяет вводить новые узлы, редактировать содержание узлов, устанавливать связи между узлами.

Прямой доступ позволяет осуществлять прямой доступ к узлам сети по их именам.

Просмотр - операция, характерная только для гипертекста. Означает поиск информации посредством просмотра гипертекстовой сети, при этом возможно запоминание пути следования, с тем чтобы при последующем аналогичном запросе поиск происходил по зафиксированному пути следования.

Гипертекстовые технологии нашли широкое применение и при орга низации поиска документальной информации в сети Интернет, например, в сервисе World Wide Web (WWW).

В состав Web - системы входят следующие составляющие:

• язык гипертекстовой разметки документов HTML (Hyper Text Markup Languae);

• универсальный способ адресации ресурсов в сети URL (Universal Resource Locator;

• протокол обмена данными (гипертекстовой информацией) HTTP (Hyper Text Transfer Protocol);

• средства просмотра Web -страниц (браузеры).

3.8. Технологии поиска документальной информации в Интернет По некоторым оценкам, в настоящее время Web содержит сотни мил лионов страниц, и каждые четыре месяца этот объем удваивается. Одна из основных проблем пользователя современного Интернета - эффективный поиск информации. Очевидно, что актуальность этой проблемы будет возрастать, так как объем документальной информации в Интернет возрастает экспоненциально. Как показывает практика, существующие инструменты поиска документальной информации в Интернет обеспечивают пока неудовлетворительную точность выдачи и возвращают слишком много документов, из которых лишь небольшая часть действительно соответствует запросу пользователя.

Основным инструментом поиска в Интернет являются поисковые системы.

В настоящее время насчитывается около 200 поисковых систем.

Существующие поисковые системы Интернет можно классифицировать по нескольким критериям[2].

1. Объем поискового индекса.

2. Метод выбора серверов для просмотра (опроса).

Генерация поискового индекса требует систематического обхода Web-узлов и определения местонахождения каждого документа. Существуют четыре метода такого обхода:

1) случайный выбор первого URL-адреса для инициализации поиска.

Программа индексирует начальный документ, выделяет URL-адреса, ука зывающие на другие документы, а затем анализирует эти URL для поиска "преимущественно в ширину" или "преимущественно в глубину";

2) поиск начинается с набора URL-адресов, определяемых на основе популярности Web-узлов;

3) пространство Web делится на разделы на основе системы имен Internet или кодов стран, а для полного исследования этих разделов выделяется одна программа - робот;

4) частота опроса - каждые несколько часов, каждый день, каждый месяц.

Частота опроса является важной характеристикой качества работы системы, так как определяет актуальность и полноту индекса;

3. Используемые поисковые технологии.

По этому критерию поисковые системы можно разделить на четыре категории:

• тематические каталоги;

• специализированные каталоги (онлайновые справочники);

• поисковые машины (полнотекстовый поиск);

• средства мета-поиска.

Тематические каталоги предусматривают обработку документов и отнесение их к одной из нескольких категорий, перечень которых заранее задан. Фактически это индексирование на основе классификации.

Специализированные каталоги или справочники - это каталоги, со зданные по отдельным отраслям и темам: каталог по новостям, каталог по городам, каталог по адресам электронной почты и т. п.

Поисковые машины (самое развитое средство поиска) реализуют технологию полнотекстового поиска.

Самой популярной поисковой системой считается AltaVista, которая имеет один из самых крупных индексных баз и всемирную зону охвата. Сервер расположен в США. Имеется ряд зеркальных серверов в других странах.

Обрабатывает и русские серверы. Применяется программа-робот (программа для просмотра) под названием Scooter,'просматривающая документы Web и группы новостей Usenet.

Самым известным представителем глобальных каталогов является система Yahoo.

Основными полнотекстовыми поисковыми системами, представленными в русскоязычном секторе Интернет, считаются Rambler, Апорт, Yandex, TELA ПОИСК.

4. Понятие автоматизированного офиса Деятельность любого предприятия, организации и фирмы сопровождается множеством разнообразных документов. Существует широкое мнение, что "офис" - это структурное подразделение, на входе и выходе которого "бумаги", в отличие от материальных изделий, сырья, полуфабрикатов, инструментов, комплектующих и бумаг типа "научно-исследовательский отчет", "проектная инженерная документация". Предполагается, что в качестве "бумаг" рассматриваются:

• письмо или заключение, фиксирующие решение, принятое должностным лицом или организацией в целом в ответ на запрос к этой организации (письмо или заявление частного лица, распоряжение государственного органа и др.), форма: документ или виза на другом документе;

• договор (контракт, соглашение, дополнительное соглашение и т.п.) с некоторым юридическим или физическим лицом;

• распорядительный или учетный документ, выпущенный для фиксации и юридического оформления действий в рамках договора или свободной инициативы (заказ на покупку, счет на оплату, запрос на оказание услуги и др.).

Другое существующее мнение (узкий подход), что "офис" - это струк турное подразделение типа канцелярии, функция которой получать и выпускать документы, а также отслеживать их движение. Часто это мнение сочетается с достаточно широким толкованием понятия документ: любое сообщение, передаваемое друг другу участниками бизнес-процесса.

Распространенная точка зрения, развивая узкий подход к понятию офис, предполагает выделение в качестве задач автоматизации офиса задачи, общие для офисов всех видов, как механизмов, "перерабатывающих" документы. К ним, в первую очередь, относятся: редактирование (набор, проверка, оформление) и печать документов, контроль их прохождения (маршрутизация, мониторинг), контроль исполнения поручений и т.п. Для обоснования такой точки зрения выделяются трактовки, предполагающие, что офисный информационно - технологический компонент может относиться к одной из двух непересекающихся групп средств, но не к обеим сразу:

• office automation - поддержка рутинных работ с документами, т.е.

обычных для большинства офисов;

• DSS (decision support system), средства поддержки принятия решений специфические - в отличие от средств предыдущей группы - для той или иной отрасли или проблемы методические и программные средства.

Однако, такая трактовка эквивалентна отказу от рассмотрения многих существующих реальных проблем. Оказывается, что в современных информационных системах предприятий сама поддержка документооборота может радикально трансформироваться, чуть ли не исчезнуть. Основываясь на том, что в общем случае офис вырабатывает не бумаги и не траекторию их перемещения, а решения, имеющие ценность для клиента, далее офис будет рассматриваться как полноценное предприятие.

Автоматизированный офис - это совокупность программно - аппаратных средств и систем, обеспечивающих взаимосвязанное и согласованное решение разнородных управленческих задач: сбор и фиксирование необходимой информации, ее передача, обработка преобразованной информации для анализа, планирования и контроля деятельности.

4.1. Электронные документы. Электронный офис.

В современном мире используются два основных типа документов бумажные и электронные. Бумажные документы порождают электронные (например, сканирование документа) и, наоборот, электронные порождают бумажные документы (например, процесс печати документа).

По оценкам западных консалтинговых компаний: общий объем информации удваивается за 5 лет и учетверяется за 10 лет, а количество электронных документов удваивается за год, в то время как количество бумажных документов растет только на 7 процентов.

Документ, как любая вещь, приносящая прибыль и помогающая в бизнесе, также привносит долю расходов. Как известно, повышать прибыль бизнеса можно путем снижения затрат на этот бизнес. Существуют оценки, насколько выигрывает каждая компания при переходе к электронным документам [1].

• Компания DELPHI оценивает, что 15 процентов всех бумажных до кументов безвозвратно теряется, и рабочие группы тратят до 30 процентов своего времени в попытках их найти.

• Компания Coopers&Lybrand оценивает, что в среднем делается 19 копий каждого документа и что 7,5 процентов всех документов теряется безвозвратно.

• Nortan Nolan Institute оценивает рост производительности сотрудника в 25-50 процентов, уменьшение времени обработки одного документа более чем на 75 процентов, и уменьшение расходов на оплату площади для хранения документов в 80 процентов. Приблизительно такие же оценки дает известная компании Ernst & Young.

Преимущества электронных документов.

1. Обслуживать клиента лучше. При работе с электронными документами время поиска документа, а, следовательно, время реакции на запрос гораздо меньше, чем при работе с бумажными документами. Следовательно, клиент, получающий ответ быстрее, чем ранее, естественно, удовлетворен гораздо больше.

2. Управлять информацией более эффективно. Управление жизненно важными документами, сохраненными в электронном виде, радикально улучшается. Появляются возможности: получать доступ к документам более быстро;

не терять документы;

перестать неправильно сохранять документы;

собирать, обрабатывать документы в гораздо большем количестве, чем ранее и, следовательно, принимать решения быстрее и точнее.

3. Защищать документы лучше. Современные технологии позволяют сохранять ключевую информацию на оптических или магнитных носителях информации. Потеря всей или какой - либо части информации для предприятия может грозить значительными последствиями, вплоть до банкротства и полного прекращения деятельности. С документами все гораздо сложнее, чем с электронными. Бумага подвержена многим опасностям:

старение, огнь, вода и т.п. Кроме того, очень трудно сделать копию всего архива бумажных документов на случай непредвиденных обстоятельств. Это вызвано, во-первых, высокой стоимостью хранения, во-вторых, высокой стоимостью и временем копирования документов. В случае с электронными носителями все наоборот. Компактность, быстрота и дешевизна копирования позволяет делать и хранить столько копий информации, сколько нужно для обеспечения надежности бизнеса. Электронные носители позволяют сохранить больше информации в меньшем объеме, а меньший объем дешевле защищать.

Кроме того, электронная информация легче обрабатывается, и процесс криптозащиты информации можно автоматизировать и выполнять быстрее и дешевле.

4. Увеличить производительность труда. Труд любого сотрудника раз делить на две основные составляющие: производительную и обеспечивающую.

В зависимости от категории работника и вида деятельности соотношения этих видов деятельности разное, но можно заметить, что при любом раскладе доля обеспечивающей деятельности остается существенной. Операции с бумажными и электронными документами относятся, естественно, к обеспечивающей деятельности и, следовательно, сокращая время на эти операции, сокращаем долю этой деятельности, высвобождая время для производительного труда. Кроме производительности труда отдельного человека, переход к электронным документам радикально повышает производительность труда рабочих групп. Работа с электронными документами в рамках сетевых технологий позволяет одновременно многим пользователям из рабочей группы получать доступ к документам, что довольно проблематично и дорого (копирование, совещания и т.п.) при работе с бумажными документами. Появляется возможность взаимодействия сотрудников внутри всех подразделений предприятия, что позволяет избежать дублирования функций и задач и, следовательно, еще снизить затраты. Для электронных документов не нужно делать копий для того, чтобы они стали доступны всем сотрудникам предприятия, не нужно нанимать на работу курьеров для сбора и разноски документов.

Вышеприведенные факты показывают преимущества обработки элек тронных документов и те мировые тенденции, которые свидетельствуют о постепенном переходе на новые, ресурсосберегающие электронные документы. Специфика перехода на безбумажную технологию работы с документами в нашей стране определяется:

• технической неподготовленностью организаций для работы с элект ронными документами (что может выражаться как в тривиальной проблеме отсутствия компьютеров на столах у сотрудников, так и в том, что в организации нет необходимых программно-аппаратных средств для перевода документов из одной формы представления в другую;

• технологической недопустимостью перевода отдельных категории конфиденциальных документов в электронный вид (службы безопасности требуют, чтобы такого рода документы передавались под роспись через поверенного или курьера);

• законодательной базой. Даже если в пределах отдельно взятой компании или организации решили перейти к безбумажной работе с документами, компания все равно не сможет существовать изолированно между ней и внешним миром постоянно циркулируют различного рода документы. При этом возникает необходимость законодательного разрешения вопроса относительно того, что собственно понимается под электронным документом и какой вид электронного документа может иметь юридическую силу (вопросы, связанные с достоверностью пересылаемых документов), что получает особый оттенок в период построения правовых способов решения конфликтных ситуаций.

Хотелось бы подчеркнуть тот факт, что никто не стремится изжить бумажные документы как таковые. Переход к обработке электронного представления документа позволит прежде всего повысить эффективность анализа, доступа и работы сотрудников с информацией, уменьшить временные затраты на передачу документов, упростить решение вопросов связанных с обработкой связанных документов, аннотацией документ несколькими сотрудниками с последующим анализом сделанных замечаний и предложений и многое другое.


Существует множество источников и типов документов. Главная задача работы с документами - это создание, регистрация и сохранение всех документов (или учетной информации по ним), связанных с жизне деятельностью предприятия таким образом, чтобы можно было быстрс его найти в соответствии с правами доступа. Поэтому определяются следующие основные задачи при организации работы с документами:

• уметь работать с бумажными документами;

• уметь переводить бумажные документы в электронный вид (и под держивать последующую их обработку либо в виде образа, скажем ъ формате tiff, либо распознавать посредством блока OCR);

• уметь перехватывать все создаваемые электронные документы: до кументы из приложений, которые создают документы, такие как текстовые процессоры, электронные таблицы, графические программы, программные пакеты для настольных издательств;

факсовые сообщения приходящие и уходящие через факс-сервер предприятия;

входящие, исходящие и внутренние сообщения из электронной почты равно как и документы, которые были к ним прикреплены.

Принято информационные системы предприятия, обрабатывающие электронные документы, называть электронным офисом.

Архитектура электронного офиса представлена на рис. 7 [6].

Рис. 7. Архитектура электронного офиса 4.2. Общие требования к системам автоматизированного офиса 1. Масштабируемость. Данное свойство является необходимым с точки зрения защиты инвестиций пользователя, затраченных на создание и настройку системы, а так же обучение пользователей и обслуживающего персонала. Оно означает, что система должна работать как с одним пользо вателем, так и с 10 000, как с 10 документами, так и с 10 миллионами. При построении решения нужно руководствоваться принципом поддержки максимально возможного количества операционных систем. Для того, что обеспечить переносимость данных, желательна поддержка многоплатформенных серверов баз данных, таких как Sybase, Oracle, Microsoft, Informix. Если данный принцип по возможности соблюден, то пользователь может не беспокоиться о будущем и подбирать конфигурацию программно аппаратного окружения системы. В случае резкого увеличения числа пользователей и, следовательно, нагрузки на систему можно перейти на более мощную аппаратную платформу при неизменности самой системы и данных.

Кроме того, под масштабируемостью понимается возможность наращивать мощность системы интенсивным образом, т.е. не повышая мощности сервера, а увеличивая количество серверов на предприятии. Особенно важно, чтобы при этом система оставалась единым целым и не требовала "настройки с нуля".

2. Открытость. Вновь создаваемая система должна вписываться в уже существующие или новые приложения, кроме того, комплекс зачастую обязан функционировать в гетерогенных и, что особенно важно, в распределенных средах. Это требование напрямую связано с требованием масштабируемости, только оно его расширяет, так как требует одновременной поддержки множества платформ, сетевых сред и серверов баз данных. Также к требованию открытости системы относится поддержка существующих стандартов в соответствующих областях, граничащих с решением задач, связанных с обработкой документов. К этим стандартам в области работы с документами относятся Shamrock и ODMA (Open Document Mangement API), в области управления деловыми процессами - WorkFlow Coalition API и т.д.

3. Модульность и технологичность. Не всегда необходимо внедрять весь комплекс работы с документами на предприятии сразу. Это может быть вызвано разными причинами: от нехватки средств в данный момент, до неспособности организации резко перестроить свою работу. Поэтому система должна состоять из модулей, каждый из которых позволяет решить ту или иную задачу, причем эти модули могут без особого труда быть добавлены в работающую систему в произвольной последовательности. Они, по возможности, должны быть независимы друг от друга, при сохранении глубокой интеграции между ними. Например, решение задачи автоматизации можно начать с решения задачи поддержки исполнения, а можно с электронного архива, но независимо от выбора, можно все равно прийти к полноценной системе. Невозможно найти систему, которая после инсталляции будет решать весь класс задач оптимальным образом для каждого пользователя (бывает крайне редко, что технология работы с документами компании полностью отвечает тем настройкам, которые поставляются с комплексом), но система должна требовать минимальное программирование и адаптацию под каждого пользователя. Выполнение данного принципа снижает цену, уменьшает время внедрения и повышает надежность в эксплуатации.

Особое значение и важность для предприятий в настоящих условиях приобретает фактор простоты модификации настроек существующей системы силами обслуживающего персонала.

4.3. Классификация систем автоматизации делопроизводства Каждый документ в процессе своего жизненного цикла проходит оп ределенные стадии:

• создание;

• визирование, согласование;

• подписание, утверждение;

• регистрацию;

• рассмотрение;

• исполнение;

• списание в дело;

• хранение, уничтожение.

Движение документов осуществляется в виде потоков документов, циркулирующих между пунктами обработки информации и пунктами технической обработки. По отношению к аппарату управления различают потоки входящих (поступающих), исходящих (отправляемых) и внутренних документов. Следовательно, автоматизации подлежат: движение документов и их обработка в пунктах обработки и все стадии жизненного цикла документов.

В результате подмены терминов делопроизводство и документооборот, различия отечественного и западного подходов, сложности совершенствования бизнес-процессов, выбор соответствующей требованиям организации системы автоматизации делопроизводства среди существующих на рынке представляет определенную сложность. Рассмотрим примерную классификацию[5].

• СУД - Системы управления документами (DMS);

• САДП - Системы автоматизации деловых процессов (WMS);

• СОГР - Системы организации групповой работы (GroupWare);

• электронные архивы;

• АСКИД - Автоматизированные системы контроля исполнения доку ментов.

По отношению к делопроизводству системы могут быть ориентиро ванными на отечественное и на западное делопроизводство.

По отношению к задачам делопроизводства такие системы автомати зируют:

• делопроизводство в целом;

• только документооборот;

• только архивные и поисковые функции;

• контроль и учет документов.

СУД основываются на промышленных СУБД - Oracle, Informix, MS SQL Server, Sybase. Организация хранения документов может осуществляться как в базе данных, так и файловой системе. Недостатком хранения в базе данных есть жесткая привязка к конкретной СУБД и сложность восстановления после сбоев. В файловой системе - низкая безопасность хранимой информации.

Обмен документами между пользователями осуществляется подсистемой обмена и маршрутизации документов, зачастую роль этой подсистемы выполняют workflow-системы. Многие СУД снабжены редакторами (дизайнерами) справочников, регистрационно-контрольных карт для задания различных атрибутов различных видов документов.

Кроме того системы можно подразделить по типу движения задач[1].

Свободная маршрутизация - сотрудник в каждый момент времени может определить новый деловой процесс (в частном случае маршрут движения документа), тут же задать его параметры и запустить его на выполнение. Под параметрами процесса понимается список сотрудников, участвующих в нем, последовательность прохождения задания по сотрудникам, права каждого сотрудника по операциям с конкретным заданием, сроки, ответственные сотрудники.

Жесткая маршрутизация - перед тем, как сотрудники начинают работать, неким аналитиком создается карта деловых процессов, которая проверяется, тестируется и потом преобразуется в АДП - приложение. Сформированное АДП - приложение запускается на сервере с помощью модуля исполнения.

Некоторые сотрудники имеют право инициировать деловые процессы в рамках запущенного процесса, некоторые имеют право только исполнять задания в тех же рамках.

Нельзя говорить о преимуществах и недостатках того или иного способа движения задач. Каждый из них применим для конкретной ситуации на конкретном предприятии. Важном элементом АДП - систем является контроль исполнения.

Рассмотрим уровни контроля исполнения задания.

Контроль доставки - выдается информация инициатору задания, что его задание достигло места назначения.

Контроль прочтения - выдается информация инициатору задания, что с его заданием ознакомились сотрудники, для которых это задание было предназначено.

Контроль выполнения - выдается информация инициатору задания, о том что задание выполнено.

Мониторинг - инициатор всегда может посмотреть, кто и что в рас сматриваемый момент времени делает с его заданием.

Извещение о нарушении сроков исполнения - АДП-система может известить инициатора, о том, что посланное им задание просрочено конкретным сотрудником.

Информация может выдаваться в виде изменения статуса задания в окнах входящих и исходящих заданий или в виде нового задания сформированного системой инициатору задания или просто с помощью сообщения по электронной почте.

Итак, обобщая систему классификации, имеем:

• системы со свободным движением документов с контролем доставки и прочтения - это обычные системы электронной почты. С помощью дополнительного программирования к ним можно добавить еще и контроль выполнения;

• системы со свободным движением документов и со всеми функциями контроля исполнения, включая мониторинг, извещения и историю - это класс специализированных маршрутизаторов, К ним можно отнести маршрутизатор WorkRoutel компании ВЕСТЬ-Метатехнология;

• системы с жестким движением документов и со всеми функциями контроля исполнения - это высший класс АДП-систем. К ним можно отнести Action WorkFlow, StaffWare, IBM FlowMark, WorkRoute II.


4.4. Компоненты АДП - систем Рассмотрим компоненты АДП-систем высшего классах [1].

Методология описания деловых процессов. В настоящее время без адекватной методологии трудно проектировать сложные деловые процессы.

Это связано с тем, что деловые процессы не являются некой жесткой структурой и меняются в течение жизни предприятия по самым разным причинам. К таким причинам можно отнести как изменяющиеся внешние условия жизни предприятия, так и естественное желание руководителя оптимизировать внутренние деловые процессы с целью высвобождения ресурсов и экономии средств. В результате появляется задача с неопреде ленными внешними условиями. В настоящее время с методологией описания деловых процессов существуют определенные проблемы. Самой рас пространенной методологией на сегодняшний день является методология направленного графа. Истоки этой методологии лежат в истоках АДП-систем.

Первые АДП-системы были созданы для деловых процессов произ водственного (даже, конвейерного) типа, где сотрудники выполняли роль неких автоматов, работающих над конкретной технологической операцией.

Сотрудник мог только выполнить операцию и отрапортовать об ее вы полнении. В некоторых случаях он мог произвести выбор между несколькими состояниями и принять решение о дальнейшем направлении движения делового процесса. В дальнейшем АДП-системы стали применять для задач управления предприятием. Здесь такая методология не совсем подходит и вот почему. Во-первых она совершенно не учитывает влияние человека на конкретный деловой процесс. Если в конвейерной задаче, можно им пренебречь, то в разработке контракта, где человек является главной производящей силой - нет. Влияние человека на конкретный бизнес-процесс огромно. Оно может носить как отрицательный характер - человек забывает, поступает вопреки логике, просто не хочет выполнять ту или иную работу, так и положительный характер - человек проявляет творчество, изобретательность при исполнении делового процесса. В том случае если методология не учитывает реалии жизни, то она все свои недостатки перенесет в АДП приложение. Среди методологий, пытающихся сделать фокус на человеке, как главной производительной делового процесса, можно отметить методологию компании Action Technologies. В качестве элементарной составляющей делового процесса, она рассматривает некий цикл, который построен между заказчиком и исполнителем работы. В этот цикл включены все возможные действия, которые могут возникнуть в процессе взаимодействия двух сотрудников, например, отказ от выполнения работ, контрпредложение, отклонение контрпредложения и т.п. Цикл имеет следующие параметры:

условия завершения, время завершения и стоимость процесса. Грубо говоря, цикл от Action - это заранее преопределенная совокупность направленных графов, которая полностью описывает взаимодействие двух персон.

Последовательно, запрещая все возможные действия, можно свести весь цикл к одному графу, который соединяет двух персон. Данная методология особенно хороша тем, что она целостна (система не допустит незамкнутой схемы), а это означает, что ни одно задание не потеряется и не зайдет в тупик.

Обычно к методологии прикладывается графический редактор, который позволяет в удобной форме проектировать карты деловых процессов.

Преобразователь методологии в конкретное АДП - приложение. Данный модуль выступает связующим звеном между методологией и конкретным АПД- приложением. Обычно это некий конвертор, который, исходя из карты деловых процессов и их заданных параметров: роли, персоны, время исполнения и т.п., формирует базу данных с соответствующей структурой и наполнением, а также создает триггера, которые отслеживают выполнение бизнес - правил.

Модуль исполнения АДП - приложения. Данный модуль взаимо действует со сформированными преобразователем методологии данными, программами и исполняет их.

Рабочее пространство пользователя. Можно сказать, что речь идет о рабочем месте пользователя и его интерфейсе. Он может быть отдельно стоящим, встроенным в какое-либо приложение или использующим для своей работы интерфейсы других программ. Построение интерфейсов пользователя обязательно включает окно входящих заданий и окно исходящих заданий. Для каждого задания показывается его состояние и прочие его характеристики.

Кроме составных частей, которые описывают практически любую АДП систему, необходимо помнить, что АДП-системы не должны работать напрямую со списком конкретных сотрудников, а только через список ролей, которые могут исполнять конкретные сотрудники. Использование ролей позволяет:

• связывать структуру предприятия с конкретными деловыми процессами, что очень важно;

• связывать деловые процессы с ролями, а не сотрудниками, что имеет, естественно, более общую постановку - "есть сотрудник, нет сотрудника, обязанности все равно остаются";

• динамически переназначать сотрудников на роли, что позволит системе более гибко реагировать на изменения, происходящие на предприятии;

• более гибко управлять заданиями. Например, посылать задание на исполнение всем "менеджерам".

Обратимся к архитектурным моделям. В основном, они различаются по типу ориентации:

• ориентированы на документ. В своей основе они рассматривают документ и процесс его движения между сотрудниками. Системы, ори ентированные на документ, в своем архитектурном построении идут от почтовых систем. Самой сильной стороной такой модели является поддержка удаленных пользователей и офисов, возможность сохранять ра ботоспособность системы в самых разнообразных операционных и сетевых средах, поддерживать множество типов клиентов и серверов. Основной недостаток такого подхода - это сложность в управлении правилами деловых процессов. Так как система не предназначена с самого начала отслеживать деловой процесс, все попытки сохранить информацию в недрах системы не приводят к приемлемому результату. При таком подходе часто бывает трудно, а иногда невозможно, определить текущий статус данного делового процесса.

Кроме того, в приложениях, которые построены на таком подходе и которые маршрутизируют документ, документ становится недоступным никому, кроме получателя почты. Это довольно значительное ограничение в приложениях, когда требуется непрерывный доступ к документу;

• ориентированы на деловой процесс или на задание, как составную часть делового процесса. Данные системы возникли от попыток не просто автоматизировать движение документов, а от попыток взглянуть на весь процесс управления предприятием в целом. Соответственно, основная логика построения таких систем выглядит следующим образом: деловой процесс задание - документ. К заданию может быть прикреплен документ, а может и нет. В реальной жизни, подход от задания или делового процесса является более общим в документоориентированном подходе. Поэтому внимание уделяется не только поддержке документа (в реальных системах, эти функции отдаются на откуп системам управления документами), а, в основном, поддержке деловых процессов. Единственным местом, где можно хранить и обслуживать информацию о деловых процессах, является база данных со всеми ее преимуществами и недостатками. В таком случае появляется возможность следить за состоянием и историей каждого задания и каждого делового процесса. Но при этом имеют место и определенные недостатки, связанные с трудностью организации распределенных систем, особенно с поддержкой удаленных пользователей. В случае, когда удаленный пользователь может регулярно подсоединяться к центральной базе данных, эти проблемы решаются, но что делать, если единственная надежная связь - это электронная почта.

5. Понятие электронной системы управления документооборотом Компания IDC дает следующее определение понятия систем электронного управления документами (EDM - Electronic Document Management):

Системы электронного управления документами (ЭУД) обеспечивают процесс создания, управления доступом и распространения больших объемов документов в компьютерных сетях, а также обеспечивают контроль над потоками документов в организации. Часто эти документы хранятся в специальных хранилищах или в иерархии файловой системы. Типы файлов, которые, как правило, поддерживают системы ЭУД включают текстовые документы, образы, электронные таблицы, аудио-, видео- данные, и документы Web. Общими возможностями систем ЭУД являются создание документов, управление доступом, преобразование и безопасность."[7]. Часто подобные системы называют системами управления электронными документами (СУЭД) (Electronic Document Management Systems - EDMS).

Исторически системы управления документами являлись приложениями, разработанными для использования небольшими группами специалистов, работающих в территориальной близости друг от друга с сильно структурированными документами. За рубежом приложения вертикального управления документами, в основном, внедрялись в таких областях, как фармацевтические исследования, страхование, инженерные разработки, промышленное производство.

В современных распределенных предприятиях система распространения документов, требования по их доступности и необходимость совместной работы с ними растут экспоненциально. Имеющие высокую ценность информационные материалы создаются ежедневно, размещаются в глобальных сетях, распространяются в различных профессиональных коллективах. В эпоху Web формализованные документы, доступные только специалистам, не могут более служить хранилищем корпоративных знаний.

5.1. Задачи и назначение электронной системы управления документооборотом Электронные системы управления документооборотом составляют основу систем управления документами. К основным задачам относятся:

1. Обеспечение регистрации поступающей информации (заполнение необходимых атрибутов документа).

2. Организация хранения документов. Включает: поддержку устройств хранения разных типов (от быстрых магнитных дисков до стримеров, в том числе поддержка работы со съемными носителями);

поддержку миграции документов между устройствами хранения в зависимости от изменения активности обращения к информации, что позволяет оптимизировать удельную стоимость хранения данных. При этом должна учитываться как настраиваемая пользователем миграция документов, так и автоматическая.

Технология автоматической миграции документов называется Hierarchical Storage Management, а продукты ее поддерживающие - HSM продуктами.

3. Автоматические операции с документами (копирование, восстановление, уничтожение).

4. Организация индексирования документов для дальнейшего их быстрого поиска - поддержка индексов различных типов. Выделяют два основных типа атрибутивный и полнотекстовый. Эти два основных метода поиска документов не являются взаимоисключающими, они прекрасно дополняют друг друга. У каждого из них существуют вполне понятные преимущества и недостатки.

Применение каждого из них зависит от конкретно стоящей задачи (например, если в организации имеется аналитический отдел и канал информации из СМИ, то возникает совершенно нормальное желание проводить анализ документов, поступающих из открытых источников, то есть заполнять соответствующие карточки, подобные регистрационным). В общем случае необходимо применять комбинацию из этих двух методов. Кроме того, существует метод семантического анализа содержания текста документа и выделения из него ключевых слов, помещения их в атрибутивную поисковую систему, что как бы сливает две системы поиска в одну. Отдельно стоит целый пласт задач, который подразумевает поиск и анализ информации, которая на ходится в нетекстовом формате: звук, видео или рисунок, (например, фотография человека или отпечатки пальцев).

5. Аудит и обеспечение безопасности документов. Под этим имеется ввиду контроль доступа к документу и протоколирование всех событий с документом. Контроль доступа подразумевает разрешение или запрещение, в зависимости от полномочий пользователя, вошедшего в систему таких операций как:

• просмотр документа;

• копирование документа;

• уничтожение документа;

• редактирование документа;

• управление доступом к документу.

Администратор может просматривать файл истории, в который записы ваются все события, которые происходят в системе при работе с документами, так что он в любое время сможет найти виновного и наказать его. Система управления документами должна позволять рассчитывать стоимость использования документа. Данная функция важна не только для анализа деятельности предприятия и конкретных сотрудников, но и просто для выставления счета на оплату клиенту. Отдельно хотелось бы отметить возможность использования специализированных аппаратно-программных модулей криптозащиты данных, которые предоставляют дополнительные сервисы по защите документов (электронная подпись, шифрование).

6. Интеграция с приложениями обработки документа. Существует множество приложений, которые порождают документы. Выделяют два типа приложений, с которыми может происходить интеграция:

• приложения, которые сохраняют результаты своей работы в файлах собственного формата;

• приложения, которые готовят и выводят результаты только на печать. К ним можно отнести большое количество информационных систем, которые производят невероятное количество отчетов и различного рода выходной информации. Данная информация может быть сохранена в промежуточных файлах или, чаше всего, сразу же выводится на печать.

Исходя из типов приложений, вытекает два типа интеграции:

• интеграция на уровне операций с файлами. Операции создания нового, открытия и сохранения файла в стандартную файловую систему замещаются подобными операциями с системой управления документами. Такой вид интеграции сложен, так как требует индивидуальной работы с каждым приложением, причем с каждой версией по отдельности. В последнее время производители подобных приложений, в особенности текстовых процессоров, стали поддерживать стандарт ODMA. Пример тому, новая версия приложений MS Office поддерживает этот стандарт, и интеграция в систему управления документами становится делом настройки конфигурационных файлов, а не дополнительного программирования. Данный вид интеграции интересен тем, что документ сохраняется в своем оригинальном формате, что позволяет обеспечить удобную дальнейшую его обработку (редактирование, просмотр и т.п.). С другой стороны, существует универсальный подход интеграции с приложениями на уровне отдельных операций, таких, как "Открыть", "Сохранить", "Сохранить как...", который характерен для конкретной операционной системы и сопряжен определенными работами по настройке такого шлюза на приложение. Такой универсальный шлюз для среды Win был выполнен компанией ВЕСТЬ-Метатехнология;

• интеграция на уровне вывода на печать. Система управления докумен тами перехватывает документы, которые уходят на печать, и сохраняет их в себе. Такой вид интеграции более универсален, так как не зависит от типа приложений, а зависит только от операционной системы, которая используется на конкретном рабочем месте. Но полученный документ нельзя после сохранения редактировать, так он теряет формат, в котором он был создан и сохраняется в универсальном формате (например, PDF или PS). Данный тип интеграции хорошо подходит для документов, которые существуют в окончательном виде (сформированные отчеты, подготовленные договора и т.п.). Тип систем, который перехватывает потоки вывода данных на печать носит название COLD (Computer OutPut to Laser Disk).

В качестве отдельно стоящего вида интеграции можно выделить ин теграцию с электронной почтой и факс-системами, как наиболее распро страненными механизмами передачи информации. Это вызвано тем, чтс электронные и факс-сообщения выделяются своим количеством, просто той доставки и важностью - с одной стороны, и слабой приспособленно стью почтовых серверов для выполнения функций электронного архив;

документов (сбор, хранение, быстрый поиск больших объемов информа ции) - с другой стороны.

Интеграция с электронной почтой осуществляется через стандартные интерфейсы MAPI и VIM. Соответственно поддерживаются все програм мы электронной почты, которые соответствуют вышеуказанным интерфейсам.

Возможен как ручной способ, когда пользователь самостоятельно оп ределяет - какую информацию следует поместить в архив, а какую - нет так и автоматический способ - когда почта приходит на заранее определенный адрес и специальная программа - робот, которая была предвари тельно настроена, выполняет операцию переноса данных из почтовьо систем в электронный архив.

Для передачи информации по факсимильным каналам характерен опре деленный формат передаваемых документов, как правило, растр, что и оп ределяет возможности (точнее их ограничение) последующей обработки.

Интефация с системами управления документами факс-сервер мо жет осуществлять тремя основными методами:

• прямая интеграция, когда факс-сервер программным путем связан с конкретной системой управления документами;

• через ODMA. Тогда факс-сервер должен поддерживать этот стан дарт;

• через электронную почту. Многие факс-сервера имеют интерфейс через MAPI или VIM в стандартные программы электронной почты. Это1 интерфейс позволяет посылать и принимать факс-сообщения через про грамму электронной почты и таким, не совсем простым способом, мож но наладить взаимодействие систем электронной почты с системой уп равления документами.

7. Организация коллективной работы с документами.

5.2. Структура электронной системы управления документооборотом Электронная система управления документооборотом, или системе управления электронным документооборотом (СУЭД), предназначена для следующих целей:.

• интеграции процессов документального обеспечения управления предприятием в рамках единой информационной системы;

• повышения информированности руководства и специалистов за счет увеличения объемов информационного хранения, централизованной обработки информации, уменьшения времени поиска документов и, соответственно, подготовки отчетов и докладов, а также за счет повышения полноты и достоверности отчетов;

• дня их последующего ввода;

• потоковый ввод стандартных форм документов в фактографическую часть подсистемы "Электронный архив" (включая сканирование, распознавание, контекстный поиск;

• уменьшение стоимости документационного обеспечения управления предприятием за счет перехода от бумажного делопроизводства к электронному, снижение стоимости копирования и передачи бумажных документов;

• уменьшения стоимости и сокращения времени поиска бумажных оригиналов документов в архивном хранении за счет получения точной адресации в электронном виде;

• интеграции информационных процессов в рамках кооперации пред приятий;

• создания качественно новой информационной базы для последующего совершенствования процессов документационного обеспечения управления и технологии работы с документами.

5.2.1. Состав СУЭД СУЭД должна соответствовать существующей информационно-орга низационной структуре предприятия и обеспечивать модификацию по мере совершенствования этой структуры.

СУЭД предназначена для автоматизации процессов документационного обеспечения управления предприятием, включая[8]:

1) процессы подготовки, ввода, хранения, поиска и вывода организационно - распорядительных документов (подсистема "Электронный архив");

2) процессы подготовки, ввода, хранения, поиска и вывода стандартных форм документов (подсистема "Ввод стандартных форм документов");

3) управление делопроизводством (создание, обработка и систематизация архивного хранения документов - подсистема "Делопроизводство").

Объектом автоматизации являются процессы:

• создания документов;



Pages:     | 1 || 3 |
 





 
© 2013 www.libed.ru - «Бесплатная библиотека научно-практических конференций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.