авторефераты диссертаций БЕСПЛАТНАЯ БИБЛИОТЕКА РОССИИ

КОНФЕРЕНЦИИ, КНИГИ, ПОСОБИЯ, НАУЧНЫЕ ИЗДАНИЯ

<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ


Pages:     | 1 | 2 || 4 | 5 |   ...   | 7 |

«ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ НАУКИ ГЕОФИЗИЧЕСКИЙ ЦЕНТР РОССИЙСКОЙ АКАДЕМИИ НАУК На правах рукописи ...»

-- [ Страница 3 ] --

Центр СПЦ, получив предварительные параметры и оценку цунамигенности землетрясения, немедленно начинает анализ поступающей информации.

Одновременно начинается непрерывная обработка данных об уровне моря, поступающих от гидрофизической (уровенной) сети СПЦ (рис. 1.31).

Рис. 1.31. Гидрофизическая (уровенная) сеть СПЦ.

Гидрофизическая сеть обеспечивает:

непрерывные наблюдения уровня моря и измерения уровня различными методами;

передачу измеренных данных в центры сбора и обработки данных соответствующего уровня СПЦ;

обработку данных для обнаружения аномальных изменений уровня, фильтрация гидрологических явлений, обнаружение цунамиподобных сигналов и идентификация волн цунами;

расчет характеристик волн цунами (времена вступления, амплитуды, периоды);

сбор и накопление первичных измерительных данных об уровне моря;

получение и накопление данных о проявлениях цунами на берегу (величине заплеска, характере воздействия на объекты).

На основе поступивших сейсмологических данных в Центре СПЦ производится предварительный расчет времен воздействия волн цунами на цунамизащищаемые пункты (времен подхода первой и последней волны цунами) и ожидаемых высот волн.

При наличии резерва времени, ведется непрерывный анализ информации, поступающей с сети измерений уровня моря. Данные измерений уровня моря позволяют определить, как сам факт возникновения волны, так и её основные параметры: оценку времени прихода, амплитуду первой волны и другие.

Наличие инструментальных наблюдений уровня моря позволяет подтвердить или отменить тревожное сообщение, переданное в соответствующий пункт, до которого волна цунами должна дойти позже.

Отмена угрозы цунами производиться по данным сети измерений уровня моря.

Состояние угрозы цунами отменяется, если в течение нормативного времени после прихода волны цунами ни в одном пункте измерений не зафиксирован факт прихода волны цунами [http://rtws.ru/info/sluzhba-predupr].

Имеющиеся проблемы и трудности в обеспечении функционирования СПЦ Российской Федерации приведены ниже [Воробьев, 2006]:

крайне малое число сейсмостанций, привлекаемых к СПЦ, отсутствие совместной обработки сейсмических данных от нескольких станций;

временные задержки, ошибки в определении параметров землетрясений — возрастание вероятности пропусков и ложных тревог;

несвоевременность передачи предупреждений об угрозе цунами;

практически полное отсутствие инструментальных дистанционных наблюдений цунами;

большая вероятность пропусков цунами и ложных тревог;

неудовлетворительное выполнение Россией обязательств в рамках международной Тихоокеанской СПЦ;

отсутствие надежной оперативной связи с сейсмическими и гидрометеорологическими станциями на Курильских островах и в других труднодоступных местах, а также центров СПЦ с цунамизащищаемыми пунктами на Камчатке и Курильских островах;

невозможность своевременно и надежно довести сигналы и сообщения до цунами-защищаемых пунктов, а также своевременно получать данные от пунктов наблюдений СПЦ;

ненадежность и недостоверность используемого в настоящее время магнитудно-географического критерия цунамигенности землетрясений и отсутствие в практике работы научно обоснованных комплексных критериев прогнозирования возникновения и степени опасности цунами;

невозможность достоверного прогнозирования возникновения цунами;

недостаток в центрах СПЦ современных технических средств и программного обеспечения для информационной поддержки принятия решений, в том числе для оперативного моделирования распространения цунами, расчета высот волн и оценки степени опасности цунами для конкретных пунктов побережья;

ненадежность работы аппаратно-программных комплексов (АПК) центров СПЦ;

невозможность достоверно оценить степень опасности цунами для пунктов побережья.

1.4.4. Система DART Национальное управление США по изучению океана и атмосферы (NОАА) развернула глубоководную систему обнаружения волн цунами – систему DART (Deep ocean Assessment and Reporting of Tsunamis) [http://www.ndbc.noaa.gov/dart.shtml, http://nthmp.tsunami.gov/]. Ее еще называют – заякоренные буи системы «Оценка и сообщение о цунами в глубоком океане». Это часть американской Национальной программы уменьшения опасности цунами – плод усилий Тихоокеанской морской экологической лаборатории Национального управления океанических и атмосферных исследований, чтобы решать задачу регистрации и передачи данных о цунами в глубоководной части океана в реальном масштабе времени. DART призвана обеспечить оперативное информирование об опасности цунами и снизить риск подачи ложных тревог.

Четыре автоматические цунами-станции работают в северной части Тихого океана, в Аляскинской зоне субдукции. Еще три такие станции работают в районе штата Орегон, вблизи каскадной зоны субдукции, где, по мнению специалистов, мощное цунами можно ожидать в ближайшие десятилетия. По геологическим данным, катастрофические цунами случаются здесь раз в несколько столетий. В августе 2001 г. вступила в строй станция в глубоководной зоне Тихого океана у Южной Америки. Эта область печально знаменита тем, что 23 июня 2001 года там произошло сильное землетрясение, породившее цунами, которое обрушилось на южное побережье Перу. Наблюдениями данной станции в той или иной мере охвачены также побережья Японии, Гавайских островов и западных районов Латинской Америки.

На рис. 1.32 представлена общая схема построения Международной системы оповещения о цунами в Тихом океане.

Рис. 1.32. Схема построения Международной системы оповещения о цунами в Тихом океане.

Каждая глубоководная цунами-станция (рис. снабжена донным 1.33) регистратором давления, которое соответствующим образом меняется в случае прохождения мощной волны цунами. Зафиксировав ее движение, станция передает акустический сигнал на буй, находящийся на поверхности моря, а с буя радиосигнал поступает к искусственному спутнику Земли, а оттуда — к наземным станциям, которые ретранслируют его в Сиэтл, в распоряжение Тихоокеанской лаборатории по изучению морской среды (PMEL — именно ее коллектив и разработал всю эту систему).

Одновременно информацию получают и станции раннего оповещения о цунами, расположенные на Аляске (WCATWC — от Берингова пролива до Алеутских о-вов) и на Гавайях (PTWC), а также национальный центр обработки данных буйковых и прибрежных станций (NDBC).

Рис. 1.33. Схема доведения сигналов от глубоководных цунами-станций.

Система якорного крепления ДАРТ состоит из двух главных компонентов: пакета для мониторинга морского дна, который определяет изменения в давлении воды, и заякоренного поверхностного буя, который передает сигналы в режиме реального времени на искусственный спутник Земли. Поверхностный буй прикреплен якорем к дну океана на глубине 4000-6000 метров.

На буе устанавливаются радиочастотная антенна и антенна системы глобального позиционирования для отправки данных на геостационарный оперативный экологический спутник (GOES, ГОЭС) NОАА.

Пакет для мониторинга морского дна, закрепляемый якорем на дне океана под поверхностным буем, состоит из центрального процессора, преобразователя энергии, акустической модемной техники и самописцев донного давления, которые могут обнаруживать и измерять малые и большие цунами.

Волны цунами в глубоком океане порождают более сильное давление, чем окружающая вода, и донный пакет ДАРТ регистрирует повышенное давление в толще воды с прохождением волны цунами.

Показания датчика давления снимаются каждые 15 минут, и при обнаружении сигнала цунами осуществляется автоматический переход на 15-секундный интервал измерений.

После регистрации перепада давления акустическая система связи на донном пакете передает данные по акустическому каналу связи (в диапазоне частот 15–18 кГц) на поверхностный буй ДАРТ, аппаратура которого преобразует эти данные в радиосигнал, поступающий на спутник ГОЭС. Спутник переправляет данные на наземные принимающие станции, которые передают сигналы в центры предупреждения о цунами на Аляске и Гавайях. Устройство глубоководной станции цунами приведено на рис. 1.34.

Рис. 1.34. Устройство глубоководной станции цунами.

Регистратор придонного давления способен определять амплитуду волны цунами всего в 0,5 см на глубинах до 6 км. Все данные, включая давление и температуру, сохраняются на жестком диске процессора. Щелочные батареи обеспечивают работу комплекса в течение 12 месяцев.

Телецунами – это цунами, которое происходит вдали от побережья данной страны и пересекает открытые воды. Именно здесь становятся ценными глубоководные датчики, поскольку они могут обнаруживать цунами в открытом море.

Следует отметить, что автоматизированная система регистрации цунами с помощью вынесенных в океан донных станций была запроектирована в СССР еще в начале 80-х годов, однако проект, к сожалению, так и не был реализован.

Чтобы ДАРТы были доступны другим странам, NОАА планировала в 2005 году разместить в Интернете чертежи системы ДАРТ после того, как будет готова документация по обновленной версии ДАРТ под названием «ДАРТ II». После того как документация по ДАРТII будет готова, а чертежи размещены в Интернете, любая страна или компания может суметь загрузить эти схемы и изготовить ДАРТII.

Основная разница между заякоренными буями систем ДАРТI и ДАРТ II связана со спутниковой передачей данных с ДАРТ II в центры предупреждения. ДАРТI использует спутник, охватывающий только треть земной поверхности, поэтому он, например, не может использоваться в Индийском океане, поскольку этот участок спутник не охватывает. ДАРТ II использует глобальную спутниковую систему сотовой связи («Иридий»), которая может применяться в любой точке мира, включая Индийский океан (рис. 1.35) [Воробьев, 2006].

Рис. 1.35. Устройство глубоководной станции цунами системы ДАРТ II.

1.4.5. Прогноз цунами Как ни странно, но проблема прогноза цунами оказывается несколько более простой, чем проблема прогноза землетрясений. Здесь также необходимо заранее предсказать место, время и энергию события. Но в отличие от прогноза землетрясений прогноз цунами может быть иногда вполне достоверным и при этом базироваться на определенном запасе времени, обеспечивающим эффективность прогноза. Это – интервал времени между возникновением сейсмического толчка и моментом прихода волны цунами к данной точке побережья [Поплавский и др., 1997;

Поплавский, 2002].

При прогнозе цунами сейсмического происхождения обычно используются:

статистические прогнозы на основе собранного эмпирического материала о современных и древних событиях (палеоцунами);

прогноз возбуждения волны в источнике цунами на основе обработки динамических характеристик сейсмограмм;

прогноз возникновения источника цунами в океане на основе регистрации гидроакустической волны от землетрясения;

прогноз возникновения источника цунами в океане на основе обработки спутниковой информации о процессах в эпицентральной зоне (акустическая кавитация, турбулизация поверхности, волновые структуры);

прогноз времен прихода волны цунами и ее интенсивности в пунктах побережья на основе компьютерных моделей и вычислительного эксперимента с учетом гидродинамических закономерностей и реальной батиметрии дна;

прогноз прихода волны цунами на основе обработки записей автономных систем вынесенных в океан гидрофизических буйковых и донных регистраторов и станций наблюдения.

Понятно, что прогноз цунами от удаленных источников имеет значительно больше шансов на успех, чем прогноз местных или локальных цунами. Например, цунами, возникшее у берегов Аляски, придет к берегам Камчатки только через несколько часов, и прогноз этого события для жителей побережья Камчатки может быть вполне достоверным.

Статистические прогнозы базируются на материалах опубликованных каталогов цунами. Существуют каталоги для многих цунами-опасных мест. Известно, что в Тихом океане примерно каждые полтора года возникает одно разрушительное цунами, а в конкретном регионе, подверженном действию цунами, частота появления катастрофического цунами составляет около 100 лет. Поиски следов сильнейших цунами древних времен дают ученым ценнейший материал для повышения надежности статистических прогнозов.

Традиционные методы предупреждения о волнах цунами основаны в первую очередь на сейсмической информации, получаемой сразу после землетрясения. Поскольку землетрясения предсказать очень трудно, то и долгосрочный прогноз цунами сделать достаточно сложно. Но когда происходит землетрясение, у ученых еще остается некий запас времени – от 15-20 минут до пяти-шести часов, в зависимости от удаленности очага, чтобы определить факт возникновения цунами, время его возможного приходак определенным точкам побережья и предупредить население. Здесь большую помощь могут оказать специальные компьютерные программы, которые позволяют проводить расчеты цунами при условии, что известны место и магнитуда землетрясения, глубина его залегания, рельеф дна и другие переменные данные.

Прогноз цунами связан с прогнозами землетрясений. И пока делать точные выводы сложно: очень часто сила цунами непропорциональна силе землетрясений. Бывали случаи, когда сильные землетрясения вызывали очень слабые цунами, и тревога оказывалась ложной. Но бывает и наоборот. Идеальной ситуации, позволяющей создавать точные прогнозы на будущее, в мире нет. Сейсмическая информация сегодня продолжает оставаться главной для выдачи оперативного прогноза: является ли данное землетрясение цунами-генным, т.е. вызовет ли оно цунами или нет. Алгоритм оперативной обработки сейсмограмм лежит в основе работы служб предупреждения о цунами.

Совершенствование сейсмической аппаратуры и методов обработки открывают новые возможности для прогностических подходов.

Спутниковая информация и возможности ее автоматической обработки дают обнадеживающие результаты для развития прогностических методов в третьем тысячелетии. Первый случай обнаружения из космоса океанского волнового возмущения, идентифицируемого как волна цунами от Гуамского землетрясения 1993 года, зафиксирован в научной литературе.

Наблюдения океанской поверхности со спутника значительно расширяют возможности океанографии. Кардинально решить проблему позволяет спутниковая альтиметрия, которая регистрирует крупномасштабные смещения уровня океана высотой всего в несколько сантиметров. Такие измерения уже сейчас можно проводить с искусственных спутников Земли GEOSAT, TOPEX/POSEIDON, ERS-1.2, JASON-1, ENVISAT, а в перспективе и с российского геодезического спутника «Геоик-2».

Практически непрерывное исследование высоты поверхности Мирового океана идет с 1985 года. Созданы оригинальные базы данных спутниковой альтиметрии, они регулярно пополняются и доступны для научного использования в двух центрах: в США и в Европе.

В последнее время возникла технология обнаружения очагов возникновения и распространения цунами со спутников, их альтиметрические данные позволяют регистрировать возмущения поверхности океана с точностью в несколько сантиметров.

Как свидетельствует расшифровка данных с американского спутника, который пролетел по траектории над Индийским океаном в тот момент, когда фронт цунами находился между Суматрой и Шри-Ланкой, альтиметрическими датчиками была зарегистрирована длинная волна цунами амплитудой около 80 см.

Недавно замечено, что в отдельных случаях перед головным фронтом цунами бежит некая тень – полоса воды более темной окраски. Это явление рассмотрел геофизик Годин. Он установил, что гигантская волна при движении вызывает специфический ветер, который захватывает лишь тонкий слой приводной атмосферы, лежащей непосредственно над цунами. Эта струя воздуха усиливает морское волнение, нарушает гладкость зеркала вод и образует темную полосу, параллельную волновому фронту, проходящему между гребнями волн. Благодаря подобному признаку цунами, предваряемое своей «тенью», может быть обнаружено в открытом океане, пока оно еще не нанесло смертельного удара по суше. Фиксировать такую «тень» могли бы радиолокаторы и радиометры, устанавливаемые на борту самолета или искусственного спутника Земли.

В случае цунами, возникающих в результате подводных оползней, извержений подводных вулканов или действия метеорологических возмущений, прогноз событий оказывается достаточно проблематичным. Это связано с локальным характером явления и ограниченностью времени для прогноза. Тем более что первичная сейсмологическая информация об источнике генерации цунами в этих случаях, как правило, отсутствует [Воробьев, 2006].

1.5. Обоснование и постановка задачи диссертации Последние десятилетия в геофизике и смежных науках наблюдается стремительный рост объема получаемой информации о процессах, происходящих на Земле и в околоземном пространстве. Наземные сети геофизических наблюдений не только непрерывно растут, но и осуществляют переход на более высокочастотную регистрацию данных с целью удовлетворения потребностей более широкого круга научных и практических интересов. Так, переход с минутной на секундную регистрацию геомагнитных данных является одной из актуальных, трудных и обсуждаемых задач в геомагнитном сообществе. Кроме того, происходит переход от накопленных ранее аналоговых представлений результатов измерений к цифровым. Вследствие этого возросла роль автоматизации сбора и анализа данных и математических методов их обработки.

Статистика показывает, что не менее стремительно растет и число запросов к цифровым данным. При небольших объемах данных опытному эксперту не составляет труда извлечь из них полезную информацию. Но для эффективного использования объемных массивов данных и получения на этой основе качественно новых результатов актуальной является задача создания адекватных автоматизированных методов комплексного анализа и обработки данных. В этом случае автоматизированное извлечение полезной информации должно быть формализовано, происходить единообразно и объективно.

Одной из важнейших проблем современной геофизики является распознавание, изучение, классификация аномальных событий на длинных одномерных и многомерных временных рядах геофизических наблюдений. Несмотря на огромное многообразие и разнородность типов наблюдаемых рядов геофизических наблюдений эта проблема может рассматриваться в общей постановке, достаточно инвариантной к выбору того или иного типа информации. Тем самым, возникает необходимость создания общей теории и методов распознавания аномалий на рядах геофизических наблюдений различной природы. Этот общий метод должен адаптироваться к конкретному выбору типа геофизических данных в виде нетривиальной самостоятельной реализации.

Вероятностно-статистические методы выделения возмущений, частотно-временной анализ, вейвлет-анализ и нейронные сети являются эффективными при наличии априорной информации. Во многих случаях априорная информация об искомых возмущениях весьма ограничена и касается только общих представлений об их форме.

Форма аномалии является достаточно нечетким понятием, а корреляционные свойства ее неизвестны. Поскольку природа явлений, отраженных в регистрируемых данных, априори не известна и изменчива во времени, то и методы должны быть в большой степени адаптивными. Требуются такие методы анализа временных рядов, которые бы позволяли решать задачи распознавания аномальных событий в самом общем случае.

Одной из актуальных проблем анализа геофизических данных является распознавание физических и техногенных аномалий на рядах геомагнитных наблюдений и обнаружение всплесков магнитной активности. В то же время, крайне актуальной задачей является развитие сетей наблюдения магнитного поля Земли. При решении фундаментальных и прикладных задач геомагнетизма необходимым условием является наличие геомагнитных данных, предварительно очищенных от техногенных аномалий.

Актуальной задачей является различение естественных аномалий, обусловленных физическими процессами, и техногенных аномалий. Например, разделение магнитосферных возмущений (пульсаций) от промышленных помех (электропоезда, самолеты) на магнитограммах. В обсерваторской практике такая деятельность до сих пор осуществляется вручную, что служит серьезным препятствием для адекватного использования данных и развития систем геомагнитных наблюдений.

При стремительном росте объема данных использование единичных мер для описания характеристик наблюдаемых процессов представляется устаревшим и неэффективным. В геомагнетизме такими единичными мерами являются геомагнитные планетарные индексы. Они предназначены для оценки общей интенсивности магнитных бурь и рассчитываются по данным фиксированного набора станций. Современный этап развития сетей наблюдений требует перехода к новой парадигме в анализе геомагнитных данных, подразумевающей обработку целиком массива наблюдений на многих станциях, как единого целого. В геомагнитных исследованиях требуется введение меры комплексного анализа данных, позволяющей в единой шкале оценивать относительную магнитную активность в разных регионах Земли по данным максимального числа наблюдений. Такая мера позволила бы получать мгновенные «снимки» распределения магнитной бури в каждый момент времени для изучения динамики распространения возмущений по земному шару.

Создание общей формализованной методологии обеспечивает независимость результатов обработки от субъективных факторов (напр., отличия в подходах различных экспертов к анализу данных). В то же время решается актуальная задача значительного сокращения задержки в получении обработанных данных мировым научным сообществом. Математическая формализация распознавания временных возмущений будет способствовать значительному повышению качества обработки данных геомагнитных измерений, что внесет существенный вклад в расширение и углубление знаний о магнитном поле Земли.

В настоящее время главными задачами по преодолению отставания российской сети магнитных наблюдений от мирового уровня являются: (1) развитие пунктов геомагнитных наблюдений в России;

(2) создание национального центра геомагнитных данных, который будет служить ядром российского сегмента ИНТЕРМАГНЕТ;

(3) преобразование результатов наблюдений российских обсерваторий в окончательные данные, предоставляемые научной общественности, вместо передачи «сырых» данных в различные зарубежные центры.

Распознавание временных участков с сейсмическими и цунами- волновыми возмущениями в сигналах датчиков гидростатического давления донных сейсмических станций, содержащих сигналы землетрясений и цунами, является актуальной геофизической задачей. Cигналы датчиков гидростатического давления с такими составляющими являются ранними предвестниками возможных цунами. Цунами волновые возмущения, обнаруживаемые в сигналах датчиков гидростатического давления от донных сейсмических станций, которые располагаются вдали от берега, могут приниматься в качестве непосредственных предвестников цунами. Донные сейсмические станции, объединённые в глобальную систему, могут обеспечить эффективное предупреждение цунами и внести весомый вклад в изучение сейсмичности Земли. Эти утверждения основаны на том, что 80% всех землетрясений происходят под дном океанов и морей, и сеть исключительно из наземных сейсмических станций не может регистрировать землетрясения без пропусков [Гетманов и др., 2012].

На основании вышесказанного, задачи диссертации заключаются в следующем:

1. Создание алгоритмической системы автоматизированного, адаптивного распознавания аномальных событий произвольной природы на длительных временных рядах различных геофизических наблюдений;

2. Системно-математическая и алгоритмическая реализация разработанного общего метода для распознавания аномальных событий на временных рядах минутных, секундных и полусекундных магнитограмм, зарегистрированных наземными обсерваториями и искусственными спутниками Земли. Оптимизация системы обучения и математическая формализация критериев эффективности разработанного метода.

Создание формализованного метода оценки эффективности работы алгоритмов в задаче распознавания аномальных событий техногенной природы на магнитограммах в периоды спокойного магнитного поля и повышенной активности;

3. Программно-алгоритмическая реализация метода для автоматизированного, формализованного и единообразного распознавания аномальных событий техногенной природы на магнитограммах наземных сетей наблюдений;

доведение качества распознавания до уровня, сравнимого с работой эксперта вручную;

сравнение созданного метода с классическими статистическими методами распознавания;

4. Разработка модели и технологической схемы функционирования межрегионального центра геомагнитных данных по обслуживанию российско украинского сегмента сети ИНТЕРМАГНЕТ;

5. Создание нового метода распознавания и мониторинга геомагнитной активности на основе данных всей глобальной сети наземных наблюдений для возможности изучения динамики распространения магнитных бурь по земному шару в режиме реального времени;

разработка меры, дающей оценку геомагнитной активности в различных регионах Земли в единой шкале, и ее сравнение с классическими индексами геомагнитной активности. Оценка эффективности разработанного метода в задаче внутреннего анализа сильных геомагнитных бурь, наблюдаемых во время 23-го солнечного цикла на всей мировой сети магнитных обсерваторий ИНТЕРМАГНЕТ;

6. Реализация метода для распознавания аномальных событий на временных рядах вариаций придонного давления воды, регистрируемых мировой сетью придонных датчиков гидростатического давления в открытом океане;

применение реализованной алгоритмической системы для решения задачи распознавания на записях наблюдений системы DART-2 (глубоководная система обнаружения волн цунами) временных участков, соответствующих сигналам от подводных землетрясений (P-волн) и волн цунами;

оценка работы системы с работой эксперта.

ГЛАВА 2. Метод и алгоритмы дискретного математического анализа геофизических данных Данная глава посвящена описанию разработанных алгоритмов, которые составили основу диссертационной работы и были применены в геофизике. Глава основана на результатах, опубликованных в работах [Агаян и Соловьев, 2004;

Соловьев и др., 2005, 2012а;

Soloviev et al., 2009, 2012а, 2012c, 2013;

Богоутдинов и др., 2010;

Гвишиани и др., 2010а, 2011;

Сидоров и др., 2012;

Kleimenova et al., 2012;

Клейменова и др., 2013;

Зелинский и др., 2014]. В ходе подготовки диссертации были получены следующие свидетельства о государственной регистрации программ для ЭВМ: (1) Агаян С.М., Соловьев А.А. «Кристалл». Свидетельство № 2010616341 от 24.9.2010;

(2) Гвишиани А.Д., Агаян С.М., Богоутдинов Ш.Р., Соловьев А.А. «SP». Свидетельство № 2011616021, от 3.8.2011;

(3) Гвишиани А.Д., Агаян С.М., Богоутдинов Ш.Р., Соловьев А.А. «SPs».

Свидетельство № 2012619415 от 18.10.2012.

Поскольку разработанные в рамках диссертации алгоритмы опираются на элементы нечеткой математики и теорию дискретного математического анализа (ДМА), то в главе также приведены базовые положения теории нечетких множеств (раздел 2.1) и общие принципы ДМА (раздел 2.2).

2.1. Базовые элементы теории нечетких множеств 2.1.1. Основные определения Основной особенностью классического множества является наличие четкой границы между элементами, которые принадлежат и не принадлежат этому множеству.

Другими словами, если все рассматриваемые элементы принадлежат универсальному множеству U, тогда классическое подмножество AU может определяться функцией принадлежности, принимающей только два значения: «элементы, принадлежащие A» и «элементы, не принадлежащие A».

Теория нечетких множеств расширяет это понятие путем введения более сложных функций принадлежности. Для начала дадим некоторые формальные определения.

Рассмотрим основное множество U, которое назовем универсальным.

Определение 1. A – нечеткое подмножество U (или A – нечеткое множество на U), если существует отображение A :U L, где L – некоторое упорядоченное множество.

Простым примером L является отрезок [0, 1].

Назовем значения отображения A ( x), x U степенью принадлежности элемента x нечеткому множеству A.

Назовем A функцией принадлежности нечеткого множества A.

Если L=[0, 1], тогда используется следующая терминология:

« x U полностью принадлежит A» тогда и только тогда, когда A ( x) 1 ;

« x U не принадлежит A» тогда и только тогда, когда A ( x) 0 ;

« x U частично принадлежит A» тогда и только тогда, когда 0 A ( x) 1.

Введем два особых нечетких множества:

пустое множество такое, что ( x) 0 x U ;

универсальное множество U такое, что U ( x) 1 x U.

Любое классическое подмножество AU может рассматриваться как нечеткое множество на U с функцией принадлежности 1, если x A A ( x).

0, если x A Если множество U конечно, или U является множеством натуральных чисел, тогда его нечеткие подмножества A обозначаются следующим образом:

A A ( x1 ) / x1, A ( x2 ) / x2,..., A ( xn ) / xn,..., A x A A ( xi ) / xi, или, i A A ( x1 ) / x1 A ( x2 ) / x2... A ( xn ) / xn...

где U x1, x2,..., xn,..., а под знаком суммы понимается операция объединения классических множеств.

Примеры.

U x1, x2, x3. A 0.2 / x1,0.5 / x2,0.8 / x 1. Положим Тогда 0.2 / x1 0.5 / x2 0.8 / x3 является нечетким множеством на U.

2. Пусть U 0,1,..., n,... – универсальное множество целых чисел. Определим функцию принадлежности нечеткого подмножества S (от “Small” – “малый”) следующей формулой:

n S ( n) 1.

Тогда нечеткое множество S может быть записано как n S 1 / n.

n 0 Определение 2. Если A – нечеткое множество на U, тогда элемент x0 U такой, что A ( x0 ) 0.5 называется точкой перехода множества A. Для нечеткого множества S (“Small”) точка перехода x0 равна 10.

Если универсальное множество U является множеством вещественных чисел, тогда используется следующая запись:

A A ( x) / x dx.

U Определение 3. Нечеткие множества с функцией принадлежности A : U [0,1] называются нечеткими множествами первого типа. Если A : U L, где L – нечеткое множество первого типа на отрезке [0, 1], тогда A называется нечетким множеством второго типа, или супер нечетким множеством.

Следующим пример иллюстрирует это определение.

Положим U = {0, 0.1, 0.2, 0.3, …, 0.9, 1}.

Пусть A – нечеткое множество на U, в котором только для трех элементов x1, x2, x A ( x) 0. Остальные элементы U \{x1, x2, x3} не принадлежат A. Допустим, что элементы x1, x2, x3 имеют разную степень принадлежности множеству A: x1 – «слабо», x2 – «умеренно», x3 – «сильно» принадлежат A.

Тогда нечеткое множество A может быть записано следующим образом:

A = {«слабо»/ x1, «умеренно»/ x2, «сильно»/ x3 }. (2.1) Теперь определим каждое из множеств «слабо», «умеренно» и «сильно», как нечеткое множество первого типа на отрезке [0, 1].

W = «слабо» = {0.1/0, 0.1/0.1, 0.2/0.2, 0.8/0.3}, (2.2) W = «умеренно» = {0.5/0.3, 0.7/0.4, 1/0.5, 0.8/0.6}, (2.3) W = «сильно» = {0.6/0.6, 0.8/0.7, 0.9/0.9, 1/1}. (2.4) Другими словами, когда мы говорим «сильно», мы имеем ввиду, что в формуле (2.1) элементу x3 соответствует нечеткое множество первого типа на отрезке [0, 1], которое определяется формулой (2.4). Аналогично для (2.2) и (2.3).

Таким образом, A (2.1) является нечетким множеством второго типа, или супер нечетким множеством.

На базе этого примера можно определить нечеткое множество A второго типа следующим образом.

Положим, U – конечное, либо целочисленное множество. Тогда A {A1 / x1, A2 / x2,..., An / xn,...}, где Ai 0, либо Ai является нечетким множеством первого типа и определяется формулой:

Ai { Ai ( y1 ) / y1,..., Ai ( yk ) / yk,...}. (2.5) В (2.5) y j [0,1] и Ai ( y j ) [0, 1].

Не следует путать понятия «степень принадлежности» и «вероятность». Несмотря на то, что в обоих случаях мы имеем дело с вещественной характеристикой на отрезке [0, 1], сущность этих характеристик принципиально разная.

Понятие степени принадлежности предполагает наличие универсума U и показывает, насколько сильно элементы xU обладают изначально заданными свойствами, что определяется функцией A. Напротив, понятие вероятности связано с событием, другими словами, изменением универсума.

Разница может быть продемонстрирована на следующем примере. Допустим, автобус вмещает 50 пассажиров. Для того, чтобы определить нечеткое множество «молодых» с помощью множества пассажиров, необходимо рассмотреть 50 конкретных людей и определить, в какой степени A каждый пассажир является молодым.

В случае «вероятности», задача формулируется иначе: каковы шансы того, что среди произвольной группы из 50 человек найдется молодой человек на конкретном месте. Опять же, понятие «молодой» может быть сформулировано в терминах нечетких множеств. Им будет являться человек, для которого степень «молодости» не равна нулю [Gvishiani, Dubois, 2002].

Пусть A – нечеткое множество на универсальном множестве U c функцией принадлежности A : U [0,1].

Определение 4. Определим носитель A классическим подмножеством:

supp( A) {x U : A ( x) 0}.

Если supp( A) {x1,..., xn } – конечное множество, тогда A может быть записано как n A A ( x1 ) / x1,..., A ( xn ) / xn A ( xi ) / xi.

i 2.1.2. Операции над нечеткими множествами Для создания алгоритмов с использованием классификаций нечетких множеств, необходимо ввести основные операции над нечеткими множествами аналогичные тем, которые используются в теории классических множеств. Ниже приводятся формальные определения таких операций.

Определение 1. Пусть A и B – нечеткие множества, A и B – их функции принадлежности, X – универсальное множество.

Тогда, A B, если x X A ( x) B ( x) (равенство), (2.6) A B, если x X A ( x) B ( x) (включение). (2.7) Определение 2. Дополнение A нечеткого множества A определяется функцией принадлежности A ( x) n A ( x), где n: [0, 1] [0, 1] – операция отрицания. (2.8) Другими словами, n – невозрастающая инволютивная функция, такая что n(0) = 1, а n(1) = 0.

Функция n(u) может иметь разный вид. Классическая функция отрицания выглядит так:

n(u) = 1 – u. (2.9) В дальнейшем будет использоваться классическое отрицание. Тем самым, (2.8) может быть представлено следующим образом:

A ( x) 1 A ( x) (2.10) Аналогичные принципы могут быть построены с использованием других функций отрицания. Некоторые известные функции отрицания приведены ниже:

квадратичное отрицание: nr (u ) 1 u 2, 1 u отрицание Сучено: n (u ).

1 u Определение 3. Определим т-норму как функцию T: [0, 1] [0, 1] [0, 1], удовлетворяющую следующим условиям:

T (0,0) 0 ;

T (u1, v1 ) T (u2, v2 ), если u1 u2, v1 v2 ;

T (u, v) T (v, u) ;

T (u,1) T (1, u) u ;

T (u, T (v, w)) T (T (u, v), w).

Т-норма T называется «архимедовой», если T непрерывна как функция от двух аргументов и T(u, u) u u[0, 1]. Т-норма T называется «строгой т-нормой», если T строго возрастающая функция от обоих аргументов. Ниже приведены некоторые примеры т-норм:

минимум (т-норма Задэ): T (u, v) min(u, v) ;

вероятностная т-норма: Tp (u, v) u v ;

т-норма Лукашевича: Tm (u, v) max(0, u v 1) ;

min(u, v), если u 1 или v т-норма Домби: Tw (u, v).

0, в остальных случаях Определение 4. Определим т-конорму как функцию : [0, 1] [0, 1] [0, 1], удовлетворяющую следующим условиям:

(1, 1) = 1;

(u1, v1 ) (u2, v2 ), если u1 u2, v1 v2 ;

(u, v) = (v, u);

(0, v) = (v, 0) = v;

(u, (v, w)) ( (u, v), w).

Т-конорма называется «архимедовой», если непрерывна как функция от двух аргументов и (u, u) u u[0, 1]. Т-конорма называется «строгой т-конормой», если строго возрастающая функция от обоих аргументов.

Класс т-конорм дуален классу т-норм. Это означает, что любая т-конорма может быть получена из т-нормы T, используя следующее преобразование:

(u, v) = 1–T(1–u, 1–v).

Примеры т-конорм включают в себя:

(u, v) max(u, v) ;

p (u, v) u v u v ;

m (u, v) min(1, u v) ;

max(u, v), если u 0 или v w (u, v).

1, в остальных случаях Дуальными являются следующие пары т-норм и т-конорм:

T (u, v) min(u, v) и (u, v) max(u, v) ;

Tp (u, v) u v и p (u, v) u v u v ;

Tm (u, v) max(0, u v 1) и m (u, v) min(1, u v ) ;

Tw (u, v) и w (u, v).

Понятия т-норм и т-конорм используются для определения операций пересечения и объединения нечетких множеств.

Определение 5. Пусть A и B – нечеткие множества, A и B – их функции принадлежности, T – т-норма и – т-конорма, дуальная по отношению к T. Тогда пересечение и объединение нечетких множеств A и B определяются следующими функциями принадлежности:

A B T ( A, B ), A B ( A, B ).

Действительно, x X, AB ( x) T ( A ( x), B ( x)) и 0 AB ( x) 1 по определению т-нормы (см. определение 3). Аналогично, x X, AB ( x) ( A ( x), B ( x)) [Gvishiani, Dubois, 2002].

2.1.3. Нечеткие бинарные отношения Архимедовы т-нормы и, соответственно, операции пересечения и объединения нечетких множеств, могут быть представлены аддитивными генераторами архимедовых функций. Такие генераторы являются непрерывными, монотонно убывающими f :[0,1] функциями – множество неотрицательных вещественных чисел), ( такими как:

T (u, v) f 1 ( f (u) f (v)), (2.11) где f 1 ( y ), если y [0, f (0)] ( 1) ( y) f. (2.12) 0, если y f (0) Аддитивные генераторы и дуальность т-норм и т-конорм являются основой в изучении обобщенных операций пересечения и объединения нечетких множеств.

Следующий оператор усреднения также играет важную роль в приводимых конструкциях. Понятие «обобщенное среднее значение» было введено А.Н.

Колмогоровым [Колмогоров, Фомин, 1981]. Среднее значений C1, C2,...Cn определяется по формуле:

1 N M F (C1, C2,..., CN ) F 1 F (Ci ), (2.13) N i 1 где F(u) – функция, а F-1 – ее обратное преобразование.

Ниже приведен часто используемый особый вариант обобщенного среднего:

1/ r 1 N r M (C1, C2,..., CN ) F Ci. F (2.14) r N i Несложно показать, что если Ci 0, i 1,..., N, тогда M (C1, C2,..., CN ) min1i N (Ci ), (2.15) M (C1, C2,..., CN ) max1i N (Ci ) 1/ N i1 Ci N M 0 (C1, C2,..., CN ), (2.16) 1N Ci.

M1 (C1, C2,..., CN ) (2.17) N i Формулы (2.16) и (2.17) очевидно определяют геометрическое и арифметическое среднее соответственно. Этот факт также является основанием для использования термина «обобщенное среднее» в отношении функции (2.13).

Пусть имеется отображение : XY и нечеткое множество AX. Тогда образ A, отображенный при помощи, будет представлять собой нечеткое множество BY с функцией принадлежности B ( y) sup A ( x), y Y, (2.18) x 1 ( y ) где -1(y) = {xX | (x) = y}.

Определение 1. Бинарное нечеткое отношение R между множествами X и Y является нечетким множеством в прямом произведении XY с функцией принадлежности R : X Y [0,1], определенной по формуле (2.18).

Пусть – бинарное нечеткое отношение между X и Y с функцией принадлежности ( x, y) и A – нечеткое множество в X c функцией принадлежности A ( x). Тогда образ B нечеткого множества A, порожденный нечетким отношением, будет являться нечетким множеством в Y с функцией принадлежности [Gvishiani, Dubois, 2002]:

B ( y) sup min( A ( x), ( x, y)), y Y.

xX 2.2. Общие принципы дискретного математического анализа 2.2.1. Алгоритмический подход ДМА Одно из направлений развития дискретной математики связано с моделированием умения человека анализировать данные. Действительно, опытный исследователь прекрасно выделяет аномалии в двух- и трёхмерных физических полях, умеет перейти от их локального уровня к глобальному для целостной интерпретации, находит сигналы нужной формы на записях небольшой длины и делает многое другое. Объясняется это более естественным и устойчивым по сравнению с математическим характером восприятием им формы, дискретности и стохастичности. Приведём три примера.

1. Гладкая в математическом смысле функция f на отрезке [a, b] после даже достаточно тщательной дискретизации [a, либо под воздействием b] небольшого стохастического возмущения потеряет это свойство, но по прежнему останется гладкой для человека.

2. Математическую монотонность f на [a, b] может нарушить любое сингулярное возмущение, в то время как человеческое восприятие тренда более устойчиво к нему. Лишь достаточно «большое» возмущение заставит человека изменить своё решение о монотонности f на [a, b].

3. В многомерном конечном массиве любой, в частности, геолого X геофизической природы особую роль реперных точек играют наиболее «плотные» из них, сильнее всего концентрирующие X вокруг себя. Они важны для анализа X, например, при кластеризации или трассировании в нём.

Нетривиальное формальное выражение плотности в X не может быть построено в рамках классической математики, потому что для неё X – дискретное пространство, все точки которого одинаково изолированы и не интересны.

Но человек бессилен в больших размерностях и перед большими объёмами, поэтому особую актуальность приобретает задача передачи компьютеру путём моделирования умения человека анализировать данные для работы в реальных условиях.

Наш коллектив занялся таким моделированием более 10 лет тому назад, сразу учитывая то обстоятельство, что человек мыслит и оперирует не числами, а нечёткими понятиями.

Ещё Норберт Винер в своей работе «Творец и робот» отмечал: «По-видимому, главное преимущество человека перед компьютером – это его способность оперировать с нечётко очерченными понятиями» [Винер, 1966].

Именно в этой связи в 1965 году американский математик Лотфи Заде создал теорию нечётких множеств [Zadeh, 1965;

Заде, 2001]. Основная идея Заде заключалась в том, что человеческий способ рассуждений, опирающийся на естественный язык, не может быть описан в рамках традиционных математических формализмов. Этим формализмам присуща строгая однозначность интерпретации, а всё, что связано с использованием естественного языка, имеет многозначную интерпретацию. Программа Заде состояла в построении новой математической дисциплины, в основе которой лежала бы не классическая теория множеств, а теория нечётких множеств. Последовательно проводя идею нечёткости, по мнению Заде, можно было построить нечёткие аналоги всех основных математических понятий и создать необходимый формальный аппарат для моделирования человеческих рассуждений и человеческого способа решения задач.

Программа построения нечёткой математики быстро нашла отклик среди исследователей из разных стран мира. Часть исследователей устремилась «вширь», вводя в рассмотрение нечёткие расширения таких фундаментальных понятий математики, как функция, отношение, предикат. Появились нечёткие уравнения и нечёткие интегралы, нечёткая логика и нечёткая топология и т.д. Другие исследователи устремились «вглубь».

Их целью было выявление самой природы нечёткости. В потоке чисто математических работ начал возникать поток работ прикладных. Идеи Заде и его последователей нашли и находят применение при создании систем, понимающих тексты на естественном языке, при создании планирующих систем, опирающихся на неполную информацию, при обработке зрительных сигналов, в управлении техническими, социальными и экономическими системами, в системах искусственного интеллекта и робототехнике.

Всё это доказало, что нечёткая математика и нечёткая логика обладают достаточно большими возможностями для моделирования человеческих представлений и рассуждений по сравнению с обычными множествами и булевой логикой. Булевы признаки внутренне дизъюнктны (жестки), что приводит в реальности к выхолащиванию.

Содержательные признаки должны быть непрерывными (мягкими), а потому нечёткими.

Нечёткая математика и нечеткая логика позволили дать строгое математическое описание в действительности расплывчатых экспертных утверждений и преодолеть лингвистический барьер между человеком, суждения и оценки которого являются приближенными, качественными и нечёткими, и компьютером, который может выполнять только чёткие инструкции.

Таким образом, с помощью нечёткой математики становится возможной формализация эксперта при анализе геолого-геофизической информации. Но имеется ещё одно обстоятельство, делающее нечёткую математику привлекательной для геологии и геофизики. Нечёткая математика является формальным аппаратом, способным наиболее адекватно учесть не только мнение экспертов, но и нечёткость данных. Действительно, в геологии и геофизике мы часто имеем дело с приближенными величинами, да и модели сложных природных процессов не всегда точны из-за излишней их идеализации, в частности, линеаризации, дискретизации и т.п. Это свидетельствует о естественности нечёткого подхода к геологии и геофизике, которым изначально присущ нечёткий характер в силу неполноты и расплывчатости наших знаний о Земле. В этой связи процитируем Заде: «Образно говоря, теории о природе должны отражать то, что природа «пишет» скорее произвольными мазками, чем шариковой ручкой» [Нечеткие множества и теория возможностей. Последние достижения, 1986].

Итак, стремление решать сегодня геологические и геофизические задачи наиболее адекватно реальности требует перехода от жёстких, чётких формальных методов к мягким, нечётким. И, в первую очередь, это касается математики, использующейся в геологии и геофизике.

Упомянутое выше проникновение нечёткости в математику происходило в основном в её дискретные области (логику, графы, автоматы, группы, алгоритмы), за исключением имеющей скорее теоретический характер нечёткой топологии. Программа Заде остановилась на пороге «непрерывной» математики, составляющей основу анализа и обработки данных (математический и функциональный анализ, спектральные методы, дифференциальные уравнения и т.д.). Причина – большая сложность нечёткой арифметики: она тесно связана с интервальным анализом, который, в свою очередь, недистрибутивен и крайне ограничен в своих применениях.

Теперь можно сформулировать основную цель и задачи наших исследований – продолжить программу Заде проникновения нечётких множеств в непрерывную математику, разработать мягкие, нечёткие методы анализа данных и применить их в изучении физических полей Земли.

Как было сказано выше, работа в этом направлении началась в 1999 году и привела к новому методу анализа данных. Называется он «Дискретный математический анализ» (в дальнейшем ДМА). Для его понимания необходимо обратиться к стандартному дискретному анализу: «Дискретный анализ – область математики, занимающаяся изучением свойств структур конечного характера. Дискретный анализ представляет собой важное направление в математике, имеющее характерные для него предмет исследования, методы и задачи, специфика которых обусловлена, в первую очередь, необходимостью отказа в дискретном анализе от основополагающих понятий классический математики – предела и непрерывности — и (в связи с этим) тем, что для многих задач дискретного анализа сильные средства классической математики оказываются, как правило, мало приемлемыми» [Математическая энциклопедия, 1979].

Была предпринята попытка исправить это положение и получить конечный предел, но не в рамках классической математики, а нечётким моделированием способности человека ощущать предельность. Надо отметить, что подход к конечному пределу и ДМА, как продолжение программы Заде на «непрерывную» математику, следует считать одним из возможных. Далее с помощью конечного предела по сценарию классической математики были получены конечные аналоги основных фундаментальных понятий:

непрерывности, связности, плотности, тренда и др. Так возник ДМА. Он представляет собой серию алгоритмов, нацеленных на решение основных задач анализа данных:

кластеризацию и трассирование в многомерных массивах, морфологический анализ рельефов, поиск аномалий и трендов на записях и так далее. Все алгоритмы ДМА носят универсальный характер, скреплены единой формальной основой, базирующейся, в свою очередь, на конечном пределе.

Для более точного описания ДМА обратимся к его блок-схеме (рис. 2.1). Три верхние блока относятся к «Формальным основам» ДМА. Умение человека анализировать данные объясняется не только способностью оперировать с нечёткими понятиями, но и очень гибким, адаптивным восприятием фундаментальных понятий предельности, близости, непрерывности, связности и др. Потому что именно из этих понятий, как из конструктора, складываются все алгоритмы обработки данных. В блоке «Формальные основы» мы пытаемся достичь такого отношения к этим понятиям, трактуем их как нечёткие и строим функции принадлежности к ним, тем самым переводя их на язык нечёткой математики, для того, чтобы дальше работать с ними с помощью нечёткой логики. В результате такой формализации предельность, близость, непрерывность, связность, тренд и т.д. предстают в ДМА в виде параметризованных нечётких структур, что придаёт им необходимую гибкость и адаптивность. В этой связи процитируем Рональда Ягера: «... всё, что нам нужно для решения большинства практических задач – это параметризованные семейства определений, которые в час надобности допускали бы нестандартный выбор операторов, отражающих характерные особенности конкретного приложения. Преимущество этого подхода состоит в том, что, избегая фиксированных, конкретно-независимых определений, теория нечётких множеств и нечёткая логика достигают плюрализма, который повышает их гибкость и экспрессивные возможности»

[Нечеткие множества и теория возможностей. Последние достижения, 1986].

Рис. 2.1. Схема ДМА.


«Формальные основы» дают возможность строго определить все объекты и понятия ДМА: кластеры, сгущения, трассы, аномалии, тренды, сглаживания, морфологию и т.д. На их поиск нацелены остальные блоки ДМА. Каждый из них развёртывается в серию алгоритмов, объединённых единым названием. Блоки слева (Роден, Кристалл, Монолит, Трассирование) представляют алгоритмы, нацеленные на поиск кластеров, сгущений, трасс в многомерных дискретных пространствах [Агаян и Соловьев, 2004;

Соловьев и др., 2005;

Гвишиани и др., 2002а, 2002б;

Mikhailov et al., 2003].

Остальные ветви схемы ДМА относятся к конечным временным рядам (КВР) и образуют вторую серию алгоритмов, представленных на рис. 2.1 («Равновесие», «Прогноз», DRAS, FLARS, алгоритмы поиска нечетких монотонностей, экстремумов, морфологический анализ КВР: алгоритм «Геометрические меры») [Гвишиани и др., 2003а, 2003б;

Gvishiani et al., 2004;

Zlotnicki et al., 2005;

Агаян и др., 2005;

Богоутдинов и др., 2007]. К этой же серии относится и алгоритм FCARS (Fuzzy Comparison Algorithm for Recognition of Signals).

Настоящая диссертация во многом посвящена расширению именно этого раздела ДМА. Находящиеся в этих блоках алгоритмы реализуют функциональный подход к рядам, напоминающий классический математический анализ гладких функций. Именно этим объясняется название подхода: для рядов строятся дискретные аналоги гладкости, разрывности, монотонности, экстремума, выпуклости, изучается и их геометрия. Таким образом, ДМА является единой основой большой серии алгоритмов, имеющих достаточно универсальный характер. Ниже мы будем говорить о ДМА, отождествляя его с алгоритмами, представленными на рис. 2.1.

Итак, ДМА – это подход к изучению многомерных массивов и временных рядов, базирующийся на моделировании предела в конечной ситуации и реализованный в серии алгоритмов. Основой построения конечного предела послужил более устойчивый по сравнению с математическим характер восприятия человеком дискретности и стохастичности. Другими словами, то, что академик Кейлис-Борок называл моделированием «на глаз»: решает не математика, а эксперт, и его решение нужно формально выразить [Кейлис-Борок, 1968]. Нечёткая математика и нечёткая логика обладают достаточными возможностями для моделирования экспертных представлений и рассуждений, и потому именно они послужили технической основой ДМА.

ДМА не противоречит классическим методам обработки данных, а дополняет их, но по сравнению с ними значительно более ориентирован на эксперта.

В изучении данных, представленных временными рядами, выделяются две последовательные задачи. Первая из них – выделение сигнала на фоне шума. Вторая – распознавание аномальных участков выделенного сигнала.

Диссертация посвящена второй задаче, важной в исследованиях, связанных с ретроспективным анализом и оценкой возможного возникновения таких природных явлений как землетрясения, извержения вулканов, магнитные бури и т.д., а также явлений, носящих техногенный характер. Исходной информацией при этом являются наблюдаемые временные ряды геофизических данных. Эта работа продолжает цикл исследований [Гвишиани и др., 2002а, 2002б;

Mikhailov et al., 2003;

Гвишиани и др., 2003а, 2003б;

Gvishiani et al., 2004;

Агаян и Соловьев, 2004;

Соловьев и др., 2005;

Zlotnicki et al., 2005;

Агаян и др., 2005;

Богоутдинов и др., 2007], в которых описывается новый подход к исследованию аномалий.

К настоящему моменту ДМА имеет важные геолого-геофизические и геодинамические приложения [Гвишиани и др., 2002б;

Mikhailov et al., 2003;

Zlotnicki et al., 2005;

Соловьев и др., 2005;

Агаян и др., 2005;

Богоутдинов и др., 2007]. Среди них изучение аномалий на сейсмических, геоэлектрических, геомагнитных, и гравитационных записях, поиск магнитных аномалий, мониторинг вулканов, геодинамические приложения, геоэкологические исследования мест возможного захоронения радиоактивных отходов. В то же время сфера приложений ДМА существенно шире. Так, описанные ниже алгоритмы могут быть использованы в анализе временных рядов самой различной природы.

Общепринятые алгоритмы выделения аномалий на временных рядах основываются преимущественно на статистическом и частотно-временном анализах. Созданные в рамках ДМА алгоритмы поиска аномалий на временных рядах представляют собой иной подход к моделированию рассуждений и действий человека при поиске аномалий, по сравнению с подходами к распознаванию аномальных событий, перечисленными в историческом экскурсе. В рамках ДМА – это попытка моделирования логики интерпретатора, распознающего «на глаз» аномалии на записи, с целью ее дальнейшего автоматизированного использования для анализа больших массивов данных, не поддающихся ручной обработке. Трактовка аномальности является свободным параметром этих алгоритмов, а потому они способны работать с очень широким пониманием аномальности на временных рядах и могут моделировать практически любое экспертное мнение по этому вопросу.

Алгоритмы DRAS, FLARS и FCARS [Гвишиани и др., 2003б;

Gvishiani et al., 2004;

Гвишиани и др., 2008б] дают оценку границ искомых аномалий и осуществляют их морфологический разбор в виде начальной, центральной и конечной стадий с выделением сильных и слабых фаз в центральной стадии. Достаточная «гибкость» алгоритмов обеспечивается посредством широкого набора «выпрямлений» [Гвишиани и др., 2003б;

Gvishiani et al., 2004;

Zlotnicki et al., 2005;

Гвишиани и др., 2008а, 2008б], возникающих при моделировании работы интерпретатора.

Упрощая работу интерпретатора, визуально определяющего аномалии на записи, мы понимаем ее следующим образом. Сначала он скользит взглядом по записи, оценивая для себя в терминах положительных чисел активность ее небольших фрагментов. При этом выработанные числовые оценки «мысленно» присваиваются фрагментам или центрам фрагментов записи. Так от исходной записи интерпретатор переходит к неотрицательной функции, которую естественно назвать «выпрямлением» записи.

Действительно, ее точкам, более активным с точки зрения искомых сигналов, будут соответствовать большие значения этой функции (выпрямления). Далее, поиск интерпретатором аномалий на записи сводится к поиску возвышенностей на ее выпрямлении, отвечающим наиболее активным участкам записи. Таким образом, интерпретатор работает на двух уровнях: локальном – выпрямлении записи, и глобальном – поиске возвышенностей на выпрямлении.

Естественно, предложенная упрощенная модель логики интерпретатора не может рассматриваться, как единственная и/или универсальная. Кроме того, рассуждения интерпретатора во многом определяются тем конкретным типом аномалий (данных), которые он рассматривает. Представляется, однако, что процесс «выпрямления» в той или иной форме оказывается «задействованным» в любом случае.

Локальный уровень: построение выпрямления записи. Аномалия на записи (временном ряде) – понятие неоднозначное, видоизменяющееся как от записи к записи, так и в рамках одной записи. Так же как и для других, интуитивно ясных математических понятий (например, элемент множества), мы не пытаемся дать ее строгого определения.

Аномальность возникает из примеров, которые даются экспертами. В рамках ДМА для адекватного моделирования «аномалий» (зон повышенной активности) применяется открытый к пополнению набор «выпрямлений». Точные конструкции приведены в разделе 2.2.2.

Глобальный уровень: поиск возвышенностей на выпрямлении. Примеры показывают, что рельеф выпрямления может быть устроен достаточно сложно (см. раздел Аномалии могут не обладать постоянно высокой активностью, быть 2.2.2).

неоднородными (активных участков больше, но их разделяют «спокойные» точки).

Соответствующие им участки выпрямления представляют собой осциллирующие возвышенности. Естественно искать «платформу», то есть связное основание такой возвышенности и на ней указать искомые «всплески». Для этого необходима более тонкая, чем просто выбор по вертикальному уровню, процедура выделения возвышенностей на y (k ). Эта процедура должна сочетать в себе процесс объединения (поиск платформ) и процесс размежевания (вырезание всплесков внутри платформ) [Гвишиани и др., 2008а]. Для поиска больших значений выпрямления используются нечеткие сравнения (см. раздел 2.2.3).

2.2.2. Выпрямления и их примеры kh, h 0, k 1, 2, Пусть дана дискретная положительная полуось и КВР h y yk y(kh), определенный на отрезке (периоде регистрации) T. Введем h параметр локального обзора 0, кратный h :. Назовем фрагменты локального h обзора записи y с центром в kh T ее отрезок:

2 k y yk, h, yk,, yk.

h h Определение. Если J k y совокупность фрагментов локального обзора записи y и : J, где - множество положительных действительных чисел, то суперпозицию k k y k y y (k ) назовем выпрямлением y на основе.

def Собственно отображение будем называть выпрямляющим функционалом.

Выпрямление можно считать определенным удачно, если то, что интерпретатор объявляет аномалиями на записи, переходит к возвышенности на выпрямлении.

Соответственно для построения выпрямления крайне полезным оказывается наличие материала обучения, т.е. обработки достаточно длительной части записи экспертом.

Примеры выпрямлений.

1. Длина фрагмента обзора L k y j k h y j 1 y j k h 2. Энергия фрагмента обзора E k y j k h y yk, где yk k k h j k h y j 2 h j h h 3. Отличие фрагмента обзора от его регрессии n-го порядка:

k h [y Rn ( k y ) Regrk y ( jk )]2, n j j k h где - оптимальное среднеквадратичное приближение n-го порядка n Regrk y фрагмента k y. Заметим, что при n=0 получается предыдущий функционал энергия:

k k k y y yk E ( k y ) h h h h 2 y j yk, R0 ( y ) Regr 0 k Regr ( jh) 2 h k y k y j j j k j k j k h h h 4. Осцилляция фрагмента обзора:


k k h h O( y ) max y j min y j [Гвишиани и др., 2003б].

k j k j k h h Единый локальный уровень семейства алгоритмов ДМА для анализа временных рядов состоит в построении выпрямления y и переходе к нему от записи y. Это преобразование моделирует первый этап анализа, проводимого интерпретатором «на глаз». На рис. 2.2а приведена запись y естественного электрического потенциала в окрестности вулкана Ла Фурнез (остров Реюньон, Франция;

8-9 марта 1998 года), на рис.

2.2б – ее выпрямление с помощью выпрямляющего функционала «Энергия E k y », а на рис. 2.2в – ее выпрямление с помощью выпрямляющего функционала «Длина L k y ».

Рис. 2.2. Примеры выпрямлений записи: а - запись собственного электрического потенциала в окрестности вулкана Ла Фурнез (остров Реюньон, Франция;

8-9 марта года);

б - выпрямление этой записи с помощью выпрямляющего функционала “энергия”;

в - выпрямление с помощью выпрямляющего функционала “длина”.

2.2.3. Нечеткие сравнения Во многих случаях обычная мера превосходства одного числа над другим в виде их разности оказывается слишком грубой. В частности, алгоритмы ДМА требуют более тонких конструкций сравнения чисел.

Определение. Нечеткое сравнение n(a, b) действительных чисел a и b измеряет в знакопеременной шкале отрезка [-1,1] степень превосходства “ b ” над “ a ”:

n(a, b) mes(a b) [1,1]. (2.19) Таким образом, роль нечеткого сравнения может играть любая функция [1,1], возрастающая по b при фиксированном a и убывающая по a при f (a, b), f :

фиксированном b (возрастание и убывание понимаются при этом в обычном смысле) с дополнительными граничными условиями a lim f (a, b) 1 b lim f (a, b) 1 a f (a, a) 0.

b a Действительно, такие функции будут обладать свойствами, которые естественно требовать при сравнении чисел.

Если n(a, b) - нечеткое сравнение, а - монотонно возрастающее преобразование отрезка [1,1] в себя, то суперпозиция ( n)(a, b) также будет нечетким сравнением, которое называется вариацией n при помощи. Выбор дает возможность усиливать или ослаблять базовое сравнение n.

В алгоритмах семейств алгоритмов ДМА для анализа временных рядов достаточно использовать нечеткие сравнения, определенные на положительных числах.

Действительно, обработка записей этими алгоритмами ведется через их выпрямления, принимающими только положительные значения. Введем следующее семейство базовых нечетких сравнений n (a, b), 0, а также их вариации специального вида n, (a, b).

Определение. Если a, b, то 1. для любого ba n (a, b) (a b ) 2. для любого (1,1) положим n, (a, b) (n (a, b)), где t 1, t [,1] (t ) t, t [1, ] Такая вариация корректна: n0, (a, b) 0 (n (a, b)) n (a, b). При 0 получается усиление n, при 0 - наоборот, его ослабление. В дальнейшем под сравнением n(a, b) понимается какое-либо n, (a, b), 0, 1 1.

Нам понадобится расширение n(a, b) до понятия нечетких сравнений n(a, A) и n( A, a) произвольного числа a 0 с произвольной взвешенной совокупностью чисел A (ai, wi ) |1, ai, N. Такое расширение неоднозначно. Каждый,0 wi вес ai, i 1, N вариант такого расширения по-своему дает формализацию понятия «большой (маленький) относительно A (по модулю A )». Мы понимаем n(a, A) mes(a A), как функцию принадлежности на к нечеткому понятию «быть маленьким по модулю A » и n( A, a) mes( A a), как функцию принадлежности на к нечеткому понятию «быть большим по модулю A ».

В дальнейшем развитии алгоритмических конструкций алгоритмов использовались три расширения:

Бинарное расширение.

iN 1 n(a, ai ) wi nb (a, A) [1,1] iN 1 wi (2.20) iN 1 n(ai, a) wi nb ( A, a) N [1,1] i 1 wi Гравитационное расширение.

iN 1 ai wi Пусть grA центр тяжести совокупности A, т.е. grA, тогда iN 1 wi ng (a, A) n(a, grA) [1,1] (2.21) ng ( A, a) n( grA, a) [1,1] -расширение.

Левый момент l (a, A) (a ai )wi : ai a есть довод за максимальность “ a ” по модулю A. Соответственно, правый момент r (a, A) (ai a)wi : ai a есть довод за минимальность “ a ” по модулю A. Тогда n (a, A) n l (a, A), r (a, A) [1,1]. (2.22) n (a, A) n r (a, A), l (a, A) [ 1,1] Представляется естественным считать, что если выполнение некоторого свойства 0, 12 означает сильно выражается в шкале [1,1], то попадание в отрезок 1, (слабо-) экстремальное проявление этого свойства. Следуя этому, формализуем понятия «большой» и «маленький» по отношению к взвешенной совокупности A (по модулю A ).

Определение. Назовем число a 0 для данной взвешенной совокупности A на основании данного нечеткого сравнения n и его расширений n( A, a), n(a, A) n( A, a) 1,1 n( A, a) 0, 1 ;

1. сильно (слабо) большим, если 2 2. сильно (слабо) маленьким, если n(a, A) 1,1 n(a, A) 0, 1.

2 Пример. Мера экстремальности (k ) в алгоритме FLARS (мера FLARS’а) получается как результат сравнения (2.20) значения выпрямления y (k ) с взвешенной совокупностью Im y (k ) y (k ), k (k ), k T, где k (k ) - модель глобального обзора на отрезке [a, b] записи y в точке k :

(k ) n Im y (k ), y (k ), где |k k |. (2.23) k (k ) max | k a |,| k b | Стандартный FLARS [Gvishiani et al., 2004] получается при использовании конструкции -расширения (2.22). Аналогично можно построить две другие версии FLARS, используя бинарную (2.20) и гравитационную (2.21) конструкции. Последние приводят к более «жестким» моделям алгоритма FLARS. Степень различия в «жесткости»

принятия решения этими тремя версиями алгоритма FLARS представлена на следующем синтетическом примере (рис. 2.3).

Рис. 2.3. Примеры применения алгоритма FLARS с различными конструкциями расширения нечеткого сравнения. Черным цветом обозначены распознанные аномальные участки: а - мягкая - конструкция, n определено формулой (2.22);

б – умеренная бинарная конструкция, nb определено формулой (2.20);

в – жесткая гравитационная конструкция, ng определено формулой (2.21).

Пример. Параметр локального обзора в алгоритмах DRAS и FLARS [Гвишиани и др., 2003б;

Gvishiani et al., 2004] означает близость на отрезке регистрации T записи y. С помощью нечетких сравнений его выбор также может быть автоматизирован: обозначим через dT | k k |: k k T совокупность всех нетривиальных расстояний на T. Тогда - сильноминимальный элемент по mod dT и является решением уравнения n(, dT ) 1.

2.3. Алгоритм распознавания выбросов на минутных данных SP (SPIKE) Неформальная логика, лежащая в основе поиска выброса на записи, может быть коротко описана следующим образом: “Выброс – цепь связанных друг с другом сингулярных фрагментов записи, представляющих собой значительные по вертикали и незначительные по горизонтали возмущения, не приводящая к смещению уровня записи” [Богоутдинов и др., 2010].

Аналогично с алгоритмами [Агаян и др., 2005;

Гвишиани и др., 2008а;

2008б], построенный в этой работе алгоритм распознавания выбросов на записи имеет два уровня.

На локальном уровне ищутся сингулярные фрагменты, а на глобальном уровне анализируются их сочетания на предмет смещения уровня записи.

Запись (магнитограмму) мы будем интерпретировать как временной ряд y { yt y(t )}, заданную на отрезке (периоде регистрации) T дискретной полуоси {t kh, h 0, k 1,2, }, где h – шаг дискретизации, k – узел наблюдения. Без h потери общности положим h 1.

y y(t ) - это Локальный уровень. Сингулярный фрагмент на записи значительное по вертикали (сингулярное по значениям) и незначительное по горизонтали (сингулярное по времени, кратковременное) ее возмущение. Поскольку сингулярный фрагмент значителен по вертикали, он обязательно должен включать в себя резкие, стремительные динамики на y(t ). Под динамиками на записи y(t ) везде в дальнейшем понимаются участки резких стохастических трендов. Идеальный пример – это двухэлементная динамика [ yt, yt h ] с очень большой по модулю производной | Dy (t ) |.

Однако мы находимся в стохастической ситуации, отличной от идеальной.

Соответственно, на проявление “стремительности” и “резкости” записи y(t ) мы даем динамике записи не более 2 тактов, где. Их поиск на y(t ) будем осуществлять h с помощью выпрямления “осцилляция” Oy (t, ) [Гвишиани и др., 2008а;

2008б] (рис.

2.4):

Oy (t, ) max | y(t ) y(t ) |: t, t [t, t ] (2.24) и нечеткого сравнения n [Гвишиани и др., 2008а] (см. раздел 2.2.3). Под n мы будем подразумевать какое-либо из нечетких сравнений “Минковского” ba, a, b, 0 [Колмогоров, Фомин, 1981;

Гвишиани и др., n(a, b) n (a, b) (b a ) 2008а]. Оно поможет нам выбрать очень большие значения для Oy (t, ) :

A A(, n) T :t A n(Oy (T ), Oy (t )), [0.75,1], (2.25) где Oy (t ) Oy (t, ) и Oy (T ) {Oy (t, ): t T }.

Magnetogram - - - 50 55 60 65 70 = 10, = 0. 50 55 60 65 70 Рис. 2.4. Фрагмент магнитограммы (вверху) и построенное для нее выпрямление “осцилляция” Oy (t, ) (внизу). Большие значения Oy (t, ) находятся выше отмеченного уровня.

Именно на отрезках [t, t ] при t A и лежат резкие динамики y |dt, dt [bt, et ] [t, t ]. Мы называем их сингулярными фрагментами или элементарными динамиками на y(t ) и отождествляем с носителем dt : y |dt dt.

Следующий шаг – определение dt (рис. 2.5). Поскольку динамика dt кратковременна по горизонтали и сингулярна по вертикали, то на отрезке dt обязательно будут лежать точки со значительными по модулю производными. Обозначим их совокупность через B :

B B(, n) T : t B n(| Dy (T ) |,| Dy (t ) |), [0.5,1]. (2.26) - - - - - - 235.66 235.68 235.7 235.72 235.74 235.76 235. (а) - - - - 323.62 323.64 323.66 323.68 323.7 323.72 323. (б) Рис. 2.5. Примеры элементарных динамик. Они выделены черными цветом.

Тогда концы dt лежат в B. Так мы “боремся с инерцией” при определении dt с помощью отбрасывания его возможных слабых концов (“энергичная динамика” dt должна “энергично начинаться” и “энергично заканчиваться”).

Итак, с помощью горизонтального параметра h, нечеткого сравнения n и и значительного – мы двух уровней вертикальной сингулярности – очень большого формализовали понятие сингулярного фрагмента (элементарной динамики) dt на записи y (t ). Итог локального уровня – совокупность элементарных динамик {dt, t A}. Из них, на глобальном уровне, и будут “складываться” выбросы.

Глобальный уровень. Посмотрим на запись y(t ) глобально, перенумеруем динамики dt, t A и обозначим их через {dk }, k 1,,| A |.

Теперь определим выброс s на y(t ) как цепь довольно близко расположенных друг с другом элементарных динамик d k, не приводящую к смещению базового уровня y(t ).

Пусть h параметр достаточной близости между динамиками d k в выбросе s :, и – результат предварительного анализа на стадии обучения. Выброс s определяется объединением k k* dk :| ek bk 1 |, k k *,, k ** 1 и представляет ** k собой фрагмент записи y(t ) с началом bk * и концом ek** : s y |[b.

,e ] k* k** Определим крылья (s) и (s) выброса s (рис. 2.6). Они помогут выразить его вертикальную сингулярность на глобальном уровне и, тем самым, завершить формализацию s. Положим (s) y |[b,b * ] k* k.

(s) y |[e **,e ** ] k k - - - - - - 235.66 235.68 235.7 235.72 235.74 235.76 235. (а) - - - - 323.62 323.64 323.66 323.68 323.7 323.72 323. (б) Рис. 2.6. Серым цветом обозначено множество (s) (s), черным цветом – множество s.

Сохранение выбросом базового уровня записи y(t ) означает ее спокойствие на объединении (s) и (s) по сравнению с s (рис. 2.7), что формализуется нечетким сравнением n.

n(O( (s) (s)), O(s)) 0. - - - - - - 235.66 235.68 235.7 235.72 235.74 235.76 235. (а) n(O( (s) (s)), O(s)) 0. - - - - 323.62 323.64 323.66 323.68 323.7 323.72 323. (б) Рис. 2.7. Значение n(O( (s) (s)), O(s)) больше 0.5 говорит о наличии выброса (черный цвет).

Последовательная реализация описанных выше шагов приводит к объективному распознаванию выбросов на записи временного ряда y(t ) и представляет собой самодостаточный алгоритм их поиска. По аналогии с целью исследования будем называть его алгоритмом SP (сокращенно от SPIKE). Из (2.24)-(2.26) следует, что конкретная реализация алгоритма SP определяется выбором следующих свободных параметров:

–параметр обзора динамики, h – параметр достаточной близости h, между динамиками, [0.75,1] – уровень экстремальности осцилляции, (2.27) [0.5,1] – уровень значительности производной, каждый набор свободных параметров обозначим через (,,, ), а их совокупность через P.

Таким образом, построенный в рамках введенной математической модели алгоритм SP осуществляет единообразное формализованное выделение выбросов на временных рядах произвольной природы. Блок схема алгоритма SP приведена на рис. 2.8.

Рис. 2.8. Блок-схема алгоритма SP.

2.4. Алгоритм распознавания выбросов на секундных данных SPs (SPIKEsecond) Предлагаемый алгоритм SPs (от SPIKEsecond) нацелен на поиск на записи (временном ряде) y сингулярных выбросов (спайков) произвольной природы с простой морфологией, показанных на рис. 2.

Рис. 2.9. Примеры (а) положительного и (б) отрицательного выбросов.

Логика, лежащая в основе алгоритма, основана на следующей модели выброса.

Простой выброс (в дальнейшем выброс) представляет собой сингулярный S стохастический экстремум, имеет вершину t(S), в которой встречаются его энергичные стороны S l и S r, окруженные спокойными крыльями wl ( S ) и wr ( S ) (рис. 2.9). Ниже приведены формальные определения перечисленных понятий: вершина t(S), энергичность, стороны S l и S r, спокойствие, крылья wl ( S ) и wr ( S ). Графически некоторые из этих понятий отражены на рис. 2.9.

Алгоритм SPs начинает поиск выброса S с определения его вершины t t (S ), выбирая тот или иной экстремум на y. Далее SPs строит стороны S l и S r вокруг t. Если они оказываются трендами, энергичными на записи y, то тройка S (S l, t, S r ) образует квазивыброс на y (рис. 2.10), с которым SPs продолжает работать. Далее алгоритм ищет спокойные крылья wl ( S ) и wr ( S ), соответственно, слева и справа от S l и S r. Наличие таких крыльев делает квазивыброс S изолированным от других квазивыбросов, то есть выбросом (рис. 2.10б). Именно на распознавание таких выбросов на записи y нацелен алгоритм SPs.

Рис. 2.10. Примеры квазивыбросов: (а) квазивыброс не является выбросом, (б) квазивыброс является выбросом.

Формирование сторон ( S l, S r ) и крыльев ( wl, wr ) выброса требует распознавания на записи y связи «спокойствие-энергичность» и «возрастание-убывание». В алгоритме SPs это делает так называемый -анализ. Таким образом, алгоритм SPs состоит из трех блоков: «-анализ», «Поиск квазивыбросов» и «Выбор выбросов». На рис. 2.11 приведена его блок-схема.

Рис. 2.11. Блок-схема алгоритма SPs.

Перед точным описанием каждого блока алгоритма SPs подведем промежуточный итог в виде следующих положений:

1) В поиске выбросов необходимо различать на исходной записи спокойные и энергичные участки.

2) В свою очередь, энергичные участки нуждаются в дальнейшей классификации на возрастающие и убывающие. Действительно, выбросы – это квазивыбросы, окруженные спокойными крыльями, а квазивыбросы представляют собой комбинации энергичных возрастаний и убываний.

3) Учитывая принципиальную применимость алгоритма к широкому классу временных рядов различной природы, следует определить спокойствие энергичность, возрастание-убывание в общей стохастической ситуации.

Блок 1: «-анализ». В основе распознаваний «спокойствие-энергичность» и «возрастание-убывание» в алгоритме SPs лежит линейная регрессия [Draper and Smith, 1966]. Она просто и эффективно решает эти проблемы своим угловым коэффициентом:

его знак отвечает за возрастание и убывание, а модуль – за спокойствие и энергичность.

Однако линейной регрессии можно верить только на непродолжительных фрагментах записи y. Т.о., понадобилась оригинальная процедура для распространения понятий «спокойствия-энергичности» и «возрастания-убывания» на произвольные фрагменты записи y.

Перейдем к точному изложению -анализа в форме приведенных ниже последовательных шагов.

1) Исходная запись (временной ряд) y предполагается заданной на отрезке (периоде {kh, k 1, 2, }, регистрации) T [a, b] дискретной положительной полупрямой h h 0:

y { yk y(kh), kh T } Без ограничения общности положим h 1, так что.

h и отрезок [k, k ] T, то назовем -фрагментом k y записи y ее 2) Если k, ограничение на [k, k ] :

k y { yk,, yk }.

3) Введем в рассмотрение линейную регрессию [Draper and Smith, 1966] фрагмента k y :

Regr( k | k y) r qk, k [k, k ]. Коэффициенты r r (k ) и q q(k ) определяются с помощью метода наименьших квадратов, когда минимизируется сумма квадратов отклонений реальных значений yk от значений регрессии Regr(k | k y) на интервале [ k, k ].

4) Распознавание «возрастание-убывание» для -фрагментов записи y определяем следующим образом:

фрагмент k y – возрастающий, если Regr(k | k y) Regr(k | k y), фрагмент k y – убывающий, если Regr(k | k y) Regr(k | k y).

-фрагментов 5) Распознавание «спокойствие-энергичность» для на записи y выполняется на основе:

модуля F (k y) | Regr(t | k y) Regr(t | k y) |, разности считающимся в алгоритме SPs показателем активности фрагмента k y, формализации для k y с помощью нечеткого сравнения понятий сильноактивного (энергичного) и слабоактивного (спокойного) -фрагмента.

6) Нечеткое сравнение неотрицательных чисел и измеряет в A B n( A, B) знакопеременной шкале отрезка [1,1] степень превосходства B над A (см. раздел 2.2.3):

n( A, B) mes( A B) [1,1].

Во многих случаях обычная линейная мера превосходства B над A в виде их разности B A оказывается слишком грубой. Тогда целесообразно использование различных вариантов нечетких сравнений A и B с нормировкой. В алгоритме SPs мы используем нечеткое сравнение B A, A 0, B 0, 0 ;

n (0, 0) 0.

n ( A, B) (2.28) ( A B ) 7) Распознавание «спокойствие-энергичность» для -фрагментов записи y использует нечеткое сравнение n (рис. 2.12):

n( F ( k y ), F ( k y )) 1, где 1 (0,1], (2.29) фрагмент k y – энергичный, если k [ a,b ] b a n( F ( k y), F ( k y )) 2, где 2 (0,1]. (2.30) фрагмент k y – спокойный, если k [ a,b ] b a Рис. 2.12. Фрагмент записи (сверху) и соответствующий график F ( k y), рассчитанный для 5 (снизу). Значения F ( k y) выше отмеченного уровня соответствуют энергичным фрагментам k y. Здесь 0.5 и 1 0.5.

8) Локальный взгляд на запись y в алгоритме SPs моделируется мягко выбором множества {1,, m } (2.31) локальных размеров обзора i [Гвишиани и др., 2008а;

2008б]. Вариативность ( m 1 ) придает устойчивость и гибкость алгоритму SPs в его последующих, уже глобальных на распознаваниях «спокойствие-энергичность», «возрастание y, убывание».

i -фрагмент Будем считать -фрагментом записи y любой ее iki y для подходящего i и ki [a, b i ], i 1,, m. С помощью -фрагментов и их связных объединений распознавания «спокойствие-энергичность» и «возрастание-убывание»

продолжаются на произвольные фрагменты записи y. Фрагмент y |[ c,d ] считается возрастающим (убывающим), если существует его связное покрытие возрастающими (убывающими) -фрагментами. Формально это выглядит так:

y |[ c,d ] – возрастающий [c, d ] [c j, d j ], где p j c c1, d d p, c j [c j 1, d j 1 ], j 2,, p, d j [c j 1, d j 1 ], j 1,, p 1 (рис. 2.13) и y |[ c j,d j ] – возрастающий -фрагмент на y для всех j 1,,p.

Соответственно, y |[ c,d ] – убывающий [c, d ] [c j, d j ], где p j c c1, d d p, c j [c j 1, d j 1 ], j 2,, p, d j [c j 1, d j 1 ], j 1,, p 1 (рис. 2.13) и y |[ c j,d j ] – убывающий -фрагмент на y для всех j 1,,p.

Аналогично, фрагмент y |[ c,d ] считается спокойным (энергичным), если существуют его связное покрытие спокойными (энергичными) -фрагментами:



Pages:     | 1 | 2 || 4 | 5 |   ...   | 7 |
 





 
© 2013 www.libed.ru - «Бесплатная библиотека научно-практических конференций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.