авторефераты диссертаций БЕСПЛАТНАЯ БИБЛИОТЕКА РОССИИ

КОНФЕРЕНЦИИ, КНИГИ, ПОСОБИЯ, НАУЧНЫЕ ИЗДАНИЯ

<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ


Pages:   || 2 | 3 | 4 | 5 |
-- [ Страница 1 ] --

Министерство образования и науки Российской Федерации

Московский государственный университет экономики,

статистики и информатики (МЭСИ)

Е.В.

Черепанов

МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ

НЕОДНОРОДНЫХ СОВОКУПНОСТЕЙ

ЭКОНОМИЧЕСКИХ ДАННЫХ

Москва 2013

УДК 519.86

ББК 65.050

Ч 467

Черепанов Евгений Васильевич. Математическое моделирование

неоднородных совокупностей экономических данных. Монография / Мос-

ковский государственный университет экономики, статистики и информати ки (МЭСИ). – М., 2013. – С. 229.

Рецензенты:

Мхитарян В.С., д.э.н., проф. руководитель департамента статистики и анализа данных НИУ ВШЭ;

Вартазарова Л.С., д.э.н., зам. Генерального директора Информационно-аналитического агентства «МиК - Маркетинг и Консалтинг»

В монографии изложен материал по использованию стохастических ме тодов при математическом моделировании неоднородных совокупностей экономических данных по случайным выборкам.

Рассмотрены задачи статистического оценивания частот встречаемости качественных (нечисловых) признаков в неоднородной совокупности, непа раметрического полиграммного оценивания функционалов, зависящих от (аналитически неизвестного) распределения, задача выявления недостающих и неточных данных в эмпирических таблицах показателей, задачи экстрапо лирования последовательностей экономических показателей по короткой ре троспективе наблюдения и статистической классификации.

Отдельно стоит пятая главу, где изложен не имеющий мировых аналогов подход, который позволяет с единой позиции рассмотреть основные характе ристики потребления и производства (торговли) на рынке конкурентных то варов. Пока этот подход разработан лишь теоретически, в связи с чем требует обсуждения и дальнейшего развития.

Для специалистов по эконометрике, математической экономике и ком пьютерной обработки результатов выборочных обследований, а также аспи рантов и студентов старших курсов этих специальностей.

© Московский государственный университет ISBN 978-5-7764-0775- экономики, статистики и информатики, © Черепанов Евгений Васильевич, СОДЕРЖАНИЕ Введение.................................................................................................................. Глава 1. Стохастические методы в социально-экономических исследованиях: состояние и направления развития.................................... 1.1. Специфика использования стохастического формализма в маркетинговых и социально-экономических исследованиях.......................... 1.2. Дихотомизация описания социально-экономических систем как основной принцип работы с эмпирическими нечисловыми данными........ 1.3. Проблема полноты и достоверности таблиц эмпирических данных.

Статистическое прогнозирование в экономических и технико-экономических исследованиях............................................................ 1.4. Статистическая классификация многомерных объектов.

Соотношение понятий неопределенности, нечеткости и случайности............. Выводы по главе 1...................................................................................................

......... Глава 2. Многомерные обобщения гипергеометрического распределения и их асимптотика как основа изучения неоднородных (структурированных) множеств........................................... 2.1. Многомерные обобщения гипергеометрического распределения (ГГР).......... 2.2. Случайные и квотные оценки в социальных исследованиях и маркетинге потребительских рынков................................................................. 2.3. Полиномиальное распределение (ПР) и его обобщения..................................... 2.4. Непрерывные аналоги распределений полиномиального типа.......................... Выводы по главе 2............................................................................................................ Глава 3. Статистические оценки частот встречаемости булевых признаков по случайной неоднородной выборке.

Непараметрические полиграммные оценки.................................................. 3.1. Статистические оценки частот встречаемости булевых признаков по случайной неоднородной выборке с использованием МГГР........................ 3.2. Статистические оценки частот встречаемости дихотомических признаков для категорий населения....................................... 3.3. Метод группового анкетирования на «малых выборках»................................. 3.4. Полиграммные оценки и их использование при анализе непрерывных распределений экономических показателей.............................. Выводы по главе 3.......................................................................................................... Глава 4. Статистические методы выборочного оценивания в задачах социально-экономических исследований.................................. 4.1. Анализ полноты и достоверности данных в эмпирических таблицах значений экономических показателей................... 4.2. Непараметрическое прогнозирование и статистическое планирование экономической динамики.............................. 4.3. Типологическое пространство, функция сходства и анализ уровня экономических объектов.......................................................... 4.4. Статистическая классификация многомерных экономических и технических систем............................................................................................ Выводы по главе 4.......................................................................................................... Глава 5. Теоретико-математические основы маркетинга потребительских рынков.......................................................... 5.1. Потребление на многотоварном конкурентном рынке..................................... 5.2. Критерий максимизация прибыли продавца...................................................... 5.3. Издержки продавца (производителя).................................................................. 5.4. Зависимости между категориями потребления.................................................. Выводы по главе 5.......................................................................................................... Глава 6. Статистический анализ потребительских предпочтений (на примере московского рынка табачной продукции............................. 6.1. Оценка потребления марок табачной продукции.............................................. 6.2. Структура потребления табачной продукции.................................................... 6.3. Структура потребления в социальных «разрезах»............................................. 6.4. Оценка количества выкуриваемого табака в день и предпочтения москвичей по крепости табачных изделий............................. Выводы по главе 6.......................................................................................................... Заключение......................................................................................................... Библиографические ссылки............................................................................ ВВЕДЕНИЕ Экономика, по своей природе, наука стохастическая, что отме чал еще основоположник современной теории потребления У. Дже вонс: «Законы экономики носят настолько сложный характер, что проявляются только для совокупностей и должны изучаться мето дом средних» [296]. В «переводе» на современный язык это значит:

«Экономические законы носят вероятностный характер и должны изучаться статистическими методами».

Одно из основных направлений использования математики в эконометрических и прикладных социально-экономических рабо тах основано на выборочном методе. Но любые выборочные мето дики базируются на законе больших чисел, который (в форме тео ремы Я. Бернулли [28]) утверждает, что выборочные частоты встречаемости качественных признаков асимптотически сходятся к истинным значениям соответствующих вероятностей. Но этот не параметрический факт априори предполагает наличие большой се рии независимых и однородных наблюдений.

А социум (население, покупатели, электорат) практически все гда является неоднородным множеством (структурированным по различным номинальным шкалам).

В такой ситуации в эмпирических исследованиях решить про блему неоднородности (структурированности) наблюдений (сово купностей населения, потребителей, избирателей) можно на основе одного из двух подходов:

создав квотную выборку, репрезентативную по основным априорным классификациям структуре изучаемой совокупности;

математически корректно учесть при компьютерной обработке данных различия между структурами выборочного ансамбля и ис следуемой генеральной совокупности.

Собственно, в 30-е гг. ХХ века, когда отсутствовала вычисли тельная техника, у пионеров выборочных исследований и выбора фактически не было: раз считать условные вероятности не на чем, будем строить квотные выборки. Так квотная методология выбо рочных исследований просуществовала в почти неизменном виде до наших дней. В 70-е гг. ХХ века появились компьютеры, но их применение для обработки эмпирических данных свелось, почти исключительно, к использованию методов классической статисти ки, заимствованных из физических наук.

Квотная методология выборочных исследований, а также «стан дартные» компьютерные методы обработки эмпирических данных сводятся к использованию процедур классической статистики в предположении, что связанные с неоднородностью данных пробле мы решены на этапе формирования квотной выборки. Однако квот ный подход в принципе не может дать оценок частот встречаемости качественных признаков по категориям априорных классификаций.

Кроме того, создание квотной выборки для населения, проживаю щего на большой территории, даже по 3 - 4 номинальным шкалам (как видно, например, из монографий Ф. Йейтса [82], Л. Киша [298] и статьи М.С. Косолапова [99]) дело весьма дорогостоящее, методи чески сложное, а иногда и практически нереализуемое. Причем, при формировании квотной выборки неизбежно не учитываются многие классификации, создающие значимую неоднородность выборочного ансамбля, и тем самым, внося в выборочные оценки погрешности, которые не поддаются количественному анализу.

Второй подход, связанный со строгим математическим учетом различий в структурах исследуемой неоднородной совокупности и выборочного ансамбля из ее элементов, пока не нашел в мировой практике заметного развития. Решению этой проблемы и посвяще на большая часть предлагаемой монографии.

Выборочные методологии сегодня являются основным инстру ментарием эконометрических, социально-экономических, марке тинговых и политологических исследований эмпирического харак тера. Причем теоретической базой любой статистической процеду ры служат асимптотические свойства выборочных статистик, что позволяет считать теорию вероятностей основой всей выборочной методологии. Стоит отметить, что еще А.Н. Колмогоров подчерки вал 1: «… теория вероятностей начинается с закона больших чисел Я. Бернулли и найденного вскоре после этого Муавром нормально го приближения к биномиальному распределению». Но, схема ис пытаний Бернулли предполагает абсолютную идентичность усло вий опытов. А в социально-экономических и эконометрических ра ботах однородные выборочные ансамбли встречаются крайне ред ко.

Статистическая теория, развиваемая в фишеровских традициях [291], и выборочная методология, включая аспекты анализа эмпи рических данных, долгое время обеспечивали фактографическую основу прикладных работ. Однако, в силу специфики стохастиче ского анализа многих реальных данных (неоднородность и малые объемы выборок, наличие «выбросов», ошибки в таблицах данных, наличие смесей распределений и др.), классические статистические процедуры, резко теряя свою эффективность в эмпирических ис следованиях, оказываются малопригодными для обработки реаль ных эконометрических и социально-экономических данных.

До 60-х гг. ХХ века применение математических и стохастиче ских методов в эконометрических, социально-экономических и маркетинговых исследованиях носило весьма бессистемный харак тер, а используемые методы и процедуры «заимствовались» из ма тематической физики.

При этом вопрос о корректности и границах применимости ис пользуемых статистических методов в приложениях практически рассматривался крайне редко [186,187]. В этой связи Норберт Винер отмечал: «Успехи математической физики вызвали у социо логов и экономистов чувство ревности к силе ее методов. Чувство, которое едва ли сопровождалось отчетливым пониманием интел лектуальных истоков этой силы» [39].

Из предисловия к юбилейному изданию трактата Якоба Бернулли [28].

В 70-80-е гг. ХХ в. стали отличать методы прикладной стати стики (которую на Западе чаще называют анализом данных) от ме тодов математической статистики. Как отмечает А.И. Орлов [138], именно в это двадцатилетие была наработана основная база мето дов анализа данных, используемая в современных статистических методиках.

Выделились четыре направления разработки процедур при кладной статистики и анализа реальных (в том числе, эконометри ческих и социально-экономических) данных:

устойчивых к нарушениям априорных предпосылок (непара метрических и робастных) процедур оценивания моментов и характеристик непрерывных распределений;

измерения и анализа качественных (нечисловых) показателей (признаков);

классификации сложных многомерных объектов и систем;

прогнозирования многомерных последовательностей показате лей.

Но, к сожалению, классические методы математической стати стики до наших дней широко используются в прикладных исследо ваниях на малых объемах весьма неоднородных данных.

Например, авторы статьи [108], изучив около 200 кандидатских и докторских диссертаций в области медицины и биологии, показа ли, что в абсолютном большинстве из них статистические методы применялись некорректно.

Большой вклад в развитие прикладной статистики и многомер ного анализа данных был внесен западными учеными, среди кото рых особенно выделяются труды Т. Андерсена [19], П. Бикеля [31, 286], Г. Бокса [287], Г. Бриллинджера [36, 52], Я. Гаека [43, 293], М. Гупты [292], Э. Дидэ [50], Г. Дженкинса [287], Г. Дэйвида [59], М. Кендалла и А. Стюарта [83-86], Р. Литтла [109], Ф. Мостеллера [124], Дж. Тьюки [124, 188, 189, 286, 302, 303], Ф. Хампеля [202, 203, 286, 294], М. Холлиндера и Д. Вульфа [206], П. Хубера [207, 286, 295], также ряда других ученых.

Не менее велик вклад в развитие вероятностно-статистических методов социально-экономических исследований российских уче ных С.А. Айвазяна [9-13], М.Г. Дмитриева [51,52], А.М. Дуброва [54,55], А.А. Ершова [64], Э.Б. Ершова [65], Н.Г. Загоруйко [71-74], В.С. Мхитаряна [13,55,126-133], А.И. Орлова [139-141], В.С. Пуга чёва [152], Г.В.Раушенбаха [154], Ф.П. Тарасенко [172-175], Ю.Н.

Толстовой [177-184], В.Н. Тутубалина [186,187], Ю.Н. Тюрина [190-193] и ряда других ведущих специалистов.

Важные результаты по развитию стохастического аппарата со циально-экономических и социологических исследований, распо знаванию образов, статистической классификации, факторному ана лизу, прогнозированию и смежным вопросам получили Ю.И. Али мов [15-17], В.А. Балаш [25], Г.П. Бессокирная [29, 30], А.Д. Деев [49], Ю.Г. Дмитриев [172], Т.А. Дуброва [56, 57], С.А. Дубровский [58], И.С. Енюков [10-12], Г.С. Жукова [68, 69], И.Г. Журбенко [70], А.О. Крыштановский [103], Г.С. Лбов [106], Ю.П. Лукашин [111, 112], Б.Г. Миркин [121,122], Л.Д. Ме-шалкин [10-12, 117-119], В.И. Паниотто [143], В.Т. Перекрест [144], А.Б. Пересецкий [145], А.Г. Постников [149], П.С. Ростовцев [155], Г.А. Сатаров [162], А.А. Свешников [163,164], С.А.Смоляк и Б.П. Титаренко [169], Ю.К. Устинов [196], А.А. Филиппова [198] и ряд других отече ственных учёных.

Заметим, что анализ объектов нечисловой природы лежал в ис токах всей стохастической математики (схема испытаний Бернул ли, задачи выбора, с возвращением и без него, «разноцветных» ша ров из урны). Именно при изучении этих явлений были получены теорема Муавра-Лапласа, биномиальное, Пуассона и гипергеомет рическое распределения. А в середине ХХ в. была создана методо логия статистического анализа качества продукции [123,126], в ос нове которой лежат труды А.Н. Колмогорова и Б.В. Гнеденко. О современном состоянии нечисловой статистики можно судить по монографиям Ю.Н. Толстовой [180-182] и А.И. Орлова [139-141], а также по статье Ю.Н. Тюрина и Д.С. Шмерлинга [193].

Разработка методов нечисловой статистики неразрывно связана с совершенствованием выборочной методологии. Интересные взгля ды на природу случайности и репрезентативности выборочных ан самблей высказывались в работах Ф.Н. Ильясова [81], А.П. Чурико ва [280] и М.С. Косолапова [99]. Наиболее полное представление о современных взглядах на проведение выборочных исследований дают известные монографии западных исследований Ф. Йейтса [82], Л. Киша [298] и У. Кокрена [90].

Но и сегодня существует большое число (общих и частных) проблем в методиках анализа реальных социально-экономических данных (как количественных, так и нечисловых).

Изложенные в работе методы анализа неоднородных совокуп ностей на основе использования случайных выборок позволяют:

значительно повысить точность оценивания и полноту описа ния предпочтений и ожиданий населения по сравнению с квотными методами при маркетинге потребительских рынков и социально экономических обследованиях;

получать количественные результаты при малых объемах вы борочных данных, которые невозможно получить при массовом об следовании населения (покупателей, электората), что позволяет по высить адресность и эффективность рекламных и агитационных кампаний, объективность подготовки управленческих решений при проведении социально-экономической политики;

значительно повысить оперативность исследований и суще ственно снизить затраты на получение фактографической выбороч ной информации при проведение эконометрических, социально экономических, маркетинговых и электоральных исследований за счет случайного формирования выборки.

Изложенный в монографии материал формировался треть века (с 1978 по 2012 гг.) За этот период время автор, в качестве руково дителя и непосредственного участника исследований, провел более 50 исследовательских проектов. С 1982 по 1991 гг. было проведено более 20 научно-исследовательских работ (компьютерно-матема тический анализ данных в технико-экономических исследованиях, анализ и прогнозирование развития радио-электронных техниче ских систем, разработка и обоснование ряда экономических про грамм и др.) в институтах ВПК СССР.

С 1993 г. по настоящее время были проведены аналитические, социально-экономические и маркетинговые исследования в интере сах ряда крупных компаний («Газпром», «Даймлер-Бенц», «Young & Rubicam Inc.», «Регион-Информ», «Пепси-Кола», «Филип Мор рис», «Росгосстрах», Саяногорский и Новокузнецкий алюминиевые заводы, «Норильский никель» и др.), ряда крупных газет («АиФ», «Независимая», «Московский комсомолец», «Куранты» и др.), ряда банков и финансово-промышленных групп («Газпромбанк», «Ин комбанк», «Союз-Интеграция», «Менатеп», «Российский Кредит» и др.).

В 1992-1993 гг. по методике, разработанной автором (и опи санной в предлагаемой монографии) в режиме реального времени осуществлялось прогнозирование исходов голосований депутатов на VII, VIII и IX Съездах народных депутатов РФ и Конституцион ном Совещании РФ (1993 г.).

В 1996 году автор был координатором президентской кампании А.И. Лебедя, одновременно осуществляя руководство аналитиче ской работой для этой избирательной кампании. С 1993 по 2001 гг.

были проведены аналитические работы в рамках избирательных кампаний кандидатов в депутаты ГД ФС РФ, губернаторов и мэров в ряде регионов России (Москве, С.-Петербурге, Владимире, Яро славле, Иваново, Мурманске, Пскове, Самаре, Ростове, Новокуз нецке, Твери, Кирове, Перми, Красноярске, Иркутске и др., респуб ликах Хакасия и Коми).

В 2011 г. автор руководил и принимал непосредственное уча стие в исследовании «Особенности региональной специфики и са моидентификации современного казачества Юга России в процессе модернизации гражданского общества» [268, 275-277]. Работа, имея официальный статус «социально значимой», носила комплексный характер и проводилась в качестве президентского гранта в соответ ствии с распоряжением Президента РФ от 08.05.2010 г. № 300–рп.

*** Работа состоит из Введения, Заключения, шести глав и списка литературы (305 библиографических ссылок). Каждая глава состо ит из четырех разделов, которые, по мере надобности, разделены на пункты. В конце глав кратко сформулированы основные выводы по их содержанию. В Заключении изложены основные результаты проведенных исследований.

Пользуясь случаем, автор выражает глубокую благодарность д.э.н., проф. В.С. Мхитаряну и д.э.н. Л.С. Вартазаровой за многие ценные советы и помощь в работе над этой монографией.

ГЛАВА 1. СТОХАСТИЧЕСКИЕ МЕТОДЫ В СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ ИССЛЕДОВАНИЯХ:

СОСТОЯНИЕ И НАПРАВЛЕНИЯ РАЗВИТИЯ 1.1. Специфика использования стохастического формализма в маркетинговых и социально-экономических исследованиях 1.1.1. Математическая и прикладная статистика (анализ данных) При практическом использовании количественных методов в эконометрических и социально-экономических исследованиях, как правило, требуется оценить несколько числовых параметров (ча стоты встречаемости доминант общественного мнения и предпо чтений покупателей потребительского рынка, электоральных ожи даний и т.п.). Эти задачи обычно решаются на основе выборочных методик [2, 81, 82, 90, 99, 129-132, 156, 158, 240, 247, 257, 280, 298]. Отметим, что впервые идея выборочного метода, насколько это известно автору, была рассмотрена (в те времена, естественно, только на философском уровне) полтора века назад Огюстом Курно (см. гл.9 его трактата [105]).

Можно утверждать, что «сверхзадачей» прикладной статистики является достаточно точное определение вида распределения на ос нове имеющихся эмпирических данных (наблюдений выборочного ансамбля). Однако определение (оценка) вида распределения, во первых, не всегда реальна. Например, в силу малого объема выбо рочных данных, отсутствия априорных сведений о характере модель ного распределения и т.п. Во-вторых, во многих задачах знания рас пределения и не требуется, а необходимы лишь оценки характери стик этого распределения (моментов, моды, коэффициентов корреля ции показателей, значений частот встречаемости признаков и др.).

В этих случаях целью статистической обработки выборочных данных является оценка числовых характеристик распределения случайного вектора и вычисление выборочных статистик.

Статистическое оценивание базируется на законе больших чи сел. И это, в частности, означает, что анализируемый случайный выборочный ансамбль должен состоять (теорема Я. Бернулли) из независимых и однородных наблюдений. А условие однородности социально-экономических наблюдений во многих случаях бесспор но не выполняется. Следовательно, важно понимать, в какой мере априорные предпосылки теоремы Я. Бернулли выполняются в кон кретной прикладной области исследований. При этом «классиче ские статистические оценки» (выборочное среднее как оценка ма тематического ожидания и стандартное отклонение как оценка корня из дисперсии) являются наилучшими (в широком диапазоне требований) для случая многомерного нормального распределения.

А поскольку математическая статистика долгое время развива лась, главным образом, в связи с проблемой обработки физических измерений, ошибки которых хорошо описываются гауссовой кри вой, то методы классической статистики [84,91, 102,107,195,193] базируется на нормальном распределении.

При статистической обработке так называемых «реальных дан ных», т.е. не относящихся к области измерений в естественных науках, возникает целый ряд принципиальных трудностей [10, 15 17, 21, 64, 87, 117, 124, 127, 128, 140, 141, 169, 173, 186-190, 192, 193, 202, 203, 296, 297, 222, 234, 245, 262, 286, 293-295, 302, 303]:

малые объемы выборок, значительная неоднородность наблюде ний, существенные отклонения эмпирических распределений от модельного (обычно, гауссового), наличие неточностей и пропус ков значений в таблицах данных, принципиально плохая формали зуемость используемых в прикладной работе понятий и категорий.

Но на практике, в эмпирических экономических исследованиях по-прежнему часто используются классические статистические оценки (типа выборочного среднего и стандартного отклонения) на неоднородных данных. Такая ситуация заставила классика стати стики ХХ века Джона Уилдера Тьюки с юмором заметить, что «слишком часто статистическую теорию ошибочно называют «ма тематической статистикой», относительно которой многие практи ки придерживаются той опасной позиции, что научная работа мо жет быть хорошей «математической статистикой», не будучи ни хорошей математикой, ни хорошей статистикой» [188].

В приложениях, за рамками физических и смежных им наук, классические методы статистического оценивания резко теряют свою эффективность и становятся малопригодны для обработки эмпирических данных. В 70-е гг. это заставило понимать под ме тодами прикладной статистики [10-13, 31, 50, 55, 58, 73, 87, 124, 127, 138-141, 169, 171-173, 187-190, 192-193, 202, 203, 206, 207, 220, 222, 234, 245, 261, 286, 293-295, 302, 303] нечто отличное от мето дов статистики математической. Заметим, что в США и Запад ной Европе прикладную статистику называют «анализом данных».

Осознание принципиальных различий между методами матема тической и прикладной статистики в 70-80–е гг. ХХ века стало настолько велико, что распространилось мнение о том, что есте ственнонаучной традиции более соответствует не теоретико множественное описание вероятности по А.Н. Колмогорову [92, 96], а ее статистическое описание по Мизесу [120,299] – Смирнову [168] – Виллю-Постникову [149,196,198].

Наиболее аргументировано и последовательно взгляды такого рода отстаивали проф. МГУ В.Н. Тутубалин [186,187] и проф. Ю.И.

Алимов [15-17] (Екатеринбург). В ряде аспектов, связанных с асимптотическими свойствами вероятностных мер, описания по Колмогорову и по Мизесу не вполне эквивалентны, но для прило жений это не существенно.

В прикладных работах, в силу закона больших чисел, асимпто тические свойства выборочных статистик «напрямую» не зависят того, какие аксиомы заложены в основу стохастической теории. И правомерно не акцентировать внимание на формальной аксиомати ке самого понятия «вероятность».

Действительно, наблюдается ли в данном приложении стати стическая устойчивость, требуемая по Р. Мизесу, зачастую априори сказать очень трудно. С другой стороны, понятие «пространство элементарных событий», лежащее в основе аксиоматики А.Н. Кол могорова, является чистой абстракцией. Кроме некоторых триви альных случаев конечных множеств, в природе не существует объ ектов, адекватных этому понятию.

Подчеркнем, что речь идет именно об описании, а не об опреде лении, «вероятности» по А.Н. Колмогорову или по Р. Мизесу. При этом отметим, что и сам основоположник современной аксиомати ческой теории вероятностей академик А.Н. Колмогоров серьезно задумывался об условиях и границах приложений вероятностно статистического аппарата [93].

1.1.2. Концепция «анализа данных» Дж.У. Тьюки и статистические методы «с интенсивным применением ЭВМ»

Одно из самых интересных направлений прикладной статисти ки связано с концепцией «анализа данных», которая была предло жена Дж.У. Тьюки [124,188,189,302,303]. По существу, эта кон цепция является синтезом детерминированных, стохастических и эвристических подходов к анализу выборочных наблюдений. В рам ках концепции Дж.У. Тьюки выделяют три этапа анализа данных [188]: 1) «разведочный» («пробный») [189] анализ;

2) стохастиче ский анализ и 3) итоговый.

На этапе пробного анализа [189] данные интерпретируются как числовые массивы, а любые стохастические методы не использу ются. «К вероятности (в прикладных работах. – авт.) следует отно ситься серьезно, или оставлять ее в покое, если время от времени это может оказаться полезным или даже необходимым», подчерки вал Дж.У. Тьюки [188]. Цель этого этапа – первичная обработка числовой информации (сортировка данных, «сглаживание» рядов наблюдений, иногда – переход к логарифмическому масштабу). За метим, что первая книга [10] фундаментального справочного трех томника [10-12] по методам прикладной статистики С.А. Айвазяна с соавторами практически полностью посвящена методам пробного анализа данных.

На втором этапе работы с данными (собственно «анализ дан ных»), в рамках концепции Дж.У. Тьюки, используется широкий диапазон методов вероятностно–статистической обработки инфор мации. Включая «стабильные» (устойчивые) [16, 64, 117, 169, 202, 203, 284, 295] робастные и непараметрические (см. ниже) оценки, регрессионные методы [11, 13, 35, 42, 87, 124, 165, 208, 216], анализ временных рядов и последовательностей, методы «с интенсивным применением ЭВМ» [23, 215, 282, 303].

Смысл методов «с интенсивным применением ЭВМ» (не име ющих ничего общего с методом «Монте-Карло») сводится к созда нию мощной «вторичной статистики», по которой вычисляются итоговые оценки и определяются их погрешности. Критерии фор мирования искусственных вторичных данных весьма различаются (несколько подробнее см. ниже).

На третьем этапе «анализа данных» проводится экспертный анализ результатов и их итоговое обобщение. В случае необходи мости, на всех этапах исследования возможны итерационные уточ нения и обобщения.

Среди методов «с интенсивным применением ЭВМ» наиболее широко используется метод «джекнайф» («охотничий складной нож»), разработанный Дж.У. Тьюки [124,303]. Этот метод хорошо обоснован и может с пользой применяться при анализе «реальных данных». Его суть сводится к следующему.

Пусть имеется выборка n однородных и независимых наблюде ний. Исключим из нее m ( m n ) фиксированных наблюдений. По «урезанной» выборке (объема n - m) с помощью некоторой проце дуры получим «вспомогательную» оценку (1) искомого параметра и вычислим ее погрешность (1).

Этот прием совершенно правомерен: любые реальные наблю дений из выборки по каким-то причинам могли в нее и не попасть, отказ от части реально имеющейся информации вполне допустим.

Всего исключать из выборки объема n по m наблюдений мы можем n n!

N m m ! (n m) ! способами.

Например, при малой выборке n = 25 и m = 3 получаем N = 300. Следовательно, мы можем получить вторичную статистику вида ( (1), ( 2),..., ( N ) ) большой мощности N. Погрешность оцен ки ( j ) обозначим ( j ) ( j 1, N ). Итоговую оценку определим как некоторый параметр центра для «наблюдений» вторичной вы борки { (1), ( 2),..., ( N ) } с итоговой погрешностью, определяе мой вектором погрешностей { (1),..., ( N ) }.

В приложениях также широко применяется предложенный Брэдли Эфроном метод «бутстрэп» [282] («вспомогательный шну рок для натягивания сапог», иносказательно - «помогаю сам себе»).

В части метода «бутстрэп» кратко (подробнее см. [215]) можно ре зюмировать, что этот метод имеет неясную логику процесса созда ния вторичной статистики.

При использовании генератора случайных чисел «в режиме бутстрэп» [282], исследуемое эмпирическое (и аналитически неиз вестное) распределение фактически заменяется равномерным дис кретным распределением [215], определенным в точках единствен ной имеющейся выборки.

Работая именно с этим дискретным распределением, создается чрезвычайно мощная вторичная статистика. Но это значит, что вместо исследования стохастических характеристик изучаемой со вокупности, мы заняты изучением свойств самой процедуры «бут стрэп».

Не зря известный специалист по теории вероятностей и при кладной статистике проф. Ю.И. Алимов из Екатеринбурга однажды сравнил метод «бутстрэп» с попытками барона Мюнхгаузена вы тащить самого себя за волосы из болота 2.

1.1.3. Непараметрические и робастные методы статистики Как правило, реальные эмпирические данные плохо описыва ются гауссовой кривой. Причем, точность и стабильность (свой ство метода быть слабо чувствительным к нарушениям априорных предпосылок его использования) классических статистических процедур резко падает при отклонениях эмпирического распреде ления от нормального случая. Но эмпирические распределения случайных экономических, технико- и социально- экономических величин (часто положительно определенных), как правило, асим метричны и имеют ненормальный эксцесс, обладая правыми «тя желыми хвостами», в связи с чем классические статистические оценки зачастую оказываются весьма неточными и нестабиль ными.

В этой связи в 40-60-е годы ХХ века возник острый интерес к статистическим методам, «свободным от распределения». Из сво бодных от распределения методов наиболее развит аппарат непа раметрической статистики [141,172-175,190,192,193,293], к которо му, в частности, относятся процедуры рангового оценивания. Для использования непараметрических процедур не требуется знания вида модельного распределения, обычно предполагается только наличие каких-то (весьма общих) требований. Например, часто требуют непрерывность и ограниченность функции плотности ве роятности (ФПВ) и ее первых производных, наличие не более, чем счетного, числа точек разрыва ФПВ, конечность первых моментов распределения.

Из личной переписки автора с Ю.И. Алимовым, 1986 г.

Следовательно, «свободный от распределения» - понятие более сильное, чем «непараметрический», хотя на практике эти термины часто используются как синонимы. Прагматически важно, что не параметрические процедуры, не требуя априорных знаний об изу чаемом эмпирическом распределении, обладают высокой устойчи востью, несмещенностью и достаточно эффективны (или асимпто тически эффективны).

Например, коэффициент ранговой корреляции свободен от распределения, не зависит от случайных вариаций переменных и его значение сохраняется для любых монотонных преобразований переменных. А это очень кстати при работе с распределениями, об ладающими «тяжелыми хвостами». И эта оценка весьма эффектив на ( E r 9 / по отношению к оценке корреляционного момента r для нормального случая) [293].

Из фундаментальных трудов по непараметрической статистике следует выделить отечественные монографии Ф.П. Тарасенко [172,173] и Ю.Н. Тюрина [190,192,193], а также перевод моногра фии М. Холлиндера и Д. Вульфа [206].

Отметим и монографию Я. Гаека [293], которая может служить первоклассным пособием для систематического начального изуче ния непараметрической статистики. К сожалению, перевода на рус ский язык этой монографии не существует. Есть перевод его сов местной с З. Шидаком книги [43]. Но эта работа, требуя хорошей математической подготовки читателя, касается только описания и свойств ранговых критериев, а не их использования при построе нии процедур оценивания.

Крупнейший российский специалист по прикладной статистике Ф.П. Тарасенко подчеркивал, что непараметрические методы яви лись «сверхреакцией» математиков на тот факт, что эмпирические распределения обнаруживают большие отклонения от нормального случая. Ф.П. Тарасенко отмечал: «Создалось впечатление, что в статистических работах, выходящих за рамки физических измере ний, мы вообще ничего не знаем о виде эмпирического распределе ния. В результате, в середине XX в., стал активно разрабатываться аппарат непараметрической статистики. В ходе этих работ выясни лось, что некоторые общие свойства реальных распределений все же можно выделить» 3.

В итоге появился аппарат робастной статистики [31,55,63 65,117-119,124, 141,169,202-203,207,286,294,295,302,303]. Термин «робастный» (по-русски, наиболее близко, «крепкий, прочный») был введен Г. Боксом для обозначения свойств статистической процедуры быть, во-первых, достаточно эффективной в идеальных условиях (при строгом выполнении априорных требований) и, во вторых, быть стабильной (слабо чувствительной к отклонениям от идеальных условий). Приведенное «определение» робастности но сит описательный характер. Поскольку в каждом конкретном слу чае требуется оговорить, во-первых, в каком смысле понимается стабильность процедуры и, во-вторых, как сравнивать эффектив ность методов. После чего можно делать заявления вида «эта про цедура более робастна, чем та».

Можно считать, что робастные методы «по степени свобо ды от распределения» занимают «промежуточное» положение между непараметрическими и классическими процедурами стати стики.

Во многих случаях робастные методы опираются на представ ление изучаемого распределения как смеси базового с небольшой «добавкой» засоряющего распределения, т.е. модель распределения имеет вид F ( x) (1 ) G( x) H ( x) ;

0 1, где G(x) - «основное», а Н(х) – «засоряющее» распределение. В ка честве Н(х) на практике часто используют равномерное распре Цитируется по выступлению Ф.П. Тарасенко на одном из заседаний 5-й Всесоюзной школы – семинара по непараметрической и робастной статистике (Шушенское, 1985 г.). Попутно отметим, что выдающийся сибирский ученый Ф.П. Тарасенко в 1994 г. был официально признан «Человеком года» в США. В настоящее время Феликс Петрович возглавляет Международный факультет управления Томского госуниверситета.

деление. Первым модель такого типа предложил все тот же Дж.У. Тьюки, который использовал распределение вида:

F ( x) (1 ) (, ) (,3 ).

Здесь основное распределение является гауссовым:

1 t x Ф( x ) exp [ ] dt 2 с математическим ожиданием и дисперсией, а в качестве «за сорения» используется также нормальное распределение с тем же значением математического ожидания, но с дисперсией, в 9 раз большей, чем у основного распределения. Эта модель широко ис пользовалась в эконометрических исследованиях в 70-80-е гг.

Возникновение строгой теории робастности связано с именем П. Хубера [207,286,295], который в 1964 году доказал теорему, по ложившую начало оптимизационному подходу к робастности. Пи тер Хубер рассматривал случай, когда основное и засоряющее рас пределения были симметричны. Для таких распределений в общем случае можно записать: F(х, ) = F (х - ).

n Теорема Хубера, используя условие f ( x j ) 0, j по выборке значений { x j ;

j 1, n } позволяет получить состоя тельную оценку математического ожидания. Здесь f – функ ция плотности вероятностей (ФПВ) распределения, которое обес печивает оценку с наименьшим средним квадратом смещения при наихудшем засорении.

В несколько упрощенном виде теорема Хубера указана в учеб ном пособии [55, п. 9.3]. Математически строгое изложение мини максного (оптимизационного) подхода к построению робастных оценок приведено в монографиях Ф. Хампеля с соавторами [203] и П.Дж. Хубера [207].

В России пионером робастной статистики стал Л.Д. Мешалкин [117-119], разработавший робастный метод экспоненциального «провешивания» наблюдений [119], который сохранил в экономет рии свое прикладное значение до нашего времени Принято выделять существование трех классов робастных ме тодов статистического оценивания:

минимаксные (оптимизационные или М - оценки), линейные комбинации порядковых статистик (L -оценки) и процедуры, основанные на ранговых критериях (R - оценки).

Оптимизационные оценки основаны на минимаксном подходе П. Хубера [207]. Этот класс оценок наиболее часто используется на практике. М-оценки допускают обобщение на многопараметриче ский случай, но не являются инвариантными относительно выбора масштаба.

Линейные комбинации порядковых статистик. Искомый пара n метр Т оценивается по выборке в виде Tn nj h( x( j ) ), j где h( x( j ) ) - некоторая функция порядковых статистик, выбираемая для разных L- оценок из различных соображений. Наиболее часто стремятся минимизировать дисперсию оценки Tn. Иногда на прак тике используют упрощенную модель, принимая h( x( j ) ) x( j ), что n дает оценку Tn nj x( j ).

j Оценки, основанные на ранговых критериях [43], в общем виде позволяют получить искомую оценку Tn сдвига («центра», пара метра положения) распределения Т при помощи функционала J(T), используя решение неявного уравнения вида J { (1 2) [ s 1 F (2T ( F ) F 1 (s) ] } ds 0, где вид функционала J(T) определяется используемым в конкрет ном исследовании ранговым критерием. Например, использование рангового критерия Уилкоксона [43] приводит [55, п. 9.3] к функ ционалу J (t ) t 1 2, который дает простую и надежную оценку Ходжеса - Лемана:

Tn Me [ ( xi x j ) 2 ].

i j Великолепными введениями в теорию робастности служат об зоры Ф. Хампеля [202,294], П. Хубера [295], А. Ершова [64], а так же книга С.А. Смоляка и Б.П. Титаренко [169], не устаревшие за треть века. Особо выделим совместную работу [286] ряда западных статистиков, изданную Принстонским университетом. Но эта рабо та, хотя все ее авторы давно получили мировое признание и счита ются классиками статистической науки ХХ века, на русский язык никогда не переводилась.

Сегодня робастные методы разработаны не только для оценки характеристик распределений, но и для регрессионных задач (см.

гл. 7 монографии П. Хубера [207]), и для анализа временных рядов.

Этот аппарат наиболее полно отражен в монографии Г. Бриллин джера [36].

Ф. Мостеллер и Дж. Тьюки писали: «Слово «нормальное» мно гие неверно толкуют как «обыкновенно появляющееся», однако из вестно, что на практике никогда не бывает распределений, в точ ности удовлетворяющей этой формуле (гауссовой кривой. – авт.)»

[124].

Отсюда следует вывод, что при работе с реальными данными (в том числе – с экономическими, технико- и социально-экономиче скими) гораздо надежнее использование не классических, а непа раметрических или робастных статистических процедур. Даже про стейшие из них (например, виндзорированное среднее или ме диана) позволяют получать весьма точные и стабильные результа ты в эконометрических и социально-экономических исследованиях.

1.1.4. Методы непараметрического оценивания Розенблатта-Парзена В прикладных исследованиях, по-видимому, наиболее часто ис пользуются оценки типа Розенблатта – Парзена (см. [173, гл. 7, 8]).

Коротко остановимся на методике построения процедур этого типа. Пусть m-мерный ( 1 m ) случайный вектор x пред m ставлен выборкой независимых наблюдений xk ;

( j 1, m;

k 1, n), где j n - мощность выборки. Вектор x обладает функцией плотности ве роятностей (ФПВ) f (x), непрерывной и ограниченной в m. Зафик сируем в m некоторую точку X и обозначим rk расстояние от X до вектора наблюдений xk ;

(k 1, n). Расстояние понимается в смысле любой метрики, в частности, m-мерной евклидовой. Выберем кон станту оценивания s n ;

0 c 0.5. (1.1.1) C Упорядочив r k, получим вариационный ряд вида r (1)r (2)... r (s)... r(n).

~ Оценку Розенблатта - Парзена для ФПВ f ( X ) построим в виде s (n 1) n ~ J (r f (X ) r( s ) ), (1.1.2) Vm K k где Vm - объем гиперсферы в m с центром в X и радиусом r ( s), а ядерная функция J (y) должна удовлетворять условиям:

0 J ( y) ;

J ( y) J ( y) ;

J ( y)dy 1 (1.1.3) Дальнейшая конкретизация вида РП-оценок обычно связана с каким-либо критерием оптимизацией. Укажем простые и надежные результаты, полученные В.А. Епанечниковым [62].

Если выполнено: J ( y) y 2 dy 1;

J ( y) y dy ;

0 p p и J ( y) y p dy ;

(0 p ) ;

потребуем J 2 ( y)dy min. (1.1.4) Фактически этими условиями мы стремимся минимизировать дисперсию оценки (1.1.2) за счет некоторых разумных ограничений на ядерную функцию J (y). В итоге получаем:

3 y 1 ;

y 5. (1.1.5) J ( y) 4 5 y 0 при Заметим, что в изложенном методе оценивания не предполага ется независимость компонент изучаемого стохастического векто ра, что имеет существенное значение для его использования в при кладных работах.

1.2. Дихотомизация описания социально-экономических систем как основной принцип работы с эмпирическими нечисловыми данными Традиционно данные подразделяют на два больших класса – количественные и качественные. Количественные данные пред ставляют собой массивы действительных чисел. Качественные дан ные являются свойствами наблюдений, которые в числах (по край ней мере, в традиционном понимании) не выражаются. Например, мы обследуем выборку москвичей. Каждое «наблюдение» этой вы борки обладает числовыми характеристиками (рост, доход, возраст, объем грудной клетки, вес, размер обуви и т.п.) и качественными (нечисловыми – национальность, темперамент, сфера занятости, профессия, семейное положение, партийность, район и условия проживания и др.).

Измерение в сильных шкалах, по сути, представляет собой со поставление результата опыта с некоторым эталоном 4, в каче Современная математика родилась в трактате Р. Декарта «Геометрия»

(изданном в 1637 г. в Париже), где были изложены переосмысленные Р. Декартом базовые принципы античной математики. Не вдаваясь в тон кости вопроса, подчеркнем, что для натуралистически мыслящих древнегре ческих философов понятие числа «нуль» было нонсенсом [227, гл.2,3,Заключение]. Естественно, в «Началах» Евклида о математической точке, линиях и поверхностях нулевой толщины не могло быть и речи.

Понятие числа «нуль» (вместе с основами алгебры) пришло в Европу от арабов (из мавританских университетов) в начале XII века. Р. Декарт исполь зовал его в своем переосмыслении «Начал» Евклида. Кроме того, Р. Декар том были введены понятия функции и переменной величины.

В итоге Р. Декарт описал в трактате «Геометрия» свое видение евклидовой геометрии, по существу радикально отличающееся от понимания «геометрии»

самим Евклидом. (Автором использована работа: Матвеенков А.Т. «К вопросу реконструкции некоторых забытых «Начал» Евклида». М., рукопись, 1997).

Переосмысливание основ античной математики Р. Декартом привело к принципиально новому пониманию самих категорий «единица» и «число». В стве которого можно выбрать любые оговоренные объекты (рубль или доллар, метр или световой год, тонна или масса покоя электро на и т.д.).

В том случае, если в одном и том же наблюдении измеряются несколько количественных и/или качественных признаков, говорят о наличии векторного измерения. Причем (с позиций математиче ской теории и здравого смысла) наблюдения в выборке должны быть однородны. Это условие является непременной априорной предпосылкой использования стохастического формализма в при ложениях (см. п. 1.1). Следовательно, начальным этапом любого статистического исследования, является составление методики по лучения и описание результатов наблюдений.

В прикладной статистике иногда применяется процесс цензури рования данных. В этих случаях из выборочного ансамбля исклю чаются некоторое (небольшое) число наблюдений (измерений).

Причем цензурированные данные могут быть как количественными (числовыми), так и качественными. Процесс цензурирования может осуществляться как из формальных (например, исключение «гру бых выбросов» значений), так и из неформальных соображений.

Например, мы рассматриваем последовательность экономических показателей о некоторой отрасли промышленности России. Но имеет смысл рассматривать ретроспективные данные только с г. по настоящее время. В 1998 году (в силу дефолта) произошел «скачок в развитии» (термин, принятый в прогнозировании), вслед ствие чего данные до 1999 года описывают некоторую иную (чем рамках античной традиции «число» - это количество естественных «еди ниц», изначально возникших при создании Мироздания [110].

После переосмысления основ математики Р. Декартом «под числом мы понимаем не столько множество единиц, сколько отношение некоторой ве личины к другой величине того же рода, принятой (курсив мой. – авт.) нами за единицу» (И. Ньютон, «Всеобщая арифметика или книга об арифметиче ских синтезе и анализе»).

ныне) экономическую систему. И не могут быть корректно исполь зованы в проводимом исследовании.

Для измерения признаков, зафиксированных в наблюдении, применяются различные шкалы. Каждый из используемых типов шкал определяет группу допустимых преобразований этой шкалы.

Основное требование, принятое в теории измерений [141, гл.1;

153,180-182], гласит: выводы, полученные на основе данных, изме ренных в некоторой шкале, не должны измениться при допусти мом преобразовании этой шкалы.

Шкалы измерений подразделяют на сильные и слабые. В силь ных шкалах измеряются количественные признаки, в слабых – ка чественные. К сильным шкалам относятся абсолютные и интер вальные шкалы, шкалы разностей и отношений. К числу основных слабых шкал относятся ранговые и порядковые, а также шкалы наименований (или номинальные шкалы), которые предназначены для классификации наблюдений.

Абсолютные шкалы – это числовые шкалы, которые подразде ляют на дискретные (с конечным или счетным числом значений) и недискретные. Из недискретных шкал наиболее часто используют ся непрерывные шкалы и шкалы, у которых не более чем счетное число разрывов справа, но слева во всех точках разрыва они непре рывны. Для абсолютных шкал допустимы только тождественные преобразования.

Интервальная шкала образуется из абсолютной путем ее раз биения на конечное или счетное число непересекающихся интер валов. Таким образом, интервальная шкала представляет собой не которое «огрубление» абсолютной, производимое в силу практи ческих потребностей. Скажем, при построения непараметрических оценок плотности функции вероятностей непрерывной стохасти ческой переменной (гистограммы или полиграммы) ось действи тельных чисел разбивают на конечное число интервалов. В шкале интервалов измеряются величины, для которых не удается указать ни естественное начало координат, ни естественную единицу из мерения. Пример – положение точки на прямой. Для шкал интер валов допустимы любые монотонно возрастающие преобразова ния.


Для шкалы разностей характерно отсутствие «естественного»

нуля (начала координат), но зато существуют «природные» едини цы измерения. Как указывает А.И. Орлов [141, гл.1], мировое время измеряется в шкале разностей. С этим, вообще говоря, следует со гласиться. Поскольку существуют естественные единицы измере ния (сутки, стабильные периоды колебаний в молекулах и атомах и др.), но естественное начало отсчета времени сегодня точно ука зать нельзя.

Хотя существует космологическая теория возникновения Все ленной в форме «большого взрыва» Дж. Гаммова, но пока нет ме тодологии определения промежутка времени от состояния сингу лярности, породившей «большой взрыв». Можно лишь утверждать, принимая различные априорные предпосылки [227], что Вселенная существует порядка 9 - 14 млрд. лет.

Для шкалы отношений характерно наличие естественного нуля, но отсутствует естественная единица масштаба. В этих шкалах из меряются многие экономические (курсы валют, цены и ценности товаров, потребительский излишек и прибыль, энергозатраты, объ емы производства, макроэкономические коэффициенты и др.) и фи зические (масса, заряды, потенциал силового поля, импульс, тепло проводность и т.п.) величины.

Пример – измерение температуры в абсолютной шкале Кельви на. Для шкал отношений допустимы преобразования подобия (ко гда меняется только масштаб измерений).

Заканчивая эти замечания о статистических данных, отметим, что объектом приложения аппарата прикладной статистики явля ются:

числа и конечномерные векторы, случайные процессы и временные ряды, нечисловые (качественные) данные.

Важным разделом прикладной статистики служит нечисловая статистика [18,25,106,121,122,139-141,153,154,177-182,191,192], где работают с данными, которые не могут быть выражены в чис лах. В нечисловой статистике исключительную роль играет поня тие бинарного отношения [32,221,233] на множествах. Оно тесно связано с предельным случаем шкалы наименований – дихотомиче скими (булевыми) шкалами. Если в каждом из наблюдений х задан ного множества X либо фиксируется некоторое свойство y, либо фиксируется его отсутствие, то шкала измерения y – булева (дихо томическая).

Пусть есть серия наблюдений, в которых измерялась случайная величина Х. Упорядочив полученные в наблюдениях значения по возрастанию, получаем вариационный ряд вида x(1) x(2)... x(n). (1.2.1) Элементы вариационного ряда x(k ) ( k 1, n ) называются поряд ковыми статистиками [59]. Для простоты изложения мы не рас сматриваем случаи, когда имеются «связки» x(k ) x(k 1). Номер k наблюдения x (k ) в вариационном ряду (1.2.1) называется его ран гом [43, 86,173, 181, 182, 233]. Переход от выборочных значений измеряемой переменной к ее рангам, которые, по сути, и образуют ранговую шкалу измерения, резко стабилизируя данные, часто бы вает полезен в приложениях.

Таким образом, порядковая шкала на абстрактном множестве порождается отношением строгого (или частичного) порядка. При мер: места претенденток на конкурсе красоты. При этом можно сказать, какая из двух участниц конкурса «лучше» (в оговоренном смысле). Но в принципе не ставится вопрос о том, «насколько она лучше».

По сути, переход от вариационного ряда к ранговой шкале яв ляется биективным отображением упорядоченного ряда измерений на первые члены натурального ряда. Допустимыми преобразовани ями для порядковых шкал являются любые строго возрастающие преобразования.

Пусть заданы два абстрактных множества X и Y. Декартовым (или прямым) произведением X * Y множеств X и Y называется множество всех упорядоченных пар вида (x,y), где x принадлежит X, а y принадлежит Y. Например, декартовым произведением мно жества * действительных чисел является плоскость с декарто выми координатами. Бинарным отношением А на множествах X и Y [32,221,233] называется любое множество упорядоченных пар вида (x,y), где x X и y Y. Если (x, y) A, то x находится в отношении А к y, что записывается в виде x A y. В противном случае записывают xAy.

Замечания. 1) Из сказанного ясно, что всякое бинарное отно шение А на множествах X и Y определяет некоторую функцию f : X Y тогда и только тогда, когда x X ! y Y : x A y. (1.2.2) 2) Понятно, что любая функция f : X Y всегда задает би нарное отношение на множествах X и Y. Таким образом, понятие функции является частным (хотя и очень важным) случаем бинар ного отношения на множествах.

Пусть даны множества X {x1,...,xm} и Y { y1,...,yn}. Тогда матрицей бинарного отношения А на множествах X и Y называется матрица a jk, размерностью m на n, элементы которой имеют вид 1, если x j A yk. (1.2.3) a jk 0, если x j A yk Замечание. Любая матрица m на n, состоящая из нулей и еди ниц, определяет некоторое бинарное отношение на соответст вующих множествах. Поэтому любую такую матрицу называют матрицей бинарного отношения. Матрицу бинарного отношения можно рассматривать как частный случай числовых данных.

Статистический анализ качественных признаков неразрывно связан с обработкой разнотипных переменных. Методы решения этой проблемы могут быть связаны с двумя альтернативными под ходами. Во-первых, процедуры «оцифровки» слабых переменных [106,121,122]. Но объективно усилить шкалу измерения трудно, и тип «оцифровки» влияет на итоговые результаты. А усиление шка лы измерения является «домысливанием за Природу» каких-то свойств изучаемой системы.

Во-вторых, подход, основанный на «дихотомизации» (на ослаблении всех переменных до булевого уровня) с соответствую щим увеличением размерности пространства признаков.

Идея состоит в том, что сложный объект можно с примерно равной информативностью описать или небольшим числом силь ных переменных, или большим числом слабых. Эта мысль близка взглядам Ог. Курно, которые он полтора века назад изложил в трактате [105]. По Ог. Курно, любое сложное свойство объекта мо жет быть представлено как суперпозиция его более простых свойств. Каждое из этих «более простых» свойств является комби нацией «еще более простых» и т.д. Таким образом, имеется воз можность декомпозиции свойств объекта до некоторого «элемен тарного» уровня.

При составлении опросной анкеты любой маркетолог или со циолог всегда следует по пути, указанному Ог. Курно, реализуя ди хотомизацию описания социума. Изучение аспектов проблем дово дится до того «элементарного» уровня описания, который считает ся достаточным для практических выводов. Можно утверждать, что принцип дихотомизации переменных является основным методом формализации описания в любых эмпирических социально– экономических, маркетинговых и социологических исследованиях, основанных на выборочном методе.

Интересный взгляд на социологическое измерение был выска зан Ю.Н. Толстовой и Е.В. Масленниковым [183], который состоит в том, что в широком, фактически – в философском, смысле само «социологическое исследование» можно понимать как «измерение»

состояния социума.

1.3. Проблема полноты и достоверности таблиц эмпирических данных. Статистическое прогнозирование в экономических и технико-экономических исследованиях В эконометрических, социально- и технико-экономических ис следованиях, как правило, базой для математического анализа ин формации служат таблицы эмпирических данных, трактуемые как выборка из изучаемой генеральной совокупности.

При этом, как свидетельствуют многие отечественные и зару бежные авторы [71, 73, 109, 159-161, 209, 234, 244, 256], такие эм пирические таблицы часто оказываются неполными (содержат про пуски значений показателей для некоторых наблюдений) и облада ют существенной недостоверностью (часть данных неточна – ошибки ввода данных в базу ЭВМ, случайно неточные сведения, умышленная дезинформация).

Понятно, что проблема выявления недостающей и недостовер ной информации в эмпирических матрицах данных является неотъемлемой частью первичной [10,189] статистической обра ботки данных во всех прикладных эмпирических работах.

Первым среди отечественных специалистов эту проблему ре шил Н.Г. Загоруйко, который совместно с сотрудниками ИМ СО АН СССР разработал алгоритм «ЗЭТ» («заполнение эмпирических таблиц») [71]. В 70-80-е гг. ХХ в. алгоритм «ЗЭТ» очень широко использовался в прикладных эконометрических исследованиях.

Идея алгоритма «ЗЭТ» состоит в том, что таблицы данных яв ляются «избыточными» (за счет корреляций между столбцами и между строками матрицы данных), что позволяет оценить недоста ющие значения показателей. Впоследствии группа новосибирских математиков под руководством Н.Г. Загоруйко получила серьезные результаты в распознавания образов и выявления эмпирических за висимостей [72-74].

По существу, любая статистическая методология анализа эмпи рических таблиц с целью выявления недостающей и ложной ин формации базируется на том, что, во-первых, числовые показатели, как правило, попарно коррелированы, и, во-вторых, наблюдения в таблице обладают мерами «подобия», которые также поддается формализации в стохастических терминах.

Существенную роль играет предпосылка о том, что значения показателей в эмпирических таблицах измерены в интервальных шкалах [141, гл.1], что делает допустимыми любые монотонно воз растающие преобразования переменных.

Традиционно одной из основных прикладных задач экономет рики было прогнозирование экономической динамики. В целом эта задача хорошо проработана [26, 33, 40, 41, 48, 53, 56, 57, 111-113, 268, 279, 281, 285]. Наряду с эвристическими методами [281, 285], среди методов количественного прогноза [113, 218, 219, 279] широ ко используются статистические методы [11, 13, 19, 40, 48, 53, 55 57, 67, 85, 87, 111-113, 211, 212, 219, 239, 272].

Статистическое прогнозирование, по сути, сводится к экстра полированию и интерполированию временных последовательно стей [56, 67, 94, 111-113] стохастически взаимосвязанных экономи ческих показателей (т.е., по существу к статистическому прогнози рованию случайных процессов с дискретным временем).


Используют и спектральный анализ временных рядов [19,47,85,279]. Но применение этого подхода требует весьма боль шой ретроспективы наблюдений (не менее 50 точек замера). Здесь следует отметить монографию Г. Бриллинджера [36], одного из са мых интересных учеников Дж.У. Тьюки, в которой, кроме класси ческих методов анализа временных рядов, описаны и соответству ющие робастные процедуры.

Идея интерполирования и экстраполирования стационарных слу чайных последовательностей принадлежат А.Н. Колмогорову [94]. В рамках предложенного им подхода на сегодня разработано множе ство статистических методов экономического прогнозирования.

Но при этом вопрос о корректности применения методов стати стического прогнозирования часто остается вне поля зрения иссле дователей. Хотя сам А.Н. Колмогоров обращал на это особое вни мание [93].

Часто в приложениях имеется лишь очень короткий ретроспек тивный ряд (до 10 наблюдений). В этих случаях безнадежно искать «наилучший» аналитический вид тренда, требуются более «тонкие»

методы выявления и экстраполирования тенденций (см. например, [67,111,112,211, 211,218-220,236, 239,264,272]).

В связи с чем в настоящее время крайне актуальна и своевре менна разработка методов и алгоритмов непараметрического про гнозирования коротких последовательностей (на «шаг» по 5- точкам).

1.4. Статистическая классификация многомерных объектов. Соотношение понятий неопределенности, нечеткости и случайности Первый этап становления любой области знания как науки неизбежно начинается с решения проблемы систематизации объек тов ее изучения. Процесс систематизации (классификации) объек тов имеет огромное практическое значение, суть которого очень точно описал проф. Ю.П. Адлер: «Данные наступают на нас со всех сторон. Они накапливаются в темпе, значительно опережающем нашу способность их ассимилировать и использовать. Мы их «складируем впрок», порождая огромные архивы и сложнейшие проблемы хранения, переработки, поиска и использования всего того, что нам удалось «узнать». Значит, с данными нужно что-то делать. Но «делать» - это означает, насколько возможно, сократить их количество и при этом не потерять слишком много «полезной информации», потенциально в них заложенной» [3]. Следователь но, классификация – это процедура упрощения массива данных, направленная на облегчение его анализа и содержательной интер претации.

Отметим, что существуют разные подходы к систематизации сложных многомерных объектов, которые определяются различ ными терминами: классификация, типологизация, таксономия, кла стеризация и др., причем общепринятого понимания в использова нии этой терминологии на сегодня не существует. Но количествен ная таксономия и кластерный анализ не занимаются распределени ем объектов по заранее заданным классам, что относится к задачам тпологизации [78, 144, 176, 181, 199, 201] и дискриминантного ана лиза [30, 49], а устанавливают неизвестную классификацию. Кото рая, как правило, оказывается не единственной, а ее результаты редко удается рассматривать как выявление внутренней структуры, отражающей «фундаментальные» свойства изучаемой области зна ния [183].

Различают два принципиально разных подхода к систематиза ции: исключающие и неисключающие классификации. При исклю чающей классификации один объект может быть отнесен только к одному из классов (таксонов). При неисключающей классификации объект может быть отнесен к нескольким классам. Развитием идеи неисключающей классификации явилась теория нечетких (размы тых, расплывчатых) множеств Л.А. Заде [77, 101].

Исходная идея нечетких множеств самим Л. Заде [77] была сформулирована следующим образом: «Для данного объекта x и за данного класса Y в большинстве случаев вопрос состоит не в том, принадлежит ли x к Y, а в том, насколько x принадлежит к Y». Для формализации этого взгляда на классификацию Л. Заде «размыл»

индикатор принадлежности j k (1, если x j X k ) (0, если x j X k ), заменив его лингвистической переменной [76] (или, как синоним, функцией нечеткой принадлежности), которая определяется в виде k : x j [ 0,1 ]. Таким образом, k ( x j ) определяет меру принад лежности элемента x j заданному подмножеству которая, по Xk, добно вероятности, не превосходит единицу.

Пример. Пусть Х - нечеткое множество «сторонники партии “Единая Россия”» (ЕР). Некоторым образом установлено формаль ное правило, которое задает размытый индикатор принадлежности к этому нечеткому множеству. Господин x1 стал членом партии ЕР и всегда участвовал в ее мероприятиях. Оказалось, что ( x1 ) 0.95.

Гражданин x2 в ЕР не состоит, но всегда голосует за ЕР. Для него ( x2 ) 0.65. Субъект x3 на голосования и мероприятия ЕР не хо дил (было лень), но в кругу семьи он всегда говорил, что «Путин и Медведев - это намного лучше, чем коммунисты и национал - пат риоты». Его лингвистическая переменная ( x3 ) 0.35. Товарищ x всегда голосовал против ЕР и ее политики, в связи с чем:

( x4 ) 0.05. А маргинал x5 регулярно участвовал в демонстрациях и митингах протеста против политики «Единой России», для него ( x5 ) 0.00.

Несложно заметить сходство лингвистической переменной с функцией плотности вероятностей (или самой вероятностью в дис кретном случае). Есть и различие: функция распределения всегда нормирована к единице, а сумма S всех значений (или, в общем случае, интеграл Лебега по лингвистической переменной ) может быть любым неотрицательным числом S 1. Однако, несложно нормировать сумму ( x j ) к единице, просто разделив каждое зна чение лингвистической переменной на S.

Таким образом, в достаточно общем виде можно считать, что и вероятность, и нечеткая принадлежность представляют собой меры, суммы которых нормированы к единице.

В этой связи уместно вспомнить, что в начале 80–х гг. среди советских специалистов, связанных со статистическим анализом социально–экономических данных, это обстоятельство привело к острой дискуссии 5: а «стоит ли» вообще рассматривать «нечеткие множества», если есть теория случайных множеств [115].

Дискуссия не привела к консенсусу, вопрос актуален и сегодня.

Например, в современной монографии А.И. Орлова [141, п.4.6], из вестного специалиста по прикладной статистике, содержится мате риал «о сведении нечетких множеств к случайным». Математиче ски корректно А.И. Орлов показывает, каким образом нечеткие множества можно рассматривать как некоторые проекции случай В начале 80-х гг. этот вопрос активно обсуждался на научном семинаре по прикладной статистике и многомерному анализу данных под руководством проф. С.А. Айвазяна и проф. Ю.Н. Благовещенского. Этот семинар успешно функционирует в ЦЭМИ РАН и поныне.

ных множеств. Формально его выкладки безупречны, но содержа тельно взгляды А.И. Орлова неверны.

Коротко остановимся на обсуждении этого вопроса.

Есть абстрактное множество Х и элемент x. Мы не знаем точно, принадлежит ли x к Х, но можем оценить вероятность этого собы тия ( x) Pr { x X }. Пара ( X, ), т.е. множество элементов { x } с за данными вероятностями принадлежности (x), называется случай ным множеством. Математически случайное множество является измеримым отображением одного вероятностного пространства на другое [97] (часто, само на себя).

Приведем несколько примеров случайных множеств.

(а) В геологических районах { x } по предварительным данным может быть нефть. По косвенным признакам оценили вероятности этих событий (x). Набор пар { x, ( x) } образует случайное множе ство.

(б) Данные радиолокации противолодочного корабля показы вают, что наблюдаемая цель x с вероятностью (x) является под водным крейсером США. Набор пар { x, ( x) } образует случайное множество.

(в) По результатам исследований (скажем, анализу ДНК) на ос новании некоторой методики оценивается вероятность (x) того, что отцом данного ребенка является гражданин x. Набор пар { x, ( x) } также образуют случайное множество.

Представляется очевидным, что по смыслу нечеткое множе ство не может рассматриваться как множество случайное.

В рассмотренных случаях: (а) в данном районе либо есть нефть, либо ее нет;

(б) данная подлодка или является подводным крейсе ром США, или нет;

(в) у ребенка есть только один отец. Следова тельно, в реальности все указанные выше множества { x } являются обычными, а не размытыми (нечеткими) множествами. А понятие вероятности (x) появляется не в силу «фундаментальных» свойств рассматриваемых множеств, а в силу нашей неполной информиро ванности об элементах этих множествах.

Следовательно, в любом случайном множестве { x, ( x) } вероят ность (x) служит не объективной мерой принадлежности х к Х, а мерой нашей осведомленности об этом событии.

О субъективных вероятностях такого рода Анри Пуанкаре пи сал [151]: «Однако можно оставить в стороне слабость человече ской природы: то, что представляется случайным для человека не образованного, отнюдь не будет таковым для ученого. Случай ность, таким образом, служит как бы мерой нашего невежества (курсив мой. – авт.)». Отсюда следует вывод: нет оснований подме нять смысл лингвистической переменной мерой, описывающую степень субъективной информированности о принадлежности дан ного элемента к заданному множеству.

Сравните: (а) Иванов «толстый» с мерой 0.9;

(б) Петров «богат»

с мерой 0.5;

(в) Сидорова «красива» с мерой 0.1;

(г) Козлов «храбр»

с мерой 0.01. Это не характеристики нашей субъективной осведом ленности о свойствах субъектов, а их объективные характеристики, выражаемые соответствующими предикатами. Которые, в данном конкретном случае, означают: (а) Иванов очень тучен;

(б) матери альное положение Петрова весьма среднее;

(в) Сидорова внешне крайне непривлекательна;

(г) Козлов патологически труслив.

Можно возразить: совершенно неясно, как задавать эти «объек тивные» характеристики. Ответ очевиден: по оговоренной методи ке. Это нормально, ведь и вероятности для случайных множеств вычисляются не по законам Божьим, а по некоторым когда-то, кем то и как-то обоснованным методикам. Более того, вопросы унифи цированного построения лингвистической переменной (т.е. оценки уровней принадлежности), как и ее измерения, были весьма полно проработаны еще в 80-е гг. прошлого века (см., например, [34,88,101,104,114,136,137,283]).

Возвращаясь к точке зрения А.И. Орлова, отметим, что фор мально его выкладки абсолютно корректны, но его логика неверна.

В рамках естественнонаучной традиции, ни при каких обстоятель ствах изящную математическую абстракцию нельзя ставить выше содержательного смысла изучаемого явления.

Рассуждая по аналогии с позицией А.И. Орлова, и понятие ве роятность вводить незачем. Вполне достаточно рассматривать ме ру, нормированную к единице, на множестве с заданной на нем сигма – алгеброй. Но понятие вероятности несет колоссальную смысловую нагрузку, в связи с чем ее смысл не сводим к определе нию формальной меры на множествах. Тем более, что теоретико множественное описание (а не определение!) вероятности по А.Н. Колмогорову - не единственно возможный путь формализации понятия вероятности [15-17,149,166,186,187,196,198].

Ввиду важности вопроса для экономических исследований, необходимо, прежде всего, ясно осознать истоки самого понятия неопределенности, которое лежит в основе восприятия человеком событий (наблюдений, опытов) с неясным исходом. Автором про блема соотношения между понятиями неопределенности, случай ности и нечеткости рассматривалась в работах [253, 255, 258, 264, 273]. По видимому, наиболее объективна точка зрения М. Гупты [292], считающего, что неопределенность бывает двух видов, свя занных, (1) со стохастическим поведением изучаемой системы (по сути, со случайностью), и (2) с принципиально плохой формализу емостью понятийных категорий, а также с ограниченными возмож ностями человеческих восприятий и рассуждений (по существу, с нечеткостью).

В каждой неопределенности в этом мире (в том числе – в соци ально-экономических областях) всегда присутствует или случай ность, или нечеткость, или их одновременное проявление.

Хотя, существует достаточно обоснованное мнение, что разра ботки в области теории нечеткой меры [34,88,104], сделанные в связи с созданием основ теории возможностей Д. Дюбуа и А. Прадом [61], позволяют с некоторым оптимизмом смотреть на перспективы создания единой теории неопределенности. Правда, сразу подчеркнем, что теория возможностей является альтерна тивой теории вероятностей, поскольку выражает и случайность, и нечеткость только через меры нечеткости [60]. Тем самым, в рам ках теории возможностей, случайность сводится к нечеткости, реа лизуя альтернативу взглядам А.И. Орлова, которые были рассмот рены выше.

В рамках сегодняшнего развития математики представляются совершенно бессмысленными любые попытки сведения понятия нечеткости к случайности и наоборот.

Понятно, что «вероятностная» модель неопределенности плохо работают в тех случаях, когда в неопределенности доминирует не четкость описания и смысловых представлений изучаемых явле ний. И наоборот, «возможностная» модель неопределенности пло хо приспособлена для описания систем, в базовой основе неопреде ленности поведения которых лежит стохастическая природа иссле дуемой системы.

Выводы по главе 1.

В результате обсуждения тематики главы 1 можно отметить:

1. Социально–экономические законы носят вероятностный харак тер и, следовательно, наиболее адекватно могут описываться имен но в стохастическом смысле. Но в прикладных работах, за рамками естественных наук, классические статистические процедуры, кото рые в широком смысле являются наилучшими (при наличии мно гомерного гауссового распределения), резко теряют свою эффек тивность. С начала 70-х гг. XX в. это заставило понимать под мето дами прикладной статистики, которые на Западе чаще называют методами анализа данных, нечто отличное от методов математи ческой статистики.

2. Процедуры прикладной статистики ориентированы на обработ ку небольших массивов неоднородных (структурирован-ных) дан ных. Понимание принципиальных различий между математической и прикладной статистикой в начале 70-х гг. стало так велико, что появилось мнение (которое и сегодня разделяют некоторые специа листы по стохастическим приложениям) о том, что естественнона учной традиции более соответствует не теоретико-множественное описание вероятности по А.Н. Колмогорову, а статистическое опи сание по Мизесу – Смирнову – Виллю – Постникову.

3. В прикладной статистике данные подразделяют на количе ственные и качественные. Количественные признаки измеряются в сильных шкалах. По существу измерение в сильной шкале пред ставляет собой сравнение полученного результата с некоторым эта лоном. Качественные признаки отражают трудно формализуемые свойства наблюдений и в числах не выражаются. Их измеряют в слабых шкалах: порядковых и ранговых, номинальных и дихотоми ческих.

4. Статистический анализ качественных признаков (нечисловая статистика) приводит к задаче обработки разнотипных переменных.

Методы решения этой проблемы могут быть связаны с двумя аль тернативными подходами. Во-первых, процедуры оцифровки сла бых переменных. Но объективно усилить шкалу измерения трудно, а тип «оцифровки» существенно предопределяет итоговые резуль таты. Во-вторых, подход, основанный на дихотомизации, т.е. на ослаблении всех переменных до булевого уровня с соответствую щим увеличением размерности пространства признаков.

5. При составлении любой опросной анкеты маркетолог или со циолог реализует дихотомизацию описания исследуемого социума.

Изучение аспектов проблем доводится до того «элементарного»

уровня описания (набора вопросов), который считается достаточ ным для практических выводов. Принцип дихотомизации перемен ных является основным методом формализации описания социума в маркетинговых и социально–экономических исследованиях, ос нованных на выборочном методе.

6. При статистической обработке данных, не относящихся к фи зическим измерениям, возникает целый ряд принципиальных труд ностей. В этой связи в середине ХХ в. возник острый интерес к «свободным от распределения» методам статистики. Из свободных от распределения методов наиболее развит аппарат непараметриче ской статистики. Непараметрические процедуры не требуют апри орных знаний об изучаемом эмпирическом распределении, а накла дывают на него лишь определенные (весьма общего характера) ограничения.

7. В начале 60–х гг. стал активно разрабатываться аппарат ро бастной статистики. Термин робастность (по-русски, наибо-лее близко, «прочность») обозначает свойство процедуры быть, во первых, достаточно эффективной в идеальных условиях и, во вторых, стабильной при отклонениях от этих идеальных условий.

Существуют три класса робастных методов оценивания: мини максные или оптимизационные (М-оценки), линейные комбинации порядковых статистик (L-оценки) и процедуры, основанные на ран говых критериях (R-оценки).

8. Одно из самых перспективных направлений современной при кладной статистики связано с концепцией анализа данных Дж.У. Тьюки По существу эта концепция является синтезом де терминированных, стохастических и эвристических подходов к анализу выборочных данных. В рамках концепции Дж.У. Тьюки выделяют три этапа анализа данных: 1) пробный («разведочный»);

2) стохастический и 3) итоговый.

9. С 80-х годов ХХ века в прикладных статистических исследова ниях широко применяются методы с интенсивным применением ЭВМ. На практике широко используются два из них: джекнайф и бутстрэп. Метод джекнайф, разработанный Дж. У. Тьюки, имеет ясный логический смысл и может с успехом применяться в при кладных эмпирических исследованиях, в том числе – экономиче ского характера. Процедура бутстрэп, предложенная Брэдли Эфро ном, имеет неясную логику построения и вызывает ряд методиче ских возражений. В связи с чем, можно рекомендовать воздержи ваться от ее использования.

10. В прикладных исследованиях таблицы данных часто оказы ваются неполными и обладают заметной недостоверностью (ошибки ввода данных в ЭВМ, дезинформация и др.). В этой связи проблема выявления недостающей и недостоверной информации в эмпирических матрицах данных является неотъемлемой частью первичной статистической обработки данных практически во всех прикладных работах, в том числе - социально-экономического и эконометрического характера.

11. Одной из основных прикладных задач анализа данных являет ся прогнозирование экономической динамики. В целом эта задача хорошо проработана теоретически и практически. Наряду с эври стическими методами прогноза, среди методов количественного прогнозирования наиболее широко используются статистические методы. Статистическое прогнозирование, по своей сути, сводится к экстраполированию многомерных временных последовательно стей стохастически взаимосвязанных показателей. Используют и спектральный анализ временных рядов, но этот подход требует наличия весьма большой ретроспективы наблюдений.

Однако на практике исследователи зачастую сталкиваются с ситуацией, когда в их распоряжении имеется лишь очень короткая ретроспектива данных (10 и менее наблюдений). В этих условиях попытки найти вид «наилучшего» тренда бессмысленны, и высо кую актуальность приобретает разработка непараметрических ме тодов статистического прогнозирования на базе очень короткой ре троспективы.

12. По сути, классификация – это процедура упрощения массива данных, направленная на то, чтобы облегчить экспертный анализ и содержательную интерпретацию информации. Различают два раз ных подхода к систематизации: исключающие и неисключающие классификации. При исключающей классификации каждый объект может быть отнесен только к одному из классов, а при неисключа ющей - к нескольким классам.



Pages:   || 2 | 3 | 4 | 5 |
 





 
© 2013 www.libed.ru - «Бесплатная библиотека научно-практических конференций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.