авторефераты диссертаций БЕСПЛАТНАЯ БИБЛИОТЕКА РОССИИ

КОНФЕРЕНЦИИ, КНИГИ, ПОСОБИЯ, НАУЧНЫЕ ИЗДАНИЯ

<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ


Pages:     | 1 | 2 ||

«Федеральное агентство по образованию Государственное образовательное учреждение высшего профессионального образования Ухтинский государственный технический университет ...»

-- [ Страница 3 ] --

y y Проделав ту же самую операцию для всех девяти опытов, занесем по лученные результаты в таблицу 2, а в следующем столбце той же таблицы рассчитаем разность квадратов экспериментального и предсказанного по модели значений откликов. Затем по формуле (3.43) рассчитаем величину дисперсии адекватности (просуммируем числа в последнем столбце табли цы 2 и поделим полученный результат на число степеней свободы диспер сии адекватности):

i = 1 ( yi €i )2 = 0,1303247.

sад = y Число степеней свободы этой дисперсии равно ад = N k = 9 2 = 7.

Рассчитаем экспериментальное значение статистики Фишера sад 0, F= 2 = = 0,46435.

s y 0, и сравним его с табличным значением F0.05 (v ад = 7 ;

v в = 18 ) = 2,5767.

Так как экспериментальное значение меньше табличного, у нас нет оснований отбросить гипотезу об адекватности модели.

В.А.Пантелеев - 104 - РЕГРЕССИОННЫЙ АНАЛИЗ Рассчитаем интервальную оценку регрессии – коридор ошибок. Вна чале найдем оценку дисперсии предсказания по формуле (3.46):

[ ] 0,237306 0, D{€( x )} = s 2 €y x2 = 0,096446 x y 0,237306 ( ).

= s 2 0,096446 x 4 0,474612 x 2 + 0, y А затем, пользуясь формулой (3.47), определим выражение для расчё та доверительного интервала:

( ) € ( x ) = t 0.в05 0,2806602 0,096446 x 4 0,474612 x 2 + 0,695003, €y v (3.54) где значение t 0.05 = 2,1009 определяется по таблице Стьюдента.

Принципиально важно отметить, что как полученная модель (3.53), так и выражение для её интервальной оценки (3.54) формально не связаны с теми экспериментальными данными, по которым они были получены.

Это обстоятельство позволяет подставлять в модель (3.53) произвольные значения аргумента, формально сколь угодно далекие от области проведе ния эксперимента, с целью предсказания значения отклика при этих значе ниях аргумента (что, конечно, и является целью построения модели). Од нако даже интуиция нам подсказывает, что чем дальше мы будем удаляться от той области, где был сделан эксперимент, тем меньше будет точность та кого предсказания. Модель (3.53), будучи точечной оценкой, ничего не го ворит нам о точности предсказания, и поэтому все значения аргумента для неё равноправны. Напротив, выражение (3.54) сопоставляет любому значе нию аргумента доверительный интервал, т.е. точность предсказания, и, тем самым, позволяет определить качество предсказания, а также те области, в которых это предсказание вообще имеет смысл.

Протабулируем полученную модель в пределах, например, от 0 до 4, рассчитаем для каждого значения доверительный интервал, верхнюю и нижнюю границы, а полученные результаты занесем в таблицу 3.

Таблица €( x ) € (x) €y y €y y €y y нижн = € € y верх = € + € y x 0,00 3,308 0,9279 2,380 4, В.А.Пантелеев - 105 - РЕГРЕССИОННЫЙ АНАЛИЗ 0,25 3,352 0,9082 2,444 4, 0,50 3,484 0,8494 2,635 4, 0,75 3,704 0,7537 2,950 4, 1,00 4,012 0,6265 3,385 4, 1,25 4,407 0,4837 3,924 4, 1,50 4,891 0,3781 4,513 5, 1,75 5,463 0,4254 5,037 5, 2,00 6,122 0,6487 5,474 6, 2,25 6,870 0,9729 5,897 7, 2,50 7,705 1,3614 6,344 9, 2,75 8,629 1,8022 6,827 10, 3,00 9,640 2,2907 7,350 11, 3,25 10,740 2,8251 7,915 13, 3,50 11,927 3,4042 8,523 15, 3,75 13,202 4,0276 9,175 17, 4,00 14,565 4,6949 9,870 19, Из таблицы 3 видно, что минимальная погрешность отклика прихо дится на область, где проводился эксперимент (от 1 до 2). Этот результат, разумеется, не случаен. Погрешность предсказания почти всегда мини мальна в области, где проводился эксперимент, и увеличивается по мере удаления от этой области. Тот же результат виден и на рисунке, где по дан ным таблицы 3 построен график уравнения регрессии (жирная кривая) и нанесены верхняя и нижняя границы погрешности предсказания (тонкие линии). Пространство между верхней и нижней границами представляет собой коридор ошибок или (что то же самое) – интервальную оценку урав нения регрессии.

Математическая модель всегда строится для предсказания поведения отклика в некоторой области факторного пространства, и почти всегда воз никает вопрос о достоверности такого предсказания. Более того, для боль шинства технических целей достоверность предсказания модели, опреде ляемая погрешностью предсказания, задаётся изначально в качестве техни ческого требования (или задания на проектирование). Если, например, тре буется, чтобы точность предсказания модели была не хуже, чем а%, то оп В.А.Пантелеев - 106 - РЕГРЕССИОННЫЙ АНАЛИЗ ределить границы применимости модели можно решая относительно х уравнение € (x) €y a =.

€( x ) y Коридор ошибок Отклик (Y) 0 1 2 Фактор (X) эксперимент уравнение регрессии границы коридора ошибок Построение доверительного эллипсоида. Границы доверительной области для коэффициентов уравнения регрессии задаются, как уже отме чалось, при помощи уравнения (3.49). Запишем это уравнение для нашей задачи:

В.А.Пантелеев - 107 - РЕГРЕССИОННЫЙ АНАЛИЗ 9,00 22,1 1 3, [ 1 3,31 2 0,7 ] = 2 0,281 3,5546.

22,1 64,9 2 0, В этой формуле 3,5546 – это табличное значение критерия Фишера для уровня значимости 0,05 и степеней свободы 2 и 18. Значения осталь ных чисел (кроме, разумеется, k=2) округлены из соображений компактной записи.

После перемножения матриц получим:

9( 1 3,31) + 44,2( 1 3,31)( 2 0,7 ) + 64,9( 2 0,7 ) = 1,9953.

2 Это – уравнение эллипса с центром в точке (3,31;

0,7). Его главные оси не совпадают с направлением осей 1 и 2. Для получения более на глядного представления об этом эллипсе найдем собственные числа и соб ственные векторы матрицы X T X. Из алгебры известно, что собственные числа являются корнями векового уравнения:

X T X E = 0. (3.55) Записав это уравнение для нашей задачи, получим:

9 22. = 0.

64. 22. Или, что тоже самое и без округления:

2 73,8549 + 93,31603 = 0.

Решив это квадратное уравнение, получим два корня, представляю щих собой собственные числа матрицы квадратичной формы, в данном случае являющейся матрицей Фишера:

1 = 72,57 и 2 = 1,286.

Для определения собственных векторов, составляющих матрицу ор тонормированного преобразования U, каждое из полученных собственных значений подставляется в систему уравнений:

В.А.Пантелеев - 108 - РЕГРЕССИОННЫЙ АНАЛИЗ u i i ( X X i E ) u 2 = 0, T (3.56) M i uk [ ] где i – i-е собственное значение, а u1 u2 L uk – соответствующий i i i ему собственный вектор.

Для нахождения k собственных векторов эта система решается k раз с разными собственными значениями. В нашем случае эта система запи шется:

(9,000000 i ) u1 + 22,1445 u2 = 0 ;

i i 22,1445 u1 + (64,85499 i ) u2 = 0.

i i Для первого собственного значения эта система будет выглядеть:

63,57 u1 + 22,1445 u2 = 0 ;

1 1 22,1445 u1 7,71501 u2 = 0.

В силу того, что все i удовлетворяют уравнению (3.55), матрица (X T X i E ) с необходимостью вырождена, т.е. имеет ранг как минимум на единицу меньше k. Поэтому уравнения, составляющие системы (3.56), линейно зависимы, а сами эти системы имеют бесконечное множество ре шений. При проведении строгого анализа с построением матрицы U вводят дополнительное условие нормировки длины собственного вектора (u ) + (u ) + L + (uk ) = 1, i2 i2 i 1 которое устраняет множественность решения и превращает координаты собственного вектора в направляющие косинусы, соответствующие орто нормированному преобразованию.

В нашем случае, однако, нормировка необязательна, т.к. целью явля ется лишь определение ориентации осей. Поэтому из двух уравнений вы берем любое одно, т.к. из-за линейной зависимости эти уравнения получа ются одно из другого умножением на постоянный коэффициент. Например, из первого уравнения получим:

В.А.Пантелеев - 109 - РЕГРЕССИОННЫЙ АНАЛИЗ u2 u1 = 63,57 22,14 = 2,8713 tg71 o, 1 т.е. ось, соответствующая первому собственному значению, состав ляет угол 71о с осью 1.

Подставив 2 в уравнение (3.56), совершенно аналогично получим:

7,714 u1 + 22,1445 u2 = 0 ;

2 2 22,1445 u1 + 63,5689 u2 = 0.

Аналогично из, например, первого уравнения получим:

( ) u2 u1 = 7,71 22,14 = 0,3484 tg 19 o.

2 Теперь найдем длины главных полуосей по формуле (3.52):

2 0,28066 3, o z1 = = 0,1657 ;

72, 2 0,28066 3, o z2 = = 1,245.

1, Теперь имеются все данные для построения графика с 1 = А;

2 = В :

Доверительный эллипсоид 2 z z 2 3 4 В.А.Пантелеев - 110 - РЕГРЕССИОННЫЙ АНАЛИЗ 3.6 ДЕЙСТВИЯ В СЛУЧАЕ НЕВЫПОЛНЕНИЯ ПРЕДПОСЫЛОК РЕГРЕССИОННОГО АНАЛИЗА В начале настоящей главы были сформулированы три предпосылки регрессионного анализа, т.е. три условия, выполнение которых совершенно обязательно для того, чтобы можно было производить все описанные выше процедуры. В случае, если эти условия-предпосылки не выполняются, ис пользование изложенных процедур может существенно исказить результа ты анализа и привести к ошибочным выводам. Поэтому представляется весьма важным определить алгоритм действий на этот случай.

Напомним, что первая предпосылка регрессионного анализа утвер ждает, что отклики являются взаимно-независимыми случайными величи нами, распределёнными по нормальному закону.

Независимость откликов определяется условиями проведения экспе римента. Статистик должен объяснить экспериментатору, что каждый опыт должен проводиться таким образом, чтобы его результаты не оказывали воздействия на последующие эксперименты. Соблюдение этого правила определяет научную добросовестность экспериментатора.

Если отклики распределены не по нормальному закону, то необходи мо использовать методы непараметрической статистики (см., например, [27]). Эти методы не требуют информации о законе распределения откли ков, и поэтому определяемые с их помощью оценки оказываются менее точными, чем в случае использования параметрических методов, предпо лагающих знание закона распределения. Однако использование непарамет рических методов в случае неизвестного закона распределения позволяет избежать грубых смещённых оценок. Достаточно очевидно, что меньшая точность оценок непараметрической статистики обусловлена меньшей ин формацией об экспериментальных данных.

Вторая предпосылка регрессионного анализа предполагает, что дис персии всех откликов равны. Если это требование не выполняется, то сле дует использовать процедуру взвешенного метода наименьших квадратов [7], которая каждому отклику приписывает «вес», обратно пропорциональ ный среднеквадратическому отклонению этого отклика. Задача расчёта ко эффициентов уравнения регрессии и статистического анализа при этом не значительно усложняется.

Если нарушается третья предпосылка регрессионного анализа, ут верждающая неслучайность факторов, то используется процедура конфлю энтного анализа [7, 18].

Следует подчеркнуть, что выбор правильного статистического алго ритма в зависимости от свойств экспериментальных данных является не пременным условием получения разумных результатов.

В.А.Пантелеев - 111 - РЕГРЕССИОННЫЙ АНАЛИЗ 3.7 НЕЛИНЕЙНЫЙ РЕГРЕССИОННЫЙ АНАЛИЗ В случае, если функция M {y x} = ( x, B ) не линейна по параметрам, т.е. не может быть представлена в виде уравнения (3.7) ( х, ) = 1 f 1 ( х ) + 2 f 2 ( х ) + L + k f k ( х ) = j = 1 j f j ( x ), k то минимизация функции невязок (3.2) Ф( ) = i = 1 [ y i ( х i, )] N может представлять значительные трудности. Это связано с тем, что систе ма нормальных уравнений Ф( ) = 0, i = 1, k (3.57) i в данном случае будет представлять собой систему k нелинейных алгебраи ческих уравнений, общего аналитического решения которых в общем слу чае не существует.

Кроме того, в силу нелинейности система (3.57) может иметь не сколько корней, что указывает на возможность существования нескольких экстремумов функции невязок (3.2), т.е. нескольких векторов, удовлетво ряющих условию её минимума.

Все эти обстоятельства приводят к тому, что даже нахождение оценок коэффициентов нелинейной регрессии представляет собой задачу, для ко торой нельзя заранее указать оптимальный алгоритм решения, т.е. задачу, не поддающуюся априорной алгоритмизации.

Если не существует аналитического решения системы (3.57), то либо прибегают к численному её решению, либо (как правило) к прямой мини мизации функции Ф( ) в пространстве параметров методами численной нелинейной оптимизации.

Методов нелинейной оптимизации существует очень много, и в зада чу автора не входит проведение их сколько-нибудь подробного обзора. По этому ограничимся перечислением главных из этих методов с отсылкой читателя к соответствующей литературе: [1, 2], [21, 22], [31, 32].

Среди методов нелинейного оценивания параметров наиболее часто используются: метод линеаризации, метод наискорейшего спуска, метод В.А.Пантелеев - 112 - РЕГРЕССИОННЫЙ АНАЛИЗ «тяжёлого шарика», симплекс-метод, метод Маркуардта, методы случайно го поиска.

Опыт использования перечисленных методов показывает существен ную предпочтительность применения методов случайного поиска, т.к. они имеют наиболее универсальный характер, т.е. успешно работают при са мых разнообразных видах уравнений регрессии.

Следует отметить, что статистический анализ нелинейных регресси онных моделей также весьма неоднозначен и имеет множество особенно стей. Часто при его проведении прибегают к линеаризации нелинейного уравнения (разлагают его в ряд Тейлора в окрестности точки, найденной численным методом). А в дальнейшем проводят статистический анализ так, как он проводится для линейных моделей. Однако такая линеаризация далеко не всегда возможна, и результаты, полученные с её помощью, не от личаются большой точностью.

Более точные (и, разумеется, более сложные) методы показывают ка чественное отличие результатов нелинейного статистического анализа от линейного. В частности, доверительные области для коэффициентов нели нейного уравнения регрессии отклоняются от формы эллипсоида и приоб ретают, как правило, «бананообразную» форму.

Методы нелинейного регрессионного анализа интенсивно развива ются и широко используются в тех областях, где имеются веские физиче ские соображения, указывающие на структуру математической модели. В тех же случаях, когда таких соображений нет, наибольшее распространение находят линейные (главным образом – полиномиальные) модели.

ЗАКЛЮЧЕНИЕ Рассмотренные в настоящей работе статистические методы модели рования объектов статики не исчерпывают, разумеется, всего многообра зия приёмов, применяемых при статистической обработке эксперимен тальных данных и построении математических моделей. Ограниченный объём книги не позволил рассмотреть такие важные методы, как взвешен ный метод наименьших квадратов, конфлюэнтный анализ, дисперсионный анализ, факторный анализ и т.д. Осталось за рамками рассмотрения и такое важное, бурно развивающееся направление, как использование методов непараметрической статистики, т.е. методов, которые для своего примене ния не требуют предположений о законе распределения случайных вели чин вообще и откликов в частности.


Статистические методы в силу своей исключительной важности для современного производства и управления постоянно получают новые им пульсы для своего развития, что приводит к созданию всё новых и новых направлений. Настоящая книга, не претендуя на сколько-нибудь полное рассмотрение современного статистического процесса, может, тем не ме нее, служить той отправной точкой, с которой начинается знакомство с бо гатым арсеналом статистических методов, совершенно необходимых со временному учёному, инженеру или управленцу – каждому, кто заботится об обоснованности своих решений.

ЛИТЕРАТУРА 1. Базара, М. Нелинейное программирование [Текст] / М.Базара, К.Шетти. – М.:

Мир, 1982.

2. Бард, Й. Нелинейное оценивание параметров [Текст] / Й.Бард. – М.: Статистика, 1979.

3. Болч, Б. Многомерные статистические методы для эконометрии [Текст] / Б.Болч, К.Дж.Хуань – М.: Статистика, 1979.

4. Большев, Л.Н. Таблицы математической статистики [Текст] / Л.Н. Большев, Н.В.

Смирнов. – М.: Наука, 1983.

5. Боровков, А.А. Математическая статистика. Оценка параметров. Проверка гипотез [Текст] / А.А.Боровков. – М.: Наука, 1984.

6. Вознесенский В.А. Принятие решений по статистическим моделям [Текст] / В.А.Вознесенский, А.Ф.Ковальчук. – М.: Статистика, 1978.

7. Вучков, И. Прикладной линейный регрессионный анализ [Текст] / И.Вучков, Л.Бояджиева, Е.Солаков. – М.: Финансы и статистика, 1987.

8. Гнеденко, Б.В. Курс теории вероятностей [Текст] / Б.В.Гнеденко. – М.: Наука, 1988.

9. Де Грот, М. Оптимальные статистические решения [Текст] / М. Де Грот. – М.:

Мир, 1974.

10. Дрейпер, Н. Прикладной регрессионный анализ [Текст] / Н.Дрейпер, Г.Смит. – М.:

Статистика, 1973.

11. Коваленко, И.Н. Теория вероятностей и математическая статистика [Текст] / И.Н.Коваленко, А.А.Филиппова. – М.: Высшая школа, 1982.

12. Кокрен, У. Методы выборочного исследования [Текст] / У.Кокрен. – М.: Стати стика, 1976.

13. Кокс, Д. Теоретическая статистика [Текст] / Д.Кокс, Д. Хинкли. – М.: Мир, 1978.

14. Колмогоров, А.Н. Введение в теорию вероятностей [Текст] / А.Н.Колмогоров, И.Г.Журбенко, А.В.Прохоров. – М.: Наука, 1982.

15. Леман, Э. Проверка статистических гипотез [Текст] / Э.Леман. – М.: Наука, 1979.

16. Линник, Ю.В. Метод наименьших квадратов и основы математико-статистической теории обработки результатов измерений [Текст] / Ю.В.Линник. – М.: Физматгиз, 1962.

17. Митропольский, А.К. Техника статистического исчисления [Текст] / А.К. Митро польский. – М. – Л.: ГизСККЛ, 1931.

18. Планирование эксперимента в исследовании технологических процессов [Текст] / под ред. Э.К.Лецкого. – М.: Мир, 1977.

В.А.Пантелеев - 115 - ЛИТЕРАТУРА 19. Прохоров, Ю.В. Теория вероятностей [Текст] / Ю.В.Прохоров, Ю.А.Розанов. – М.:

Наука, 1973.

20. Пугачёв, В.С. Теория вероятностей и математическая статистика [Текст] / В.С. Пу гачёв. – М.: Наука, 1979.

21. Пшеничный, Б.Н. Численные методы в экстремальных задачах [Текст] / Б.Н. Пше ничный, Ю.М.Данилин. – М.: Наука, 1975.

22. Растригин, Л.А. Статистические методы поиска [Текст] / Л.А.Растригин. – М.:

Наука, 1968.

23. Розанов, Ю.А. Теория вероятностей, случайные процессы и математическая стати стика [Текст] / Ю.А.Розанов. – М.: Наука, 1985.

24. Себер, Дж. Линейный регрессионный анализ [Текст] / Дж. Себер. – М.: Мир, 1980.

25. Севастьянов, Б.А. Курс теории вероятностей и математической статистики [Текст] / Б.А.Севастьянов. – М.: Наука, 1982.

26. Смирнов, Н.В. Курс теории вероятностей и математической статистики для техни ческих приложений [Текст] / Н.В.Смирнов, И.В.Дунин-Барковский. – М.: Наука, 1969.

27. Справочник по прикладной статистике [Текст] / под ред. Э. Ллойда, У. Ледермана.

– М.: Финансы и статистика. Том 1, 1989. Том 2, 1990.

28. Уиттл, П. Вероятность [Текст] / П.Уиттл. – М.: Наука, 1982.

29. Феллер, В. Введение в теорию вероятностей и её приложения [Текст] / В.Феллер. – М.: Мир, 1984.

30. Химмельблау, Д. Анализ процессов статистическими методами [Текст] / Д. Хим мельблау. – М.: Мир, 1973.

31. Химмельблау, Д. Прикладное нелинейное программирование [Текст] / Д. Хим мельблау. – М.: Мир, 1975.

32. Численные методы условной оптимизации [Текст] / под ред. Ф.Гилла, У.Моррея. – М.: Мир, 1977.

33. Ширяев, А.Н. Вероятность [Текст] / А.Н.Ширяев. – М.: Наука, 1980.

Научное издание Пантелеев Владимир Алексеевич Статистические основы моделирования Монография Корректор О.В. Мойсеня Технический редактор Л.П. Коровкина План 2008 г., позиция 8(н). Подписано в печать 30.06.2008 г.

Компьютерный набор. Гарнитура Times New Roman.

Формат 60 84 1/16. Бумага офсетная. Печать трафаретная.

Усл. печ.л. 6,7. Уч.-изд.л. 6,4. Тираж 500 экз. Заказ № 220.

Ухтинский государственный технический университет.

169300, г. Ухта, ул. Первомайская, д.13.

Отдел оперативной полиграфии УГТУ.

169300, г. Ухта, ул. Октябрьская, д. 13.



Pages:     | 1 | 2 ||
 





 
© 2013 www.libed.ru - «Бесплатная библиотека научно-практических конференций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.