авторефераты диссертаций БЕСПЛАТНАЯ БИБЛИОТЕКА РОССИИ

КОНФЕРЕНЦИИ, КНИГИ, ПОСОБИЯ, НАУЧНЫЕ ИЗДАНИЯ

<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ


Pages:   || 2 |
-- [ Страница 1 ] --

Национальный институт

ВЫСШАЯ ШКОЛА УПРАВЛЕНИЯ

В. И. Соловьев

МАТЕМАТИКА

для специальностей «Государственное и

муниципальное управление»,

«Менеджмент организации»

Часть 3

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА

В ЭКОНОМИКЕ

Р а з д е л 3.3

РАБОЧАЯ ТЕТРАДЬ

Москва — 2005 УДК 51 (075.8) ББК 22.17я73 Ф., и., о. студента (регион) (группа) В. И. Соловьев, 2005 НИ «ВШУ», 2005 Глава 4. СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ § 4.1. НЕКОТОРЫЕ ВЕРОЯТНОСТНЫЕ НЕРАВЕНСТВА И ИХ СЛЕДСТВИЯ При доказательстве многих теорем теории вероятностей и математиче ской статистики используется ряд вспомогательных неравенств. Впрочем, эти неравенства используются не только в теории вероятностей и математической статистике, но и повсеместно в математике. Читатели наверняка знакомы с большинством из приводимых неравенств из курса математического анализа.

НЕРАВЕНСТВО МАРКОВА. Если неотрицательная случайная величина X име ет конечное математическое ожидание MX, то для любого 0 справедливо неравенство MX P{ X }. (4.1.1) Доказательство. Проведем доказательство для дискретных случайных величин. В вы ражении для математического ожидания MX = xi pi отбросим из суммы в правой части те i слагаемые, для которых : MX = xi pi xp xp p = pi.

., т. е. MX i i i i i i: xi i: xi i: xi i: xi i p = P{ X }, поэтому MX P{ X }, откуда P{ X } MX /, что доказывает Но i i: xi формулу (4.1.1) для д и с к р е т н ы х неотрицательных случайных величин. Справедливость ее для п р о и з в о л ь н ы х неотрицательных случайных величин следует из того, что любая случайная величина может быть приближена монотонно неубывающей последовательностью дискретных случайных величин, и математическое ожидание случайной величины определяет ся как предел последовательности соответствующих математических ожиданий (см. п. 2.6.2).

Из неравенства Маркова (4.1.1) следует НЕРАВЕНСТВО ЧЕБЫШЁВА. Если случайная величина X имеет конечные ма тематическое ожидание MX и дисперсию DX, то для любого 0 справед ливо неравенство DX P{| X MX | } 1 2. (4.1.2) Доказательство. Пусть Y = (X – MX), =, тогда Y 0, 0 и согласно неравенству Марко 2 ва (4.1.1) P{Y } MY / или P{ | X MX| } = P{( X MX )2 2 } DX / 2.

При этом P{ | X MX| } = 1 P{ |X MX| } 1 DX / 2, что и требовалось доказать.

Также из неравенства Маркова (4.1.1) следует, что если математическое ожидание неотрицательной случайной величины X равно нулю, то эта слу чайная величина равна нулю с вероятностью, равной единице.

0, MX = 0, тогда для любого 0 P{ X } MX / = 0, зна Доказательство. Пусть X чит, P{X 0} = 0, и учитывая, что X 0, получаем, что P{X = 0} = 1 – P{X 0} = 1, что и тре бовалось доказать.

Теперь мы можем провести доказательство, обещанное в п. 2.2.2.

Доказательство второй части утверждения о формуле для дисперсии константы (2.2.20).

Покажем, что если для некоторой случайной величины X выполняется равенство DX = 0, то существует такое число c = MX, что P{X = c} = 1, т. е. с вероятностью, равной единице, эта случайная величина равна константе. Согласно неравенству Чебышёва (4.1.2) для любого 0 P{| X MX | } 1 DX / 2. Но в данном случае DX = 0, т. е. для любого P{|X – MX| } 1. Учитывая, что по теореме об ограниченности вероятности (1.4.8) вероят ность любого события, в том числе, и события {|X – MX| }, не превосходит единицы, заклю чаем, что для любого 0 P{|X – MX| } = 1, откуда P{|X – MX| = 0} = 1, значит, P{X = MX} = 1, т. е. существует такое число c = MX, что P{X = c} = 1, что и требовалось дока зать.

С помощью неравенства Чебышёва (4.1.2) можно доказать ПРАВИЛО ТРЕХ СИГМ ДЛЯ ПРОИЗВОЛЬНОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ. Вероятность P{|X – MX| } для произвольной случайной величины с конечным матема тическим ожиданием и конечной дисперсией составляет не менее 8/9 = 0,(8) 0,89:

P{| X MX | 3 X }. (4.1.3) Доказательство. Согласно неравенству Чебышёва (4.1.2) для любого 2 DX P{| X MX | } 1. Пусть = 3X, тогда P{| X MX | 3 X } 1 = 1 = 1 =, X X (3 X ) 2 2 99 X что и требовалось доказать.

НЕРАВЕНСТВО ЙЕНСЕНА. Для любой случайной величины X и любой выпуклой вверх [выпуклой вниз] функции (x) справедливо неравенство (MX) (MX)].

M(X) [соответственно M(X) (4.1.4) Доказательство. Если функция u(x) в ы п у к л а в в е р х, то для любого x0 R найдет ся такое = (x0), что для всех x R u(x) u(x0) + (x – x0)(x0). Подставляем x0 = MX:

u(MX) + (x – MX)(MX), откуда, учитывая, что величины u(MX) и (MX) не являются u(x) u(MX), что и требовалось. Для в ы п у к случайными, а M(X – MX) = 0, получаем Mu(X) л ы х в н и з функций доказательство аналогично.

Интерпретация неравенства Йенсена такова. Индивидуум, функция по лезности которого выпукла, всегда предпочтет любому случайному доходу X детерминированный доход в размере MX.

НЕРАВЕНСТВО КОШИ – БУНЯКОВСКОГО – ШВАРЦА. Для любых случайных вели чин X, Y справедливо неравенство MX 2 M Y 2.

|M(XY)| (4.1.5) Доказательство. Рассмотрим случайную величину Z = (X + tY), где t R — произволь ное вещественное число. Эта случайная величина неотрицательна, поэтому ее математическое 2 0. Но MZ = M[(X + tY) ] = M[(X) +2tXY + ожидание также будет неотрицательным: MZ 2 2 2 2 2 2 + (tY) ] = M[X ] +2tM[XY] + t M[Y ] = at + bt + c, где a = M[Y ] 0, b = 2M[XY], c = M[X ]. Для того, чтобы квадратный трехчлен at + bt +c, в котором коэффициент a 0, был неотрица тельным, необходимо и достаточно, чтобы дискриминант этого квадратного трехчлена был 2 2 2 2 D = b – 4ac неположителен: 0, т. е. (2M[XY]) – 4M[X ]M[Y ] 0 или 4(M[XY]) 2 MX 2 MY 2, что и требовалось доказать. Если же a = 0, то 4M[X ]M[Y ], откуда |M( XY)| это означает, что M[Y ] = 0, откуда следует, что Y = 0 с вероятностью, равной единице (по следствию из неравенства Маркова), и тогда справедливость неравенства Коши — Буняков ского — Шварца также не вызывает сомнений.

Теперь мы можем провести еще два доказательства, обещанных ранее — в п. 2.10.2.

Доказательство нормированности коэффициента корреляции (3.2.20). Пусть случайные величины X и Y имеют нулевые математические ожидания, тогда MX = 0, MY = 0, DX = 2 2 2 2 2 = M[X ] – (MX) = M[X ], DY = M[Y ] – (MY) = M[Y ], cov(X, Y) = M[XY] – MXMY = M[XY]. Из не | M[XY] | равенства Коши — Буняковского — Шварца (4.1.5) следует, что 1. Учиты M[ X 2 ] M[Y 2 ] | cov(X, Y) | 2 вая, что M[XY] = cov(X, Y), M[X ] = DX, M[Y ] = DY, заключаем, что 1 или DX DY cov( X, Y) 1, т. е. |(X, Y)| 1, откуда и получаем доказываемое неравенство.

X Y Если теперь X и Y — произвольные случайные величины, то случайные величины X = X – MX и Y = Y – MY имеют нулевые математические ожидания, значит, как мы только 1. Но по свойству (3.2.17) (X, Y) = (X, Y), поэтому для любых слу что показали, |(X, Y)| чайных величин X и Y коэффициент корреляции лежит в границах [–1;

1], что и требовалось доказать.

Доказательство второй части утверждения о формуле для коэффициента корреляции линейно связанных случайных величин (3.2.22). Покажем, что если для каких либо случайных величин X и Y |(X, Y)| = 1, то существуют такие числа a, b R, a 0, что P{Y = aX + b} = 1. Пусть X MX Y MY X=,Y=, тогда D X = D Y = 1, = = 1, ( X, Y) = (X, Y).

X Y X Y Поскольку |(X, Y)| = 1, возможны два случая: (X, Y) = 1 и (X, Y) = –1. В случае (X, Y) = 1 имеем: D(Y X) = D Y + D X 2 ( X, Y) = 2[1(X, Y)] = 0, откуда по (недавно до Y X казанной) второй части утверждения о формуле для дисперсии константы получаем, что Y MY X MX существует такая константа c R, что P{Y X = c} = 1 или P = 1, т. е.

= c+ Y X P Y = Y X + MY Y MX + Y c = 1 или P{Y = aX + b} = 1, где a = Y 0, b = MY Y MX + X X X X +Y c. В случае (X, Y) = –1 аналогичным образом получаем: D(Y + X ) = 2[1 + (X, Y)] = 0, откуда P{Y + X = c} = 1 или P Y = Y X + MY + Y MX + Y c = 1, т. е. P{Y = aX + b} = 1, X X Y Y где a = 0, b = MY + MX + Y c. Утверждение доказано.

X X При решении задач могут оказаться полезными еще два неравенства.

НЕРАВЕНСТВО ГЁЛЬДЕРА. Для любых случайных величин X, Y при (0;

1) справедливо неравенство (M |X|1/ ) (M |Y|1/(1 ) ) M | XY|. (4.1.6) НЕРАВЕНСТВО МИНКОВСКОГО. Для любых случайных величин X, Y при r справедливо неравенство (M | X + Y|r ) (M |X|r ) + (M |Y|r ) 1/ r 1/ r 1/ r. (4.1.7) Доказательство этих неравенств оставляем читателю в задачах 392—393.

Задачи 386. Сумма всех вкладов в некотором банке составляет 2 000 000 ден. ед., а вероятность того, что случайно взятый вклад не превысит 10 000 ден. ед., равна 0,8. Оценить с помощью неравенства Маркова число вкладчиков банка.

Решение. Пусть n — число вкладчиков, а (неотрицательная) случайная величина X описывает размер случайно выбранного вклада. Тогда средний размер вклада MX 2 000 MX = ден. ед., и по неравенству Маркова P{ X 10 000}, откуда n 10 MX P{ X 10 000} 1 или P{ X 10 000} 1. Но по условию P{X 10 000} = 0,8, отку n 10 да 1 200/ n 0,8, значит, n 1000 человек.

387. Для новогоднего праздника Петя должен сделать гирлянду из электрических лампочек. Он решает включить их параллельно. Лампочки оказа лись очень низкого качества — вероятность того, что какая либо из них погаснет во время праздника, составляет 0,5. С помощью неравенства Чебышёва оценить вероятность того, что число горящих лампочек будет заключено между 100 и 300.

388. Инвестор покупает ценные бумаги за счет кредита, взятого под i про центов годовых под залог своей недвижимости. Годовая доходность ценных бу маг X представляет собой случайную величину с математическим ожиданием a i и средним квадратичным отклонением. Оценить вероятность того, что ин вестор не сможет вернуть кредит: а) не имея никаких сведений о характере за кона распределения случайной величины X, зная только, что она положительна;

б) предполагая случайную величину X распределенной по нормальному закону.

389. Средние ежедневные расходы на покупку канцелярских принадлеж ностей для офиса банка составляют 1000 руб., а среднее квадратичное отклонение этой случайной величины не превышает 200 руб. Оценить вероятность того, что расходы на канцелярские принадлежности в любой наугад выбранный день не превысят 2000 руб, используя: а) неравенство Маркова;

б) неравенство Чебышёва.

390. По статистическим данным в среднем 87% новорожденных доживают до 50 лет (т. е. вероятность дожития до 50 лет равна 0,87). С помощью неравенст ва Чебышёва оценить вероятность того, что из 1000 новорожденных доля (отно сительная частота) доживших до 50 лет будет отличаться от вероятности не бо лее, чем на 0,04 (по модулю).

391. Пусть X — положительная случайная величина с конечным матема тическим ожиданием. Доказать, что 1/ MX M(1/ X).

392. Доказать неравенство Гельдера (4.1.6).

393. Доказать неравенство Минковского (4.1.7).

394. Доказать, что для любых случайных величин X, Y при 1 справед ливо неравенство M | X + Y| M | X | +M |Y|.

§ 4.2. ВИДЫ СХОДИМОСТИ СЛУЧАЙНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ Мы же встречались ранее с примерами сходимости случайных величин:

когда в п. 2.6.2 определяли и н т е г р а л Л е б е г а, мы рассматривали после довательность случайных величин {Xn}, которая сходится к случайной вели чине X равномерно по. Рассмотрим другие виды сходимости случайных ве личин.

Последовательность случайных величин X1, X2, …, Xn, … сходится почти наверное к случайной величине X, если P {lim Xn = X } = 1.

n Сходимость почти наверное обозначается так:

п. н.

Xn X.

Последовательность случайных величин X1, X2, …, Xn, … сходится по веро ятности к случайной величине X, если для любого lim P {| Xn X | } = 1.

n Сходимость по вероятности обозначается так:

Xn X.

P Последовательность случайных величин X1, X2, …, Xn, … сходится по распределению (или слабо сходится) к случайной величине X, если во всех точках x, в которых функция распределения FX (x) непрерывна, lim FXn (x) = FX (x) n равномерно по x.

Сходимость по распределению обозначается так:

Xn X или Xn X.

D Примером сходимости по распределению является формула Пуассона (1.6.5).

Различные виды сходимости обладают следующими с в о й с т в а м и:

если Xn X, Yn Y, то P P Xn + Yn X + Y, Xn Yn XY ;

P P (4.2.1) если Xn X и (x) — непрерывная функция, то P ( Xn ) ( X) ;

P (4.2.2) если Xn x0 и (x) непрерывна в точке x0, то P (Xn ) (x0 ) ;

P (4.2.3) если Xn x = const, Yn Y, то P Xn + Yn x + Y, Xn Yn xY ;

(4.2.4) п. н.

если Xn X, то Xn X, P (4.2.5) н о н е н а о б о р о т!;

если Xn X, то Xn X ;

P (4.2.6) если Xn x = const, то Xn x ;

P (4.2.7) Доказать свойства (4.2.1)—(4.2.7) мы предлагаем читателю самостоятель но в задаче 395.

Отметим также, что из сходимости по вероятности н е с л е д у е т схо димость математических ожиданий, дисперсий и других характеристик.

При доказательстве центральной предельной теоремы в п. 4.4.1 нам пона добится следующий важный факт, который мы примем без доказательства.

ТЕОРЕМА НЕПРЕРЫВНОСТИ. Следующие три утверждения эквивалентны:

• последовательность случайных величин X1, X2, …, Xn, … сходится по распределению к случайной величине X: lim FXn (x) = FX (x) равномерно по x;

n • последовательность производящих функций случайных величин X1, X2, …, Xn, … сходится к производящей функции случайной величины X :

lim Xn (z) = X (z) равномерно по z;

n • последовательность характеристических функций случайных величин X1, X2, …, Xn, … сходится к характеристической функции случайной вели чины X : lim gXn (t) = gX (t) равномерно по t.

n Доказательство теоремы непрерывности можно найти, например, в книгах [16, 49].

Задачи 395. Доказать свойства (4.2.1)—(4.2.7).

396. Привести пример такой последовательности случайных величин Xn (n = 1, 2, …), чтобы она сходилась по вероятности к некоторой случайной ве личине X, но при этом lim MXn MX.

n 397. Доказать, что из сходимости почти наверное следует сходимость по вероятности, а обратное утверждение неверно.

§ 4.3. ЗАКОНЫ БОЛЬШИХ ЧИСЕЛ Под з а к о н а м и б о л ь ш и х ч и с е л понимается обобщенное назва ние группы теорем, утверждающих, что при неограниченном увеличении чис ла испытаний средние величины сходятся (в каком то из смыслов, рассмот ренных в предыдущем параграфе) к некоторым постоянным. Наиболее общей из этих теорем является теорема Чебышёва, также называемая просто зако ном больших чисел.

ТЕОРЕМА ЧЕБЫШЁВА. Если дисперсии некоррелированных случайных вели чин X1, X2,…, Xn ограничены сверху числом B, то для произвольного сколь угодно малого 0 справедливо неравенство n n X MX i i=1 i B P 1 i=1 (4.3.1) n n n и предельное равенство n n X MX i i=1 i lim P = 1, n i= (4.3.2) n n т. е.

n n Xi MX i i=1 i= P.

n n Доказательство. Очевидно, если X1, X2,…, Xn — случайные величины, то величина n X i X= i = также является случайной, причем по свойствам математического ожидания и n n MX i дисперсии M X = i=1, и поскольку случайные величины X1, X2,…, Xn некоррелированы, n n DXi D X = i=1 2 X то. Применим к случайной величине неравенство Чебышёва:

n n n n X i MX i DXi DX P i=1 = P{| X M X | } 1 2 = 1 i=1 2 2.

n i = n n n n DX B i nB B B, получим, что 1 1 = = 1 2, т. е.

i =1 i = Учитывая, что все DX i n n n n 22 доказана справедливость неравенства (4.3.1). Переходя в этом неравенстве к пределу при n, получаем равенство (4.3.2).

Закон больших чисел утверждает, что среднее арифметическое случай ных величин при возрастании их числа обладает свойством статистической устойчивости, т. е. сходится по вероятности к н е с л у ч а й н о й величине — среднему арифметическому математических ожиданий этих случайных величин. Практическое применение закона больших чисел состоит в том, что среднее арифметическое, вычисленное по достаточно большому числу ре зультатов измерений какой либо величины, будет сколь угодно близко к из меряемой величине.

Статистическая устойчивость относительной частоты появления успеха в серии независимых испытаний доказывается в следующей теореме.

ТЕОРЕМА БЕРНУЛЛИ. Если вероятность успеха в каждом из n независимых испытаний постоянна и равна p, то для произвольного сколь угодно малого 0 справедливо предельное равенство m lim P p = 1, (4.3.3) n n где m — число успехов в серии из n испытаний.

Доказательство. Рассмотрим случайные величины X1, X2, …, Xn, определяемые по сле дующему правилу:

1, если произошел успех в i м испытании [с вероятностью p], Xi = 0, если не произошел успех в i м испытании [с вероятностью (1 p)].

n Тогда MX i = p, DX i = p(1 p), m = X i. Поскольку 0 p 1, дисперсии случайных ве i = личин Xi ограничены сверху единицей (так как DXi = p(1 p) 1 ), и можно воспользоваться теоремой Чебышёва (4.3.2), согласно которой n n Xi MXi m m np i=1 lim P p = lim P = lim P = 1, i = n n n n n n n n что и требовалось доказать.

Теорему Бернулли, очевидно, можно записать и в форме, аналогичной (4.3.1):

m p(1 p) P p 1. (4.3.4) n n Если для некоторой последовательности случайных величин вместо схо димости по вероятности имеет место сходимость почти наверное:

n n Xi MX i п. н.

i=1 i=, n n то говорят, что такая последовательность удовлетворяет усиленному закону больших чисел.

Задачи 398. Последовательность некоррелированных случайных величин X1, X2, X3,… определяется по следующему правилу: случайная величина Xi принимает значения n, 0, n с вероятностями 1/n, 1 – 2/n, 1/n соответст венно. Доказать, что для этой последовательности выполняются условия теоре мы Чебышёва.

Доказательство. Условия теоремы Чебышёва выполнены, поскольку MXi = 0, DXi = 2.

399. Для определения среднего дохода налогоплательщиков города нало говой инспекцией была проведена проверка 250 жителей этого города, отобран ных случайным образом. Оценить вероятность того, что средний годовой доход жителей города отклонится от среднего арифметического X = X i /250 годо i= вых доходов выбранных 250 жителей не более, чем на 1000 руб., если известно, что среднее квадратичное отклонение годового дохода не превышает 2500 руб.

Решение. Согласно неравенству (4.3.1), которым можно пользоваться, поскольку все n n X i MX i i=1 2500 2500 DXi (2500), P 1000 i = = 1 = 0,975.

n 250 1000 n 400. Доказать, что для последовательности некоррелированных случай ных величин X1, X2, X3, …, определяемых рядом распределения a Xi a n +1 n p 2n + 1 2n + выполняется усиленный закон больших чисел.

401. Доказать, что для последовательности некоррелированных случай ных величин X1, X2, X3,…, таких что MX i = a, DX i b (i = 1, 2, 3, …), выполняется усиленный закон больших чисел.

§ 4.4. ЦЕНТРАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА 4.4.1. Т е о р е м ы Л е в и, Л я п у н о в а и Л и н д е б е р г а Законы больших чисел устанавливают факт приближения среднего зна чения большого числа случайных величин к некоторым постоянным в виде сходимости последовательностей случайных величин по вероятности и почти наверное. Но этим не ограничиваются закономерности, возникающие в ре зультате суммарного действия случайных величин. Центральная предельная теорема — это общее название группы теорем, утверждающих, что достаточ но большая сумма сравнительно малых случайных величин распределена приближенно по нормальному закону.

Практическое значение центральной предельной теоремы велико — она составляет теоретико вероятностную основу методов м а т е м а т и ч е с к о й с т а т и с т и к и.

ТЕОРЕМА ЛЕВИ. Если независимые случайные величины X1, X2, …, Xn, … рас пределены по одному и тому же закону с математическим ожиданием a и средним квадратичным отклонением, то при n случайная величина n (X a) i Zn = i= n сходится по распределению к стандартной нормальной случайной величине N (0;

1) :

Zn N (0;

1).

tY Доказательство. Пусть gY(t) = Me — характеристическая функция случайных величин Yi = Xi – a (так как законы распределения этих случайных величин одинаковы, то и характе ристическая функция у всех них одна и та же). Напишем разложение этой функции в р я д М а к л о р е н а:

Y t (Y t)2 (Y t)3 gY (t) = M e Yi t = M 1 + i + i + i eYi t, 1! 2! 3!

где (0;

1).

При этом, поскольку M(Yi t) = tMYi = tM( X i a) = t 0 = 0, M((Yi t)2 ) = t 2MYi2 = t 2 (MYi2 02 ) = = t 2 (MYi2 (MYi )2 ) = t 2DYi = t 2 (D(Yi + a)) = t 2DXi = t 22, получаем, что M(Yi t) M ((Yi t) ) (Y t)3 (Y t)3 0 t 22 t + M i eYi t = 1 + + + M i eYi t = 1 + gY (t) = M(1) + + +(t), 3! 3! 1! 2! 1! 2! 2!

(Y t)3 где (t) = M i eYi t.

3! Найдем теперь характеристическую функцию случайной величины n n (X a) Y i i Zn = = i =1 i =.

n n Имеем:

n Yi n tYi i= = M e n, t gZ (t) = M eZn t = M e n i= и поскольку математическое ожидание произведения независимых случайных величин рав но произведению их математических ожиданий, n tYi n t t n ( ) n.

tYi = g Y gZ (t) = M e n = M e n = gY n n i=1 i=1 i = Здесь t n t t = 1 + t + t = 1 + t + t, 22 = 1+ + gY n n n n 22n 2n 2!

tY 3 i tYi ( ) n tYi t t e n = = M M Yi3 e n.

n 3! 6 n n Примем дополнительное н е о б я з а т е л ь н о е п р е д п о л о ж е н и е, упрощаю щее доказательство. Будем считать, что случайные величины Yi ограничены в совокупности:

|Yi| A, i = 1, 2, 3, …, тогда при |t| T ( ) 6A n| t |n M(e ) tYi t At t3 3 = M Yi3 e n n n 63 n n и t = 1 + t + t = 1 + t (1 + n (t)), 2 gY n n 2n 2n ( )= A ( ) 2n t 2n A3 | t | At At |t| n (t) = M e M e n n t 2 n t 2 63 n n n 3 n равномерно по t.

Это означает, что 2 n t n t 1 + t = e 2, gY gZ (t) = 2n n n т. е. последовательность характеристических функций случайных величин Zn сходится рав номерно по t к характеристической функции случайной величины N (0;

1), значит, по теоре ме непрерывности (см. § 4.2) Zn N (0;

1), что и требовалось доказать.

Приведем строгую формулировку двух более общих теорем (без доказа тельства).

Рассмотрим последовательность произвольных независимых случайных величин X1, X2, …, Xn, …, и пусть MX i = a i, DX i = 2.

i Говорят, что для этой последовательности случайных величин выполня ется у с л о в и е Л я п у н о в а, если n M | X ai | i =0.

i= (4.4.1) lim n 3/ n i i= ТЕОРЕМА ЛЯПУНОВА. Если независимые случайные величины X1, X2,…, Xn удовлетворяют условию Ляпунова (4.4.1), то случайная величина n (X MX i ) i Zn = i= n i i= сходится по распределению к стандартной нормальной случайной величине N (0;

1) :

Zn N (0;

1).

С м ы с л у с л о в и я Л я п у н о в а состоит в том, что при его выполне нии дисперсия каждой случайной величины Xi составляет лишь м а л у ю ч а с т ь в общей дисперсии суммы X1 + X2 + · · · + Xn. Если бы это было не так, а, например, величина X1 имела бы существенно больший разброс, чем остальные величины X2, X3, …, Xn, то закон распределения суммы X1 + X2 + · · · + Xn опреде лялся бы в основном величиной X1, и тогда ожидать нормального распределе ния суммы X1 + X2 + · · · + Xn не было бы оснований. Если же все случайные вели чины X1, X2, …, Xn вносят в дисперсию суммы X1 + X2 + · · · + Xn приблизительно равноправный вклад, то сумма будет распределена по нормальному закону.

Говорят, что для этой последовательности случайных величин выполня ется у с л о в и е Л и н д е б е р г а, если для любого n (xi ai )2 fi (xi )dxi i=1 | x a |b =0, (4.4.2) lim i i n n n i i= n где bn = i i= ТЕОРЕМА ЛИНДЕБЕРГА. Если независимые случайные величины X1, X2,…, Xn удовлетворяют условию Линдеберга (4.4.2), то случайная величина n (X MX i ) i Zn = i= n i i= сходится по распределению к стандартной нормальной случайной величине N (0;

1) :

Zn N (0;

1).

С м ы с л у с л о в и я Л и н д е б е р г а таков. В знаменателе дроби стоит сумма дисперсий случайных величин X2, X3, …, Xn, а в числителе — сумма «хвостов» этих дисперсий. Когда условие Линдеберга выполняется, говорят, что «хвосты» дисперсий «легкие».

Теорема Линдеберга является наиболее общей из приведенных форму лировок центральной предельной теоремы: и из условий теоремы Леви, и из условия Ляпунова следует условие Линдеберга.

Таким образом, в условиях центральной предельной теоремы P {Zn z} FZ (z) = + 0 (z).

n В ряде задач приходится сталкиваться с ситуацией, когда исследуемая случайная величина является суммой большого числа независимых слагае мых, влияние каждого из которых на сумму очень мало. Такими случайными величинами являются, например, капиталы банков и страховых компаний (доля каждого отдельно взятого вкладчика не зависит от доли других вклад чиков и относительно мала, но в сумме все эти доли весьма весомы), выручка торговых предприятий (покупатели действуют независимо друг от друга и по купают товары на относительно небольшие суммы) и др. — мы уже говорили об этом в п. 2.5.3.

На основании центральной предельной теоремы часто можно до наблю дения того или иного явления сказать, что соответствующая случайная вели чина должна иметь нормальное распределение или близкое к нему.

Пусть n X ua i X= x= i=,, / n n тогда n Xi n i=1 Xi a i=1 n n u = P / n x = P{ X u} = P (4.4.3) n X i na ua i=1 1 1, x + 0 (x) = + = P n n 2 / n т. е. выборочное среднее X при n сходится по распределению к случай ной величине, распределенной по нормальному закону с параметрами aX = a, X = / n.

Задачи 402. Суточная выручка в универсаме равна в среднем 100 000 руб. и в 90% случаев отличается от 100 000 руб. не более, чем на 10 000 руб. Найти вероят ность того, что очередная суточная выручка окажется в пределах от 80 000 до 120 000 руб.

Решение. Пусть X — суточная выручка. Как было отмечено выше, покупатели действуют независимо друг от друга и покупают товары на относительно небольшие суммы X X, но i покупателей в районе достаточно много, так что можно считать, что их количество n. По этому суммарная выручка будет иметь нормальное распределение с некоторыми параметра ми a и. Поскольку для нормального распределения a = MX, то по условию a = MX = 100 000.

Также в условии сказано, что P{90 000 X 110 000} = 0,9. Но P{90 000 X 110 000} = 110 000 a 90 000 a = 10 000 10 000 = 2 10 000, откуда 10 000 = 0,45, = 0 0 0 0 0 10 1,65. Искомая вероятность P{80 000 X 120 000} = и по таблице можно найти 120 000 100 000 80 000 100 20 = 2 (2 1,65) = 2 (3,3) = 2 0,4995 = 0,999.

= 0 = 0 0 403. Банкомат выдает стандартные суммы в 500, 100 и 50 долл., причем первые составляют 10%, а последние — 60% всех выдач. В среднем банкомат производит 100 выдач в сутки. Определить размер денежной суммы, которую необходимо заложить в банкомат утром, чтобы этой суммы с вероятностью 0, хватило для выдачи наличности вкладчикам до следующего утра.

404. При составлении статистического отчета нужно было сложить чисел, каждое из которых было округлено с точностью до 10–m. Предполагая, что ошибки, возникающие при округлении, независимы в совокупности и рас пределены равномерно на отрезке [–0,5·10–m;

0,5·10–m], определить пределы, в которых с вероятностью, большей 0,987, будет лежать суммарная ошибка.

405. Торговец газетами ходит по вагонам электропоездов. В каждом из ва гонов он может продать газету с вероятностью 1/3. Случайная величина X — число вагонов, в которые заходил торговец прежде, чем продал первые 100 газет.

Найти распределение случайной величины X.

Решение. Пусть Yi — число вагонов, которые обошел торговец за время от продажи (i – 1) й газеты до продажи i й. Тогда все Yi (i = 1, 2, …, n) имеют одинаковый (геометриче n ский) закон распределения, X = Yi. Согласно центральной предельной теореме, при i = большом n случайная величина X имеет нормальное распределение. Предоставляем чита телю показать, что параметры этого распределения равны a = 300, = 30.

406. Построить на одном рисунке графики композиций двух, трех, четырех одинаковых равномерных распределений. На том же рисунке построить график плотности нормального распределения. Убедиться, что при увеличении числа сла гаемых графики сближаются.

407. Построить на одном рисунке графики композиций двух, трех, четырех одинаковых показательных распределений. На том же рисунке построить график плотности нормального распределения. Убедиться, что при увеличении числа сла гаемых графики сближаются.

408. В условиях задачи 390 найти вероятность того, что из 1 000 новорож денных доля (относительная частота) доживших до 50 лет: а) будет заключена в пределах от 0,9 до 0,95;

б) будет отличаться от вероятности не более, чем на 0, (по модулю).

409. Мера длины «фут», как видно из названия, имеет прямое отношение к ноге: это длина ступни. Но, как известно, размеры ног бывают разные. Немцы в XVI в. выходили из положения так. В воскресный день ставили рядом 16 первых вышедших из церкви мужчин, сумма длин их левых ступней делилась на 16 — средняя длина и была «правильным и законным футом». Известно, что размер стопы взрослого мужчины того времени описывается случайной величиной с ма тематическим ожиданием 262,5 мм и средним квадратичным отклонением 12 мм.

Найти вероятность того, что два «правильных и законных фута», рассчитанных указанным способом в разные дни, отличаются друг от друга более, чем на 5 мм.

Сколько нужно было бы взять мужчин для того, чтобы с вероятностью, большей 0,99, средний размер их ступней отличался бы от 262,5 мм менее, чем на 0,5 мм?

4.4.2. Т е о р е м ы М у а в р а — Л а п л а с а Приведем теперь два следствия из центральной предельной теоремы, от носящиеся к н е з а в и с и м ы м и с п ы т а н и я м.

ЛОКАЛЬНАЯ ТЕОРЕМА МУАВРА — ЛАПЛАСА. Если вероятность p успеха в каж дом испытании отлична от нуля и единицы, а число испытаний n доста точно велико, то для расчета вероятности Pn (k) появления ровно k успехов в серии из n испытаний можно пользоваться приближенной формулой k np 1 Pn (k) ( k = 0,1, 2, … ), (4.4.4) np(1 p) np(1 p) где (u) — функция плотности нормального закона распределения.

На практике, очевидно, вероятность появления любого конкретного числа успехов близка к нулю. Это имеет простое объяснение — ведь всего есть (n + 1) различных событий (может наступить 0, 1, 2, …, n успехов), и сумма ве роятностей этих (n + 1) событий должна быть равна единице. Поэтому важно уметь вычислять вероятности Pn (k1, k2 ) того, что число успехов в серии из n испытаний будет заключено между числами k1 и k2. Для этого используется ИНТЕГРАЛЬНАЯ ТЕОРЕМА МУАВРА — ЛАПЛАСА. Если вероятность p успеха в каждом испытании отлична от нуля и единицы, а число испытаний n дос таточно велико, то для расчета вероятности Pn (k1, k2 ) того, что число ус пехов в серии из n испытаний будет заключено в промежутке [k1;

k2 ), можно пользоваться приближенной формулой k np 0 k1 np Pn (k1, k2 ) 0 2 ( k1 = 0,1, 2, …;

k2 k1 ),(4.4.5) np(1 p) np(1 p) где 0 (u) — функция Лапласа.

Доказательство. Пусть в серии из n испытаний Бернулли произошло X успехов. То гда, случайную величину X = Bi(n;

p), можно представить в виде суммы n независимых оди наково распределенных случайных величин 1, если произошел успех в i м испытании (с вероятностью p), Xi = 0, если не произошел успех в i м испытании [с вероятностью (1 p)]:

т. е.

n X = Xi.

i = При этом по теореме Леви n X nM X X MX i i x = lim P x = +0 (x).

i =1 lim P n n n n Но MXi = p, = p(1 p), поэтому X np lim P x = +0 (x) n p(1 p) n и k np 1 +0 k1 np = 0 k2 np 0 k1 np, lim Pn (k1 ;

k2 ) = +0 1 np(1 p) 2 np(1 p) np(1 p) np(1 p) n что и требовалось доказать.

Локальная теорема Муавра — Лапласа (4.4.5) является простым следствием инте гральной теоремы Муавра — Лапласа (4.4.6), что предлагаем читателю доказать самостоя тельно в задаче 417.

Задачи 410. Строительная фирма для привлечения инвестиций в строительство нового дома собирается воспользоваться банковским кредитом. Вероятность то го, что какой либо банк в ответ на поступление бизнес плана примет положи тельное решение о кредитовании фирмы, равна 0,3. Строительная фирма обра тилась в 100 банков. Найти вероятности того, что решения о предоставлении кредитов этой фирме примут: а) ровно один банк;

б) ровно 15 банков;

в) ровно банков;

г) ровно 50 банков.

Решение. Данную ситуацию можно рассматривать как серию из n = 100 испытаний Бернулли, в которых успехом считается принятие банком решения о кредитовании. Вероят ность успеха в единичном испытании равна по условию p = 0,3. Поскольку число испытаний n велико, а произведение np = 30 10, можно воспользоваться локальной теоремой Муав = 1 1 30 = 0,22(6,33) = 1100 0, 1 ра — Лапласа: P100 (1) 21 100 0,3 (1 0,3) 100 0,3 (1 0,3) 1 15 = 0,22(3,27) = 0,22(3,27) = 0,220,0020 = 0,00044, = 0,22(6,33) 0,220 = 0, P100 (15) 21 1 30 = 0,22(0) = 0,220,3989 = 0,088, P100 (50) 1 50 30 = 0,22 (4,36) P100 (30) 21 21 21 0,220 = 0.

411. Вероятность появления успеха в каждом из независимых испытаний равна 0,25. Найти вероятность того, что в серии из 300 испытаний успех наступит ровно 75 раз.

412. Вероятность появления успеха в каждом из независимых испытаний равна 0,25. Найти вероятность того, что в серии из 300 испытаний успех наступит от 70 до 100 раз.

413. Менеджер ресторана по своему опыту знает, что в среднем около 70% клиентов, заказавших в ресторане столик на вечер, приходят вечером в ресто ран. В ресторане 30 столиков, но сегодня менеджер принял заказы у 35 клиентов.

Определить, с какой вероятностью вечером в ресторан придут более чем 30 по сетителей, заказавших столики. Ответ: 0,02.

414. В условиях задачи 410 найти вероятности того, что решения о предос тавлении кредитов этой фирме примут: а) хотя бы один банк;

б) более 15 банков;

в) более 50 банков.

415. Во время каникул Петя работал в предвыборном штабе кандидата в депутаты, который проводил выборочный опрос избирателей. Примерное рас пределение голосов было известно: по 40% избирателей «за» и «против» канди дата, остальные воздержались. Сколько нужно опросить людей, чтобы с вероят ностью, не меньшей 0,9, гарантировать отклонение процента голосов, отданных за кандидата при выборочном опросе, от истинного мнения избирателей не более, чем на 2% от всего электората?

416. В дачном поселке 2500 жителей, каждый из которых примерно шесть раз в месяц ездит на поезде в город, выбирая дни поездок случайным образом и не зависимо от других жителей. Какой наименьшей вместимостью должен обладать поезд, чтобы он переполнялся в среднем не чаще одного раза в 100 дней (поезд хо дит раз в сутки).

417. Доказать локальную теорему Муавра — Лапласа (4.4.3) как следствие интегральной теоремы Муавра — Лапласа (4.4.4).

§ 4.5. МАТЕМАТИЧЕСКИЕ ОСНОВЫ ТЕОРИИ СТРАХОВАНИЯ Эффективным способом уменьшения потерь от неопределенностей явля ется объединение отдельных людей и организаций в с т р а х о в ы е с о о б щ е с т в а, поскольку трудно предсказать время, место и характер событий, способных повлиять на экономическое состояние индивидуумов, вместе с тем, по з а к о н у б о л ь ш и х ч и с е л, средние (или суммарные) потери большой группы индивидуумов предсказать можно. В страховых сообществах каждый индивидуум вносит сумму, намного меньшую его возможного ущерба, и в слу чае наступления ущерба убытки возмещаются из средств, собранных всеми членами сообщества, в случае же, когда для кого то из членов страхового со общества ущерб не наступает, первоначально выплаченная этим индивидуу мом сумма распределяется между теми членами сообщества, которые понесли убытки.

Первая математическая модель страхования была построена Т. Барруа в 1834 г. (она была нами уже рассмотрена в п. 2.7.2.), современные актуарные (т. е. страховые) модели восходят к Ф. Лундбергу, который в 1903 г. заложил ос новы а к т у а р н о й т е о р и и р и с к а.

По д о г о в о р у с т р а х о в а н и я одна сторона (с т р а х о в а т е л ь) платит другой стороне (с т р а х о в щ и к у) определенную денежную сумму (с т р а х о в у ю п р е м и ю), и за это страховщик гарантирует в о з м е щ е н и е возможных убытков страхователя (в случае их возникновения). Смысл договора страхования состоит в том, что страхователь подвержен определен ному р и с к у (который заключается в возможном наступлении некоторого страхового случая) и стремится от этого риска защититься, а задачей стра ховщика является предоставление такой защиты. В качестве с т р а х о в о г о с л у ч а я может выступать болезнь, смерть, автомобильная авария, потеря имущества при пожаре, потеря финансовых средств при неблагоприятно складывающейся рыночной ситуации, а также отмеченные выше переломы ног у балерин, пальцев у пианистов, зубов у фотомоделей и т. п. В договоре страхования указываются срок его действия, условия и способ возмещения ущерба. Например, в договоре страхования гражданской ответственности во дителя транспортного средства обычно указывается, что если в момент насту пления страхового случая (при аварии) водитель находился в состоянии алко гольного опьянения, то страховщик ответственности по полису не несет. Если в указанный в договоре страхования срок страховой случай не наступил, страхователь теряет уплаченную премию.

Далее мы более подробно рассмотрим математические модели страхова ния жизни, которое получило наибольшее развитие.

Договор страхования жизни может быть обязательным (в силу действия определенного закона) или добровольным (по взаимному волеизъявлению страховщика и страхователя), краткосрочным (как правило, на один год) или долгосрочным.

Основным источником случайности в страховании жизни является неоп ределенность момента смерти отдельного человека. Однако в случае, когда од новременно у одного и того же страховщика страхуется большая однородная (по возрасту, полу, типу профессии, месту проживания и т. п.) группа страхо вателей, в силу закона больших чисел можно говорить об у с т о й ч и в о с т и о т н о с и т е л ь н ы х ч а с т о т и рассматривать продолжительность жизни как неотрицательную случайную величину X с функцией распределения F(x) = P{X x}. Функция выживания s(x) = P{X x} = 1 – F(x), (4.5.1) равна вероятности того, что человек из данной однородной группы проживет не менее x лет. Функция выживания (4.5.1) предполагается монотонно убы вающей (иначе в определенных интервалах времени смерть будет невозмож на) и непрерывной (иначе возможны моменты, в которые смерть наступает с положительной вероятностью). Кроме того, функция выживания (4.5.1) долж на удовлетворять всем свойствам, которые следуют из того, что F(x) = 1 – s(x) является ф у н к ц и е й р а с п р е д е л е н и я случайной величины X.

Пусть T(x) = X – x — о с т а т о ч н о е в р е м я ж и з н и человека в возрасте x лет. Через px = P{T(x) t} t обозначается вероятность того, что человек в возрасте x лет проживет еще не менее t лет.

По определению условной вероятности P{ X x + t} p0 s(x + t) x+t px = P{T(x) t} = P{ X x + t| X x} = = =.

t P{ X x} x p0 s(x) В т а б л и ц а х п р о д о л ж и т е л ь н о с т и ж и з н и рассматривается группа новорожденных одного пола, проживающих в одинаковой местности, в количестве l0 чел. Пусть Xk — продолжительность жизни k го человека из данной группы (k = 1, 2, …, l0). Количество доживших до возраста x обозначим L(x), и в таблицах продолжительности жизни приводится математическое ожидание случайной величины L(x):

l0 l lx = ML(x) = P{ Xk x} = s(x) = l0s(x).

k=1 k= Фрагмент такой таблицы продолжительности жизни для городского на селения Российской Федерации в 1993 г. приведен в табл. 4.5.1.

Простейший вид к р а т к о с р о ч н о г о с т р а х о в а н и я ж и з н и за ключается в следующем. Страхователь (некоторый человек) платит страхов щику (страховой компании) страховую премию в сумме c ден. ед., а страхов щик соглашается выплатить наследникам страхователя страховую выплату (или страховое пособие) в сумме b ден. ед. в случае его смерти в течение года (и не платить ничего в противном случае).

Величина страховой выплаты, конечно, должна быть много больше стра ховой премии.

Т а б л и ц а 4.5. Фрагмент таблицы продолжительности жизни городского населения Российской Федерации в 1993 г.

Женщины Мужчины Женщины Мужчины x x s(x) s(x) s(x) s(x) lx lx lx lx 0 100 000 1,00000 100 000 1,00000 55 87 007 0,87007 64 338 0, 1 98 324 0,98324 97 822 0,97822 60 82 469 0,82469 54 864 0, 5 97 922 0,97922 97 416 0,97416 65 76 558 0,76558 44 222 0, 10 97 790 0,97790 97 080 0,97080 70 67 118 0,67118 32 706 0, 15 97 623 0,97623 96 764 0,96764 75 53 628 0,53628 21 417 0, 20 97 278 0,97278 95 804 0,95804 80 36 986 0,36986 11 814 0, 25 96 832 0,96832 94 194 0,94194 85 20 192 0,20192 5113 0, 30 96 296 0,96296 92 009 0,92009 90 7607 0,07607 1571 0, 35 95 572 0,95572 89 008 0,89008 95 1591 0,01591 297 0, 40 94 474 0,94474 85 003 0,85003 99 237 0,00237 48 0, 45 92 831 0,92831 79 644 0,79644 100 130 0,00130 28 0, 50 90 335 0,90335 72 722 0,72722 110 0 0,00000 0 0, Одной из важнейших задач актуарной математики является вычисление соотношений между страховой выплатой b и страховой премией c.

ТЕОРЕМА О СУММАРНОМ ДОХОДЕ СТРАХОВЩИКА. Пусть страховщик продал страхователям одного пола, одного возраста (x лет), проживающим в оди наковой местности, n договоров страхования, согласно которым в случае смерти страхователя в течение ближайшего года его наследникам выплачи вается страховая выплата b ден. ед. Стоимость одного договора равна c ден. ед., а годовая ставка безрисковых вложений составляет i.

Тогда n(c(1 + i) bpx ) u(1 + i) + 0 npx.

u} = 0 P{U (4.5.2) 1 p b npx (1 px ) x Доказательство. В общем случае страховщик получит доход, не меньший u, если раз ность U между суммарной страховой премией и суммарными страховыми выплатами за год окажется не менее u.

Суммарная страховая премия, которую получит страховщик от всех n страхователей, равна, очевидно, C = nc ден. ед. Пусть за год наступит K страховых случаев (умрет K человек из n страхователей). Тогда суммарные страховые выплаты составят B = Kb ден. ед. Приведя – их к настоящему времени [умножив на коэффициент дисконтирования v = (1 + i) ], полу чим, что искомая вероятность { }{ } (nc u)(1 + i) Kb u} = P nc u =P K P{U.

1+ i b Вероятность того, что любой страхователь, случайно выбранный из n человек, которые приобрели полисы, умрет в течение ближайшего года, можно найти по таблице продолжи тельности жизни для данной социальной группы:

s(x + 1) lx+ px 1 px = =, s(x) lx где lx — количество доживших до возраста x.

При этом страховые случаи не зависят друг от друга, и можно рассмотреть биномиальную случайную величину K = Bi(n;

px) — количество смертей в группе из n страхователей. При n можно воспользоваться интегральной теоремой Муавра — Лапласа, согласно которой k} = P{0 k} = Pn (0;

k) = P{K K k npx 0 npx = k npx + npx.

= 0 0 0 1 p npx (1 px ) npx (1 px ) npx (1 px ) x В частности, { } (nc u)(1 + i) u} = P K = P{U b (nc u)(1 + i) npx + npx = n(c(1 + i) bpx ) u(1 + i) + npx.

b = 0 0 1 px 1 px npx (1 px ) b npx (1 px ) Таким образом, n(c(1 + i) bpx ) u(1 + i) +0 npx, u} = 0 P{U 1 p b npx (1 px ) x что и требовалось доказать.

Определим такое соотношение между страховой выплатой b и страховой премией c на один договор, чтобы с вероятностью, близкой к единице, обес печить страховой компании доход, не меньший u. При этом P{U u} =, по этому по формуле (4.5.4) получим, что n(c(1 + i) bpx ) u(1 + i) + 0 npx =.

0 1 p b npx (1 px ) x или n(c(1 + i) bpx ) u(1 + i) =.

1 + b npx (1 px ) где np x = + 0 1 p.

2 x Если обозначить x квантиль уровня стандартного нормального распре деления N(0;

1), то n(c(1 + i) bpx ) u(1 + i) = x, b npx (1 px ) откуда b (npx + x npx (1 px ) ) c=u+. (4.5.3) n(1 + i) Тем самым доказана ТЕОРЕМА О СООТНОШЕНИИ СТРАХОВОЙ ВЫПЛАТЫ И СТРАХОВОЙ ПРЕМИИ. Пусть страховщик продал страхователям одного пола, одного возраста (x лет), проживающим в одинаковой местности, n договоров страхования, согласно которым в случае смерти страхователя в течение ближайшего года его на следникам выплачивается страховая выплата b ден. ед. Стоимость одного договора равна c ден. ед., а годовая ставка безрисковых вложений составляет i.

Тогда при выполнении соотношения (4.5.3) между страховой выплатой b и страховой премией c на один договор, чтобы с вероятностью, близкой к единице, обеспечить страховой компании доход, не меньший u.

Естественно, в реальных страховых компаниях стоимость договора стра хования складывается из теоретической оценки страховой премии (4.5.3) и оценки средних транзакционных издержек на один договор. Первое из этих слагаемых одинаково для всех страховых компаний, действующих на одном рынке, и компания может обеспечить конкурентоспособность своих страховых продуктов только за счет снижения транзакционных издержек.

Задачи 418. Вероятность смерти тридцатилетнего мужчины составляет 0,006.

Страховая компания заключила 10 000 договоров страхования с мужчинами в возрасте тридцати лет, согласно которым в случае смерти застрахованного лица в течение ближайшего года его наследникам в конце этого года выплачивается 120 000 руб. Стоимость одного договора равна 1200 руб, а годовая ставка по бан ковским депозитам равна 20%. Найти вероятности следующих событий: а) к кон цу года страховая компания окажется в убытке;

б) доход страховой компании превысит 4 000 000 руб.

Решение. Пусть за год наступило K страховых случаев, тогда доход страховой компа нии составит 120 000K U = 10 000 1200 = 100 000(120 K) 1 + 0, здесь мы привели все выплаты к настоящему моменту времени: выплата 120 000 руб. че 120 000.

рез год имеет с е г о д н я ценность 1 + 0, Поэтому компания окажется в убытке (U 0), если за год наступит более 120 страхо вых случаев (т. е. от 121 до 10 000). Доход страховой компании превысит 4 000 000 руб.

(U 4 000 000), если за год наступит менее 80 страховых случаев. Вероятность наступления страхового случая px = 0,006. Всего проводится n = 10 000 испытаний. Поскольку число ис пытаний т велико, можно воспользоваться интегральной теоремой Муавра — Лапласа:

9 61 = 10 000 60 0 121 P10 000 (121;

10 000) 0 = 0 59,64 60 (1 0,006) 60 (1 0,006) 59, = 0 (1287,56) 0 (7,90) 0, т. е. страховая компания окажется в убытке с нулевой вероятностью;

= 0 20 0 60 = 0 80 60 0 60 P10 000 (0;

80) 0 60(1 0,006) 60(1 0,006) 59, 59, = 0 (2,589) 0 (7,77) 0,995, значит, доход страховой компании превысит 4 000 000 руб. с вероятностью 0,995, очень близ кой к единице, т. е. почти наверное.

419. В страховой компании 10 000 клиентов, взнос каждого из которых со ставляет 1000 руб. Вероятность наступления страхового случая равна (по оцен кам экспертов компании) 0,005, а страховая выплата при наступлении страхово го случая составляет 100 000 руб. Определить, на какую прибыль может рассчи тывать страховая компания с вероятностью 0,99. Определить минимальный раз мер страховой премии, при котором страховая компания получит прибыль, не меньшую 1 000 000 руб., с вероятностью 0,999.

Глава 5. ВВЕДЕНИЕ В МАТЕМАТИЧЕСКУЮ СТАТИСТИКУ § 5.1. ОСНОВЫ ВЫБОРОЧНОГО МЕТОДА 5.1.1. Г е н е р а л ь н а я с о в о к у п н о с т ь и в ы б о р к а Генеральной совокупностью называют совокупность результатов в с е х м ы с л е н н о в о з м о ж н ы х н а б л ю д е н и й над какой либо случайной величиной X (в том числе, и повторяющихся), проводимых в одинаковых ус ловиях. Иными словами, генеральная совокупность представляет собой набор всех возможных значений данной случайной величины. Как правило, огром ный объем генеральной совокупности не позволяет просто переписать все ее элементы, в таких случаях подвергают изучению ограниченное количество значений, отобранных из всей совокупности.

Выборочной совокупностью (или просто выборкой) называют результа ты ограниченного числа наблюдений над случайной величиной X. С у щ н о с т ь в ы б о р о ч н о г о м е т о д а состоит в том, чтобы п о в ы б о р к е как некоторой части генеральной совокупности делать выводы о в с е й гене ральной совокупности в целом.

Выборку называют репрезентативной, если она адекватно отражает ис следуемые свойства генеральной совокупности. Чтобы выборка была репрезен тативной, можно организовать ее следующим образом. Из генеральной совокуп ности случайным образом отбирается элемент и обследуется, после чего возвра щается в общую совокупность и может быть отобран и обследован повторно.

Такая выборка называется повторной случайной. В повторной случайной выборке наблюдения X1, X2, …, Xn независимы и проводятся в одинаковых (с вероятностной точки зрения) условиях, т. е. распределены по одному и тому же закону: FXi (x) = FX (x), i = 1, 2, …, n.

Конкретной выборкой называется конкретный набор чисел x1, x2, …, xn, полученный в результате наблюдений над случайной величиной X, т. е. набор, состоящий из n р е а л и з а ц и й случайной величины X.

Число элементов в выборке называется ее объемом.

Выборочным средним называется величина n X i i= X=. (5.1.1) n Эта величина является в ы б о р о ч н ы м а н а л о г о м м а т е м а т и ч е с к о г о о ж и д а н и я MX.

В ы б о р о ч н ы м а н а л о г о м д и с п е р с и и является, например, ве личина n (X X) i i= = ( X X )2 = 2, (5.1.2) X n называемая выборочной дисперсией.

По результатам наблюдений двумерной случайной величины (X1;

Y1 ), ( X2 ;

Y2 ), …, ( Xn ;

Yn ) можно вычислить выборочную ковариацию n (X X)(Yi Y) i i= cov( X, Y) = ( X X)(Y Y) = (5.1.3) n и выборочный коэффициент корреляции cov(X, Y) X, Y) = (. (5.1.4) Y X Для выборочной дисперсии и выборочной ковариации несложно доказать формулы n n X Xi i= i ( X ) = i= =X X 2 n, (5.1.5) n и n X Y i i i= cov( X, Y) = XY X Y = XY, (5.1.6) n но пользоваться этими формулами можно только в теоретических выкладках, так как при практических расчетах эти формулы обладают существенно большей вычислительной погрешностью, чем их аналоги (5.1.2) и (5.1.3). Дока зать формулы (5.1.5) и (5.1.6) мы предлагаем читателю в задачах 422 и 423.


Несложно также показать, что выборочный коэффициент корреляции заключен в пределах от –1 до 1 и характеризует близость зависимости между выборками X и Y к линейной (рис. 5.1.1).

Чем ближе точки (xi;

yi) расположены к некоторой прямой, тем ближе | ( значение модуля выборочного коэффициента корреляции X, Y) | к единице, | ( и наоборот, чем ближе X, Y) | к единице, тем ближе точки (xi;

yi) расположе ны к некоторой прямой. При этом выборочный коэффициент корреляции ( X, Y) положителен [отрицателен] тогда и только тогда, когда при увеличении одной из величин X, Y значения другой имеют тенденцию к увеличению [соот ветственно, к уменьшению], т. е. прямая, около которой расположены точки (xi;

yi), имеет положительный [соответственно, отрицательный] наклон.

Значение выборочного коэффициента корреляции, близкое к нулю, озна чает отсутствие линейной связи между переменными, но при этом может на блюдаться сильная нелинейная корреляционная зависимость (как на рис. 5.1.1, е, где точки расположены близко к некоторой п а р а б о л е ) или ста тистическая связь, которую в виде функциональной зависимости переменных представить невозможно, так, на рис. 5.1.1, ж приведен пример статистиче ской зависимости, когда с увеличением x растет разброс точек вдоль оси y, однако никакой функцией y = f(x) (линейной или нелинейной) такую зави симость выразить нельзя.

y y y x x x а) в) д) y y y x x x б) г) е) y x ж) Рис. 5.1.1. Виды зависимости между выборками:

сильная линейная прямая,X, Y) 1 (а);

( слабая линейная прямая,X, Y) 0,5 (б);

( сильная линейная обратная,X, Y) 1 (в);

( слабая линейная обратная,X, Y) 0,5 (г);

( отсутствие зависимости,X, Y) 0 (д);

( сильная нелинейная,X, Y) 0 (е);

( зависимость, не являющаяся корреляционной,X, Y) 0 (ж) ( Задачи 420. Вычислить выборочный коэффициент корреляции по результатам наблюдений двумерной случайной величины:

xi 3 4 6 yi 5 10 9 Решение. Последовательно вычисляем x, y, 2, 2, cov( X, Y), заполняя столбцы табл. 5.1.1.

X Y Т а б л и ц а 5.1. Расчет выборочных характеристик в задаче yy (x x)(y y) xx (x x)2 (y y) x y 3 5 –2 4 4 16 4 10 –1 1 1 1 – 6 9 1 0 1 0 7 12 2 3 4 9 y= x=5 (x x)(y y) = 3, (x x)2 = 2,5 (y y)2 = 6, Получили следующие значения:

x = 5;

y = 6,5;

2 = (x x)2 = 2,5;

2 = (y y)2 = 6,5;

cov(X, Y) = (x x)(y y) = 3,25.

X Y Затем находим = 1,58;

Y = = 2,55 и подставляем рассчитанные значения X 2 X Y cov( X, Y) 3, в формулу (5.1.4): X, Y) = ( = 0,81.

Y X 1,58 2, 421. Вычислить выборочный коэффициент корреляции по результатам наблюдений двумерной случайной величины:

x i 2 1 0 1 yi 4 1 422. Доказать формулу (5.1.5).

423. Доказать формулу (5.1.6).

5.1.2. Д о п у с т и м ы й о б ъ е м в ы б о р к и для обеспечения ее репрезентативности Из теоремы Чебышева (4.3.2) следует, что если DX B, то B P{| X MX | } 1, n поэтому при объеме выборки B n (5.1.7)) (1 ) с вероятностью, большей, выполняется неравенство | X MX |, т. е. гаран тируется меньшая, чем, ошибка репрезентативности при замене математи ческого ожидания MX выборочным средним X.

Пусть выборка состоит из n испытаний Бернулли, в которых произошло m успехов. Тогда выборочным аналогом вероятности успеха является отно сительная частота m p=.

n Из теоремы Бернулли (4.3.4) следует, что p(1 p) P{| p |} p, n поэтому при объеме выборки p(1 p) n (5.1.8) (1 ) с вероятностью, большей, выполняется неравенство p |, т. е. гаранти |p руется меньшая, чем, ошибка репрезентативности при замене вероятности p относительной частотой Поскольку для любых p [0,1] p(1 p) 1/4, то p.

при неизвестной p неравенство для n можно заменить на n. (5.1.9) 4(1 ) Если математическое ожидание случайной величины X равно a, ее среднее квадратичное отклонение равно, а объем выборки велик, то соглас но следствию (4.4.3) из центральной предельной теоремы P{| X MX | } = 0 = 20, X MX = P = 0 / n / n / n / n / n / n поэтому при объеме выборки Bu2/ n (5.1.10) (где u /2 — такое число, что 0 (u /2 ) = /2 ) с вероятностью, большей, вы полняется неравенство | X MX |, т. е. гарантируется меньшая, чем, ошиб ка репрезентативности при замене математического ожидания MX выбороч ным средним X. Эту же формулу для объема выборки используют и в случае, когда n велико, и есть основания пользоваться центральной предельной тео ремой.

В частности, при большом числе испытаний Бернулли n и не очень малой вероятности p (такой, что np 10 ) в силу локальной и интегральной теорем Му авра — Лапласа (4.4.6)—(4.4.7) относительная частота имеет нормальный за p кон распределения с параметрами a = p, = p(1 p)/ n, поэтому при объеме выборки u2/2p(1 p) n (5.1.11) (где u /2 — такое число, что 0 (u /2 ) = /2 ) с вероятностью, большей, вы полняется неравенство p |, т. е. гарантируется меньшая, чем, ошибка |p репрезентативности при замене вероятности p относительной частотой p.

Задачи Дисперсия случайной величины X не превышает 10. Требуется 424.

оценить вероятность того, что отклонение выборочного среднего 16 X X= 16 000, рассчитанного по 16 000 результатов наблюдений случай i i= ной величины (независимых, проведенных в одинаковых с вероятностной точ ки зрения условиях) от математического ожидания MX не превысит 0,25.

Решение. По формуле (5.1.7), в которой n = 16 000, B = 10, = 0,25, получаем:

B P{| X MX | } 1 2 = 1 = 0,99. Если обратить внимание на то, что n велико, то n 16 000 0, 20 = 20 0,25 = 20 (10) 1.

согласно (5.1.10) P{| X MX | } = 20 10/16 / n B/ n 425. В условиях задачи 424 требуется определить, сколько следует провести наблюдений, чтобы с вероятностью, не меньшей 0,99, можно было утверждать, что ошибка репрезентативности при замене математического ожидания MX выборочным средним X не превысит 0,2.

B = 10, = 0,99, = 0,2, получим:

Решение. По формуле (5.1.7), в которой B n = = 0,99. Предположив же нормальность распределения случайной (1 ) (1 0,99)0, величины X и воспользовавшись формулой (5.1.10), в которой u /2 =u0,99/2 =u0,495 =2,55 [так как Bu2 /2 10 2, 0 (2,55) = 0,495 ], получим: n = = 1625,6 — значительно меньше 25 000.

2 0, 426. Известно, что в среднем из каждой тысячи кредитов, выданных на развитие малого предпринимательства 30 не возвращаются. Определить, сколько нужно отобрать предприятий, чтобы с вероятностью, не меньшей 0,9, можно было бы ожидать, что доля предприятий в выборке, не возвращающих кредиты, будет отличаться от доли аналогичных предприятий в генеральной совокупности меньше, чем на 0,01.

p(1 p) =0,03, = 0,9, получаем: n = Решение. По формуле (5.1.8), в которой p= (1 ) 0,03 0,. По формуле (5.1.11), учитывая, что u/2 = u0,9/2 = u0,45 = 1,65 (так как 0 (1,65) = 0,45 ), = (1 0,9)0, u2 /2p(1 p) 1,652 0,03 0, n = =792,25 При этом, поскольку np 792,25 0,03 = 23 10, есть 2 0, основания пользоваться теоремами Муавра — Лапласа. Таким образом, необходимо ото брать 793 предприятия.

427. Определить количество респондентов, которых необходимо опро сить, чтобы рейтинг Президента (доля граждан, поддерживающих Президен та), вычисленный по выборке, с вероятностью, не меньшей 0,99, отличался от истинного рейтинга президента для всех жителей страны не более чем на 5% по абсолютной величине.

428. Компания, управляющая зданиями, желает по выборке оценить среднюю стоимость эксплуатации квартир определенного типа с надежностью 99% и ошибкой репрезентативности ±10 ден. ед. Определить объем выборки, необходимой для такой оценки, если из подобного же исследования, проведен ного ранее, известно, что среднее квадратичное отклонение стоимости экс плуатации уне превышает 50 ден. ед.

5.1.3. О ц е н к а ф у н к ц и и р а с п р е д е л е н и я и плотности распределения Расположив элементы выборки в порядке неубывания, получим вариаци онный ряд. Далее будем считать, что именно в таком порядке уже расставлены выборочные наблюдения. Выборочной случайной величиной называется при этом дискретная случайная величина X, задаваемая рядом распределения xl X x1 x (5.1.12) p p1 p2 pl в котором xi (i = 1, 2, …, l) — это варианты1 (расположенные по возрастанию различные элементы выборки), а = mi / n (i = 1, 2, …, l) — отвечающие этим pi значениям относительные частоты (здесь mi — частота варианты xi, т. е.

количество ее появлений в статистическом ряде распределения). При этом, l очевидно, n = mi.

i= Иногда ряд распределения (5.1.12) выборочной случайной величины на зывают статистическим рядом распределения.

Выборочное среднее и выборочную дисперсию можно при этом вычис лить по формулам n l x x m l i i i = x = pi i=1 i= x= ;

(5.1.13) i n n i= k k = (xi x)2 pi = (xi)2 pi (x)2.

X (5.1.14) i=1 i= Для н е п р е р ы в н ы х случайных величин при достаточно больших объе мах выборки n вместо выборочной случайной величиины используют интер вальный вариационный ряд X [a1;

a2 ) [a2 ;

a3 ) [a ;

a+1 ) (5.1.15) p p1 p2 p Ширина интервала x(max) x(min) = (5.1.16) 1 + 3,322lg n (здесь x(min) — минимальный элемент выборки, а x(max) — максимальный, расчет производится с числом знаков после запятой, на один большим, чем в исход ных данных). Границы интервалов [aj ;

aj+1 ) рассчитываются по правилу:

a1 = x(min) /2, a2 = a1 +, a3 = a2 +, …;

формирование интервалов заканчива Варианта — слово женского рода.

ется, как только для конца a+1 очередного интервала выполняется условие a+1 x(max). Значения = mi / n — это выборочные интервальные относи pi тельные частоты: mi — число вариант, попавших в i й интервал ( i = 1, 2, …, ).


По интервальному вариационному ряду (5.1.15) оценки математического ожидания и дисперсии вычисляются точно так же, как и по статистическому ряду распределения, при этом xi = (ai + ai+1 )/2 и, например, выборочное сред нее можно рассчитывать по формуле (5.1.13), а выборочную дисперсию — по формуле (5.1.14).

Выборочным аналогом плотности распределения fX (x) случайной вели чины X служит выборочная плотность распределения, рассчитываемая по интервальному вариационному ряду как f X (x) =/ при x (ai ;

ai+1 ), i = 1, 2, …,, pi (5.1.17) график этой функции называется гистограммой;

ломаная с вершинами в точках (xi;

/ ), где через xi = (ai + ai+1 )/2 обозначены середины интервалов pi — полигоном частот, а фигура, состоящая из прямоугольников, в основании которых лежат интервалы группирования (aj;

aj + 1), а высотами являются значе ния (xj ), называется гистограммой. Кривая распределения относительных fX частот — это ломаная с вершинами (a, f (a )).

i +1 i + X По выборочной плотности распределения легко построить выборочную функцию распределения 0, x a1, i FX (x) = pk, ai x ai+1 (i = 1, 2, …, ), (5.1.18) k= 1, x a+1, ( ) при этом ломаная с вершинами в точках xi;

называется кумулятой.

pi i= По интервальному вариационному можно вычислить оценку медианы случайной величины X — выборочную медиану 0,5 al ) F( = al + xmed, (5.1.19) pl где al — начало медианного интервала, т. е. такого интервала группирования (al;

al + 1), что al ) 0,5, а al+1) 0,5, а также оценку моды случайной величи F( F( ны X — выборочную моду pm pm = am + xm o d, (5.1.20) 2pm pm1 pm+ где am — начало модального интервала, т. е. такого интервала группирования (am;

am + 1), что = max pm pi i=1,2,…, В пакете Microsoft Excel существует надстройка «Анализ данных», в кото рой реализовано автоматизированное решение многих статистических задач.

Эта надстройка состоит из нескольких десятков программ, например, для рас чета интервальных частот и построения полигона, гистограммы и кумуляты, можно воспользоваться программой «Гистограмма» из надстройки «Анализ данных» Microsoft Excel.

Пример использования надстройки «Анализ данных» пакета Microsoft Excel (и, в частности, программы «Гистограмма»)разобран в задаче 432.

Задачи 429. Ежедневные суммарные денежные вклады населения (в тыс. руб.) в отделение банка в течение последних 20 рабочих дней были такими: 60;

20;

70;

70;

30;

20;

50;

50;

40;

60;

30;

40;

30;

50;

50;

60;

50;

60;

40;

40. Построить вариа ционный ряд, статистический ряд распределения, полигон частот, гистограм му, кумуляту, оценить средний суммарный дневной вклад и его среднее квад ратичное отклонение.

Решение. Расположив элементы выборки в порядке возрастания, получим вариацион ный ряд:

20;

20;

30;

30;

30;

40;

40;

40;

40;

50;

50;

50;

50;

50;

60;

60;

60;

60;

70;

70.

Построим теперь статистический ряд распределения (5.1.12):

X 20 30 40 50 60 X 20 30 40 50 60 или 2 3 4 5 4 2 p 0,10 0,15 0,20 0,25 0,20 0, p 20 20 20 20 20 Средний суммарный дневной вклад оценим с помощью выборочного среднего (5.1.13):

2 3 4 5 4 2 l x = xi p i = + 30 + 40 + 50 + 60 + 70 = = 46, 20 20 20 20 20 20 i = а дисперсию — с помощью выборочной дисперсии (5.1.14):

( ) 2 3 4 5 k k = (xi)2 pi x = 2 + 900 + 1600 + 2500 + 3600 + i pi 20 20 20 20 X i =1 i = 2 +4900 462 = 2116 = 2330 2116 = 214, 20 при этом выборочное X = 214 = 14,63.

430. Построить интервальный вариационный ряд, полигон частот, гис тограмму и кумуляту, оценить средний рост студента и его среднее квадра тичное отклонение по данным о росте 30 студентов (в см): 182;

171;

186;

175;

188;

177;

176;

178;

183;

187;

167;

180;

182;

179;

176;

179;

172;

173;

183;

168;

180;

179;

172;

177;

175;

173;

189;

176;

190,5;

172.

Решение. Определим длину интервала по формуле (5.1.16):

x(max) x(min) 190,6 = 4,00.

1 + 3,322lg30 1 + 3,322lg При этом интервальный вариационный ряд (5.1.15) будет иметь вид X [165;

169) [169;

173) [173;

177) [177;

181) [181;

185) [185;

189) [189;

193) 2 4 7 8 4 3 p 30 30 30 30 30 30 Теперь по интервальному вариационному ряду построим выборочную плотность рас пределения (5.1.17) и выборочную функцию распределения (5.1.18):

x 165, x 165, 0, 0, 2, 165 x 169,, 165 x 169, 4 30 4 4 30, 169 x 173, 120, 169 x 173, 7, 173 x 177,, 173 x 177, 4 30 8 fX (x)=, 177 x 181, =, 177 x 181, 4 30 4, 181 x 185,, 181 x 185, 4 30 3, 185 x 189, 120, 185 x 189, 4 2, 189 x 193,, 189 x 193, 4 30 0, 0, x 193 x 193, 0, x 165, 0, 2 x 165,, 165 x 169, 30, 165 x 169, 2 +4, 169 x 173, 30 30, 169 x 173, 2 4 ++, 173 x 177, 30 30 30, 173 x 177, 2 +4+7+8, 177 x 181, = fX (x)= 30 30 30 30, 177 x 181, 2 4 7 8 ++++, 181 x 185, 30 30 30 30 30, 181 x 185, 2 +++++, 185 x 189, 4 7 8 4 30 30 30 30 30 30, 185 x 189, 2 4 7 8 4 3 + + + + + +, 189 x 193, 1, x 193.

30 30 30 30 30 30 1, x 193, Гистограмма (тонкая линия) и полигон частот (полужирная линия) представлены на рис. 5.1.2 а, а кумулята — на рис. 5.1.2, б соответственно. По их внешнему виду можно пред положить, что рост студента подчиняется нормальному закону распределения.

Средний рост студента оценим с помощью выборочного среднего (5.1.13) k 2 4 7 8 4 3 2 535 x = x = + 171 + 175 + 179 + 183 + 187 + 191 = = 178, i pi 30 30 30 30 30 30 30 3 i = k k = (xi) x = pi pi 2 при этом выборочная дисперсия (5.1.14) составит i=1 i X i = 2 4 7 8 4 3 = 27889 + 29241 + 30625 + 32041 + 33489 + 34969 + 36481 – 30 30 30 30 30 30 = 95527 286225 = 356, и оценка среднего квадратичного отклонения роста студен 3 3 9 та будет равна = X 6,29.

x) F( x) f( 0, 0, 0, 0, 0, 0, 0, 0, x x 0 165 169 173 177 181 185 189 193 165 169 173 177 181 185 189 а) б) Рис. 5.1.2. Гистограмма (тонкая линия), полигон частот (жирная линия) (а) и кумулята (б) в задаче 431. По выборке 11;

11;

11;

9;

9;

5;

10;

10;

10;

14 построить вариационный ряд, статистический ряд распределения, полигон частот, гистограмму, куму ляту, вычислить выборочное среднее и выборочную дисперсию.

432. Служба маркетинга оценивает дилеров фирмы по объему продаж.

Сведения об объеме ежедневных продаж товара (в тыс. ден. ед.) дилером за последние 100 дней приведены в табл. 5.1.2.

Т а б л и ц а 5.1. Объем проджаж в задаче 47,0 37,2 52,4 62,8 62,0 67,3 28,2 47,7 61,0 39,1 43,1 33,1 31,5 40,2 42,3 28,8 44,3 46,0 51,3 46, 46,7 46,3 63,4 49,1 48,1 44,9 69,7 58,7 73,8 43,5 66,6 33,9 55,4 59,0 69,2 49,2 44,8 56,8 46,2 57, 35,6 41,5 34,8 46,4 49,7 50,3 46,8 71,9 32,6 42,6 24,2 64,5 37,2 43,5 57,6 54,7 58,7 56,0 36,3 38, 56,9 53,2 40,6 47,6 51,3 55,6 51,4 40,9 68,8 54,9 50,7 58,3 58,6 43,6 40,8 61,1 38,0 34,4 57,1 56, 72,1 64,4 63,0 51,1 50,0 54,5 49,7 39,5 32,3 58,3 54,4 56,2 52,1 39,7 62,4 46,9 41,6 41,8 45,7 45, Требуется построить интервальный вариационный ряд;

полигон и гисто грамму (на одном рисунке);

кумуляту (на другом рисунке).

Решение. Построим интервальный вариационный ряд. В ячейки A1:A101 рабочего лис та Microsoft Excel введем данные об объеме продаж из табл. 5.1.2 (в первой строке — заголо вок, как показано на рис. 5.1.3).

Ширина интервала x(min) x = (max) 1 + 3,322lg n (здесь x(max) — максимальный объем продаж, а x(min) — минимальный, расчет производится с числом знаков после запятой, на один большим чем в исходных данных). Границы интерва лов (aj;

aj+1) рассчитываются по правилу: a1 = x(min) – / 2, a2 = a1 +, a3 = a2 +, …;

фор мирование интервалов заканчивается, как только для конца a+1 очередного интервала вы полняется условие a+1 x(max). Расчет границ интервалов проиллюстрирован рис. 5.1.3.

Для расчета интервальных частот и построения полигона и гистограммы воспользуем ся программой «Гистограмма» из надстройки «Анализ данных» Microsoft Excel. Выберем в ме ню «Сервис | Анализ данных» Microsoft Excel пункт «Гистограмма» (если пункт «Анализ данных»

в меню «Сервис» отсутствует, то это означает, что надстройка «Анализ данных» не установ лена, — чтобы ее установить, необходимо отметить флажок «Пакет анализа» в списке над строек пакета Microsoft Excel, который вызывается с помощью выбора пункта меню «Сер вис | Надстройки»).

A B C Объем продаж за 100 дней Параметры Значения параметров Объем выборки n 47, 2 =СЧЕТ(A2:A101) x(min) 37, 3 =МИН(A2:A101) x(max) 52, 4 =МАКС(A2:A101) 62,8 Ширина интервала 5 =(C4–C3)/(1+3,322*LOG(C2;

10)) 62,0 Границы интервалов 67,3 Левые границы Правые границы 28, 8 =C3–C5/2 =B9+C 47, 9 =B9+C5 =B10+C 61, 10 =B10+C5 =B11+C 39, 11 =B11+C5 =B12+C 43, 12 =B12+C5 =B13+C 33, 13 =B13+C5 =B14+C 31, 14 =B14+C5 =B15+C 40, 15 =B15+C5 =B16+C 16 =B16+C5 =B17+C а) формулы Microsoft Excel A B C Объем продаж за 100 дней Параметры Значения параметров Объем выборки n 47,0 x(min) 37,2 24, x(max) 52,4 73, 62,8 Ширина интервала 6, 62,0 Границы интервалов 67,3 Левые границы Правые границы 28,2 20,956 27, 47,7 27,444 33, 61,0 33,933 40, 39,1 40,422 46, 43,1 46,911 53, 33,1 53,399 59, 31,5 59,888 66, 40,2 66,377 72, 16 72,866 79, б) результаты расчетов Рис. 5.1.3. Расчет границ интервалов В окне ввода исходных данных программы «Гистограмма» (рис. 5.1.4) укажем входной интервал (ссылку на ячейки A1:A101, содержащие данные об объеме продаж;

выделять заго ловок столбца и отмечать флажок «Метки» не будем), интервал карманов (ссылку на ячейки C7:C16, содержащие правые границы интервалов), установим флажок «Метки», которые оз начает, что в первой строке каждого из диапазонов A1:A101 и C7:C16 содержится текстовый заголовок. Укажем, что результаты работы программы необходимо вывести на новый рабо чий лист. Установим флажок для генерации интегральных процентных отношений — значений выборочной функции распределения, также установим флажок автоматического вывода графика — гистограммы и кумуляты. Результаты работы программы «Гистограмма» пред ставлены на рис. 5.1.5.

В столбце «Правые границы» на рис. 5.1.5, а указаны правые границы интервалов, в столбце «Частота» — интервальные частоты, а в столбце «Интегральный %» — накопленные частоты, рассчитанные программой. На рис. 5.1.5, б представлен график, построенный про граммой, — на одной диаграмме построены гистограмма и кумулята (впоследствии мы раз делим этот график на два).

Рис. 5.1.4. Окно ввода данных программы «Гистограмма»

Правые границы Частота Интегральный % 27,444 1 1,00% 33,933 7 8,00% 40,422 12 20,00% 46,911 25 45,00% 53,399 18 63,00% 59,888 20 83,00% 66,377 9 92,00% 72,866 7 99,00% 79,354 1 100,00% Еще 0 100% а) числовые результаты Гистограмма 30 120,00% 25 100,00% 20 80,00% Частота Частота 15 60,00% Интегральный % 10 40,00% 5 20,00% 0 0,00% 27,444 33,933 40,422 46,911 53,399 59,888 66,377 72,866 79,354 Еще Правые границы б) графические результаты Рис. 5.1.5. Результаты работы программы «Гистограмма»

Добавим к таблице, полученной в результате работы программы «Гистограмма» и уже содержащей правые границы интервалов (aj;

aj+1) и интервальные частоты mj, столбцы, со держащие:

• левые границы интервалов;

• середины интервалов x j = (aj + a j+1 )/2 ;

• интервальные относительные частоты = mj / n ;

pj • оценки функции плотности внутри интервалов (x j ) =/.

fX pj Для получения оценок функции распределения в концах интервалов (aj+1 ) = FX p k k j + установим в столбце «Интегральный %» (в результатах работы программы «Гистограмма» — рис. 5.1.5) числовой формат значений с двумя десятичными знаками после запятой.

Теперь заполним табл. 5.1.3.

Т а б л и ц а 5.1. Оценка функции плотности и функции распределения в задаче Интервальная Оценка функ Оценка функ Середина ин Интервальная Интервал ции плотности ции распре относительная тервала xj (aj;

aj + 1) частота mj (x ) деления (aj+1 ) частота pj fX j FX [20,956;

27,444) 24,20 1 0,01 0,0015 0, [27,444;

33,933) 30,69 7 0,07 0,0108 0, [33,933;

40,422) 37,18 12 0,12 0,0185 0, [40,422;

46,911) 43,67 25 0,25 0,0385 0, [46,911;

53,399) 50,16 18 0,18 0,0277 0, [53,399;

59,888) 56,65 20 0,20 0,0308 0, [59,888;

66,377) 63,14 9 0,09 0,0139 0, [66,377;

72,866) 69,63 7 0,07 0,0108 0, [72,866;

79,354) 76,12 1 0,01 0,0015 1, — 100 1,00 — — Итого § 5.2. ТОЧЕЧНЫЕ ОЦЕНКИ ПАРАМЕТРОВ 5.2.1. С в о й с т в а т о ч е ч н ы х о ц е н о к Статистикой называется любая функция = ( X1, X2, …, Xn ) от элемен тов выборки X1, X2, …, Xn [на конкретной выборке x1, x2, …, xn эта статистика принимает конкретное значение = (x1, x2,…, xn ) ]. Очевидно, любая стати стика является случайной величиной, поскольку она является функцией слу чайных величин.

Оценкой числовой характеристики или параметра называется любая статистика = (x1, x2, …, xn ), используемая в качестве приближенного значе ния.

Например, в качестве оценки параметра a = MX случайной величины X, распределенной по нормальному закону (с неизвестными параметрами), мож но использовать:

• a= результат единичного наблюдения X1 ;

X(min) + X(max) • a= ;

полусумму минимального и максимального элементов выборки:

• a= выборочную медиану X med ;

• a= выборочную моду X m o d ;

• a= выборочное среднее X и др.

Как определить, какая из этих оценок лучше?

Качество оценки определяется по выполнению следующих трех свойств:

состоятельности, несмещенности и эффективности.

Прежде всего, от оценки n хотелось бы требовать, чтобы по мере роста числа наблюдений она сходилась по вероятности к оцениваемому параметру, т. е. чтобы для любого сколь угодно малого 0 было справедливо предельное равенство lim P { n n } = 1. (5.2.1) n Оценка n, обладающая свойством (5.2.1), называется состоятельной оценкой параметра.

Также от «хорошей» оценки n естественно требовать, чтобы она не со держала систематической ошибки, т. е. при любом фиксированном объеме вы борки n результат осреднения оценки по всем возможным выборкам данного объема должен приводить к точному значению параметра:

M n =. (5.2.2) Оценка n, обладающая свойством (5.2.2), называется несмещенной оцен кой параметра.

Наконец, от оценки n желательно требовать, чтобы ее дисперсия была минимальной в некотором классе оценок :

D n = min D n. (5.2.3) n Оценка n, обладающая свойством (5.2.3), называется эффективной оцен кой параметра в классе оценок.

Выборочное среднее X (5.1.1) является состоятельной, несмещенной и эффективной (в классе линейных несмещенных оценок) оценкой математиче ского ожидания MX.

Доказательство. Выборочное среднее X является состоятельной оценкой математического ожидания, если генеральная совокупность имеет ограниченную дисперсию, поскольку предель ное равенство lim P{ X MX } = 1 непосредственно следует из теоремы Чебышева (4.3.2), так n n n n X X MX i i i, а M X = M i=1 = i= i = = MX. Из того, что M X = MX, следует также, что как X = n n n выборочное среднее X является несмещенной оценкой математического ожидания MX. Дока зательство эффективности выборочного среднего оставляем читателю в задаче 436.

Относительная частота (5.1.8) является состоятельной, несмещенной и p эффективной (в классе линейных несмещенных оценок) оценкой вероятности успеха p.

Доказательство этого утверждения оставляем читателю в задаче 437.

Выборочная дисперсия (5.1.2) является смещенной оценкой диспер X сии DX :

n M2 = DX DX.

(5.2.4) X n Доказательство. Действительно, 1 n 1n ( ) M2 = M ( X i X )2 = M ( X i2 ) 2M ( X i X ) + M ( X ), n n i= X i = при этом: по определению дисперсии M(X i2 ) = DX i + (MX i )2 = 2 + a2 ;

поскольку наблюдения X i и X j независимы, M( X i X j ) = MX i MX j (при i j ), и n X = MX 2 + (MX MX ) = 1 (2 + a2 + (n 1)a2 ) = + a2 ;

j n i j n j= M( X i X ) = M X i n i n n j= j i наконец, n n X Xi n j = 1 MX 2 + MX MX = 1 (n(2 + a2 ) + n(n 1)a2 ) = + a2.

n n i=1 2 j= M(X ) = M j n n2 i=1 i i n n n i =1 j=1 j i Подставляя найденные выражения для математических ожиданий в формулу для M, получим:

X 1n 1 n 2 2 2 1 2 n 1 2 n M2 = (2 + a2 ) 2 + a2 + + a2 = 2 = n 2 = = DX, n n n i=1 n n n X n i=1 n n поэтому выборочная дисперсия является смещенной оценкой дисперсии.

X Однако смещенность выборочной дисперсии легко исправима, доста X точно в качестве оценки дисперсии выбрать величину n (X X) i n i= s2 = = X, (5.2.5) n 1 n X называемую исправленной выборочной дисперсией;

исправленная выбороч ная дисперсия s2 является состоятельной и несмещенной оценкой дисперсии.

X При доказательстве состоятельности выборочной дисперсии (и исправ ленной выборочной дисперсии), что мы предлагаем сделать читателю само стоятельно в задаче 438 полезно следующее ДОСТАТОЧНОЕ УСЛОВИЕ СОСТОЯТЕЛЬНОСТИ. Для того, чтобы несмещенная оценка n была состоятельной, достаточно, чтобы lim D n = 0.

n Доказательство. Согласно неравенству Чебышёва (4.1.2), для любого P{ | n M n | } 1 D n /, откуда, учитывая несмещенность оценки n (т. е. M n = ), по P{ | n | } 1 D n / 2, и поскольку lim D n = 0, окончательно имеем, что лучаем:

n lim P{ | n | } = 1, т. е. n является состоятельной оценкой.

n Если известно точное значение a = MX математического ожидания нор мальной случайной величины X, распределенной п о н о р м а л ь н о м у з а к о н у, то статистика n (X a) i i= s0 = (5.2.6) n является состоятельной, несмещенной и эффективной (в классе всех несме щенных оценок) оценкой дисперсии DX случайной величины X. Однако на практике оценка (5.2.6) не используется, так как точное значение математиче ского ожидания почти никогда не известно.

Для получения оценки дисперсии случайной величины X, распределен ной по нормальному закону, на основании интервального вариационного ряда с шириной интервала следует пользоваться п о п р а в к о й Ш е п п а р д а:

2 = X. (5.2.7) X Выборочное среднее квадратичное отклонение — это =, а стан X X дартное отклонение — это sX = s2. X По аналогии с т е о р е т и ч е с к и м начальным моментом порядка k (k = 0, 1, 2, …) случайной величины X [т. е. величиной k ( X) = M(X k ) — см. п. 2.8.1] и т е о р е т и ч е с к и м центральным моментом порядка k (k = 0, 1, 2, …) этой случайной величины [т. е. величиной µ k ( X ) = M(X MX )k ] определяются выбо рочные начальный и центральный моменты порядка k (k = 0, 1, 2, …) — это статистики = Xk k и = (X X )k µk соответственно.

С в о й с т в а выборочных моментов аналогичны свойствам соответст вующих теоретических моментов (2.8.3)—(2.8.7).

В качестве выборочных оценок асимметрии (2.8.8) и эксцесса (2.8.9) можно взять выборочную асимметрию µ = AX и выборочный эксцесс µ = EX соответственно;

эти оценки являются смещенными, однако их можно подпра вить и получить несмещенные оценки AX и EX — исправленную выборочную асимметрию n(n 1) AX = AX n и исправленный выборочный эксцесс (n 1)[(n + 1)E X + 6] EX =.

(n 2)(n 3) Отношение = sX VX X называется выборочным коэффициентом вариации. Выборочный коэффици ент вариации оценивает относительный разброс значений случайной величи ны вокруг математического ожидания.

Задачи 433. В условиях задачи 432 требуется с помощью программы «Описа тельная статистика» пакета Microsoft Excel вычислить выборочные характери стики: среднее, дисперсию, среднее квадратичное отклонение, коэффициент вариации, асимметрию, эксцесс, моду, медиану.



Pages:   || 2 |
 





 
© 2013 www.libed.ru - «Бесплатная библиотека научно-практических конференций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.