Статистическая обработка данных

Автор работы: Пользователь скрыл имя, 27 Ноября 2013 в 17:17, курсовая работа

Краткое описание

Курсовая работа состоит из двух глав. Первая глава призвана обеспечить анализ количественной стороны массовых явлений, служит основой для принятия соответствующих управленческих решений. Также в данной главе рассматривается определение функции плотности и построение ее графика, сравнение экспериментальной и теоретической вероятности. Вторая глава раскрывает понятие рынка труда, в ней рассмотрены основные категории трудоспособного и экономически активного населения, рассмотрены коэффициенты, с помощью которых и определяется количественная оценка социальных явления (таких как занятость, безработица).

Содержание

Введение . . . . . . . . . . . . . . . . . . . 3
Глава 1. Статистическая обработка данных . . . . . . . . . 4
Постановка задачи. Цель работы. Исходные данные . . . . . 4
Вычисление основных выборочных характеристик по заданной
выборке . . . . . . . . . . . . . . . . . 5
Результаты вычисления интервальных оценок для математического
ожидания и дисперсии . . . . . . . . . . . . . 7
Результаты ранжирования выборочных данных и вычисление моды и
медианы . . . . . . . . . . . . . . . . . 10
Параметрическая оценка функции плотности распределения . . . 12
Проверка гипотезы о нормальном распределении случайной
величины по критерию Пирсона . . . . . . . . . . 17

Прикрепленные файлы: 1 файл

Statistika_Luchnikova.doc

— 573.50 Кб (Скачать документ)

 

Интервал [-1,2977; 14,9016], содержащий все элементы выборки, разбиваем на частичные интервалы, используя при этом формулу Стерджеса для определения оптимальной длины и границ этих частичных интервалов.

По формуле Стерджеса  длина частичного интервала равна:

Для удобства и простоты расчетов выбираем h = 2,35 и вычисляем последовательно границы интервалов.

За начало первого  интервала принимаем значение:

Далее вычисляем границы  интервалов.

= -2,4727 + 2,35 = -0,1227

= -0,1227 + 2,35 = 2,2273

= 2,2273 + 2,35 = 4,5773

= 4,5773 + 2,35 = 6,9273

= 6,9273 + 2,35 = 9,2773

= 9,2773 + 2,35 = 11,6273

= 11,6273 + 2,35 = 13,9773

= 13,9773 + 2,35 = 16,3273

Вычисление границ заканчивается, как только выполняется неравенство  Xn > Xmax, то есть X8 = 16,3273 > Xmax = 14,9016.

По результатам вычислений составляем таблицу. В первой строке таблицы помещаем частичные интервалы, на второй строке – середины интервалов, в третьей строке записано количество элементов выборки, попавших в каждый интервал – частоты, в четвертой строке записаны относительные частоты и в пятой строке записаны значения плотности относительных частот или значения выборочной, экспериментальной функции плотности. Значения выборочной функции плотности представлены в таблице 4.2.

По результатам вычислений функции плотности, представленной в Таблице 4.2., можно сделать вывод, что мода имеет 1 локальный максимум в окрестности точки х = 6,9273 и с частотой по n = 19

Оценку медианы находим, используя вариационный ряд:

Так как N = 2k, k = N / 2 = 60 / 2 = 30

Сравнение оценок медианы  и оценки математического ожидания показывает, что они отличаются на 1.68%.

Таблица 4.2.

Значение выборочной функции и плотности

H

ni

[-2,4727; -0,1227)

-1,2977

1

0,0167

0,0071

0,71

[-0,1227; 2,2273)

1,0523

3

0,0500

0,0213

2,13

[2,2273; 4,5773)

3,4023

6

0,1000

0,0426

4,26

[4,5773; 6,9273)

5,7523

19

0,3167

0,1348

13,48

[6,9273; 9,2773)

8,1023

16

0,2667

0,1135

11,35

[9,2773;11,6273)

10,4523

8

0,1333

0,0567

5,67

[11,6273; 13,9773)

12,8023

6

0,1000

0,0426

4,26

[13,9773; 16,3273)

15,1523

1

0,0167

0,0071

0,71


 

1.5. Параметрическая оценка функции плотности распределения

Исходя из гипотезы, что  заданная выборка имеет нормальный закон распределения, найдем параметрическую  оценку функции плотности, используя  формулу для плотности распределения  вероятности нормального закона:

Где и известны – они вычисляются по выборке.

= 3,4382 = 7,1974

Значения этой функции  вычисляются для середины частичных  интервалов вариационного ряда, т.е. при х = . На практике для упрощения вычислений функции , где i = 1,2,…, k, пользуются таблицами значений функции плотности стандартной нормальной величины.

Для этого вычисляем значения для i = 1,2,…, k, затем по таблице находим значение .

            = 0,0192

            = 0,0817

            = 0,2179

          = 0,3655

             = 0,3854

             = 0,2557

            = 0,1066

            = 0,02797

И после вычисляем  функцию: 

 0,005584          0,112094                   

0,023762                     0,074370    

0,063346                      0,031005         

0,106306                      0,008135

Функция , вычисленная при заданных параметрах и в середине частичного интервала, фактически является теоретической относительной частотой, отнесенной к середине частичного интервала.

Поэтому для определения  теоретической частоты  , распределенной по всей ширине интервала, эту функцию необходимо умножить на .

          где h = 1,33

             где N = 60

          

Результаты вычислений вероятностей и соответствующих частот приведены в таблице 5.1.

                                                    

Из результатов вычислений следует, что сумма вероятностей в интервале [-2,4727; 16,3273) не равна единице. Это объясняется тем, что мы вычисляем вероятности в интервале, где заданы экспериментальные данные. Если вычислить вероятности и частоты двух дополнительных точках и слева от заданного интервала ( = 3,5965 и = 4,9265), и справа от заданного интервала ( =18,2325 и = 19,5625), то получим сумму вероятностей в интервале [3,5965; 19,5625)  равную  и сумму соответствующих частот равную .

Сравнение экспериментальных и теоретических частот по критерию Пирсона с целью проверки гипотезы о нормальном распределении возможно только в том случае, если для каждого частичного интервала выполняется условие . Результаты вычислений приведенные в Таблице 5.1 показывают, что это условие выполняется не везде. Поэтому те частичные интервалы, для которых частоты , объединяем с соседними. Соответственно объединяем и экспериментальные частоты .

 

 

 

 

 

 

 

Таблица 5.1.

Результаты  вычисления экспериментальных и теоретических вероятностей и частот

[xi-1; xi)

[-7,1727; -4,8227)

 

-5,9977

   

-3,83

0,00007959

0,000187

0,01122

 

[-4,8227; -2,4727)

 

-3,6477

   

-3,15

0,00084059

0,001975

0,1185

 

[-2,4727; -0,1227)

1

-1,2977

0,0167

0,0071

-2,47

0,005584           

0,0131224

0,787344

1

[-0,1227; 2,2273)

3

1,0523

0,0500

0,0213

-1,79

0,023762

0,0558407

3,350442

3

[2,2273; 4,5773)

6

3,4023

0,1000

0,0426

-1,10

0,063346                     

0,1488631

8,931786

9

[4,5773; 6,9273)

19

5,7523

0,3167

0,1348

-0,42

0,106306                      

0,2498191

14,989146

15

[6,9273; 9,2773)

16

8,1023

0,2667

0,1135

0,26

0,112094                   

0,2634209

15,805254

16

[9,2773;11,6273)

8

10,4523

0,1333

0,0567

0,95

0,074370

0,1747695

10,48617

11

[11,6273; 13,9773)

6

12,8023

0,1000

0,0426

1,63

0,031005        

0,0728618

4,371708

4

[13,9773; 16,3273)

1

15,1523

0,0167

0,0071

2,31

0,008135

0,0191173

1,147038

1

[16,3273; 18,6773)

 

17,5023

   

2,99

0,0013692

0,0032176

0,193056

 

[18,6773; 21,0273)

 

19,8523

   

3,67

0,0001444

0,0003393

0,020358

 
                   

Σ

60

 

1,0001

     

1,0035337

60,212022

60


 

 

 

1.6. Проверка  гипотезы о нормальном распределении  случайной величины по критерию  Пирсона

Для проверки гипотезы о  нормальном распределении случайной  величины Х сравнивают между собой  экспериментальные и теоретические  частоты по критерию Пирсона:

Статистика  имеет распределение с V = k – r – 1 степенями свободы, где k – число интервалов эмпирического распределения, r – число параметров теоретического распределения, вычисленных по экспериментальным данным. Для нормального распределения число степеней свободы равно:

V = k – 3

В теории математической статистики доказывается, что проверку гипотезы о модели закона распределения  по критерию Пирсона можно делать только в том случае, если выполняются следующие неравенства:

N ≥ 50                              

≥ 5                  где i = 1,2,3…

Из результатов вычислений, приведенных в таблице 5.1 следует, что необходимое условие для  применения критерия согласия Пирсона  не выполнены, т.к. в некоторых группах < 5. Поэтому те группы вариационного ряда, для которых необходимое условие не выполняется, объединяют с соседними и, соответственно, уменьшают число групп, при этом частоты объединенных групп суммируются. Так объединяют все группы с частотами < 5 до тех пор, пока для каждой новой группы будет выполняться условие ≥ 5.

При уменьшении числа  групп для теоретических частот соответственно уменьшают и число  групп для эмпирических частот. После объединения групп в формуле для числа степеней свободы V = k – 3 в качестве k принимают новое число групп, полученное после объединения частот.

Результаты объединения  интервалов и теоретических частот для таблицы 5.1 приведены соответственно в таблице 6.1.

Результаты вычислений из таблицы 6.1 можно использовать для  проверки гипотезы о нормальном распределении  с помощью критерия Пирсона.

Процедура проверки гипотезы о нормальном распределении случайной  величины Х выполняется в следующей последовательности:

  1. задаются уровнем значимости а = 0,05 или одним из следующих значений:               а1 = 0,01         а2 = 0,1            а3 = 0,005
  2. вычисляют наблюдаемые значения критерия, используя экспериментальные и теоретические частоты из Таблицы 6.1.

  1. для выборочного уровня значимости а = 0,05 по таблице распределения находят критические значения при числе степеней свободы V = k – 3, где k – число групп эмпирического распределения.
  2. сравнивают фактически наблюдаемое с критическим , найденным по таблице, и принимаем решение:
    • если > , то выдвинутая гипотезы о теоретическом законе распределения отвергается при заданном уровне значимости.
    • Если < , то выдвинутая гипотеза о теоретическом законе распределения не противоречит выборке наблюдений при заданном уровне значимости, т.е. нет оснований отвергать гипотезу о нормальном распределении, т.к. эмпирические и теоретические частоты различаются незначительно (случайно).

 

Таблица 6.1.

Результаты  объединения интервалов и теоретических  частот

[-7,1727; 2,2273)

 

0,0711251

 

4,267506

4

0,07155946

0,016768449

[2,2273; 4,5773)

0,1488631

8,931786

6

8,59536915

0,962334873

[4,5773; 6,9273)

0,2498191

14,989146

19

16,08694981

1,073239917

[6,9273; 9,2773)

0,2634209

15,805254

16

0,037926004

0,002399582

[9,2773; 21,0273)

0,2703055

16,21833

15

1,484327989

0,091521629

Σ

 

1,0035337

 

60,212022

60

 

2,14626445


 

При выбранном уровне значимости а = 0,05 и числе групп k = 5, число степеней свободы V = 2.

По таблице для а = 0,05 и V = 2 находим = 5,99147.

В результате получаем:

Для = 2,14626445, которое нашли по результатам вычислений, приведенных в Таблице 6.1, имеем:

= 2,14626445<
= 5,99147

Следовательно, нет оснований  отвергать гипотезу о нормальном распределении случайной величины Х.


Информация о работе Статистическая обработка данных