Автор работы: Пользователь скрыл имя, 27 Ноября 2013 в 17:17, курсовая работа
Курсовая работа состоит из двух глав. Первая глава призвана обеспечить анализ количественной стороны массовых явлений, служит основой для принятия соответствующих управленческих решений. Также в данной главе рассматривается определение функции плотности и построение ее графика, сравнение экспериментальной и теоретической вероятности. Вторая глава раскрывает понятие рынка труда, в ней рассмотрены основные категории трудоспособного и экономически активного населения, рассмотрены коэффициенты, с помощью которых и определяется количественная оценка социальных явления (таких как занятость, безработица).
Введение . . . . . . . . . . . . . . . . . . . 3
Глава 1. Статистическая обработка данных . . . . . . . . . 4
Постановка задачи. Цель работы. Исходные данные . . . . . 4
Вычисление основных выборочных характеристик по заданной
выборке . . . . . . . . . . . . . . . . . 5
Результаты вычисления интервальных оценок для математического
ожидания и дисперсии . . . . . . . . . . . . . 7
Результаты ранжирования выборочных данных и вычисление моды и
медианы . . . . . . . . . . . . . . . . . 10
Параметрическая оценка функции плотности распределения . . . 12
Проверка гипотезы о нормальном распределении случайной
величины по критерию Пирсона . . . . . . . . . . 17
Интервал [-1,2977; 14,9016], содержащий все элементы выборки, разбиваем на частичные интервалы, используя при этом формулу Стерджеса для определения оптимальной длины и границ этих частичных интервалов.
По формуле Стерджеса длина частичного интервала равна:
Для удобства и простоты расчетов выбираем h = 2,35 и вычисляем последовательно границы интервалов.
За начало первого интервала принимаем значение:
Далее вычисляем границы интервалов.
= -2,4727 + 2,35 = -0,1227
= -0,1227 + 2,35 = 2,2273
= 2,2273 + 2,35 = 4,5773
= 4,5773 + 2,35 = 6,9273
= 6,9273 + 2,35 = 9,2773
= 9,2773 + 2,35 = 11,6273
= 11,6273 + 2,35 = 13,9773
= 13,9773 + 2,35 = 16,3273
Вычисление границ заканчивается, как только выполняется неравенство Xn > Xmax, то есть X8 = 16,3273 > Xmax = 14,9016.
По результатам вычислений составляем таблицу. В первой строке таблицы помещаем частичные интервалы, на второй строке – середины интервалов, в третьей строке записано количество элементов выборки, попавших в каждый интервал – частоты, в четвертой строке записаны относительные частоты и в пятой строке записаны значения плотности относительных частот или значения выборочной, экспериментальной функции плотности. Значения выборочной функции плотности представлены в таблице 4.2.
По результатам вычислений функции плотности, представленной в Таблице 4.2., можно сделать вывод, что мода имеет 1 локальный максимум в окрестности точки х = 6,9273 и с частотой по n = 19
Оценку медианы находим, используя вариационный ряд:
Так как N = 2k, k = N / 2 = 60 / 2 = 30
Сравнение оценок медианы и оценки математического ожидания показывает, что они отличаются на 1.68%.
Таблица 4.2.
Значение выборочной функции и плотности
H |
ni |
||||
[-2,4727; -0,1227) |
-1,2977 |
1 |
0,0167 |
0,0071 |
0,71 |
[-0,1227; 2,2273) |
1,0523 |
3 |
0,0500 |
0,0213 |
2,13 |
[2,2273; 4,5773) |
3,4023 |
6 |
0,1000 |
0,0426 |
4,26 |
[4,5773; 6,9273) |
5,7523 |
19 |
0,3167 |
0,1348 |
13,48 |
[6,9273; 9,2773) |
8,1023 |
16 |
0,2667 |
0,1135 |
11,35 |
[9,2773;11,6273) |
10,4523 |
8 |
0,1333 |
0,0567 |
5,67 |
[11,6273; 13,9773) |
12,8023 |
6 |
0,1000 |
0,0426 |
4,26 |
[13,9773; 16,3273) |
15,1523 |
1 |
0,0167 |
0,0071 |
0,71 |
1.5. Параметрическая оценка функции плотности распределения
Исходя из гипотезы, что
заданная выборка имеет нормальный
закон распределения, найдем параметрическую
оценку функции плотности, используя
формулу для плотности
Где и известны – они вычисляются по выборке.
= 3,4382 = 7,1974
Значения этой функции вычисляются для середины частичных интервалов вариационного ряда, т.е. при х = . На практике для упрощения вычислений функции , где i = 1,2,…, k, пользуются таблицами значений функции плотности стандартной нормальной величины.
Для этого вычисляем значения для i = 1,2,…, k, затем по таблице находим значение .
= 0,0192
= 0,0817
= 0,2179
= 0,3655
= 0,3854
= 0,2557
= 0,1066
= 0,02797
И после вычисляем функцию:
0,005584 0,112094
0,023762 0,074370
0,063346 0,031005
0,106306 0,008135
Функция , вычисленная при заданных параметрах и в середине частичного интервала, фактически является теоретической относительной частотой, отнесенной к середине частичного интервала.
Поэтому для определения теоретической частоты , распределенной по всей ширине интервала, эту функцию необходимо умножить на .
Результаты вычислений вероятностей и соответствующих частот приведены в таблице 5.1.
Из результатов вычислений следует, что сумма вероятностей в интервале [-2,4727; 16,3273) не равна единице. Это объясняется тем, что мы вычисляем вероятности в интервале, где заданы экспериментальные данные. Если вычислить вероятности и частоты двух дополнительных точках и слева от заданного интервала ( = 3,5965 и = 4,9265), и справа от заданного интервала ( =18,2325 и = 19,5625), то получим сумму вероятностей в интервале [3,5965; 19,5625) равную и сумму соответствующих частот равную .
Сравнение экспериментальных и теоретических частот по критерию Пирсона с целью проверки гипотезы о нормальном распределении возможно только в том случае, если для каждого частичного интервала выполняется условие . Результаты вычислений приведенные в Таблице 5.1 показывают, что это условие выполняется не везде. Поэтому те частичные интервалы, для которых частоты , объединяем с соседними. Соответственно объединяем и экспериментальные частоты .
Таблица 5.1.
Результаты вычисления экспериментальных и теоретических вероятностей и частот
[xi-1; xi) |
|||||||||
[-7,1727; -4,8227) |
-5,9977 |
-3,83 |
0,00007959 |
0,000187 |
0,01122 |
||||
[-4,8227; -2,4727) |
-3,6477 |
-3,15 |
0,00084059 |
0,001975 |
0,1185 |
||||
[-2,4727; -0,1227) |
1 |
-1,2977 |
0,0167 |
0,0071 |
-2,47 |
0,005584 |
0,0131224 |
0,787344 |
1 |
[-0,1227; 2,2273) |
3 |
1,0523 |
0,0500 |
0,0213 |
-1,79 |
0,023762 |
0,0558407 |
3,350442 |
3 |
[2,2273; 4,5773) |
6 |
3,4023 |
0,1000 |
0,0426 |
-1,10 |
0,063346 |
0,1488631 |
8,931786 |
9 |
[4,5773; 6,9273) |
19 |
5,7523 |
0,3167 |
0,1348 |
-0,42 |
0,106306 |
0,2498191 |
14,989146 |
15 |
[6,9273; 9,2773) |
16 |
8,1023 |
0,2667 |
0,1135 |
0,26 |
0,112094 |
0,2634209 |
15,805254 |
16 |
[9,2773;11,6273) |
8 |
10,4523 |
0,1333 |
0,0567 |
0,95 |
0,074370 |
0,1747695 |
10,48617 |
11 |
[11,6273; 13,9773) |
6 |
12,8023 |
0,1000 |
0,0426 |
1,63 |
0,031005 |
0,0728618 |
4,371708 |
4 |
[13,9773; 16,3273) |
1 |
15,1523 |
0,0167 |
0,0071 |
2,31 |
0,008135 |
0,0191173 |
1,147038 |
1 |
[16,3273; 18,6773) |
17,5023 |
2,99 |
0,0013692 |
0,0032176 |
0,193056 |
||||
[18,6773; 21,0273) |
19,8523 |
3,67 |
0,0001444 |
0,0003393 |
0,020358 |
||||
Σ |
60 |
1,0001 |
1,0035337 |
60,212022 |
60 |
1.6. Проверка
гипотезы о нормальном
Для проверки гипотезы о
нормальном распределении случайной
величины Х сравнивают между собой
экспериментальные и
Статистика имеет распределение с V = k – r – 1 степенями свободы, где k – число интервалов эмпирического распределения, r – число параметров теоретического распределения, вычисленных по экспериментальным данным. Для нормального распределения число степеней свободы равно:
V = k – 3
В теории математической статистики доказывается, что проверку гипотезы о модели закона распределения по критерию Пирсона можно делать только в том случае, если выполняются следующие неравенства:
N ≥ 50
Из результатов вычислений, приведенных в таблице 5.1 следует, что необходимое условие для применения критерия согласия Пирсона не выполнены, т.к. в некоторых группах < 5. Поэтому те группы вариационного ряда, для которых необходимое условие не выполняется, объединяют с соседними и, соответственно, уменьшают число групп, при этом частоты объединенных групп суммируются. Так объединяют все группы с частотами < 5 до тех пор, пока для каждой новой группы будет выполняться условие ≥ 5.
При уменьшении числа групп для теоретических частот соответственно уменьшают и число групп для эмпирических частот. После объединения групп в формуле для числа степеней свободы V = k – 3 в качестве k принимают новое число групп, полученное после объединения частот.
Результаты объединения интервалов и теоретических частот для таблицы 5.1 приведены соответственно в таблице 6.1.
Результаты вычислений из таблицы 6.1 можно использовать для проверки гипотезы о нормальном распределении с помощью критерия Пирсона.
Процедура проверки гипотезы о нормальном распределении случайной величины Х выполняется в следующей последовательности:
Таблица 6.1.
Результаты объединения интервалов и теоретических частот
[-7,1727; 2,2273) |
0,0711251 |
4,267506 |
4 |
0,07155946 |
0,016768449 |
[2,2273; 4,5773) |
0,1488631 |
8,931786 |
6 |
8,59536915 |
0,962334873 |
[4,5773; 6,9273) |
0,2498191 |
14,989146 |
19 |
16,08694981 |
1,073239917 |
[6,9273; 9,2773) |
0,2634209 |
15,805254 |
16 |
0,037926004 |
0,002399582 |
[9,2773; 21,0273) |
0,2703055 |
16,21833 |
15 |
1,484327989 |
0,091521629 |
Σ |
1,0035337 |
60,212022 |
60 |
2,14626445 |
При выбранном уровне значимости а = 0,05 и числе групп k = 5, число степеней свободы V = 2.
По таблице для а = 0,05 и V = 2 находим = 5,99147.
В результате получаем:
Для = 2,14626445, которое нашли по результатам вычислений, приведенных в Таблице 6.1, имеем:
Следовательно, нет оснований
отвергать гипотезу о нормальном
распределении случайной