Контрольная работа по "Статистике"

Автор работы: Пользователь скрыл имя, 13 Мая 2013 в 14:52, контрольная работа

Краткое описание

Задача 1. Задана выборка:...
1) Составить интервальный ряд распределения. 2) Найти выборочные среднее, моду, медиану, дисперсию, среднее квадратическое отклонение, коэффициенты вариации, ассиметрии и эксцесса. 3) Построить гистограмму частот. 4) Найти эмпирическую функцию распределения и построить ее график. 5) Проверить гипотезу о нормальном распределении генеральной совокупности с помощью критерия Пирсона при уровне значимости 0.05. 6) Найти доверительный интервал для оценки неизвестного математического ожидания генеральной совокупности с надежностью 0.95.

Прикрепленные файлы: 1 файл

Statistika.doc

— 544.00 Кб (Скачать документ)

Задача 1. Задана выборка:

102

90

94

95

95

96

96

105

76

93

102

95

88

103

87

95

88

92

79

93

101

113

92

108

75

86

71

96

84

81

97

83

97

77

94

98

105

112

91

106

87

100

82

85

99

87

88

97

99

105

91

87

99

92

93

85

102

109

96

83

83

93

81

92

111

89

95

78

83

102

101

82

95

92

99

105

69

118

97

84

83

99

103

86

93

87

94

92

87

107

88

97

87

78

100

88

95

95

108

93


 

1) Составить интервальный ряд распределения.

2) Найти выборочные среднее, моду, медиану, дисперсию, среднее квадратическое отклонение, коэффициенты вариации, ассиметрии и эксцесса.

3) Построить гистограмму частот.

4) Найти эмпирическую функцию распределения и построить ее график.

5) Проверить гипотезу о нормальном распределении генеральной совокупности с помощью критерия Пирсона при уровне значимости 0.05.

6) Найти доверительный интервал для оценки неизвестного математического ожидания генеральной совокупности с надежностью 0.95.

 

Прежде всего, для упрощения анализа выборки отсортируем ее и вычислим ее основные характеристики. Для этого удобно использовать Excel или подобную программу.

 

69

82

85

88

92

93

95

97

101

105

71

82

86

88

92

94

95

98

102

106

75

83

86

88

92

94

96

99

102

107

76

83

87

88

92

94

96

99

102

108

77

83

87

88

92

95

96

99

102

108

78

83

87

89

93

95

96

99

103

109

78

83

87

90

93

95

97

99

103

111

79

84

87

91

93

95

97

100

105

112

81

84

87

91

93

95

97

100

105

113

81

85

87

92

93

95

97

101

105

118


Таблица 1. Отсортированная выборка

 

Объем выборки, : 100

Минимальное значение, : 69

Максимальное значение, : 118

Размах, : 49

Среднее арифметическое, : 93.06

Мода (по выборке), : 95

Медиана (по выборке), : 93

Мода выборки – это наиболее часто встречающееся значение. Значение 95 – единственное, которое встречается 8 раз (выделено синим цветом).

 

Медиана выборки  – значение, находящееся в середине отсортированной выборки, т.е. либо 50-е, либо 51-е по счету. В нашем случае они оба равны 93 (выделены красным).


 

1) Разобьем диапазон значений выборки на интервалы и составим ряд распределения.

 

Рекомендуемое количество интервалов для интервального ряда, согласно формуле Стерджеса:

 

Т.е. выборку из 100 значений оптимально разбивать на 7-8 интервалов. Разобьем на 8 интервалов:

 

Тогда минимально возможная длина  интервала (шаг) составит:

 

И в этом случае начало первого интервала  совпадет с первым (минимальным) значением выборки , а конец последнего интервала – с последним значением . При выборе интервалов рекомендуется отступать от первого и последнего значений выборки (если удобно, то на вправо и влево). Кроме того, для удобства можно выбрать целочисленный шаг. Поэтому возьмем в качестве шага целое значение:

 

В таком  случае, 8 интервалов шириной  единиц полностью и с запасом покрывают размах выборки . Запас составит единиц, т.е. как раз по слева и справа, как и рекомендовано. Таким образом, отступив от минимального значения на 3.5 единиц вправо, получим начало первого интервала:

 

Его конец и начало следующего интервала:

 

Конец второго и начало третьего интервала:

 

И т.д.

 

Середины получившихся интервалов:

  

 

Пользуясь отсортированной выборкой легко подсчитать частоты для  каждого интервала – количество значений, попадающих в интервал. Например, в первый интервал попадают лишь два значения: 69 и 71. Во второй интервал попадает уже 6 значений: 75, 76, 77, 78, 78, 79. И т.д.

 

Сведем полученные данные в таблицу:

 

1

65,5

72,5

69

2

2

0,02

0,02

0,0029

2

72,5

79,5

76

6

8

0,06

0,08

0,0086

3

79,5

86,5

83

15

23

0,15

0,23

0,0214

4

86,5

93,5

90

28

51

0,28

0,51

0,04

5

93,5

100,5

97

28

79

0,28

0,79

0,04

6

100,5

107,5

104

14

93

0,14

0,93

0,02

7

107,5

114,5

111

6

99

0,06

0,99

0,0086

8

114,5

121,5

118

1

100

0,01

1,00

0,0014


Таблица 2. Разбиение выборки на интервалы

 

где

 – номер интервала;

 – границы интервала;

 – середина интервала;

 – частота (количество  значений, попавших в интервал);

 – накопительная сумма  частот (сумма частот в  -ом и всех предыдущих интервалах);

 – относительные частоты;

 – эмпирическая функция распределения;

 – высота столбцов гистограммы относительных частот.

 

2) Вычислим характеристики полученного интервального ряда распределения.

 

Мода интервального  ряда вычисляется на основе частот интервала с максимальной частотой (модальный интервал) и соседствующих с ним. Когда модальных интервалов два (как в нашем случае и , и ), то мода равна границе между этими интервалами. Убедимся в этом:

– значение моды, если в качестве модального взять четвертый интервал:

 

– такое же значение моды, если в качестве модального взять пятый интервал:

 

Медиана вычисляется  на основе медианного интервала –  такого, в котором накопительная  сумма частот впервые превысила . Таким является 4-ый интервал – в нем , тогда как в предыдущем интервале . Тогда медиану вычисляем по формуле:

 

Выборочное  среднее:

 

Итак,

.

 

Вспомним, что эти же характеристики, вычисленные на основе исходной выборки, составили в свою очередь  , , , т.е. близки к полученным выше значениям.

 

Остальные необходимые характеристики вычисляются на основе центральных моментов :

 – центральные моменты  -го порядка

Тогда

    – дисперсия

   – среднее квадратическое отклонение

    – коэффициент вариации

    – коэффициент ассиметрии

   – эксцесс

 

Для удобства сведем вычисление выражений в таблицу:

1

2

69

-24,15

1166,445

-28169,647

680296,969

2

6

76

-17,15

1764,735

-30265,205

519048,270

3

15

83

-10,15

1545,338

-15685,176

159204,533

4

28

90

-3,15

277,830

-875,165

2756,768

5

28

97

3,85

415,030

1597,865

6151,782

6

14

104

10,85

1648,115

17882,048

194020,218

7

6

111

17,85

1911,735

34124,470

609121,785

8

1

118

24,85

617,523

15345,434

381334,038

Сумма:

9346,75

-6045,375

2551934,363


 

Таким образом,

 

    – дисперсия

   – среднее квадратическое отклонение

   – коэффициент вариации

  – коэффициент ассиметрии

 – эксцесс

 

 

3,4)  Построим графики по полученным данным.

 

Гистограмма относительных частот строится по следующему принципу:

–  -ый столбец гистограммы по ширине занимает весь интервал от до , т.е. имеет ширину, равную ;

– высота столбца гистограммы принимается такой, чтобы его площадь была равна относительной частоте (соответствующие значения находятся в последнем столбце таблицы 2).

 

Рис. 1. Гистограмма относительных частот

 

 

Отобразив на графике точки  и соединив их ломаной линией, получим график эмпирической функции распределения:

 

Рис. 2. Эмпирическая функция распределения

 

5) Проверим гипотезу о нормальном распределении генеральной совокупности.

 

Коэффициент вариации интервального ряда составил порядка 10%. Такой показатель свидетельствует о достаточной однородности эмпирических данных, позволяющей делать на их основе какие-либо выводы.

 

Проанализировав построенный нами эмпирический закон распределения, выяснили, что

–  (т.е. распределение практически симметрично и не скошено);

–    и находятся в пределах от 93 до 93.5 (за исключением , которое отклонилось немного больше).

 

Подобными свойствами обладает нормальное распределение, для которого ассиметрия и эксцесс равны нулю, а мода и медиана равны математическому ожиданию. Графики на рисунках 1-3 так же визуально похожи на графики нормального распределения.

 

Поэтому выдвигаем гипотезу о нормальном распределении генеральной совокупности. Т.е. предполагаем, что значения выборки распределены по нормальному закону с математическим ожиданием и средним квадратическим отклонением .

 

Функция плотности нормального распределения с такими параметрами будет иметь вид:

 

Ее график на фоне гистограммы частот, построенной ранее:

 

Проверим гипотезу о нормальном распределении с помощью критерия Пирсона.

 

Для этого вычислим, какими теоретически должны быть частоты  , если бы данные строго соответствовали нормальному распределению с математическим ожиданием и средним квадратическим отклонением .

 

Вычислим вероятности попадания случайной величины в интервалы по формуле:

,

где

 – интегральная функция  Лапласа, значения которой находим по таблицам.

Информация о работе Контрольная работа по "Статистике"