Контрольная работа по дисциплине "Статистика"

Автор работы: Пользователь скрыл имя, 23 Ноября 2014 в 17:01, контрольная работа

Краткое описание

В таблице приведено распределение квартир жилого дома по суточному потреблению электроэнергии (кВт.ч.).
Потребление электроэнергии Количество квартир Потребление электроэнергии Количество квартир
Менее 1,25 6 3,75-4,25 126
1,25-1,75 30 4,25-4,75 70
1,75-2,25 113 4,75-5,25 31
2,25-2,75 221 5,25-5,75 14
2,75-3,25 245 5,75-6,25 3
3,25-3,75 189 6,25 и более 2
1. Построить по этим данным гистограмму.
2. Найти эмпирическую функцию распределения и построить ее график.
3. Вычислить среднее арифметическое выборки, выборочную дисперсию, выборочное среднее квадратичное отклонение, коэффициент вариации, размах вариации, начальные и центральные моменты до третьего порядка включительно, величину асимметрии и эксцесс, ошибки асимметрии и эксцесса.
4. Используя критерии - Пирсона по данному вариационному ряду при уровне значимости =0,05, проверить гипотезу о том, что случайная величина X распределена по нормальному закону. Построить на одном чертеже гистограмму эмпирического распределения и соответствующую нормальную кривую.

Прикрепленные файлы: 1 файл

статистическая обработка данных.doc

— 524.00 Кб (Скачать документ)

 

 

 

Содержание

 

 

Вариант 0

В таблице приведено распределение квартир жилого дома по суточному потреблению электроэнергии (кВт.ч.).

Потребление электроэнергии

Количество квартир

Потребление электроэнергии

Количество квартир

Менее 1,25

6

3,75-4,25

126

1,25-1,75

30

4,25-4,75

70

1,75-2,25

113

4,75-5,25

31

2,25-2,75

221

5,25-5,75

14

2,75-3,25

245

5,75-6,25

3

3,25-3,75

189

6,25 и более

2


 

  1. Построить по этим данным гистограмму.
  2. Найти эмпирическую функцию распределения и построить ее график.
  3. Вычислить среднее арифметическое выборки, выборочную дисперсию, выборочное среднее квадратичное отклонение, коэффициент вариации, размах вариации, начальные и центральные моменты до третьего порядка включительно, величину асимметрии и эксцесс, ошибки асимметрии и эксцесса.
  4. Используя критерии - Пирсона по данному вариационному ряду при уровне значимости =0,05, проверить гипотезу о том, что случайная величина X распределена по нормальному закону. Построить на одном чертеже гистограмму эмпирического распределения и соответствующую нормальную кривую.
  5. Для исследования зависимости объема производства (У) от основных фондов (X) получены статистические данные по 70 предприятиям за год.

, тыс. руб.

 

60-80

80- 100

100-120

120-130

130-160

160-180

180-200

80-100

6

           

100-120

3

4

5

       

120-130

 

2

7

6

     

130-160

   

1

8

5

   

160-180

   

1

2

7

2

 

180-200

         

5

 

200-220

           

4

220-230

           

2


 

а) Вычислить групповые средние и , построить корреляционные поля;

б) предполагая, что между х и у существует линейная корреляционная зависимость

найти уравнения прямых регрессии и построить их графики на корреляционных полях;

вычислить коэффициенты корреляции и детерминации, сделать выводы о тесноте и направлении связи;

вычислить среднюю абсолютную процентную ошибку; для коэффициента корреляции генеральной совокупности; определить доверительный интервал, соответствующий доверительной вероятности = 0,05.

1. Построить по этим данным гистограмму.

интервалы

1

Менее 1,25

1

6

2

1,25-1,75

1,5

30

3

1,75-2,25

2

113

4

2,25-2,75

2,5

221

5

2,75-3,25

3

245

6

3,25-3,75

3,5

189

7

3,75-4,25

4

126

8

4,25-4,75

4,5

70

9

4,75-5,25

5

31

10

5,25-5,75

5,5

14

11

5,75-6,25

6

3

12

6,25 и более

6,5

2


 

Гистограмма

2. Найти эмпирическую функцию распределения и построить ее график.

 

Таблица 1 - Вспомогательная таблица для расчета числовых характеристик выборки

Интервалы

Середины интервалов


Частоты

Относительные частоты

Наколенные относительные частоты

Менее 1,25

1

6

0,006

0,006

1,25-1,75

1,5

30

0,029

0,035

1,75-2,25

2

113

0,108

0,142

2,25-2,75

2,5

221

0,210

0,353

2,75-3,25

3

245

0,233

0,586

3,25-3,75

3,5

189

0,180

0,766

3,75-4,25

4

126

0,120

0,886

4,25-4,75

4,5

70

0,067

0,953

4,75-5,25

5

31

0,030

0,982

5,25-5,75

5,5

14

0,013

0,996

5,75-6,25

6

3

0,003

0,998

6,25 и более

6,5

2

0,002

1,000


 

Эмпирическая функция распределения F*(y) выборки служит для оценки функции распределения F(y) генеральной совокупности. Функция F*(y) определяет для каждого значения y относительную частоту события Y < y:

,

где ny – число выборочных значений, меньших y; n – объем выборки. Пятый столбец таблицы 1 содержит накопленные частоты, то есть значения эмпирической функции распределения F*(y), они относятся к верхней границе частотного интервала.

Эмпирическая функция распределения F*(y) имеет вид:

F(y) =

График эмпирической функции распределения F*(y) изображен на рис. 2 (для непрерывных распределений значения F*(y) распространяются на интервалы линейным интерполированием).

Рисунок 2 - График эмпирической функции распределения F*(y)

3. Для вычисления числовых характеристик выборки удобно использовать таблицу 2, где в первых двух столбцах приведены сгруппированные исходные данные, а остальные столбцы служат для вычисления числовых характеристик.

Таблица 2 Таблица для расчета числовых характеристик выборки

Середины интервалов

 

Частоты

 

1

6

-2,15

-12,9

27,735

-59,63025

128,205038

1,5

30

-1,65

-49,5

81,675

-134,7638

222,360188

2

113

-1,15

-129,95

149,443

-171,8589

197,637706

2,5

221

-0,65

-143,65

93,3725

-60,69213

39,4498813

3

245

-0,15

-36,75

5,5125

-0,826875

0,12403125

3,5

189

0,35

66,15

23,1525

8,103375

2,83618125

4

126

0,85

107,1

91,035

77,37975

65,7727875

4,5

70

1,35

94,5

127,575

172,2263

232,505438

5

31

1,85

57,35

106,098

196,2804

363,118694

5,5

14

2,35

32,9

77,315

181,6903

426,972088

6

3

2,85

8,55

24,3675

69,44738

197,925019

6,5

2

3,35

6,7

22,445

75,19075

251,889013

сумма

1050

-

0,5

829,725

352,5463

2128,79606


 

Выборочное среднее вычисляют по формуле:

где m – число интервалов, yi – середины интервалов.

у   = 3308 / 1050 = 3,15


Выборочное среднее дает усредненное значение времени непрерывной работы станков для данной выборки.

Выборочную дисперсию для сгруппированных данных вычисляют по формуле:

= 829,725 / 1050 = 0,7902

Выборочное среднее квадратическое отклонение находят по формуле:

0,88894

Оно показывает разброс выборочных значений y, относительно выборочного среднего у = 3,15


Выборочные коэффициенты асимметрии и эксцесса вычисляют по формулам:

Используя суммы из последних строк шестого и седьмого столбцов таблицы 2, получим:

352,5463 / 1050*0,888943 = 0,47798

2128,7961/1050*0,888944 -3= 0,2468

  говорит о несимметричности полигона (гистограммы) относительно выборочного среднего . Положительный знак свидетельствует о правосторонней асимметрии данного распределения. Положительность показывает, что полигон менее крут, чем нормальная кривая.

Предварительно предполагаем, что СВ Y распределена нормально по совокупности следующих признаков.

Выборочные коэффициенты асимметрии Ау = 0,477989 и эксцесса Эу = -0,2468 отличаются от значений асимметрии и эксцесса для нормального распределения (которые равны нулю) не более, чем на утроенные средние квадратические ошибки их определения.

Гипотезу о том, что генеральная совокупность, из которой извлечена выборка, распределена по нормальному закону, назовем нулевой , тогда . Проверим ее с помощью критерия согласия Пирсона. Согласно критерию Пирсона сравниваются эмпирические ni (наблюдаемые) и теоретические npi (вычисленные в предположении нормального распределения) частоты. В качестве критерия проверки нулевой гипотезы принимается СВ

 

По таблице критических точек распределения χ2 по заданному уровню значимости и числу степеней свободы (S – число интервалов, r – число параметров предполагаемого распределения СВ Y) находится критическое значение .

Если , то считается, что данный критерий не дает оснований для отклонения гипотезы при данном уровне значимости . В противном случае считается, что гипотеза не согласуется с экспериментальными данными и ее отвергают.

Так как предполагается нормальное распределение, имеющее 2 параметра (математическое ожидание a и среднее квадратическое отклонение ), поэтому , тогда число степеней свободы .

Таблица 3 Расчетная таблица для вычисления

Интервалы

Частоты эмпирические ni

Вероятности pi

Теоретические частоты npi

Менее 1,25

6

0,006

5,25

0,107143

1,25-1,75

30

0,029

29,5

0,008475

1,75-2,25

113

0,108

111,56

0,018587

2,25-2,75

221

0,210

219,63

0,008546

2,75-3,25

245

0,233

255,59

0,438781

3,25-3,75

189

0,180

189,35

0,000647

3,75-4,25

126

0,120

128,54

0,050191

4,25-4,75

70

0,067

65,32

0,335309

4,75-5,25

31

0,030

28,7

0,184321

5,25-5,75

14

0,013

12,36

0,217605

5,75-6,25

3

0,003

2,4

0,15

6,25 и более

2

0,002

1,8

0,022222

сумма

1050

1

1050

1,541827


 

В таблице критических точек распределения по уровню значимости и числу степеней свободы найдем критическое значение .

Так как , то считаем, что нет оснований для отклонения нулевой гипотезы при заданном уровне значимости .

Построим график эмпирической функции . Для этого из середины частичных интервалов восстановим перпендикуляры высотой равной pi – вероятностям попадания СВ Y в соответствующий частичный интервал. На рис.3 концы перпендикуляров отмечены точками, полученные точки соединены плавной кривой.


Рисунок 3. Полигон относительных частот и нормальная кривая

Сравнение полигона относительных частот и нормальной кривой показывает, что построенная нормальна кривая удовлетворительно сглаживает полигон.

Найдем интервальные оценки параметров нормального закона распределения. Для нахождения доверительного интервала, покрывающего математическое ожидание СВ У, найдем по таблицам квантилей распределения Стьюдента по заданной доверительной вероятности 0,95 и числу степеней свободы число

Вычислим предельную погрешность интервального оценивания:

1,984*0,88894/32,4037 = 0,0544

Запишем искомый доверительный интервал для мат. ожидания a:

3,15-0,0544<a<3,15+0,0544

3,0956 < a < 3,2044

Если будет произведено достаточное большое число выборок из одной и той же генеральной совокупности, что в 95% выборок доверительный интервал (3,0956;3,2044) покроет математическое ожидание a; и только в 5% выборок математическое ожидание может выйти за границы доверительного интервала.

Для нахождения доверительного интервала, покрывающего неизвестное среднее квадратическое отклонение с заданной вероятностью , найдем по и числу степеней свободы

 два числа  и .

Искомый доверительный интервал равен:

0.878*0,88894< σ < 1.161*0,88894

0,7805< σ < 1,0321

Если будет произведено достаточно большое число выборок из одной и той же генеральной совокупности, что в 95% выборок доверительный интервал (0,7805; 1,0321) покроет среднее квадратическое отклонение , и только в 5% среднее квадратическое отклонение может выйти за границы доверительного интервала (0,7805; 1,0321).

5. Для исследования зависимости объема производства (У) от основных фондов (X) получены статистические данные по 70 предприятиям за год.

, тыс. руб.

 

60-80

80- 100

100-120

120-130

130-160

160-180

180-200

80-100

6

           

100-120

3

4

5

       

120-130

 

2

7

6

     

130-160

   

1

8

5

   

160-180

   

1

2

7

2

 

180-200

         

5

 

200-220

           

4

220-230

           

2

Информация о работе Контрольная работа по дисциплине "Статистика"