Автор работы: Пользователь скрыл имя, 03 Мая 2014 в 23:52, контрольная работа
Задача 1. По территориям региона приводятся данные за 199X г. ( ,  )
Номер региона	Среднедушевой прожиточный минимум в день одного трудоспособного, руб.,  
Среднедневная заработная плата, руб.,  
1	85	142
2	89	148
3	87	142
4	79	154
5	89	164
6	113	195
7	67	139
8	98	167
9	82	152
10	87	162
11	86	155
12	117	173
Требуется:
1.	Построить линейное уравнение парной регрессии   по  .
2.	Рассчитать линейный коэффициент парной корреляции, коэффициент детерминации и среднюю ошибку аппроксимации.
3.	Оценить статистическую значимость уравнения регрессии в целом и отдельных параметров регрессии и корреляции с помощью  -критерия Фишера и  -критерия Стьюдента.
4.	Выполнить прогноз заработной платы   при прогнозном значении среднедушевого прожиточного минимума  , составляющем 107% от среднего уровня.
5.	Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
6.	На одном графике отложить исходные данные и теоретическую прямую.
7.	Проверить вычисления в MS Excel.
Требуется:
Решение
Для удобства проведения расчетов поместим результаты промежуточных расчетов в таблицу:
| № | |||||||||
| 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 
| 1 | 7 | 4,3 | 11 | 30,1 | 77 | 47,3 | 18,49 | 121 | 49 | 
| 2 | 7 | 3,9 | 13 | 27,3 | 91 | 50,7 | 15,21 | 169 | 49 | 
| 3 | 7 | 3,7 | 15 | 25,9 | 105 | 55,5 | 13,69 | 225 | 49 | 
| 4 | 7 | 4,0 | 17 | 28,0 | 119 | 68,0 | 16,00 | 289 | 49 | 
| 5 | 7 | 4,5 | 18 | 31,5 | 126 | 81,0 | 20,25 | 324 | 49 | 
| 6 | 7 | 4,8 | 19 | 33,6 | 133 | 91,2 | 23,04 | 361 | 49 | 
| 7 | 8 | 5,4 | 19 | 43,2 | 152 | 102,6 | 29,16 | 361 | 64 | 
| 8 | 8 | 4,4 | 20 | 35,2 | 160 | 88,0 | 19,36 | 400 | 64 | 
| 9 | 8 | 4,9 | 20 | 39,2 | 160 | 98,0 | 24,01 | 400 | 64 | 
| 10 | 10 | 6,8 | 21 | 68,0 | 210 | 142,8 | 46,24 | 441 | 100 | 
| 11 | 9 | 6,9 | 21 | 62,1 | 189 | 144,9 | 47,61 | 441 | 81 | 
| 12 | 11 | 6,4 | 22 | 70,4 | 242 | 140,8 | 40,96 | 484 | 121 | 
| 13 | 9 | 6,8 | 22 | 61,2 | 198 | 149,6 | 46,24 | 484 | 81 | 
| 14 | 11 | 7,2 | 25 | 79,2 | 275 | 180,0 | 51,84 | 625 | 121 | 
| 15 | 12 | 7,1 | 28 | 85,2 | 336 | 198,8 | 50,41 | 784 | 144 | 
| 16 | 12 | 8,2 | 29 | 98,4 | 348 | 237,8 | 67,24 | 841 | 144 | 
| 17 | 12 | 8,1 | 30 | 97,2 | 360 | 243,0 | 65,61 | 900 | 144 | 
| 18 | 12 | 8,5 | 31 | 102,0 | 372 | 263,5 | 72,25 | 961 | 144 | 
| 19 | 14 | 9,6 | 32 | 134,4 | 448 | 307,2 | 92,16 | 1024 | 196 | 
| 20 | 14 | 9,9 | 36 | 138,6 | 504 | 356,4 | 98,01 | 1296 | 196 | 
| Сумма | 192 | 125,4 | 449 | 1290,7 | 4605 | 3047,1 | 857,78 | 10931 | 1958 | 
| Ср. знач. | 9,6 | 6,27 | 22,45 | 64,535 | 230,25 | 152,36 | 42,889 | 546,55 | 97,9 | 
Найдем средние квадратические отклонения признаков:
;
;
.
1. Для нахождения параметров линейного уравнения множественной регрессии
необходимо решить систему линейных уравнений относительно неизвестных параметров , ,
либо воспользоваться готовыми формулами
;
;
.
Рассчитаем сначала парные коэффициенты корреляции:
;
;
.
Находим коэффициенты чистой регрессии и параметр :
;
;
.
Таким образом, получили следующее уравнение множественной регрессии:
.
Уравнение регрессии показывает, что при увеличении ввода в действие основных фондов на 1% (при неизменном уровне удельного веса рабочих высокой квалификации) выработка продукции на одного рабочего увеличивается в среднем на 0,8 тыс. руб., а при увеличении удельного веса рабочих высокой квалификации в общей численности рабочих на 1% (при неизменном уровне ввода в действие новых основных фондов) выработка продукции на одного рабочего увеличивается в среднем на 0,128 тыс. руб.
После нахождения уравнения регрессии составим новую расчетную таблицу для определения теоретических значений результативного признака, остаточной дисперсии и средней ошибки аппроксимации.
| № | |||||||
| 1 | 7 | 4,3 | 11 | 6,558 | 0,442 | 0,195 | 6,314 | 
| 2 | 7 | 3,9 | 13 | 6,494 | 0,506 | 0,256 | 7,229 | 
| 3 | 7 | 3,7 | 15 | 6,590 | 0,410 | 0,168 | 5,857 | 
| 4 | 7 | 4,0 | 17 | 7,086 | -0,086 | 0,007 | 1,229 | 
| 5 | 7 | 4,5 | 18 | 7,614 | -0,614 | 0,377 | 8,771 | 
| 6 | 7 | 4,8 | 19 | 7,982 | -0,982 | 0,964 | 14,029 | 
| 7 | 8 | 5,4 | 19 | 8,462 | -0,462 | 0,213 | 5,775 | 
| 8 | 8 | 4,4 | 20 | 7,790 | 0,210 | 0,044 | 2,625 | 
| 9 | 8 | 4,9 | 20 | 8,190 | -0,190 | 0,036 | 2,375 | 
| 10 | 10 | 6,8 | 21 | 9,838 | 0,162 | 0,026 | 1,620 | 
| 11 | 9 | 6,9 | 21 | 9,918 | -0,918 | 0,843 | 10,200 | 
| 12 | 11 | 6,4 | 22 | 9,646 | 1,354 | 1,833 | 12,309 | 
| 13 | 9 | 6,8 | 22 | 9,966 | -0,966 | 0,933 | 10,733 | 
| 14 | 11 | 7,2 | 25 | 10,670 | 0,330 | 0,109 | 3,000 | 
| 15 | 12 | 7,1 | 28 | 10,974 | 1,026 | 1,053 | 8,550 | 
| 16 | 12 | 8,2 | 29 | 11,982 | 0,018 | 0,000 | 0,150 | 
| 17 | 12 | 8,1 | 30 | 12,030 | -0,030 | 0,001 | 0,250 | 
| 18 | 12 | 8,5 | 31 | 12,478 | -0,478 | 0,228 | 3,983 | 
| 19 | 14 | 9,6 | 32 | 13,486 | 0,514 | 0,264 | 3,671 | 
| 20 | 14 | 9,9 | 36 | 14,238 | -0,238 | 0,057 | 1,700 | 
| Сумма | 192 | 125,4 | 449 | 191,992 | 0,008 | 7,609 | 110,371 | 
| Ср. знач. | 9,6 | 6,27 | 22,45 | 9,600 | – | 0,380 | 5,519 | 
Остаточная дисперсия:
.
Средняя ошибка аппроксимации:
.
Качество модели, исходя из относительных отклонений по каждому наблюдению, признается хорошим, т.к. средняя ошибка аппроксимации не превышает 10%.
Коэффициенты и стандартизованного уравнения регрессии :
;
.
Т.е. уравнение будет выглядеть следующим образом:
.
Так как стандартизованные коэффициенты регрессии можно сравнивать между собой, то можно сказать, что ввод в действие новых основных фондов оказывает большее влияние на выработку продукции, чем удельный вес рабочих высокой квалификации.
Сравнивать влияние факторов на результат можно также при помощи средних коэффициентов эластичности:
.
Вычисляем:
; .
Т.е. увеличение только основных фондов (от своего среднего значения) или только удельного веса рабочих высокой квалификации на 1% увеличивает в среднем выработку продукции на 0,523% или 0,299% соответственно. Таким образом, подтверждается большее влияние на результат фактора , чем фактора .
2. Коэффициенты парной корреляции мы уже нашли:
; ; .
Они указывают на весьма сильную связь каждого фактора с результатом, а также высокую межфакторную зависимость (факторы и явно коллинеарны, т.к. ). При такой сильной межфакторной зависимости рекомендуется один из факторов исключить из рассмотрения.
Частные коэффициенты корреляции характеризуют тесноту связи между результатом и соответствующим фактором при элиминировании (устранении влияния) других факторов, включенных в уравнение регрессии.
При двух факторах частные коэффициенты корреляции рассчитываются следующим образом:
;
.
Если сравнить коэффициенты парной и частной корреляции, то можно увидеть, что из-за высокой межфакторной зависимости коэффициенты парной корреляции дают завышенные оценки тесноты связи. Коэффициент множественной корреляции определить через матрицы парных коэффициентов корреляции:
,
где
– определитель матрицы парных коэффициентов корреляции;
– определитель матрицы межфакторной корреляции.
Находим:
.
Коэффициент множественной корреляции:
.
Аналогичный результат получим при использовании других формул:
;
;
Коэффициент множественной корреляции указывает на весьма сильную связь всего набора факторов с результатом.
3. Нескорректированный коэффициент множественной детерминации оценивает долю дисперсии результата за счет представленных в уравнении факторов в общей вариации результата. Здесь эта доля составляет и указывает на весьма высокую степень обусловленности вариации результата вариацией факторов, иными словами – на весьма тесную связь факторов с результатом.
Скорректированный коэффициент множественной детерминации
определяет тесноту связи с учетом степеней свободы общей и остаточной дисперсий. Он дает такую оценку тесноты связи, которая не зависит от числа факторов и поэтому может сравниваться по разным моделям с разным числом факторов. Оба коэффициента указывают на весьма высокую (более ) детерминированность результата в модели факторами и .
4. Оценку надежности уравнения регрессии в целом и показателя тесноты связи дает -критерий Фишера:
.
В нашем случае фактическое значение -критерия Фишера:
.
Получили, что (при ), т.е. вероятность случайно получить такое значение -критерия не превышает допустимый уровень значимости . Следовательно, полученное значение не случайно, оно сформировалось под влиянием существенных факторов, т.е. подтверждается статистическая значимость всего уравнения и показателя тесноты связи .
5. Оценим статистическую значимость параметров чистой регрессии с помощью -критерия Стьюдента. Рассчитаем стандартные ошибки коэффициентов регрессии:
;
.
Фактические значения -критерия Стьюдента:
, .
Табличное значение критерия при уровне значимости и числе степеней свободы составит . Таким образом, признается статистическая значимость параметра и незначимость параметра .
Доверительные интервалы для параметров чистой регрессии:
,
и
, .
6. С помощью частных -критериев Фишера оценим целесообразность включения в уравнение множественной регрессии фактора после и фактора после при помощи формул (3.16):
; .
Найдем и :
;
.
Имеем:
;
.
Получили, что . Следовательно, включение в модель фактора после того, как в модель включен фактор статистически нецелесообразно: прирост факторной дисперсии за счет дополнительного признака оказывается незначительным, существенным; фактор включать в уравнение после фактора не следует.
Если поменять первоначальный порядок включения факторов в модель и рассмотреть вариант включения после , то результат расчета частного -критерия для будет иным. , т.е. вероятность его случайного формирования меньше принятого стандарта . Следовательно, значение частного -критерия для дополнительно включенного фактора не случайно, является статистически значимым, надежным, достоверным: прирост факторной дисперсии за счет дополнительного фактора является существенным. Фактор должен присутствовать в уравнении, в том числе в варианте, когда он дополнительно включается после фактора .
7. Общий вывод состоит в том, что множественная модель с факторами и с содержит неинформативный фактор . Если исключить фактор , то можно ограничиться уравнением парной регрессии:
.
Найдем его параметры:
;
.
Таким образом,
, .
8. Проверим вычисления в MS Excel.
Найдем 
матрицу парных коэффициентов корреляции 
(Сервис→Анализ данных→
.
С помощью 
инструмента Регрессия (Сервис→Анализ данных→
| ВЫВОД ИТОГОВ | ||||||||
| Регрессионная статистика | ||||||||
| Множественный R | 0,966294 | |||||||
| R-квадрат | 0,933724 | |||||||
| Нормированный R-квадрат | 0,925927 | |||||||
| Стандартная ошибка | 0,668998 | |||||||
| Наблюдения | 20 | |||||||
| Дисперсионный анализ | ||||||||
| df | SS | MS | F | Значимость F | ||||
| Регрессия | 2 | 107,1915 | 53,59576 | 119,7516 | 9,58E-11 | |||
| Остаток | 17 | 7,608481 | 0,447558 | |||||
| Итого | 19 | 114,8 | ||||||
| Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | Нижние 95% | Верхние 95% | Нижние 95,0% | Верхние 95,0% | |
| Y-пересечение | 1,707175 | 0,537318 | 3,177218 | 0,005511 | 0,573534 | 2,840816 | 0,573534 | 2,840816 | 
| x1 | 0,78961 | 0,231638 | 3,40881 | 0,003343 | 0,300897 | 1,278324 | 0,300897 | 1,278324 | 
| x2 | 0,131045 | 0,067155 | 1,951388 | 0,067688 | -0,01064 | 0,27273 | -0,01064 | 0,27273 | 
Информация о работе Контрольная работа по дисциплине "Эконометрика"