Корреляционно-регрессионный анализ
Контрольная работа, 27 Марта 2012, автор: пользователь скрыл имя
Краткое описание
Контрльная работа по дисциплине "Экономико-математическое моделирование. Коэффициент корреляции величин x и y r(x,y) – свидетельствует о наличии или отсутствии линейной связи между переменными.
Прикрепленные файлы: 1 файл
контр по эконометрике.doc
— 186.00 Кб (Скачать документ)Задание 1.
1. Без использования вычислительной техники найдите значение r(Y,X) выборочного коэффициента корреляции между этими переменными. Методом наименьших квадратов подберите модель линейной (непропорциональной) связи между этими переменными, считая переменную Y объясняемой, а переменную X объясняющей.
2. Получите разложение полной суммы квадратов на остаточную и объясненную подобранной моделью суммы квадратов.
3. Вычислите коэффициент детерминации R2.
4. Вычислите коэффициент корреляции r (Y,Y*) между переменной Y и переменной Y*, значения которой заменяют значения переменной Y согласно оцененной модели ("выровненные" значения).
5. Сравните полученные значения r(Y,X) и r(Y,Y*); объясните полученный результат.
№ | ||||||
1 | 4,7 | 20,3 | 95,41 | 412,09 | 3,925552 | 22,09 |
2 | 4,8 | 20,4 | 97,92 | 416,16 | 4,024536 | 23,04 |
3 | 4,9 | 20,9 | 102,41 | 436,81 | 4,519456 | 24,01 |
4 | 5,1 | 21,5 | 109,65 | 462,25 | 5,11336 | 26,01 |
5 | 5,3 | 22,1 | 117,13 | 488,41 | 5,707264 | 28,09 |
6 | 5,6 | 22,7 | 127,12 | 515,29 | 6,301168 | 31,36 |
7 | 5,7 | 23,1 | 131,67 | 533,61 | 6,697104 | 32,49 |
8 | 6,2 | 23,4 | 145,08 | 547,56 | 6,994056 | 38,44 |
9 | 6,9 | 23,8 | 164,22 | 566,44 | 7,389992 | 47,61 |
10 | 7,2 | 24 | 172,8 | 576 | 7,58796 | 51,84 |
11 | 7,5 | 24,3 | 182,25 | 590,49 | 7,884912 | 56,25 |
12 | 8,6 | 24,7 | 212,42 | 610,09 | 8,280848 | 73,96 |
13 | 9,1 | 25 | 227,5 | 625 | 8,5778 | 82,81 |
14 | 10 | 25,8 | 258 | 665,64 | 9,369672 | 100 |
15 | 10,3 | 26,3 | 270,89 | 691,69 | 9,864592 | 106,09 |
16 | 10,5 | 26,6 | 279,3 | 707,56 | 10,16154 | 110,25 |
итого | 112,4 | 374,9 | 2693,77 | 8845,09 | 112,3998 |
|
средн | 7,025 | 23,43125 | 168,3606 | 552,8181 | 7,024988 | 53,3963
|
1. Коэффициент корреляции величин x и y r(x,y) – свидетельствует о наличии или отсутствии линейной связи между переменными:
Если: rxy = -1, то наблюдается строгая отрицательная связь;
rxy = 1, то наблюдается строгая положительная связь;
rxy = 0, то линейная связь отсутствует.
, - стандартное отклонение случайной величины, т.е. мера разброса случайной величины вокруг среднего значения.
= 1,947986
= 2,011374
0,958639 – связь прямая сильная
Парная регрессия – регрессия между двумя переменными y и x, то есть модель вида: y=f(x)+ε, где:
y - зависимая переменная (результативный признак),
x – независимая, объясняющая, переменная ( признак- фактор),
ε - возмущение или стохастическая переменная, включающая влияние неучтенных в модели факторов
При количественной оценке связей используется линейная функция вида:
y=a+вx
Оценивание параметров а, в производится методом наименьших квадратов. Параметры уравнения линейной регрессии можно вычислить следующим образом:
;
- уравнение регрессии
b=0,98984
a=-16,1682
Получили уравнение регрессии:
-16,1682+0,98984x
Экономический смысл параметров уравнения линейной парной регрессии: Параметр b показывает среднее изменение результата y с изменением фактора x на единицу. Параметр a=y, когда x=0. Если x не может быть равен 0, то a не имеет экономического смысла. Интерпретировать можно только знак при а: если а>0, то относительное изменение результата происходит медленнее, чем изменение фактора, то есть вариация результата меньше вариации фактора: Vy<Vx, и наоборот.
Коэффициент вариации случайной величины x, y (Vx, Vy) – мера относительного разброса случайной величины. Показывает, какую долю среднего значения случайной величины составляет ее средний разброс.
;
В данном случае величина параметра а не имеет экономического смысла.
; ;
; ;
То, что а<0, соответствует опережению изменения результата над изменением фактора:
2. Разложение общей суммы квадратов отклонений переменной y от среднего значения на две части – «объясненную» и «необъясненную»:
= +
Общая сумма Сумма квадратов Остаточная сумма
квадратов
отклонений объясненная
№ | ||||||
1 | 4,7 | 3,925552 | 9,606578 | 0,59977 | 5,405625 | 18,45009 |
2 | 4,8 | 4,024536 | 9,002784 | 0,601344 | 4,950625 | 19,31777 |
3 | 4,9 | 4,519456 | 6,277751 | 0,144814 | 4,515625 | 22,14533 |
4 | 5,1 | 5,11336 | 3,654367 | 0,000178 | 3,705625 | 26,07814 |
5 | 5,3 | 5,707264 | 1,736428 | 0,165864 | 2,975625 | 30,2485 |
6 | 5,6 | 6,301168 | 0,523933 | 0,491637 | 2,030625 | 35,28654 |
7 | 5,7 | 6,697104 | 0,107516 | 0,994216 | 1,755625 | 38,17349 |
8 | 6,2 | 6,994056 | 0,000958 | 0,630525 | 0,680625 | 43,36315 |
9 | 6,9 | 7,389992 | 0,133219 | 0,240092 | 0,015625 | 50,99094 |
10 | 7,2 | 7,58796 | 0,316924 | 0,150513 | 0,030625 | 54,63331 |
11 | 7,5 | 7,884912 | 0,739449 | 0,148157 | 0,225625 | 59,13684 |
12 | 8,6 | 8,280848 | 1,577154 | 0,101858 | 2,480625 | 71,21529 |
13 | 9,1 | 8,5778 | 2,411188 | 0,272693 | 4,305625 | 78,05798 |
14 | 10 | 9,369672 | 5,497487 | 0,397313 | 8,850625 | 93,69672 |
15 | 10,3 | 9,864592 | 8,063283 | 0,18958 | 10,72563 | 101,6053 |
16 | 10,5 | 10,16154 | 9,837883 | 0,114555 | 12,07563 | 106,6962 |
итого | 112,4 | 112,3998 | 59,4869 | 5,24311 | 64,73 |
|
средн | 7,025 | 7,024988 |
|
|
| 53,06847 |
Общая сумма квадратов отклонений (Sобщ):
Sобщ ==64,73
Факторная сумма квадратов отклонений (Sфакт):
Sфакт ==59,48693
Остаточная сумма квадратов отклонений (S ост):
S ост= Sобщ - Sфакт=5,24311
Сумма квадратов отклонений, обусловленная регрессией (59,4869) больше остаточной суммы квадратов (5,24311), следовательно уравнение регрессии статистически значимо и фактор x оказывает существенное воздействие на результат y.
3. Коэффициент детерминации (rxy2) – характеризует долю дисперсии результативного признака y, объясняемую дисперсией, в общей дисперсии результативного признака. Чем ближе rxy2 к 1, тем качественнее регрессионная модель, то есть исходная модель хорошо аппроксимирует исходные данные.
=3,717931; =4,045626
0,919 – прямая сильная связь
Уравнением регрессии объясняется 91,9% дисперсии результативного признака, а на долю прочих факторов приходится лишь 8,1% ее дисперсии (т.е. остаточная дисперсия).
4. Коэффициент корреляции величин и :
=0,958645 – прямая сильная связь
5.