Парная регрессия и корреляция

Автор работы: Пользователь скрыл имя, 14 Марта 2013 в 16:22, контрольная работа

Краткое описание

Задача 1. По территориям региона приводятся данные за 200X г.
Требуется:
1. Постройте поле корреляции и сформулируйте гипотезу о форме связи.
2. Рассчитайте параметры уравнений линейной, степенной, экспоненциальной, полулогарифмической, обратной для линейной, гиперболической парной регрессии.
3. Оцените тесноту связи с помощью показателей корреляции, детерминации.
4. Дайте с помощью среднего коэффициента эластичности сравнительную оценку силы связи прожиточного минимума x со значением заработной платы y .

Прикрепленные файлы: 1 файл

teoria.doc

— 601.50 Кб (Скачать документ)

 

Для вычисления коэффициентов  используется МНК.

                   

a1= 2,933;          a0 = 31,222

Уравнение тренда имеет  вид: Y(t) = 31,222 + 2,933 ∙ t

Оценка  качества (адекватности) построенной линейной модели тренда.

Модель считается хорошей  со статистической точки зрения, если она адекватна и достаточно точна.

Проверка адекватности модели реальному явлению является важным этапом прогнозирования социально - экономических процессов. Для этого исследуют ряд остатков , т.е. отклонения расчетных значений от фактических данных.

Таблица 17 Расчет случайной величины

t

E(t)

Точки поворота

E2(t)

(E(t)- E(t+1))2

|E(t)|/Y(t)

1

0,84

 

0,71

0,871

2,41%

2

-0,09

*

0,01

0,004

0,24%

3

-0,02

*

0,00

3,738

0,06%

4

-1,96

*

3,82

1,138

4,77%

5

-0,89

 

0,79

9,404

1,98%

6

2,18

*

4,74

3,738

4,27%

7

0,24

*

0,06

0,004

0,47%

8

0,31

*

0,10

0,871

0,57%

9

-0,62

 

0,39

 

1,09%

0,00

6

10,62

19,77

15,85%


 

1. Проверка условия случайности возникновения отдельных отклонений от тренда.

Для проверки случайности  уровней ряда может быть использован  критерий «пиков», или критерий поворотных точек.

Рисунок 3 - График случайной величины εt

Критерий случайности  отклонений от тренда при уровне вероятности 0,95 можно представить как

где р – фактическое  количество поворотных точек в случайном  ряду; 1,96 – квантиль нормального распределения для 5%-го уровня значимости. Квадратные скобки здесь так же означают, что от результата вычисления следует взять целую часть.

p0 = [1,95] = 1.

Случайная величина E(t) содержит как положительные, так и отрицательные значения. Число поворотных точек p = 6.

Так как неравенство p = 6 > po = 1 соблюдается, то ряд остатков можно считать случайным (т.е. он содержит регулярную компоненту).

2. Проверка соответствия  ряда остатков нормальному закону  распределения важна с точки  зрения правомерности построения  доверительных интервалов прогноза. Для проверки используется критерий размаха (RS- критерий):

где и - максимальный и минимальный уровни ряда остатков;

- несмещенная оценка среднеквадратического отклонения ряда остатков

S = 1,152;              RS = (2,18 - (-1,96))/1,152 = 3,587

Так как расчетное  значение RS попадает между табулированными границами с заданным уровнем вероятности: RS = 3,587 > 3,54, то гипотеза о нормальном распределении ряда остатков не принимается. (Для n = 9 и 5%-ного уровня значимости α интервал равен (2,58; 3,54)). 

3. Для проверки отсутствия  автокорреляции используется критерий  Дарбина-Уотсона.

Под автокорреляцией  понимается зависимость последующих  уровней ряда от предыдущих.

При проверке независимости (отсутствие автокорреляции) определяется отсутствие в ряду остатков систематической составляющей, например, с помощью d-критерия  Дарбина–Уотсона по формуле:

d0 = 19,77/10,62 = 1,861

d0 = 1,861 < 2, d = = 1,861. Значение случайной величины d сравнивается с критическими числами d1 = 1,08; d2 = 1,36. Исходя из неравенства d = 1,861 > d2 = 1,36, автокорреляция ряда отсутствует.

Так как  все  пункты проверки, кроме второго, дают положительный результат, то выбранная трендовая модель является не полностью адекватной. Необходимо осуществить оценку точности модели прогноза.

Оценка точности линейной модели тренда.

Вычислим среднюю относительную  ошибку модели:

средняя относительная  ошибка: Еотн = 1/ n ∙ ∑|Еmax| / Yt ∙100%

Еотн = 1,76 %

Модель имеет удовлетворительный уровень точности, так как средняя  относительная ошибка: Еотн = 1,76 % не превышает 8-10%. Следовательно, линейную модель можно использовать для построения прогнозных оценок.

 

 Построим точечный и  доверительный прогноз на два шага вперед для Y(t). Для точечного прогноза необходимо подставить вместо значения t в уравнение модели Y(t) = 31,222 + 2,933 ∙ t значения t =10;11

Yp(10) = 31,222 + 2,933 ∙ 10 = 60,56

Yp(11) = 31,222 + 2,933 ∙ 11 = 63,49

Для доверительного прогноза необходимо вычислить U = S ∙ t1-L, N-2 = 2,73.

S = 1,152; t1-L, N-2 = 2,37

Yp(10) (60,56 - 2,73; 60,56 + 2,73). Следовательно, с вероятностью 0,95 Y(10) попадет в интервал (57,82; 63,29).

Yp(11) (63,49 - 2,73; 63,49 + 2,73). Следовательно, с вероятностью 0,95 Y(10) попадет в интервал (60,76; 66,22).

Для проверки используем надстройку Excel «Анализ данных». В диалоговом окне Анализ данных необходимо выбрать инструмент Регрессия. В диалоговом окне Регрессия в поле Входной интервал Y нужно ввести адрес одного диапазона ячеек, который представляет зависимую переменную. В поле Входной интервал Х - адрес диапазона, который содержат значения независимой переменной t Если выделены и заголовки столбцов, то установить флажок Метки в первой строке.

Рисунок 4 - Диалоговое окно Регрессия

Таблица 18 Проверка расчетов с помощью Excel

 

Коэффициенты

Стандартная ошибка

t-статистика

Y-пересечение

A0

31,22222

0,89492

34,88828

t

A1

2,933333

0,159031

18,44499


 

Таблица 19 Вывод остатка

Наблюдение

Предсказанное Y(t)

Остатки

1

34,15556

0,844444

2

37,08889

-0,08889

3

40,02222

-0,02222

4

42,95556

-1,95556

5

45,88889

-0,88889

6

48,82222

2,177778

7

51,75556

0,244444

8

54,68889

0,311111

9

57,62222

-0,62222


 

Во втором столбце таблицы 17 содержатся коэффициенты уравнения регрессии a0, a1, в третьем столбце – стандартные ошибки коэффициентов уравнения регрессии, а в четвертом – t-статистика, используемая для проверки значимости коэффициентов уравнения регрессии. Предсказанные значения и остатки полностью совпадают с рассчитанными.

Регрессионная модель: Y(t) = a0+a1 ∙ x(t)

Таблица 20 Расчет показателей регрессионной модели

t

Y(t)

X(t)

2

2

Yp(t)

1

35

65

6

-10,89

118,57

36

-65,333

38,22

2

37

67

8

-8,89

79,01

64

-71,111

35,66

3

40

63

4

-5,89

34,68

16

-23,556

40,78

4

41

60

1

-4,89

23,90

1

-4,889

44,61

5

45

56

-3

-0,89

0,79

9

2,667

49,72

6

51

53

-6

5,11

26,12

36

-30,667

53,56

7

52

57

-2

6,11

37,35

4

-12,222

48,45

8

55

59

0

9,11

83,01

0

0,000

45,89

9

57

51

-8

11,11

123,46

64

-88,889

56,11

Итого

413

531

0

0,00

526,89

230

-294,000

413,00

Среднее значение

45,9

59

0

0,00

58,54

25,56

-32,667

45,89




Для вычисления коэффициентов  используются формулы:  

a1 = ∑(

)/
2                                 a0 = y - a1 ∙ x

a1= -1,278;          a0 = 121,31

Уравнение регрессии  имеет вид: Y(t) = 121,31 - 1,278 ∙ x (t)

Коэффициент a1= - 1,278 выражает величину изменения признака y при изменении фактора x на 1 единицу измерения (%). Так как a1 < 0, между факторами существует обратная связь.

Величина влияния фактора x на y оценивается с помощью коэффициента корреляции (связи). Коэффициент корреляции Rxy = - 0,713. Таким образом, связь между y и x обратная, устойчивая, высокая.

Покажем, что построенная  модель адекватна и может быть использована для прогноза.

Таблица 21 Расчет случайной величины

t

E(t)

Точки поворота

E2(t)

(E(t)- E(t +1))2

|E(t)|/Y(t)

1

-3,22

 

10,36

20,762

9,20%

2

1,34

*

1,79

4,465

3,61%

3

-0,78

 

0,60

8,036

1,94%

4

-3,61

 

13,04

1,239

8,81%

5

-4,72

*

22,31

4,688

10,50%

6

-2,56

 

6,55

37,369

5,02%

7

3,55

 

12,64

30,875

6,84%

8

9,11

*

83,01

67,669

16,57%

9

0,89

 

0,78

-

1,55%

0,00

3

151,08

175,10

64,03%

Информация о работе Парная регрессия и корреляция