Контрольная работа по "Статистике"

Автор работы: Пользователь скрыл имя, 02 Июня 2013 в 20:24, контрольная работа

Краткое описание

Задание 6.15. Известны объемы производства отдельных видов промышленной продукции в трех странах: Рассчитайте относительные показатели уровня экономического развития, используя следующие данные о среднегодовой численности населения, млн. чел.: Венгрия - 10,3;Германия - 81,4; Россия-148,3.
Задание 9.2. Установите направление и характер связи между четырьмя показателями, характеризующими экспорт технологий и услуг технического характера, по 10 областям РФ в 2003 г., применив метод приведения параллельных данных.(млн. долл. США)

Содержание

Задание 6.15. 3
Задание 6.17. 6
Задание 7.20. 7
Задание 8.1. 8
Задание 10.1. 16
Задание 12.4. 18
Задание 9.2. 25

Прикрепленные файлы: 1 файл

2166 Задание по статистике решение.docx

— 107.56 Кб (Скачать документ)

Транспонированная матрица.

1

1

1

1

1

1

1

1

1

1

9

7

3

20

8

11

6

13

18

16

0.49

4.19

0.11

3.69

0.51

5.1

0.52

1.75

4.28

2.49

0.49

4.18

0.11

3.69

0.51

5.05

0.52

1.74

4.22

2.48

0.42

0.19

0.11

2.38

0.51

2.04

0.52

0.28

3.3

0.3


Матрица ATA.

10

111

23.13

22.99

10.05

111

1509

310.8

308.81

150.52

23.13

310.8

85.55

84.95

36.09

22.99

308.81

84.95

84.36

35.78

10.05

150.52

36.09

35.78

21.64


Полученная матрица имеет следующее  соответствие:

∑n

∑y

∑x1

∑x2

∑x3

∑y

∑y2

∑x1 y

∑x2 y

∑x3 y

∑x1

∑yx1

∑x1 2

∑x2 x1

∑x3 x1

∑x2

∑yx2

∑x1 x2

∑x2 2

∑x3 x2

∑x3

∑yx3

∑x1 x3

∑x2 x3

∑x3 2


Найдем парные коэффициенты корреляции.

Для y и x1

Средние значения

 

 

 

Дисперсия

 

 

Среднеквадратическое отклонение

 

 

Коэффициент корреляции

 

Для y и x2

Средние значения

 

 

 

Дисперсия

 

 

Среднеквадратическое отклонение

 

 

Коэффициент корреляции

 

Для y и x3

Средние значения

 

 

 

Дисперсия

 

 

Среднеквадратическое отклонение

 

 

Коэффициент корреляции

 

Для x1  и x2

Средние значения

 

 

 

Дисперсия

 

 

Среднеквадратическое отклонение

 

 

Коэффициент корреляции

 

Для x1  и x3

Средние значения

 

 

 

Дисперсия

 

 

Среднеквадратическое отклонение

 

 

Коэффициент корреляции

 

Для x2  и x3

Средние значения

 

 

 

Дисперсия

 

 

Среднеквадратическое отклонение

 

 

Коэффициент корреляции

 

Матрица парных коэффициентов корреляции.

-

y

x1

x2

x3

y

1

0.57

0.57

0.69

x1

0.57

1

1

0.67

x2

0.57

1

1

0.66

x3

0.69

0.67

0.66

1


Анализ первой строки этой матрицы  позволяет произвести отбор факторных  признаков, которые могут быть включены в модель множественной корреляционной зависимости. Факторные признаки, у  которых ryxi < 0.5 исключают из модели.

Коллинеарность – зависимость между факторами. В качестве критерия мультиколлинеарности может быть принято соблюдение следующих неравенств:

r(xjy) > r(xkxj) ; r(xky) > r(xkxj).

Если одно из неравенств не соблюдается, то исключается тот параметр xk или xj, связь которого с результативным показателем Y оказывается наименее тесной.

При оценке мультиколлинеарности факторов следует учитывать, что чем ближе к 0 определитель матрицы межфакторной корреляции, тем сильнее мультиколлинеарность факторов и ненадежнее результаты множественной регрессии.

Для отбора наиболее значимых факторов xi учитываются следующие условия:

- связь между результативным  признаком и факторным должна  быть выше межфакторной связи;

- связь между факторами должна  быть не более 0.7;

- при высокой межфакторной связи признака отбираются факторы с меньшим коэффициентом корреляции между ними.

Более объективную характеристику тесноты связи дают частные коэффициенты корреляции, измеряющие влияние на результат фактора xi при неизменном уровне других факторов.

Модель регрессии в  стандартном масштабе.

Модель регрессии в стандартном  масштабе предполагает, что все значения исследуемых признаков переводятся  в стандарты (стандартизованные  значения) по формулам:

 

где хji - значение переменной хji в i-ом наблюдении.

 

Таким образом, начало отсчета каждой стандартизованной переменной совмещается  с ее средним значением, а в  качестве единицы изменения принимается  ее среднее квадратическое отклонение S.

Если связь между переменными  в естественном масштабе линейная, то изменение начала отсчета и  единицы измерения этого свойства не нарушат, так что и стандартизованные  переменные будут связаны линейным соотношением:

ty = ∑βjtxj

Для оценки β-коэффциентов применим МНК. При этом система нормальных уравнений будет иметь вид:

rx1y1+rx1x2•β2 + ... + rx1xm•βm

rx2y=rx2x1•β1 + β2 + ... + rx2xm•βm

...

rxmy=rxmx1•β1 + rxmx2•β2 + ... + βm

Для наших данных:

0.573854940501 = β1 + 0.999966250744β2 + 0.668024636893β3

0.574084969611 = 0.999966250744β1 + β2 + 0.664967880835β3

0.689325606234 = 0.668024636893β1 + 0.664967880835β2 + β3

Откуда находим: β1 = -37.79224619484; β2 = 37.859673100176; β3 = 0.76001055962461;

Стандартизированная форма уравнения  регрессии имеет вид:

y0 = -37.792x1 + 37.86x2 + 0.76x3

Найденные из данной системы β–коэффициенты позволяют определить значения коэффициентов в регрессии в естественном масштабе по формулам:

 

 

3. Анализ параметров  уравнения регрессии.

Перейдем к статистическому  анализу полученного уравнения  регрессии: проверке значимости уравнения  и его коэффициентов, исследованию абсолютных и относительных ошибок аппроксимации

Для несмещенной оценки дисперсии  проделаем следующие вычисления:

Несмещенная ошибка ε = Y - Y(x) = Y - X*s (абсолютная ошибка аппроксимации)

Y

Y(x)

ε

(Y-Yср)2

9

8.4

0.6

4.41

7

10.67

-3.67

16.81

3

6.81

-3.81

65.61

20

19.37

0.63

79.21

8

8.76

-0.76

9.61

11

14.11

-3.11

0.01

6

8.81

-2.81

26.01

13

8.2

4.8

3.61

18

16.74

1.26

47.61

16

9.13

6.87

24.01

 

 

 

 

 

 

276.9


se2 = (Y - X*s)T(Y - X*s) = 118.71

Несмещенная оценка дисперсии равна:

 

Оценка среднеквадратичного отклонения равна (стандартная ошибка для оценки Y):

 

Найдем оценку ковариационной матрицы  вектора k = S • (XTX)-1

1.3

17.25

-17.64

-0.21

17.25

2748.18

-2761.37

-25.28

-17.64

-2761.37

2774.88

25.12

-0.21

-25.28

25.12

0.92


 

Дисперсии параметров модели определяются соотношением S 2i = Kii, т.е. это элементы, лежащие на главной диагонали

Показатели тесноты связи  факторов с результатом.

Если факторные признаки различны по своей сущности и (или) имеют различные  единицы измерения, то коэффициенты регрессии bj при разных факторах являются несопоставимыми. Поэтому уравнение регрессии дополняют соизмеримыми показателями тесноты связи фактора с результатом, позволяющими ранжировать факторы по силе влияния на результат.

К таким показателям тесноты  связи относят: частные коэффициенты эластичности, β–коэффициенты, частные коэффициенты корреляции.

Частные коэффициенты эластичности.

С целью расширения возможностей содержательного анализа модели регрессии используются частные коэффициенты эластичности, которые определяются по формуле:

 

Частный коэффициент эластичности показывает, насколько процентов  в среднем изменяется признак-результат у с увеличением признака-фактора хj на 1% от своего среднего уровня при фиксированном положении других факторов модели.

 

Частные коэффициент эластичности |E1| > 1. Следовательно, он существенно влияет на результативный признак Y.

 

Частные коэффициент эластичности |E2| > 1. Следовательно, он существенно влияет на результативный признак Y.

 

Частный коэффициент эластичности |E3| < 1. Следовательно, его влияние на результативный признак Y незначительно.

Стандартизированные частные  коэффициенты регрессии.

Стандартизированные частные коэффициенты регрессии - β-коэффициенты (βj) показывают, на какую часть своего среднего квадратического отклонения S(у) изменится признак-результат y с изменением соответствующего фактора хj на величину своего среднего квадратического отклонения (Sхj) при неизменном влиянии прочих факторов (входящих в уравнение).

По максимальному βj можно судить, какой фактор сильнее влияет на результат Y.

По коэффициентам эластичности и β-коэффициентам могут быть сделаны противоположные выводы. Причины этого: а) вариация одного фактора очень велика; б) разнонаправленное воздействие факторов на результат.

Коэффициент βj может также интерпретироваться как показатель прямого (непосредственного) влияния j-ого фактора (xj) на результат (y). Во множественной регрессии j-ый фактор оказывает не только прямое, но и косвенное (опосредованное) влияние на результат (т.е. влияние через другие факторы модели).

Косвенное влияние измеряется величиной: ∑βirxj,xi, где m - число факторов в модели. Полное влияние j-ого фактора на результат равное сумме прямого и косвенного влияний измеряет коэффициент линейной парной корреляции данного фактора и результата - rxj,y.

Так для нашего примера непосредственное влияние фактора x1 на результат Y в уравнении регрессии измеряется βj и составляет -37.79224619484; косвенное (опосредованное) влияние данного фактора на результат определяется как:

rx1x2β2 = 0.999966250744 * 37.859673100176 = 37.8584

Частные коэффициенты корреляции.

Коэффициент частной корреляции отличается от простого коэффициента линейной парной корреляции тем, что он измеряет парную корреляцию соответствующих признаков (y и xi) при условии, что влияние на них остальных факторов (xj) устранено.

 

 

Теснота связи низкая.

 

 

Теснота связи низкая.

 

 

Теснота связи низкая.

 

 

Теснота связи низкая.

 

 

Теснота связи умеренная

 

 

Теснота связи умеренная

 

 

Теснота связи низкая.

 

 

Теснота связи низкая.

 

 

Теснота связи сильная

 

 

Теснота связи сильная

 

 

Теснота связи не сильная

 

 

Теснота связи умеренная

 

 

Теснота связи низкая.

 

 

Теснота связи низкая.

 

 

Теснота связи сильная

 

 

Теснота связи сильная

 

 

Теснота связи не сильная

 

 

Теснота связи не сильная

 

 

Теснота связи умеренная

 

 

Теснота связи умеренная

 

 

Теснота связи не сильная

 

 

Теснота связи умеренная

 

 

Теснота связи не сильная

 

 

Теснота связи не сильная

Индекс множественной  корреляции (множественный коэффициент  корреляции).

Тесноту совместного влияния факторов на результат оценивает индекс множественной  корреляции.

В отличии от парного коэффициента корреляции, который может принимать отрицательные значения, он принимает значения от 0 до 1.

Поэтому R не может быть использован для интерпретации направления связи. Чем плотнее фактические значения yi располагаются относительно линии регрессии, тем меньше остаточная дисперсия и, следовательно, больше величина Ry(x1,...,xm).

Информация о работе Контрольная работа по "Статистике"