Елементи теорії кореляції

Автор работы: Пользователь скрыл имя, 23 Октября 2013 в 19:16, курсовая работа

Краткое описание

Мета: формування базових знань з основ застосування ймовірнісно – статистичного апарата для розв’язування теоретичних і практичних економічних задач.
В результаті вивчення дисципліни студент повинен вміти:
- використовувати у своїй практичній діяльності набуті знання щодо застосовування статистичних методів для дослідження економічних явищ;
- проаналізувати та сформулювати постановку економічної задачі з використанням найпростіших кореляційних методів;

Содержание

ВСТУП……………………………………………………………………………….3
РОЗДІЛ I
ЗАГАЛЬНА ХАРАКТЕРИСТИКА ТЕОРІЇ КОРЕЛЯЦІЇ………………5
1.1.Теорія кореляційного дослідження…………………………………………..5
1.2.Характеристика методів і критеріїв встановлення залежності між змінними…………………………………………………………………………….15
1.3.Лінійна регресія……………………………………………………………...21
1.3.1.Критерій Фішера…………………………………………………….23
1.3.2.Дисперсія…………………………………………………………….23
1.3.3.Коефіцієнти кореляції………………………………………………24
1.4.Виробнича регресія………………………………………………………….27
1.5.Моделі парної регресії та їх дослідження………………………………….36
РОЗДІЛ II
ПРАКТИЧНА РЕАЛІЗАЦІЯ ТЕОРІЇ КОРЕЛЯЦІЇ…………………...47
2.1. Реалізація лінійної регресії на прикладі задач……………………………47
2.2. Реалізація застосування методу найменших квадратів на прикладах…..50
2.3.Застосування методу лінійної регресії на прикладі………………….......54
ВИСНОВОК………………………………………………………………………..58
ВИКОРИСТАНА ЛІТЕРАТУРА………………………………………………..59

Прикрепленные файлы: 1 файл

Курсова робота Корзун.doc

— 919.00 Кб (Скачать документ)

2. Часткова  кореляція

Для того щоб вплив  кореляційного зв'язку між двома  змінними "очистити" від можливого впливу третьої, уведене поняття часткової кореляції. По ній коефіцієнт кореляції між двома змінними X і Z визначається по формулі:

   (2.4)

де r12, r13 і r23 - коефіцієнти парної кореляції між змінними X і Y, X і Z, Y і X відповідно.

При використанні часткового коефіцієнта кореляції необхідно  пам'ятати:

  • взаємовпливаючих змінних може бути не три, а скільки завгодно;
  • ви можете не знати про усіх взаємовпливаючих змінних;

3.Рангова кореляція

Рангова кореляція є аналогом парної кореляції для тих випадків, коли величини, наявність зв'язку між який потрібно перевірити, представлені не в шкалі відносин, а в який-небудь іншій. Найбільше часто така ситуація виникає, якщо ми маємо справу із суб'єктивними оцінками об'єктивних явищ, які не можна вимірити, тобто з експертними оцінками. Крім того, рангова кореляція використовується також у випадках, коли закон розподілу досліджуваних змінних не є гаусовським (нормальним).

Коефіцієнти кореляції [4, 93-95 ст.] називаються ранговими, тому що перед обчисленням значення змінних перетворюють у ранги. Для цього наявні значення змінних розташовують у ранжированому (впорядкованому по величині) ряду (значення у вихідному стані можуть бути таким ранжированим рядом). Потім кожному значенню присвоюється ранг від 1 до N, де N - кількість аналізованих об'єктів. У тому випадку, якщо кілька елементів мають той самий ранг, те кожному з них присвоєються середнє від займаних ними місць.

Допущення

  • Усі спостереження взаємно незалежні.
  • Усі значення спостережень витягнуті з однієї і тієї ж двовимірної генеральної сукупності, тобто X і Y однаково розподілені.

Існує кілька різних способів обчислення коефіцієнтів рангової кореляції. Найбільше часто використовують коефіцієнт кореляції Спірмена (r, іноді позначається rs) і коефіцієнт Кендалла (τ).

4. Коефіцієнт кореляції Спірмена

Коефіцієнт кореляції Спірмена [17, 125-126 ст.]обчислюється по формулі:

   (2.5)

де R1i і R2i - ранги i-го об'єкта для кожної з порівнюваних змінних. Значення r не залежить від способу упорядкування рангів.

Очевидно, що цей коефіцієнт є повним аналогом коефіцієнта парної кореляції - після перетворення його можна представити у виді:

   (2.6)

При наявності співпадаючих значень (зв'язок) знаменник зменшується па величину:

   (2.7)

де L1 і L2 - кількість зв'язок у T1i і T2J - розміри зв'язок (кількість елементів у них).

5. Коефіцієнт кореляції Кендалла

Коефіцієнт кореляції Кендалла [17, 144-145 ст.]обчислюється по формулі:

   (2.8)

де п - кількість спостережень, a Q - число неузгоджених пар (ХjУj) і (Xi,Yi) для всіх комбінацій i і j. Пари називаються неузгодженими, якщо для них виконується наступне умова:

sign(Xj - Yj)sign(Xi - Yi) = -1,   (2.9)

де sign - означає "знак". Це функція приймає значення +1 для позитивного числа і -1 для негативного. Іншими словами, приведена умова означає, що збільшення X приводить до зменшення Y, і навпаки. Для перевірки значимості коефіцієнта існують спеціальні таблиці.

6. Конкордація.

У тому випадку, коли необхідне  порівняння не двох змінних, а більшої  кількості (наприклад, при з'ясуванні погодженості думок групи експертів), використовується коефіцієнт конкордації, запропонований Кендаллом:

   (2.10)

де п - кількість аналізованих об'єктів, т - кількість експертів, Rij - ранг j-го об'єкта, що привласнений йому i-м експертом.

Варто звернути увагу  на відмінність у значеннях коефіцієнта  конкордації від коефіцієнта  кореляції. Якщо думки експертів  цілком протилежні, коефіцієнт конкордації дорівнює нулю (W = 0), але коефіцієнт кореляції в цьому випадку буде дорівнює -1.

При наявності зв'язок (однакових значень) формула здобуває наступний вид:

   (2.11)

де  при цьому Li - число зв'язок, ni - кількість елементів у i-й зв'язці для j-го експерта.

Значимість коефіцієнта конкордації при малій кількості експертів перевірити складно. Для малих значень існують неповні таблиці.

1.3. Лінійна регресія

 

Якщо дано сукупність показників y, що залежать від факторів х, то постає завдання знайти таку економетричну  модель, яка б найкраще описувала існуючу залежність. Одним з методів є лінійна регресія. Лінійна регресія передбачає побудову такої прямої лінії, при якій значення показників, що лежать на ній будуть максимально наближені до фактичних, і продовжуючи цю пряму одержуємо значення прогнозу. Процес продовження прямої називається екстраполяцією. Відповідно до цього постає задача визначити цю пряму, тобто рівняння цієї прямої. В загальному вигляді рівняння прямої виглядає:

                                                   =а+bх,    (1.1)

де  - вирівняне значення у для відповідного значення х.

Константи а і b - константи, які  передбачають зменшення суми квадратів  відхилень між фактичним значенням  у і вирівняним значенням  .

                                              S(у - )2 ® min   (1.2)

Коефіцієнт а характеризує точку  перетину прямої регресії з лінією координат.

Коефіцієнт b характеризує кут нахилу цієї прямої до осі абсцис, а також  на яку величину зміниться при зміні х на одиницю.

Коефіцієнти а і b знаходять із системи  рівнянь (1.3), що випливає з формули (1.2).

                                              (1.3)

Знайшовши значення параметрів розраховують ряд вирівняних значень для відповідних факторів і проводять дослідження знайденої економетричної моделі.

Щоб зробити висновок про доцільність  використання знайденої моделі проводять  аналіз за наступними напрямками:

1) Розраховують критерій Фішера та перевіряють знайдену модель на адекватність вихідним даним;

2) Розраховують і аналізують  дисперсію показників;

3) Розраховують і аналізують  коефіцієнт кореляції;

4) Розраховують та аналізують  коефіцієнт еластичності;

5) Розраховують довірчий інтервал для прогнозованих показників [20, 65-66 ст.].

           1.2.1. Критерій Фішера

Для оцінки знайденої  економетричної моделі на адекватність порівнюють розрахункове значення критерію Фішера із табличним.

Розрахункове значення критерію Фішера знаходиться за формулою:

                                             ,    (1.4)

                                          де ,                 (1.5)

                                           ,             (1.6)

n – число дослідів,

m – число включених  у регресію факторів, які чинять  суттєвий вплив на показник.

Для даної надійної ймовірності  р (а=1-р рівня значущості) і числа  ступенів вільності k1=m, k2=n-m-1 знаходиться табличне значення F(a, k1, k2). Отримане розрахункове значення порівнюється з табличним. При цьому, якщо Fроз > F(a, k1, k2), то з надійністю р = 1-а можна вважати, що розглянута економетрична модель адекватна вихідним даним. У протилежному випадку з надійністю р розглянуту лінійну регресію не можна вважати адекватною.

      1. Дисперсія

Дисперсія в лінійній регресії дає можливість визначити  значимість характеристик, вирахуваних  в регресійному аналізі (характеристики а і b). Для визначення цих характеристик  використовують:

1) Загальна дисперсія  - характеризує рівень відхилень між фактичними значеннями ряду і їх середнім значенням:

                                                 (1.7)

2) Дисперсія,  що пояснюється регресією. Чим  більша доля дисперсії, що пояснюється  регресією в загальній дисперсії, тим тісніший зв`язок між у і х. Чим ця доля менша, тим відповідно слабший зв`язок. Ця дисперсія визначається, як сума квадратів відхилень між вирівняним значенням ряду і середнім значенням ряду.

                                             .   (1.8)

Якщо ПД ® до ЗД, то зв`язок тісний між у і t.

Якщо ПД ® до ЗД, то зв`язок слабшає. Изображение помощника.

 

3) Залишкова дисперсія  - це та частина ЗД, яка не  пояснюється регресією

                                             Зал.Д = ЗД – ПД,

                                                          (1.9),

де уі – фактичне значення ряду.

 

1.2.3. Коефіцієнти  кореляції

 

Коефіцієнт  кореляції r [10, 88-90 ст.] – міра тісноти зв`язку. Він на відміну від дисперсії характеризує міру тісноти зв`язку (дає її числове значення). Змінюється в межах від -1 до +1.

Якщо r=0, то лінія регресії паралельна осі абсцис, тобто залежності між  у і t немає (регресія відсутня).

Якщо r ® +1 (додатна регресія). Із збільшенням t – уt теж буде зростати.

Якщо r ® -1 (від`ємна регресія). Із збільшенням t – уt буде зменшуватись.

Коефіцієнт кореляції визначається як корінь квадратний з коефіцієнта  детермінації r2, що показує долю ПД в ЗД:

                                                   ,   (1.10)

і відповідно

                                                                  (1.11)

де ПД і ЗД розраховуються відповідно за формулами 1.8 і 1.7.

Знак коефіцієнта кореляції  співпадає із знаком коефіцієнта b в рівнянні регресії.

Коефіцієнт  еластичності [6, 56-57 ст.].

Розрахунок коефіцієнта  еластичності розраховується для кожного  із факторів і показує на скільки  відсотків зміниться показник, якщо фактор зміниться на 1%.

Коефіцієнт еластичності:

                                          (1.12)

Довірчий інтервал [8, 110-111 ст.].

Вихідна економетрична  модель лінійної регресії передбачає наявність випадкової величини Е, яка  вимірює похибку між фактичним  значенням і вирівняним значенням  показника. Для розрахунку цих похибок використовують поняття "стандартного відхилення"

                                             ,             (1.13)

де Sr – стандартна похибка рівняння регресії

n-2 – число значень  ряду зменшене на кількість параметрів рівняння регресії (тобто а і b).

Розрахувавши  стандартну похибку рівняння регресії знаходимо стандартну похибку прогнозу:

                                              (1.14)

Для розрахунку довірчих меж потрібно знайти значення .

Нижня межа довірчого  інтервалу  ; верхня межа довірчого інтервалу .

Прогнозне значення ур=a+bxp буде знаходитись в межах від уmin до ymax.

                                                       (1.15)

де t – критерій Стюдента (знаходиться з таблиць в залежності від ймовірності P і ступеня вільності n-m-1).

1

Значення фактора Х

N

Х1

Х2

ХЗ

Х4

Х5

Х6

Х7

Х8

Х9

Х10

Х11

Х12

1

2,06

2,53

2,17

3,65

3,22

2,16

4,57

2,25

6,15

1,86

2,07

3,11

2

2,58

3,54

2,90

3,82

3,87

2,65

5,42

2,98

5,66

1,91

3,22

3,15

3

3,14

3,84

3,29

3,76

4,95

3,49

5,29

2,15

7,50

2,14

3,04

3,85

4

3,54

3,84

4,13

5,24

5,10

3,16

6,33

2,71

6,90

3,39

3,42

4,84

5

4,18

4,22

5,25

5,03

5,88

3,85

7,63

3,70

6,31

3,95

5,23

4,62

6

4,78

4,81

4,92

5,52

7,28

4,58

7,53

4,59

6,25

4,30

5,70

4,87

7

5,11

6,53

5,79

5,62

6,90

5,33

7,73

4,77

9,39

5,10

6,53

6,09

8

5,67

5,82

5,87

6,98

7,54

5,89

8,44

5,34

9,73

5,47

6,41

7,06

9

6,02

6,43

6,99

6,91

7,91

6,20

9,49

5,45

9,33

5,97

6,68

6,23

10

6,65

7,73

7,04

7,95

8,40

6,39

9,18

6,00

10,50

6,16

7,46

6,83

11

7,05

8,19

8,14

7,24

8,14

6,95

10,14

6,25

11,10

6,46

6,83

8,01

12

7,52

7,65

8,06

9,27

8,76

7,25

9,94

6,79

11,51

6,07

6,34

8,26

13

8,03

9,31

8,57

8,46

9,67

7,80

10,92

8,24

12,42

6,71

8,19

9,37

14

8,56

9,26

9,45

10,30

10,28

8,47

11,89

8,51

12,40

7,16

7,19

9,02

15

9,03

9,86

9,06

10,72

10,59

9,22

11,14

9,15

13,14

8,81

9,72

9,76

Хр

9,52

9,69

10,30

10,05

11,58

9,32

11,73

9,78

12,56

8,07

8,71

10,28

Информация о работе Елементи теорії кореляції