Автор работы: Пользователь скрыл имя, 25 Сентября 2013 в 00:29, контрольная работа
При машинной обработке исходной информации на ЭВМ, оснащенных пакетами стандартных программ ведения анализов, вычисление параметров применяемых математических функций является быстро выполняемой счетной операцией.
Для полного усвоения корреляционно-регрессионного анализа в эконо¬мических исследованиях в аналитической части работы будет приведено еще одно решение задачи.
Данная работа посвящена изучению возможности обработки статис-тических данных методами корреляционного и  регрессионного анализа 
с использованием пакета прикладных программ MicrosoftExcel
Целью выполнения данного Задания является выявление наличия корреляционной связи между факторным и результативным признаками, установление направления связи, оценка тесноты и силы связи.
Факторный и результативный признаки либо задаются в условии задания, либо определяются путем проведения предварительного теоретического анализа. Лишь после того, как выяснена экономическая сущность явления и определены факторный и результативный признаки, приступают к проведению корреляционного анализа данных.
По условию Задания 2 факторным является признак цена на первичном рынке жилья (X), результативным – признак среднемесячная прибыль (Y).
Применение метода аналитической группировки
При использовании метода аналитической группировки строится интервальный ряд распределения единиц совокупности по факторному признаку Х и для каждой j-ой группы ряда определяется среднегрупповое значение результативного признака Y. Если с ростом значений фактора Х от группы к группе средние значения систематически возрастают (или убывают), между признаками X и Y имеет место корреляционная связь.
Используя разработочную 
таблицу 3, строим аналитическую группировку, 
характеризующую зависимость 
Групповые средние значения получаем из таблицы 3 (графа 4), основываясь на итоговых строках «Всего». Построенную аналитическую группировку представляет табл. 8.
Таблица 8
Зависимость суммы прибыли банков от цены на первичном рынке жилья
Номер группы  | 
  Группы цен  х  | 
  Число организаций, fj  | 
  Среднемесячная прибыль, млн руб.  | |
всего  | 
  в среднем на одну организацию,  | |||
| 
   1  | 
  2  | 
  3  | 
  4  | 
  5=4:3  | 
1  | 
  20,6 – 23,5  | 
  6  | 
  0,45  | 
  0,075  | 
2  | 
  23,5 – 26,4  | 
  9  | 
  1,8  | 
  0,2  | 
3  | 
  26,4 – 29,3  | 
  8  | 
  3,57  | 
  0,45  | 
4  | 
  29,3 – 32,2  | 
  4  | 
  4,5  | 
  1,125  | 
5  | 
  32,2 – 35,2  | 
  3  | 
  3,08  | 
  1,03  | 
Итого  | 
  30  | 
  13,4  | 
  2,88  | |
Вывод. Анализ данных табл. 8 показывает, что с увеличением цены на первичном рынке жилья от группы к группе систематически возрастает и средняя прибыль по каждой группе организация, что свидетельствует о наличии прямой корреляционной связи между исследуемыми признаками.
Измерение тесноты и силы корреляционной связи с использованием коэффициента детерминации и эмпирического корреляционного отношения
Для измерения тесноты и силы связи между факторным и результативным признаками рассчитывают специальные показатели – эмпирический коэффициент детерминации и эмпирическое корреляционное отношение .
Эмпирический коэффициент детерминации оценивает силу связи, определяя, насколько вариация результативного признака Y объясняется вариацией фактора Х (остальная часть вариации Y объясняется вариацией прочих факторов). Показатель рассчитывается как доля межгрупповой дисперсии в общей дисперсии по формуле
, (9)
где – общая дисперсия признака Y,
– межгрупповая (факторная) дисперсия признака Y.
Значения показателя изменяются в пределах . При отсутствии корреляционной связи между признаками Х и Y имеет место равенство =0, а при наличии функциональной связи между ними - равенство =1.
Общая дисперсия характеризует вариацию результативного признака, сложившуюся под влиянием всех действующих на Y факторов (систематических и случайных). Этот показатель вычисляется по формуле
, (10)
где yi – индивидуальные значения результативного признака;
– общая средняя значений результативного признака;
n – число единиц совокупности.
Общая средняя вычисляется как средняя арифметическая простая по всем единицам совокупности:
(11)
или как средняя взвешенная по частоте групп интервального ряда:
Для вычисления удобно использовать формулу (11), т.к. в табл. 8 (графы 3 и 4 итоговой строки) имеются значения числителя и знаменателя формулы.
Расчет по формуле (11):
Для расчета общей дисперсии 
Таблица 12.
Номер банка п/п  | 
  Прибыль, млн руб.  | 
  |||
| 
   1  | 
  2  | 
  3  | 
  4  | 
  5  | 
1  | 
  0,81  | 
  0,36  | 
  0,13  | 
  0,66  | 
2  | 
  0,71  | 
  0,26  | 
  0,068  | 
  0,50  | 
3  | 
  0,42  | 
  -0,03  | 
  0,0009  | 
  0,18  | 
4  | 
  0,70  | 
  0,25  | 
  0,063  | 
  0,49  | 
5  | 
  0,19  | 
  -0,26  | 
  0,068  | 
  0,036  | 
6  | 
  0,43  | 
  -0,02  | 
  0,0004  | 
  0,18  | 
7  | 
  0,40  | 
  -0,05  | 
  0,0025  | 
  0,16  | 
8  | 
  0,42  | 
  -0,03  | 
  0,0009  | 
  0,18  | 
9  | 
  0,27  | 
  -0,18  | 
  0,032  | 
  0,073  | 
10  | 
  0,46  | 
  0,01  | 
  0,0001  | 
  0,21  | 
11  | 
  0,43  | 
  -0,02  | 
  0,0004  | 
  0,18  | 
12  | 
  0,34  | 
  -0,11  | 
  0,012  | 
  0,12  | 
13  | 
  0,32  | 
  -0,13  | 
  0,012  | 
  0,102  | 
14  | 
  0,50  | 
  0,05  | 
  0,0025  | 
  0,25  | 
15  | 
  0,11  | 
  -0,34  | 
  0,116  | 
  0,012  | 
16  | 
  0,55  | 
  0,1  | 
  0,01  | 
  0,303  | 
17  | 
  0,44  | 
  -0,01  | 
  0,0001  | 
  0,19  | 
18  | 
  0,61  | 
  0,16  | 
  0,026  | 
  0,37  | 
19  | 
  0,25  | 
  -0,2  | 
  0,04  | 
  0,063  | 
20  | 
  0,28  | 
  -0,17  | 
  0,029  | 
  0,078  | 
21  | 
  0,36  | 
  -0,09  | 
  0,0081  | 
  0,13  | 
22  | 
  0,70  | 
  0,25  | 
  0,06  | 
  0,49  | 
23  | 
  0,33  | 
  -0,12  | 
  0,0144  | 
  0,11  | 
24  | 
  0,68  | 
  0,23  | 
  0,053  | 
  0,46  | 
25  | 
  0,56  | 
  0,11  | 
  0,012  | 
  0,31  | 
26  | 
  0,47  | 
  0,02  | 
  0,0004  | 
  0,22  | 
27  | 
  0,24  | 
  -0,21  | 
  0,044  | 
  0,06  | 
28  | 
  0,86  | 
  0,41  | 
  0,17  | 
  0,74  | 
29  | 
  0,41  | 
  -0,04  | 
  0,0016  | 
  0,17  | 
30  | 
  0,15  | 
  -0,3  | 
  0,09  | 
  0,023  | 
Итого  | 
  13,4  | 
  -0,1  | 
  1,0673  | 
  7,05  | 
Расчет общей дисперсии по формуле (10):
Общая дисперсия может быть также рассчитана по формуле
где – средняя из квадратов значений результативного признака,
– квадрат средней величины значений результативного признака.
Для демонстрационного примера
Тогда
Межгрупповая дисперсия измеряет систематическую вариацию результативного признака, обусловленную влиянием признака-фактора Х (по которому произведена группировка). Воздействие фактора Х на результативный признак Y проявляется в отклонении групповых средних от общей средней . Показатель вычисляется по формуле
, (13)
где –групповые средние,
– общая средняя,
–число единиц в j-ой группе,
k – число групп.
Для расчета межгрупповой дисперсии строится вспомогательная таблица 13 При этом используются групповые средние значения из табл. 8 (графа 5).
Таблица 13
Вспомогательная таблица для расчета межгрупповой дисперсии
Группы банков по размеру кредитных вложений, млн руб.  | 
  Число банков,  | 
  Среднее значение   | 
  ||
| 
   1  | 
  2  | 
  3  | 
  4  | 
  5  | 
20,6 – 23,5  | 
  6  | 
  0,075  | 
  -0,375  | 
  0,844  | 
23,5 – 26,4  | 
  9  | 
  0,2  | 
  -0,25  | 
  0,563  | 
26,4 – 29,3  | 
  8  | 
  0,45  | 
  0  | 
  0  | 
29,3 – 32,2  | 
  4  | 
  1,125  | 
  0,675  | 
  1,82  | 
32,2 – 35,2  | 
  3  | 
  1,03  | 
  0,58  | 
  1,009  | 
Итого  | 
  30  | 
  4,236  | 
Расчет межгрупповой дисперсии по формуле (11):
Расчет эмпирического коэффициента детерминации по формуле (9):
   
Вывод. 43,8% вариации среднемесячная прибыль организаций обусловлено вариацией ценой на первичном рынке жилья, а 56,2 % – влиянием прочих неучтенных факторов.
Эмпирическое корреляционное отношение оценивает тесноту связи между факторным и результативным признаками и вычисляется по формуле
(14)
Значение показателя изменяются в пределах . Чем ближе значение к 1, тем теснее связь между признаками. Для качественной оценки тесноты связи на основе служит шкала Чэддока (табл. 14):
Таблица 14
Шкала Чэддока
h  | 
  0,1 – 0,3  | 
  0,3 – 0,5  | 
  0,5 – 0,7  | 
  0,7 – 0,9  | 
  0,9 – 0,99  | 
Характеристика силы связи  | 
  Слабая  | 
  Умеренная  | 
  Заметная  | 
  Тесная  | 
  Весьма тесная  | 
Расчет эмпирического корреляционного отношения по формуле (14):
Вывод. Согласно шкале Чэддока связь между объемом кредитных вложений и суммой прибыли банков является тесной.
Оценим статистическую значимость коэффициента детерминации .
Показатели и рассчитаны для выборочной совокупности, т.е. на основе ограниченной информации об изучаемом явлении. Поскольку при формировании выборки на первичные данные могли иметь воздействии какие-либо случайные факторы, то есть основание полагать, что и полученные характеристики связи , несут в себе элемент случайности. Ввиду этого, необходимо проверить, насколько заключение о тесноте и силе связи, сделанное по выборке, будет правомерными и для генеральной совокупности, из которой была произведена выборка.
Проверка выборочных показателей на их не случайность осуществляется в статистике с помощью тестов на статистическую значимость (существенность) показателя. Для проверки значимости коэффициента детерминации служит дисперсионный F-критерий Фишера, который рассчитывается по формуле
где n – число единиц выборочной совокупности,
m – количество групп,
– межгрупповая дисперсия,
– дисперсия j-ой группы (j=1,2,…,m),
– средняя арифметическая групповых дисперсий.
Величина рассчитывается, исходя из правила сложения дисперсий:
где – общая дисперсия.
Для проверки значимости показателя рассчитанное значение F-критерия Fрасч сравнивается с табличным Fтабл для принятого уровня значимости и параметров k1, k2, зависящих от величин n и m : k1=m-1, k2=n-m. Величина Fтабл для значений , k1, k2 определяется по таблице распределения Фишера, где приведены критические (предельно допустимые) величины F-критерия для различных комбинаций значений , k1, k2. Уровень значимости в социально-экономических исследованиях обычно принимается равным 0,05 (что соответствует доверительной вероятности Р=0,95).
Если Fрасч>Fтабл , коэффициент детерминации признается статистически значимым, т.е. практически невероятно, что найденная оценка обусловлена только стечением случайных обстоятельств. В силу этого, выводы о тесноте связи изучаемых признаков, сделанные на основе выборки, можно распространить на всю генеральную совокупность.
Если Fрасч<Fтабл, то показатель считается статистически незначимым и, следовательно, полученные оценки силы связи признаков относятся только к выборке, их нельзя распространить на генеральную совокупность.
Фрагмент таблицы Фишера критических величин F-критерия для значений =0,05; k1=3,4,5; k2=24-35 представлен ниже:
k2  | ||||||||||||
| 
   k1  | 
  24  | 
  25  | 
  26  | 
  27  | 
  28  | 
  29  | 
  30  | 
  31  | 
  32  | 
  33  | 
  34  | 
  35  | 
3  | 
  3,01  | 
  2,99  | 
  2,98  | 
  2,96  | 
  2,95  | 
  2,93  | 
  2,92  | 
  2,91  | 
  2,90  | 
  2,89  | 
  2,88  | 
  2,87  | 
4  | 
  2,78  | 
  2,76  | 
  2,74  | 
  2,73  | 
  2,71  | 
  2,70  | 
  2,69  | 
  2,68  | 
  2,67  | 
  2,66  | 
  2,65  | 
  2,64  | 
5  | 
  2,62  | 
  2,60  | 
  2,59  | 
  2,57  | 
  2,56  | 
  2,55  | 
  2,53  | 
  2,52  | 
  2,51  | 
  2,50  | 
  2,49  | 
  2,48  | 
Информация о работе Взаимосвязанные признаки и графики связи