Построение графика зависимости признаков по теоретическим частота
Курсовая работа, 11 Октября 2012, автор: пользователь скрыл имя
Краткое описание
В современном обществе важную роль в механизме управления экономикой выполняет статистика. Она осуществляет сбор, научную обработку, обобщение и анализ информации, характеризующей развитие экономики страны, культуры и уровня жизни населения.
Содержание
ВВЕДЕНИЕ______________________________________________________
1. Виды и способы наблюдения_____________________________________
2. Построение вариационных рядов распределения____________________
3. Анализ вариационных рядов распределения________________________
4. Построение рядов распределения____________________________________
4.1 Определение количественных характеристик распределения (показателей асимметрии и эксцесса)____________________________________
4.2 Нахождение эмпирической функции, построение ее графика____
4.3 Определение теоретических частот по закону нормального распределения. Построение графиков._______________________________
4.4 Проверка гипотезы о подчинение изучаемых признаков нормальному закону распределения_________________________________
5. Оценка параметров генеральной совокупности на основе выборочных данных__________________________________________________________
6. Корреляционно-регрессионный анализ_____________________________
6.1. Отбор факторов в регрессионную модель____________________
6.2. Расчет парного коэффициента корреляции. Анализ зависимости между переменными____________________________________________________
6.3. Построение уравнения однофакторной регрессии с использованием метода наименьших квадратов_______________________
6.4 Проверка значимости коэффициентов регрессии и коэффициента корреляции______________________________________________________
6.5. Построение графика зависимости признаков по теоретическим частотам________________________________________________________
ЗАКЛЮЧЕНИЕ__________________________________________________
Прикрепленные файлы: 1 файл
основная часть.doc
— 562.00 Кб (Скачать документ)Относительное линейное отклонение для выборки по объему кредитных вложений равно:
Коэффициент вариации характеризует однородность совокупности. Совокупность считается однородной, если коэффициент вариации меньше либо равен 33%, иначе признается неоднородной. Коэффициент вариации определяется по формуле:
Тогда, коэффициент вариации для выборки по объему кредитных вложений равен:
Коэффициент вариации для выборки по объему кредитных вложений больше, чем 33% (равен 59,1 %), следовательно, совокупность неоднородна, а это означает, что среднее значение признака не является центром распределения.
4. Построение рядов распределения.
4.1 Определение количественных характеристик распределения (показателей асимметрии и эксцесса).
При анализе данных важно представить не только размер вариации, но и то, как распределены единицы совокупности по всему диапазону значений признака.
Показатели асимметрии и эксцесса используются для количественной оценки симметричности.
Для расчета показателя асимметрии используют формулу:
где M3 – центральный момент третьего порядка;
σ – среднее квадратическое отклонение.
В свою очередь центральный момент третьего порядка рассчитывается по формуле:
Для того, чтобы определить, является ли асимметрия существенной или не существенной, рассчитывается отклонение показателя асимметрии к среднеквадратическому отклонению. Для этого используют соотношение: , где As – показатель асимметрии; - средняя квадратическая ошибка отклонения асимметрии, которая рассчитывается по формуле:
где n – число единиц в совокупности.
Данное соотношение меньше 3, из этого следует, что асимметрия признается несущественной.
В симметричных распределениях или распределениях с несущественной асимметрией рассчитывается показатель эксцесса. Расчет производится по следующей формуле:
где M4 – центральный момент четвертого порядка;
σ – среднее квадратическое отклонение.
Момент четвертого порядка рассчитывается как:
Показатель эксцесса меньше 0, из этого следует что распределение плосковершинное.
4.2 Нахождение эмпирической функции, построение ее графика.
Построим графики
4.3 Определение теоретических частот по закону нормального распределения. Построение графиков.
Для удобства вычислений
вероятностей случайные величины нормируются,
а затем по специальным таблицам
находится плотность распределе
где t – нормируемое отклонение.
Теоретические частоты находятся по формуле:
где f – эмпирические частоты;
k – величина интервала.
Определим теоретические частоты для выборки банков по объему кредитных вложений.
Таблица 5 – Расчет теоретических частот по объему кредитных вложений.
№ п/п |
Группы банков по объему кредитных вложений, млн. руб. |
Число банков, fi |
Середина интервала, xi’ |
|
|
Теоретические частоты, |
|
1 |
34-100 |
10 |
67 |
-1,02 |
0,2371 |
5 |
2 |
101-167 |
7 |
134 |
-0,34 |
0,3765 |
8 |
3 |
168-234 |
6 |
201 |
0,34 |
0,3765 |
8 |
4 |
235-301 |
4 |
268 |
1,02 |
0,2371 |
5 |
5 |
302-368 |
1 |
335 |
1,69 |
0,0957 |
2 |
6 |
369-435 |
2 |
402 |
2,37 |
0,0241 |
0 |
Итого |
- |
30 |
- |
- |
- |
28 |
По найденным теоретическим частотам построим график теоретического распределения банков по объему кредитных вложений.
При совмещении графиков теоретического и эмпирического распределения получится следующее:
4.4 Проверка гипотезы о подчинение изучаемых признаков нормальному закону распределения.
Так как все предположения о характере распределения лишь гипотезы, а не категорические утверждения, то они должны быть подвергнуты статистической проверке с помощью одного из критериев согласия. Критерии согласия, опираясь на установленный закон распределения, дают возможность установить, когда расхождение между частотами эмпирического и теоретического распределений следует признать несущественными, то есть случайными, а когда существенными (в тех случаях, когда неверно выдвинута гипотеза о законе распределения).
Для проверки гипотезы о подчинении изучаемых признаков нормальному закону распределения воспользуемся критерием Романовского, который рассчитывается по формуле:
где h – число групп;
l – число независимых параметров, которые необходимо знать, чтобы построить кривую теоретического распределения.
В свою очередь рассчитывается по формуле:
где fi – эмпирические частоты распределения;
fi' – теоретические частоты распределения.
Таблица 6 – Расчет значения критерия Пирсона для распределения по объему кредитных вложений.
№ п/п |
Группы банков по объему кредитных вложений, млн. руб. |
Эмпирические частоты, fi |
Теоретические частоты, |
|
|
|
1 |
34-100 |
10 |
5 |
25 |
5 |
2 |
101-167 |
7 |
8 |
1 |
0,125 |
3 |
168-234 |
6 |
8 |
4 |
0,5 |
4 |
235-301 |
4 |
5 |
1 |
0,2 |
5 |
302-368 |
1 |
2 |
1 |
0,5 |
6 |
369-435 |
2 |
0 |
4 |
0 |
Итого |
- |
30 |
28 |
- |
6,325 |
Рассчитаем значение критерия Романовского для распределения по объему кредитных вложений:
Так как критерий Романовского меньше 3 (равен 1,357), то гипотеза о распределении банков в зависимости от объемов кредитных вложений по закону нормального распределения принимается.
5. Оценка параметров генеральной совокупности на основе выборочных данных.
Расхождение между генеральной и выборочной совокупностями измеряется средней ошибкой выборки, которая рассчитывается следующим образом:
где n – число единиц в выборочной совокупности;
N – число единиц в генеральной совокупности.
Среднюю ошибку необходимо знать для того, чтобы определить возможные пределы для средней генеральной совокупности
Суждение о том, что
средняя в генеральной
где t – коэффициент доверия, определяемый в зависимости от вероятности по таблицам.
Таким образом, показатели генеральной совокупности для генеральной средней при заданной вероятности определяются по показателям выборочной совокупности следующим образом:
Рассчитаем среднюю ошибку для выборки по объему кредитных вложений:
Найдем предельную ошибку для выборки по кредитным вложениям, принимая вероятность равной 0,95. По таблице находим коэффициент доверия t, равный 1,96.
Таким образом, границы, в которых с вероятностью 0,95 будет находиться среднее значение показателя объемов кредитных вложений, принимают вид:
6. Корреляционно-регрессионный анализ.
6.1. Отбор факторов в регрессионную модель.
Примем в качестве факторного признака объемы кредитных вложений, а в качестве результативного – прибыль. Данный выбор обусловлен спецификой банковской деятельности, где прибыль, в том числе, складывается и из процентов, за выданные кредиты.
6.2. Расчет парного коэффициента корреляции. Анализ зависимости между переменными.
Парный коэффициент корреляции можно вычислить по следующей формуле:
где n – число единиц в выборочной совокупности;
xi – значение факторного признака;
yi – значение результативного признака.
Таблица 7 – Расчет парного коэффициента корреляции для выборочной совокупности.
№ п/п |
Название банка |
Кредитные вложения, млн. руб. xi |
Прибыль, млн. руб. yi |
xi2 |
yi2 |
xi·yi |
|
1 |
Нефтехимбанк |
252 |
38 |
63504 |
1444 |
9576 |
2 |
Ланта-банк |
201 |
3 |
40401 |
9 |
603 |
3 |
Совфинтрейд |
276 |
33 |
76176 |
1089 |
9108 |
4 |
Еврофинанс |
431 |
-2 |
185761 |
4 |
-862 |
5 |
Уралпромстробанк |
73 |
25 |
5329 |
625 |
1825 |
6 |
МАПО-Банк |
192 |
47 |
36864 |
2209 |
9024 |
7 |
Тори-Банк |
51 |
15 |
2601 |
225 |
765 |
8 |
Петровский |
368 |
9 |
135424 |
81 |
3312 |
9 |
Нефтепромбанк |
156 |
31 |
24336 |
961 |
4836 |
10 |
Оргбанк |
253 |
8 |
64009 |
64 |
2024 |
11 |
Евразия-Центр |
68 |
17 |
4624 |
289 |
1156 |
12 |
Гарантия |
80 |
18 |
6400 |
324 |
1440 |
13 |
Промрадтехбанк |
71 |
50 |
5041 |
2500 |
3550 |
14 |
Металлинвестбанк |
207 |
29 |
42849 |
841 |
6003 |
15 |
Прио-Внешторг-банк |
103 |
30 |
10609 |
900 |
3090 |
16 |
Камчаткомагропром-банк |
66 |
92 |
4356 |
8464 |
6072 |
17 |
Тайдон |
249 |
36 |
62001 |
1296 |
8964 |
18 |
Роспромстройбанк |
122 |
43 |
14884 |
1849 |
5246 |
19 |
Тагилбанк |
108 |
-9 |
11664 |
81 |
-972 |
20 |
Подольск-промкомбанк |
70 |
55 |
4900 |
3025 |
3850 |
21 |
Мосстройбанк |
64 |
0,5 |
4096 |
0,25 |
32 |
22 |
Волгопромбанк |
183 |
7 |
33489 |
49 |
1281 |
23 |
Нижний Новгород |
34 |
6 |
1156 |
36 |
204 |
24 |
Ставрополье |
185 |
28 |
34225 |
784 |
5180 |
25 |
Колыма-банк |
110 |
20 |
12100 |
400 |
2200 |
26 |
Экопромбанк |
119 |
1 |
14161 |
1 |
119 |
27 |
Преображение |
198 |
11 |
39204 |
121 |
2178 |
28 |
Краснодарбанк |
394 |
15 |
155236 |
225 |
5910 |
29 |
МЕНАТЕП Санкт-Петербург |
128 |
14 |
16384 |
196 |
1792 |
30 |
Ноябрьск-нефте-комбанк |
49 |
22 |
2401 |
484 |
1078 |
Итого |
4861 |
692,5 |
1114185 |
28576,25 |
98584 |
Таким образом, парный коэффициент корреляции будет равен:
Парный коэффициент корреляции, равный -0,21247, показывает, что связь между факторным признаком, т.е. объемом кредитных вложений, и результативным, т.е. прибылью, обратная (так как коэффициент имеет отрицательное значение), и практически отсутствует (что определилось по шкале количественных характеристик тесноты связи Чеддока – 0,1-03 – слабая корреляционная связь).
6.3. Построение уравнения однофакторной регрессии с использованием метода наименьших квадратов.
Определим вид зависимости
между объемом кредитных
По графику можно предположить, что зависимость прибыли от объема кредитных вложений все больше приближается к уравнению прямой. Следовательно, сумма квадратов отклонений эмпирических точек от теоретических принимает вид:
В этом случае коэффициенты
уравнения регрессии
Рассчитаем данные коэффициенты:
Таким образом, уравнение регрессии принимает вид:
6.4 Проверка значимости коэффициентов регрессии и коэффициента корреляции.
Поскольку анализ взаимосвязей между явлениями проводят в выборочной совокупности, а данные необходимо обобщить на всю генеральную совокупность, то необходимо проверить коэффициенты уравнения регрессии на статистическую значимость.
При объеме выборки меньше или равном 30 единицам значимость коэффициентов уравнения регрессии определяют с помощью t-критерия Стьюдента, который находится по формуле (для коэффициента a):
где a – коэффициент уравнения регрессии;
n – число единиц совокупности;
- остаточное среднее квадратическое отклонение, которое отображает вариацию результативного признака (y) от всех прочих, кроме факторного признака (x), которое находится по формуле:
где yi – эмпирические значения результативного признака;
- теоретические значения
n – число единиц в совокупности.
Проверка значимости для коэффициента b осуществляется по формуле: