Построение и анализ однофакторной регрессионной модели

Автор работы: Пользователь скрыл имя, 28 Марта 2014 в 09:31, курсовая работа

Краткое описание

Целью данной курсовой работы является построение и анализ однофакторной регрессионной модели в среде программирования Delphi.
Поставленная цель определила постановку следующих задач:
 исследовать существующие экономико-математические модели;
 построить регрессионные модели зависимости Y(X) следующих моделей: линейной, степенной, показательной, гиперболической;
 программная реализация компьютерной модели для получения прогноза;
 анализ созданной модели: калибровка параметров модели, проверка корректности модели, оценка чувствительности модели;
 оценка точности прогнозирования на основе построенной модели.

Содержание

Введение
1. Однофакторная регрессионная модель
1.1 Понятие регрессионного уравнения
1.2 Метод наименьших квадратов
1.3 Проверка адекватности регрессионного уравнения
2. Создание программы для построения и анализа однофакторной регрессионной модели в среде программирования Delphi
2.1 Программная реализация построения однофакторной регрессионной модели
2.2 Проверка адекватности однофакторного регрессионного уравнения, отражающего зависимость чистой прибыли от оборотного капитала
Заключение
Список использованных источников и литературы
Приложение А
Приложение В

Прикрепленные файлы: 1 файл

Пример курсовой работы.doc

— 2.07 Мб (Скачать документ)

СОДЕРЖАНИЕ

 

Введение 

3

  1. Однофакторная регрессионная модель 

5

1.1 Понятие регрессионного уравнения

5

1.2 Метод наименьших квадратов

9

1.3 Проверка адекватности регрессионного уравнения 

12

  1. Создание программы для построения и анализа однофакторной регрессионной модели в среде программирования Delphi

13

2.1 Программная реализация построения однофакторной регрессионной модели

13

2.2   Проверка адекватности однофакторного регрессионного уравнения, отражающего зависимость чистой прибыли от оборотного капитала

 

Заключение 

51

Список использованных источников и литературы 

Приложение А

Приложение В

53


 

Введение

Одним из традиционных подходов к исследованию экономических процессов является подход, основанный на использовании эконометрических моделей. Эконометрические модели позволяют решать достаточно широкий круг задач исследования: анализ причинно-следственных связей между экономическими переменными; прогнозирование значений экономических переменных; построение и выбор вариантов (сценариев) экономической политики на основе имитационных экспериментов с моделью. Моделирование и прогнозирование экономических процессов является, несомненно, актуальной проблемой.

Анализ трудов В.Коптюга, В.Кульбы, В.Левашова, В.Матросова, И. Прангишвили, А. Яншина по экономико-математическому моделированию сложных систем показал многообразие подходов и методов исследования и принятия управленческих решений в области устойчивого развития социально-экономических систем.

Методам системного анализа социально-экономических систем и принятию решений посвящены работы С.Айвазяна, П.Андруковича, Э.Бравермана, В.Волковой, Б.Глумеля, Г.Гореловой, А.Денисова, А.Дуброва, М.Кендалла, Э.Короткова, Б.Литвака, В.Лумельского, Ю.Молоткова, А.Орлова, Е.Пустильника, Т.Саати, Р.Фатхутдинова и др.

Управление комплексным развитием социально-экономических систем, отражено в трудах Е.Анимица, М.Боровской, Г.Ветрова, А.Воронина, А.Гапоненко, В.Иванова, Н.Кетовой, Е.Картаевой, Ю.Колесникова, В.Лексина, В.Овчинникова, А.Широкова, С.Юрковой и др.

На сегодняшний день существует много универсальных программ обработки и анализа статистической информации. Благодаря кругу охватываемых задач, они могут быть полезны не только студентам на стадии изучения статистических методов, но и научным работникам, экономистам, решающим задачи анализа и прогноза с использованием статистических данных.

Перечисленные обстоятельства обусловили выбор темы курсовой работы, предопределили ее цель, задачи и структуру.

Целью данной курсовой работы является построение и анализ однофакторной регрессионной модели в среде программирования Delphi.

Поставленная цель определила постановку следующих задач:

  • исследовать существующие экономико-математические модели;
  • построить регрессионные модели зависимости Y(X) следующих моделей: линейной, степенной, показательной, гиперболической;
  • программная реализация компьютерной модели для получения прогноза;
  • анализ созданной модели: калибровка параметров модели, проверка корректности модели, оценка чувствительности модели;
  • оценка точности прогнозирования на основе построенной модели.

При построении, проверки адекватности, вычислении прогнозов вышеперечисленных моделей производится много вычислений. Эти вычисления обычно производят в таких программах как: «Microsoft  Excel», «Statistica» , «SPSS», «Stadia» и др. В данной курсовой работе построение и анализ моделей будут проводиться в среде программирования Delphi.

Для решения поставленных задач использовались методы теории вероятностей и математической статистики: теория проверки гипотез, теория случайных процессов, корреляционный анализ, регрессионный анализ и методы теории оценивания. Разработанная модель основана на методах имитационного моделирования, в частности, агентного и дискретно-событийного моделирования, ее реализация - на принципах объектно-ориентированного программирования.

 

1. Однофакторная регрессионная модель

1.1 Понятие регрессионного уравнения

Регрессионное уравнение модели отражает зависимость между экономическими переменными, а именно между одной зависимой и одной или более независимыми переменными. Зависимая переменная обозначается через у, независимая - через х.

Регрессионное уравнение, которое отражает зависимость между математическим ожиданием (условным распределением) одной переменной и соответствующим значениям другой называется однофакторным регрессионным уравнением (ОРУ). В общем виде ОРУ:

М(у/х) = f(x),

где левая часть М(у/х) - условное математическое ожидание переменной у при заданном значении переменной  х.

В частном случае ОРУ является линейная модель зависимости:

y=a+bх + e i

где y - зависимая (объясняемая) переменная;

x - независимая (объясняющая) переменная;

a - свободный член регрессии;

b - коэффициент регрессии; отражает наклон линии вдоль которой рассеяны данные наблюдений по модели, также показатель, характеризующий процентное изменение переменной у, которое вызвано изменением переменной х на единицу;

ei - ошибка, или так называемая случайная компонента. Для статистической проверки взаимозависимости между у и  х необходимо найти значения а, b. Для нахождения параметров регрессионного уравнения используется метод наименьших квадратов (МНК), который дает наилучшие, линейные, несмещенные оценки.1

Уравнение регрессии: y = a + bxi где y - теоретическо-расчетные значения зависимой переменной; a и b - оценочные значения коэффициентов a и b.

Расчет остаточной дисперсии производится по формуле:

.       (1)

Чем меньше величина остаточной дисперсии, тем меньше влияние не учитываемых в уравнении регрессии факторов и тем лучше уравнение регрессии подходит к исходным данным. Параметр b называется коэффициентом регрессии.

Уравнение регрессии всегда дополняется показателем тесноты связи. При использовании линейной регрессии в качестве такого показателя выступает линейный коэффициент корреляции , который можно рассчитать по следующим формулам:

.         (2)

Линейный коэффициент корреляции находится в пределах: . Чем ближе абсолютное значение к единице, тем сильнее линейная связь между факторами.

Для оценки качества подбора линейной функции рассчитывается квадрат линейного коэффициента корреляции , называемый коэффициентом детерминации. Коэффициент детерминации характеризует долю дисперсии результативного признака y, объясняемую регрессией, в общей дисперсии результативного признака:

,           (3)

где , .

Соответственно величина характеризует долю дисперсии , вызванную влиянием остальных, не учтенных в модели, факторов.

После нахождения уравнения линейной регрессии, проводится оценка значимости как уравнения в целом, так и отдельных его параметров.

Чтобы иметь общее суждение о качестве модели из относительных отклонений по каждому наблюдению, определяют среднюю ошибку аппроксимации:

.         (4)

Средняя ошибка аппроксимации не должна превышать 8-10%.

Оценка значимости уравнения регрессии в целом производится на основе F- критерия Фишера, которому предшествует дисперсионный анализ. Согласно основной идее дисперсионного анализа, общая сумма квадратов отклонений переменной y от среднего значения раскладывается на две части - «объясненную» и «необъясненную»:

,    (5)

где - общая сумма квадратов отклонений; - сумма квадратов отклонений, объясненная регрессией (или факторная сумма квадратов отклонений); - остаточная сумма квадратов отклонений, характеризующая влияние неучтенных в модели факторов.

Определение дисперсии на одну степень свободы приводит дисперсии к сравнимому виду. Сопоставляя факторную и остаточную дисперсии в расчете на одну степень свободы, получим величину F - критерия Фишера:

.            (6)

Фактическое значение F - критерия Фишера (6) сравнивается с табличным значением при уровне значимости и степенях свободы и . При этом, если фактическое значение F-критерия больше табличного, то признается статистическая значимость уравнения в целом.

Для парной линейной регрессии m=1, поэтому

  .     (7)

Величина F - критерия связана с коэффициентом детерминации , и ее можно рассчитать по следующей формуле:

.           (8)

В парной линейной регрессии оценивается значимость не только уравнения в целом, но и отдельных его параметров. С этой целью по каждому из параметров определяется его стандартная ошибка: и .

Стандартная ошибка коэффициента регрессии определяется по формуле:

,      (9)

где - остаточная дисперсия на одну степень свободы.

Величина стандартной ошибки совместно с -распределением Стьюдента при n-1 степенях свободы применяется для проверки существенности коэффициента регрессии и для расчета его доверительного интервала.

Для оценки существенности коэффициента регрессии его величина сравнивается с его стандартной ошибкой, т.е. определяется фактическое значение -критерия Стьюдента: которое затем сравнивается с табличным значением при определенном уровне значимости и числе степеней свободы . Доверительный интервал для коэффициента регрессии определяется как .

Стандартная ошибка параметра определяется по формуле:

.    (10)

Процедура оценивания существенности данного параметра не отличается от рассмотренной выше для коэффициента регрессии. Вычисляется -критерий: , его величина сравнивается с табличным значением при n-2 степенях свободы.

Значимость линейного коэффициента корреляции проверяется на основе величины ошибки коэффициента корреляции :

.         (11)

 

1.2 Метод наименьших квадратов

Если некоторая физическая величина зависит от другой величины, то эту зависимость можно исследовать, измеряя y при различных значениях x. В результате измерений получается ряд значений:

x1, x2, ..., xi, , ... , xn;

y1, y2, ..., yi, , ... , yn.

По данным такого эксперимента можно построить график зависимости y = ƒ(x). Полученная кривая дает возможность судить о виде функции ƒ(x). Однако постоянные коэффициенты, которые входят в эту функцию, остаются неизвестными. Определить их позволяет метод наименьших квадратов. Экспериментальные точки, как правило, не ложатся точно на кривую. Метод наименьших квадратов требует, чтобы сумма квадратов отклонений экспериментальных точек от кривой, т.е. [yi - ƒ(xi)]2 была наименьшей.

На практике этот метод наиболее часто используется в случае линейной зависимости, т.е. когда

y = kx    или  y = a + bx.

Линейная зависимость очень широко распространена в физике. И даже когда зависимость нелинейная, обычно стараются строить график так, чтобы получить прямую линию. Например, если предполагают, что показатель преломления стекла n связан с длиной λ световой волны соотношением n=a + b/λ2, то на графике строят зависимость n от λ-2.

Рассмотрим зависимость y = kx (прямая, проходящая через начало координат). Составим величину φ - сумму квадратов отклонений наших точек от прямой

.       (12)

Величина φ всегда положительна и оказывается тем меньше, чем ближе к прямой лежат наши точки. Метод наименьших квадратов утверждает, что для k следует выбирать такое значение, при котором φ имеет минимум

 
или 
   (13)

Вычисление показывает, что среднеквадратичная ошибка определения величины k равна при этом

,   (14) 
где - n число измерений.

Рассмотрим теперь несколько более трудный случай, когда точки должны удовлетворить формуле y = a + bx (прямая, не проходящая через начало координат).

Задача состоит в том, чтобы по имеющемуся набору значений xi, yi найти наилучшие значения a и b.

Снова составим квадратичную форму φ , равную сумме квадратов отклонений точек xi, yi от прямой

и найдем значения a и b , при которых φ имеет минимум

 ;

 

Совместное решение этих уравнений дает

  (15)

.  (16)

Среднеквадратичные ошибки определения a и b равны

  (17)

.  (18)

При обработке результатов измерения этим методом удобно все данные сводить в таблицу, в которой предварительно подсчитываются все суммы, входящие в формулы (13)-(18). 

 

1.3 Проверка адекватности уравнения

Корреляционное отношение служит только оценкой тесноты

корреляционной зависимости и никак не связано с ее формой. Проверка того, хорошо ли согласуется подобранная теоретическая линия регрессии с экспериментальными данными, называется проверкой адекватности уравнения регрессии.

Уравнение регрессии считается адекватным, если расхождение между эмпирической и теоретической линиями регрессии можно объяснить ошибками в определении условных средних, вызванных разбросом (дисперсией) случайных результатов эксперимента.

Для проверки адекватности условия используется критерий Фишера:                                           

    (19)

где      - остаточная дисперсия;         

 - число коэффициентов в уравнении регрессии;         

 - ордината линии регрессии в точке xi;         

- дисперсия воспроизводимости средних, равная исправленной внутренней дисперсии, деленной на число экспериментов m, по которым вычислялись условные средние  :                 

Информация о работе Построение и анализ однофакторной регрессионной модели