Прикладные системы обработки данных

Автор работы: Пользователь скрыл имя, 22 Мая 2012 в 19:55, контрольная работа

Краткое описание

Линейная регрессия определяет прямую, которая наилучшим образом представляет множество данных. Основываясь на данных продаж за текущий год, линейная регрессия может определить прогнозируемый объем продаж за март следующего года. Линейная регрессия возвращает наклон и у-пересечение (точки, в которой прямая пересекает ось Y) прямой, аппроксимирующей данные продаж. Продолжая эту линию для будущих значений времени и предполагая линейный рост, можно оценить будущие продажи.
Коэффициенты линейной регрессии Y = mX+b и их ошибки вычисляются по довольно сложным формулам. Excel предлагает ряд функций, облегчающих эти расчеты.
Коэффициент m (наклон) линии, описываемой уравнением Y = mX+b может быть получен при помощи статистической функции НАКЛОН.
Коэффициент b, показывающий отрезок, отсекаемый линией Y = mX+b на оси Y, может быть определен с помощью функции ОТРЕЗОК.

Прикрепленные файлы: 1 файл

контрольная.doc

— 679.00 Кб (Скачать документ)


Министерство образования Республики Беларусь

 

Учреждение образования

БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

ИНФОРМАТИКИ И РАДИОЭЛЕКТРОНИКИ

 

 

 

 

 

 

 

 

Контрольная работа по курсу

"ПРИКЛАДНЫЕ СИСТЕМЫ ОБРАБОТКИ ДАННЫХ"

вариант № 073

 

 

 

 

 

 

 

 

 

 

                                                                              Былицкий В.В.

                                                                              Группа №  802-301    

             

                                                                            

 

 

 

 

 

 

 

 

 

 

 

 

 

Минск, 2010

1. Теоретические вопросы

1.1. Microsoft Excel: выполнение линейной регрессии с помощью функций тренда.

 

Линейная регрессия определяет прямую, которая наилучшим образом представляет множество данных. Основываясь на данных продаж за текущий год, линейная регрессия может определить прогнозируемый объем продаж за март следующего года. Линейная регрессия возвращает наклон и у-пересечение (точки, в которой прямая пересекает ось Y) прямой, аппроксимирующей данные продаж. Продолжая эту линию для будущих значений времени и предполагая линейный рост, можно оценить будущие продажи.

Коэффициенты линейной регрессии Y = mX+b и их ошибки вычисляются по довольно сложным формулам. Excel предлагает ряд функций, облегчающих эти расчеты.

Коэффициент m (наклон) линии, описываемой уравнением Y = mX+b может быть получен при помощи статистической функции НАКЛОН.

Коэффициент b, показывающий отрезок, отсекаемый линией Y = mX+b на оси Y, может быть определен с помощью функции ОТРЕЗОК.

Коэффициент корреляции Пирсона R, который отражает степень линейной зависимости между двумя множествами данных, и его квадрат (коэффициент детерминации) может быть получен с помощью функций ПИРСОН и КВПИРСОН.
Если R2 равен 1, то имеет место полная корреляция с линейной моделью, т.е. нет различия между фактическим и оценочным значениями Y. В противоположном случае, если коэффициент равен 0, то уравнение линейной регрессии не применимо для предсказания значений Y.

Синтаксис:
НАКЛОН(известные_значения_y; известные_значения_x)
ОТРЕЗОК (известные_значения_y; известные_значения_x)
КВПИРСОН (известные_значения_y; известные_значения_x)

Наиболее полную статистическую информацию по линейной регрессии выдает функция ЛИНЕЙН. Кроме того, эта функция позволяет обрабатывать данные по линейным функциям нескольких переменных (многофакторный эксперимент). Поскольку функция возвращает не одно значение, а несколько, массив значений, она относится к формулам массива. Ввод этих формул имеет ряд особенностей:

        Начинать ввод следует с выделения массива ячеек, куда будут выводиться данные. Для функции ЛИНЕЙН это прямоугольник N*5, где N - число коэффициентов в уравнении.

        Заканчивать ввод функции следует сочетанием клавиш Ctrl-Shift-Enter (или, удерживая нажатыми клавиши Ctrl-Shift щелкнуть мышкой Ok).

Синтаксис: ЛИНЕЙН(извест_знач_y; извест_знач_x; конст; статистика)
Константа определяет, нужно ли рассчитывать отрезок b, отсекаемый линией на оси OY. Если из теоретических представлений известно, что линия проходит через начало координат и отрезок b, отсекаемый ею на оси OY равен 0, то вводится значение константы ЛОЖЬ (или 0). В противном случае вводится значение ИСТИНА (1), и отрезок b будет вычислен из массива данных.
Еще одно логическое значение Стат указывает, требуется ли вернуть полную статистику по регрессии (ИСТИНА) или нет (ЛОЖЬ) В результате правильного ввода функции в выделенных ячейках получаем таблицу данных (пример в таблице 1):

В ячейке Е7 находится коэффициент m (наклон) линии, в ячейке F7 - коэффициент b (отрезок);
В ячейках E8 и F8 приведены стандартные значения ошибок для коэффициентов m и b. (sm, sb) Стандартные значения ошибок могут быть использованы для оценки значимости коэффициентов регрессии.
В ячейке Е9 - квадрат коэффициента корреляции Пирсона (R2) В ячейке F9 - cтандартная ошибка для оценки Y (sy).
В ячейке Е10 выводится F-статистика, используемая для определения адекватности модели. В ячейке F10 представлено число степеней свободы (f). Число степеней свободы используются для нахождения F-критических значений в статистической таблице. Оно находится по формуле f = n - (k + 1), где k - это число независимых переменных, а n - число точек данных. В нашем случае f = 10 - (1 + 1) = 8
В ячейках Е11 и F11 представлены, соответственно, регрессионная сумма квадратов и остаточная сумма квадратов.

Еще одной возможностью получить параметры линейной зависимости является построение линии тренда. Для этого щелкают правой кнопкой по точке графика и выбирают команду Добавить линию тренда.

На вкладках этой команды выбираем тип тренда (линейный) и его параметры. В частности, отмечаем Выводить уравнение, Выводить коэффициент R^2.

Открыв через контекстное меню точки окно "Параметры рядов данных", на график также можно нанести планки погрешностей, используя значение ошибок в определении величины Y. В качестве величины ошибки может быть использовано значение ДИ рассчитанное для одной из точек или cтандартная ошибка для оценки Y (sy), найденая функцией ЛИНЕЙН.

 

 

 

 

 

 

 

 

 

 

 

1.2 MathCAD: работа с графиками, управление вычислительным процессом. Символьные вычисления.

1.2.1. Работа с графиками

Графические области делятся на три основных типа - двумерные графики, трехмерные графики и импортированные графические образы. Двумерные и трехмерные графики строятся самим MathCAD на основании обработанных данных.

Для создания декартового графика:

1.       Установить визир в пустом месте рабочего документа.

2.       Выбрать команду Вставка  График  Х-У график, или нажать комбинацию клавиш Shift + @, или щелкнуть кнопку панели Графики. Появится шаблон декартового графика.

3.       Ввести в средней метке под осью Х первую независимую переменную, через запятую - вторую и так до 10, например х1, х2, …

4.       Ввести в средней метке слева от вертикальной оси Y первую независимую переменную, через запятую - вторую и т. д., например у1(х1), у2(х2), …, или соответствующие выражения.

5.       Щелкнуть за пределами области графика, что бы начать его построение.

Трехмерные, или 3D-графики, отображают функции двух переменных вида Z(X, Y). При построении трехмерных графиков в ранних версиях MathCAD поверхность нужно было определить математически (Рисунок 2, способ 2). Теперь применяют функцию MathCAD CreateMesh.

Рисунок 2.

CreateMesh(F (или G, или f1, f2, f3), x0, x1, y0, y1, xgrid, ygrid, fmap)

Создает сетку на поверхности, определенной функцией F. x0, x1, y0, y1 - диапазон изменения переменных, xgrid, ygrid - размеры сетки переменных, fmap - функция отображения. Все параметры, за исключением F, - факультативные. Функция CreateMesh по умолчанию создает сетку на поверхности с диапазоном изменения переменных от -5 до 5 и с сеткой 2020 точек.

Пример использования функции CreateMesh для построения 3D-графиков приведен на Рисунке 2, способ 1. На Рисунке 2 построена одна и та же поверхность разными способами, с разным форматированием, причем изображены поверхности и под ними те же поверхности в виде контурного графика. Такое построение способно придать рисунку большую наглядность.

 

Нередко поверхности и пространственные кривые представляют в виде точек, кружочков или иных фигур. Такой график создается операцией Вставка  График  3D Точечный, причем поверхность задается параметрически - с помощью трех матриц (X, Y, Z) (см. Рисунок 3, способ 2), а не одной как в примере на Рисунке 2.

 

Рисунок 3.

 

 

Для определения исходных данных для такого вида графиков используется функция CreateSpace (см. Рисунок 3, способ 1).

CreateSpace (F , t0, t1, tgrid, fmap)

Возвращает вложенный массив трех векторов, представляющих х-, у-, и z-координаты пространственной кривой, определенной функцией F. t0 и t1 - диапазон изменения переменной, tgrid - размер сетки переменной, fmap - функция отображения. Все параметры, за исключением F, - факультативные.

Построение пересекающихся фигур

Особый интерес представляет собой возможность построения на одном графике ряда разных фигур или поверхностей с автоматическим учетом их взаимного пересечения. Для этого надо раздельно задать матрицы соответствующих поверхностей и после вывода шаблона 3D-графика перечислить эти матрицы под ним с использованием в качестве разделителя запятой (Рисунок 4).

 

Рисунок 4.

 

 

1.2.2.Управление вычислительным процессом

Вычисление в пределах экрана (Calculate)

По умолчанию MathCAD работает в режиме автоматических вычислений. Однако иногда бывает удобнее работать в ручном режиме, например, если вычисления объектов при их изменении выполняются заново и долго. Ручной режим вводится операцией Calculate (Вычисления) из главного меню. Для ее выполнения надо нажать кнопку со знаком = в панели инструментов или клавишу F9. Разумеется, режим автоматических вычислений при этом должен быть отключен.

Из рис. 7. 1, иллюстрирующего работу MathCAD в режиме ручных вычислений видно, что вычислений не происходит. В частности, выражение х= не выводит, как в автоматическом режиме, вектор значений х, а в шаблоне графика нет собственно графика.


Рис. 7. 1 Документ в режиме ручных вычислений до ввода операции Calculate

Чтобы начались вычисления, надо выполнить операцию Calculate любым из описанных выше способов. Нетрудно заметить, что теперь выведен вектор значений х и построен график функции.

Если, однако, пролистать документ дальше и перейти к ниже расположенному экрану, то можно обнаружить, что блоки в нем не выполнялись.

Итак, операция Calculate исполняет только те блока, которые видны на текущем экране. Для исполнения последующих блоков надо вновь исполнять операцию Calculate. Другой способ исполнения последующих блоков описан ниже.

Если после подготовки документа с невычисленными блоками нужно исполнить весь документ от начала до конца, то следует использовать операцию Calculate Worksheet (Вычисление документа)

Операция Automatic Calculation (Автоматические вычисления) обеспечивает переключение между ручным и автоматическим режимами вычислений Если против названия этой операции мышью установить "птичку", то будет работать автоматический режим вычислений, в противном случае, когда "птички" нет, — ручной.

Как правило, автоматический режим вычислений намного удобнее ручного, поэтому он установлен по умолчанию

Оптимизация вычислений (Optimization)

Oптимизация вычислений достигается заменой сложной функции или математического выражения их аналитическим представлением.


Пример на оптимизацию вычислений

На рисунке вначале показано вычисление тройного интеграла обычным способом.

Во втором случае использовалась техника оптимизации. Выражение для интеграла, оформленное как функция 1 (n), было выделено, а затем исполнена операция Optimize (Оптимизация), после чего скорость вычислений увеличилась в несколько раз

Признаком оптимизации выражения является появление после него красной звездочки — знака *. Кроме того, установив в оптимизированное выражение курсор мыши и щелкнув ее левой клавишей, можно наблюдать появление окна с оптимизированным выражением; на рис. 7. 5 это окно также показано. Нетрудно заметить, что в нашем примере довольно сложный интеграл оказался замененным достаточно простым аналитическим выражением

Разумеется, вычисление по такому выражению намного проще, чем по полному интегралу. Особенно большой выигрыш оптимизация может дать при многократном вычислении сложных функций, содержащих интегралы, производные, суммы, произведения и ряды. Бывают, впрочем, случаи, когда исходное выражение превращается в не менее сложное оптимизированное выражение. Тогда оптимизация оказывается бесполезной Оптимизацию можно задать в тексте документа специальными словами — директивами, но эта возможность будет рассмотрена позже

Установка опций (Options...)

В позиции Options... (Опции) сосредоточены различные опции вычислительных процессов Если активизировать эту позицию, то на экран будет выведено окно с панельным переключателем


Диалоговое окно установки опций

Это окно имеет следующие панели:

Built-in Variables... — установить значения встроенных (Встроенные переменные) (системных) переменных, Units System (Единицы — вывести подменю с позициями, Dimension (Размерность) — установить размерность величин.

Рассмотрим назначение опций в каждой из этих панелей

Установка значений системных переменных (Built-in Variables...)

В системе MathCAD имеется несколько так называемых системных переменных. У них есть свои имена и значения, присваиваемые системой по умолчанию. Действие системных переменных глобальное, т е. они доступны в любом месте программы и их значения можно изменить также в любом месте программы.

Операция Built-in Variables... (Встроенные переменные) служит для установки значений системных переменных:

TOL [0. 001] — погрешность численных расчетов;

ORIGIN [0] — нижняя граница значения индекса индексации векторов и матриц;

PRNPRECISION [4] - число столбцов для WRITEPRN, PRNCOLWIDTH [8] — число десятичных знаков, используемых для записи числовых данных в WRITEPRN

При применении этой операции появляется окошко со списком указанных переменных (в квадратных скобках указаны их заданные значения) — см. рис. 7. 6

Можно откорректировать значения системных переменных. К назначению двух последних переменных мы вернемся позднее, при описании оператора записи данных на диск WRITEPRN Значения переменных можно вывести, указав после их имени знак =

Опции установки системы единиц

В этом окне можно выбрать одну из следующих систем единиц для размерных величин. SI, MKS, CGS, US и None (не используется ни одна из этих систем).

Информация о работе Прикладные системы обработки данных