Статистическая и корреляционная зависимости

Автор работы: Пользователь скрыл имя, 09 Декабря 2013 в 19:12, контрольная работа

Краткое описание

Математическая статистика – наука о математических методах систематизации и использования статистических данных для решения научных и практических задач. Математическая статистика тесно примыкает к теории вероятностей и базируется на ее понятиях. Однако главным в математической статистике является не распределение случайных величин, а анализ статистических данных и выяснение, какому распределению они соответствуют. Большая статистическая совокупность, из которой отбирается часть объектов для исследования, называется генеральной совокупностью, а множество объектов, собранных из нее,– выборочной совокупностью, или выборкой. Статистическое распределение – это совокупность вариант и соответствующих им частот (или относительных частот).

Содержание

Введение
Функциональная, статистическая и корреляционная зависимости.
Корреляционная таблица.
Уравнения прямых регрессий.
Коэффициент линейной корреляции, его свойства.
Метод наименьших квадратов.
Понятие о множественной корреляции.
Приложения в медицине.
Заключение

Прикрепленные файлы: 1 файл

математика1.doc

— 255.00 Кб (Скачать документ)

 

Карагандинский государственный  медицинский университет

Кафедра медицинской  биофизики и информатики

 

 

 

 

 

 

 

 

 

 

 

 

Самостоятельная работа студентов

 

Тема: «Статистическая и корреляционная зависимости»

 

 

По дисциплине

 «Математика»

Для специальности 

5В110300 «Фармация»

Курс

 

 

 

 

 

 

Выполнили:ст.гр.Ф-1-003

Дрыгало О., Савченко Д.

Проверила: Такуадина  А.И.

1

 

 


 

 

 

 

 

 

 

 

 

 

 

Караганда – 2013г.

План:

  1. Введение
  2. Функциональная, статистическая и корреляционная зависимости.
  3. Корреляционная таблица.
  4. Уравнения прямых регрессий.
  5. Коэффициент линейной корреляции, его свойства.
  6. Метод наименьших квадратов.
  7. Понятие о множественной корреляции. 
  8. Приложения в медицине.
  9. Заключение

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  1. Введение

         Математическая статистика –  наука о математических методах систематизации и использования статистических данных для решения научных и практических задач.                  Математическая статистика тесно примыкает к теории вероятностей и базируется на ее понятиях. Однако главным в математической статистике является не распределение случайных величин, а анализ статистических данных и выяснение, какому распределению они соответствуют. Большая статистическая совокупность, из которой отбирается часть объектов для исследования, называется генеральной совокупностью, а множество объектов, собранных из нее,– выборочной совокупностью, или выборкой. Статистическое распределение – это совокупность вариант и соответствующих им частот (или относительных частот).

        Исследователей нередко интересует, как связаны между собой две или большее количество переменных в одной или нескольких изучаемых выборках. Например, такая связь может наблюдаться между погрешностью аппаратной обработки экспериментальных данных и величиной скачков сетевого напряжения. Другим примером может служить связь между пропускной способностью канала передачи данных и соотношением сигнал/шум.

       В  1886 году английский естествоиспытатель  Френсис Гальтон для обозначения  характера подобного рода взаимодействий  ввёл термин «корреляция». Позже его ученик Карл Пирсон разработал математическую формулу, позволяющую дать количественную оценку корреляционным связям признаков.

      В своей  работе мы будем рассматривать  функциональную, статистическую, корреляционную  зависимости, их свойства и  применение в медицине.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2. Функциональная, статистическая и корреляционная  зависимости.

 

По характеру зависимости  признаков различают функциональную (полную) связь и корреляционную (статистическую, неполную) связь. 
 
Функциональная зависимость(жестоко детерминированная у=2х) – величине факторного признака строго соответствует одно или несколько значений результативного признака. 
 
Статистическая– определенному значению факторного признака соответствует лишь среднее значение результативного признака. Стат. Связь не имеет ограничений и условий как в функциональной. Корреляционная связь явл. Частным случаем стат. Связи , состоит в том, что разным значениям одной переменной соответствуют различные средние значения другие.

Рассмотрим эти определения более подробно:

Отличительной особенностью функциональной зависимости двух величин  считается тот факт, что значению одной из них всегда соответствует  одно или несколько точно определённых значений другой величины. Кроме того, функциональная связь двух факторов возможна только при условии, что вторая величина зависит только от первой и не зависит ни от каких других величин. В случае зависимости величины от множества факторов, функциональная связь возможна, если первая величина не зависит ни от каких других факторов, кроме входящих в указанное множество.

В реальных ситуациях  эти условия не выполнимы, поскольку  всегда существует огромное количество свойств самого объекта и окружающей его среды, влияющих друг на друга, что  приводит к невозможности учёта  всех взаимодействий (как качественно, так и количественно), поэтому такого рода связи не существуют. Естественно, функциональная связь является математической абстракцией и находит практическое применение только тогда, когда определённая величина в основном зависит от соответствующих факторов, а остальные связи пренебрежимо слабы.

При статистической зависимости  изменение одной из величин влечёт изменение распределения других величин, которые с определенными  вероятностями принимают некоторые  значения. Функциональную зависимость следует считать частным случаем статистической: значению одного фактора соответствуют значения других факторов с вероятностью, равной единице.

Значительно больший  интерес представляет другой частный  случай статистической зависимости, когда  существует взаимосвязь значений одних случайных величин со средним значением других, при той особенности, что в каждом отдельном случае любая из взаимосвязанных величин может принимать различные значения.

Такого рода зависимость между переменными  величинами называется корреляционной, или корреляцией. Она имеет место не только в природных явлениях и физических процессах, но и в социальной сфере. Этот факт предопределил разносторонний интерес исследователей различных научных кругов к разработке и дальнейшему развитию методов анализа и оценки корреляционных зависимостей.

Корреляционный анализ, как и другие статистические методы, основан на использовании вероятностных  моделей, описывающих поведение  исследуемых признаков в некоторой  генеральной совокупности, из которой получены экспериментальные значения и .

Задача корреляционного  анализа сводится к следующим  более малым задачам:

  • установлению формы (линейная, нелинейная)
  • и направления (положительное или отрицательное) связи между варьирующими признаками,
  • измерению тесноты связи
  • и проверке уровня значимости полученных коэффициентов корреляции.

Корреляция - статистическая взаимосвязь двух или нескольких случайных величин (либо величин, которые  можно с некоторой допустимой степенью точности считать таковыми). При этом изменению значений одной или нескольких из этих величин сопутствует систематическое изменение значений другой или других величин.

Математической мерой  корреляции двух случайных величин  служит линейный коэффициент корреляции (коэффициент корреляции Пирсона).

В общем случае корреляционная связь описывает следующие виды зависимостей:

  • причинную зависимость между значениями параметров. Пример такой зависимости приводился выше: взаимосвязь пропускной способности канала передачи данных и соотношения сигнал/шум (на пропускную способность влияют и другие факторы – характер помех, амплитудно-частотные характеристики канала, способ кодирования сообщений и прочее). Установить однозначную связь между конкретными значениями указанных параметров не удаётся, но очевидно, что пропускная способность зависит от соотношения уровней сигнала и помех в канале. Иногда при этом причину и следствие особо не выделяют. В некоторых случаях такая корреляция является бессмысленной, например: если в качестве исходного фактора взять доходы разработчиков антивирусных программ, а за результат – количество вновь появляющихся вирусов, то можно сделать вывод, что разработчики антивирусов «стимулируют» создание вирусов;
  • «зависимость» между следствиями общей причины. Подобная зависимость характерна, в частности, для скорости и безошибочности набора текста оператором (оба фактора зависят от квалификации оператора).

Корреляционные связи  различаются по форме, направлению  и степени (силе).

        Корреляционная таблица

Простейшим приемом  выявления связи между 2 признаками является построение корреляционной таблицы.

В основу группировки  положено 2 изучаемых во взаимосвязи  признака – Х и У. Частоты fijпоказывают количество соответствующих сочетаний  Х и У. Если fij расположены в  таблице беспорядочно, то можно говорить об отсутствии связи между переменными. В случае образования какого-либо характерного сочетания fij допустимо утверждать о связи между Х и У. При этом если fij концентрируется около одной из двух диагоналей, имеет место прямая или обратная линейная связь. Наглядным изображением корреляционной таблице служит корреляционное поле. Оно представляет собой график, где на оси абсцисс откладывают значения Х, по оси координат – У, а точками показывается сочетание Х и У. По расположению точек, их концентрации в определенном направлении можно судить о наличии связи.

Корреляционное  поле.

Корреляция изучается  на основании экспериментальных  данных, представляющих собой измеренные значения двух признаков . Если экспериментальных данных сравнительно немного, то двумерное эмпирическое распределение представляется в виде двойного ряда значений . При этом корреляционную зависимость между признаками можно описывать разными способами. Соответствие между аргументом и функцией может быть задано таблицей, формулой, графиком и т. д.

Когда исследуется корреляция между количественными признаками, значения которых можно точно  измерить в единицах метрических  шкал, то очень часто принимается  модель двумерной нормально распределенной генеральной совокупности. Такая  модель отображает зависимость между переменными величинами и графически в виде геометрического места точек в системе прямоугольных координат. Эта графическая зависимость называется диаграммой рассеивания или корреляционным полем.

Данная модель двумерного нормального распределения (корреляционное поле) позволяет дать наглядную графическую интерпретацию коэффициента корреляции, т.к. распределение в совокупности зависит от пяти параметров:

  • математических ожиданий величин ;
  • стандартных отклонений случайных величин ;
  • коэффициента корреляции , который является мерой связи между случайными величинами     и .

Примеры корреляционных полей.

Если  , то значения , полученные из двумерной нормальной совокупности, располагаются на графике в пределах области, ограниченной окружностью. В этом случае между случайными величинами x и y отсутствует корреляция, и они называются некоррелированными. Для двумерного нормального распределения некоррелированность означает одновременно и независимость случайных величин x и y.

Если  или , то говорят о полной корреляции, то есть между случайными величинами и существует линейная функциональная зависимость.

При значения определяют точки, лежащие на прямой линии, имеющей положительный наклон (с увеличением значения также увеличиваются).

При прямая имеет отрицательный наклон.

В промежуточных случаях, когда  , определяемые значениями точки попадают в область, ограниченную некоторым эллипсом, причём при имеет место положительная корреляция (с увеличением значения в целом имеют тенденцию к возрастанию), при корреляция отрицательная. Чем ближе к , тем уже эллипс и тем теснее точки, определяемые экспериментальными значениями, группируются около прямой линии.

Здесь же следует обратить внимание на то, что линия, вдоль которой группируются точки, может быть не только прямой, а иметь любую другую форму: парабола, гипербола и т. д. В этих случаях рассматривают нелинейную корреляцию.

Корреляционную зависимость  между признаками можно описывать разными способами, в частности, любая форма связи может быть выражена уравнением общего вида , где признак – зависимая переменная, или функция от независимой переменной , называемой аргументом.

Таким образом, визуальный анализ корреляционного поля помогает определить не только наличие статистической связи (линейной или нелинейной) между исследуемыми признаками, но и ее тесноту и форму.

 
4. Уравнение прямых регрессий.

Регрессия

В общественных науках большинство  функциональных зависимостей носит статистический характер. Одним из эффективных математических методов для определения зависимости по множеству измеренных данных является регрессионный анализ.

Общее назначение множественной  регрессии (термин введен Пирсоном, 1908) состоит в анализе связи между несколькими независимыми переменными (называемыми также регрессорами или предикторами) и зависимой переменной. Исследователь в области образования может узнать, какие факторы являются наиболее «весомыми» для показателей успеваемости в средней школе. Упрощенно, формулировка задачи линейной регрессии состоит в подгонке прямой линии к некоторому набору точек.

Корреляционная  зависимость между случайными величинами Х и У называется линейной корреляцией, если обе функции регрессииf(y) иg(x) являются линейными. В этом случае линии регрессии- прямые и называются прямыми регрессии.

Выведем уравнение прямой регрессии У на Х, т.е. найдем коэффициенты линейной функции g(x) = AX+B.

Введем обозначения  М(Х) =а, М(У) =b, D(X) =s12, D(Y) ==s22, М(ХУ) – М(Х)М(У) =m.

Используем свойства математического ожидания:

М(У) =М(g(x))=M(AX+B) =AM(X) +B, тогдаB= b– Aa.

M(XY) =M(Xg(x)) =M(AX2+BX) =AM(X2) +BM(X)AM(X2) + (b–Aa)a, откуда

Информация о работе Статистическая и корреляционная зависимости