Проверка статистических гипотез

Автор работы: Пользователь скрыл имя, 17 Марта 2014 в 19:45, контрольная работа

Краткое описание

Данная работа создается с целью ознакомления с основными понятиями и методами математической статистики как средства решения задач физического, химического, биологического и иного характера, встречающихся как в процессе изучения профильных дисциплин, так и в дальнейшей профессиональной деятельности.
В тексте этой работы будут описаны основных понятия статистической проверки гипотез и произойдет закрепление их практически.

Содержание

Введение
Понятия статистической гипотезы, нулевой и конкурирующей гипотез
Понятие статистического критерия. Наблюдаемое значение критерия
Критическая область, область принятия гипотезы. Критические точки. Основной принцип проверки нулевой гипотезы. Право-, лево- и двухсторонняя критическая область
Понятие уровня значимости. Нахождение критических точек
Проверка гипотезы о равенстве дисперсий двух нормальных генеральных совокупностей (критерий Фишера-Снедекора)
Проверка гипотезы о равенстве математических ожиданий двух генеральных нормальных совокупностей в случае, когда дисперсии неизвестны и одинаковы (t-критерий, z-критерий)
Проверка гипотезы о законах распределения (критерий Пирсона)
Практическое решение задач
Заключение
Список литературы

Прикрепленные файлы: 1 файл

SAMOSTOYaTEL_NAYa_PO_MATEMATIKE.docx

— 162.57 Кб (Скачать документ)

 

 


ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ 
ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ 
«КУРСКИЙ ГОСУДАРСТВЕННЫЙ МЕДИЦИНСКИЙ УНИВЕРСИТЕТ» МИНИСТЕРСТВА ЗДРАВООХРАНЕНИЯ 
РОССИЙСКОЙ ФЕДЕРАЦИИ

(ГБОУ ВПО КГМУ)

 

 

Зав. кафедрой физики,

информатики и математики,

доцент Снегирева Л. В.

 

 

Самостоятельная работа по математике №1

Тема: «Проверка статистических гипотез».

 

Выполнила:

студентка лечебного

факультета, 1 курса, 19 группы

Середенко Софья Михайловна.

Проверила:

Тарасова С.А.

 

 

 

Курск 2014

 

 

План

  1. Введение
  2. Понятия статистической гипотезы, нулевой и конкурирующей гипотез
  3. Понятие статистического критерия. Наблюдаемое значение критерия
  4. Критическая область, область принятия гипотезы. Критические точки. Основной принцип проверки нулевой гипотезы. Право-, лево- и двухсторонняя критическая область
  5. Понятие уровня значимости. Нахождение критических точек
  6. Проверка гипотезы о равенстве дисперсий двух нормальных генеральных совокупностей (критерий Фишера-Снедекора)
  7. Проверка гипотезы о равенстве математических ожиданий двух генеральных нормальных совокупностей в случае, когда дисперсии неизвестны и одинаковы (t-критерий, z-критерий)
  8. Проверка гипотезы о законах распределения (критерий Пирсона)
  9. Практическое решение задач
  10. Заключение
  11. Список литературы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Введение

Данная работа создается с целью ознакомления с основными понятиями и методами математической статистики как средства решения задач физического, химического, биологического и иного характера, встречающихся как в процессе изучения профильных дисциплин, так и в дальнейшей профессиональной деятельности.

В тексте этой работы будут описаны основных понятия статистической проверки гипотез и произойдет закрепление их практически.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


 

 

 

Понятия статистической гипотезы, нулевой и конкурирующей гипотез


Статистической гипотезой называется любое предположение о виде неизвестного закона распределения или о параметрах известных распределений. Предположим, что на основании имеющихся данных есть основания выдвинуть предположения о законе распределения или о параметре закона распределения случайной величины (или генеральной совокупности, на множестве объектов которой определена эта случайная величина). Задача проверки статистической гипотезы заключается в подтверждении или опровержении этого предположения на основании выборочных (экспериментальных) данных.

Статистическая гипотеза называется простой, если она однозначно определяет распределение случайной величины  , в противном случае гипотеза называется сложной. Например, простой гипотезой является предположение о том, что случайная величина   распределена по нормальному закону с математическим ожиданием, равным нулю, и дисперсией, равной единице. Если высказывается предположение, что случайная величина   имеет нормальное распределение с дисперсией, равной единице, а математическое ожидание — число из отрезка  , то это сложная гипотеза. Другим примером сложной гипотезы является предположение о том, что непрерывная случайная величина   с вероятностью   принимает значение из интервала  , в этом случае распределение случайной величины   может быть любым из класса непрерывных распределений.

Проверка статистической гипотезы означает проверку соответствия выборочных данных выдвинутой гипотезе. Параллельно с выдвигаемой основной гипотезой, рассматривают и противоречащую ей гипотезу, которая называется конкурирующей или альтернативной. Альтернативная гипотеза считается справедливой, если основная выдвинутая гипотеза отвергается.

Нулевой, основной или проверяемой гипотезой называется первоначально выдвинутая гипотеза, которая обозначается Н0.

Конкурирующей или альтернативной гипотезой называется гипотеза, которая противоречит основной гипотезе Н0 и обозначается Н1.

Например, основная гипотеза Н0 состоит в том, что математическое ожидание μ равно какому-то значению μ0. В этом случае конкурирующая гипотеза Н1 может состоять в предположении, что математическое ожидание μ не равно (больше или меньше) значения μ0:

Н0: μ=μ0; Н1: μ≠μ0, или Н1: μ>μ0, Н1: μ<μ0.

 

Понятие статистического критерия. Наблюдаемое значение критерия

Статистическим критерием называется случайная величина, которая используется с целью проверки нулевой гипотезы. Статистические критерии называются соответственно по тому закону распределения, которому они подчиняются, т. е. F-критерий подчиняется распределению Фишера-Снедекора, χ2-критерий подчиняется χ2-распределению, Т-критерий подчиняется распределению Стьюдента, U-критерий подчиняется нормальному распределению.

Статистические критерии подразделяются на следующие категории:

  1. Критерии значимости. Проверка на значимость предполагает проверку гипотезы о численных значениях известного закона распределения:   — нулевая гипотеза.  или   — конкурирующая гипотеза.
  2. Критерии согласия. Проверка на согласие подразумевает проверку предположения о том, что исследуемая случайная величина подчиняется предполагаемому закону. Критерии согласия можно также воспринимать, как критерии значимости. Критериями согласия являются:
  • Критерий Пирсона
  • Критерий Колмогорова
  • Критерий Андерсона-Дарлинга
  • Критерий Крамера — Мизеса — Смирнова
  • Критерий согласия Купера
  • Z-тест
  • Критерий Жака-Бера 
  • Критерий Шапиро-Уилка
  • График нормальности — не столько критерий, сколько графическая иллюстрация: точки специально построенного графика должны лежать почти на одной прямой.
  1. Критерии проверки на однородность. При проверке на однородность случайные величины исследуются на факт значимости различия их законов распределения (т.е. проверки того, подчиняются ли эти величины одному и тому же закону). Используются в факторном анализе для определения наличия зависимостей.

Это разделение условно, и зачастую один и тот же критерий может быть использован в разных качествах.


Пример: Пусть дана независимая выборка  , где  . Пусть есть две простые гипотезы:

Тогда можно определить следующий статистический критерий:

где   - выборочное среднее.


Статистические критерии проверки гипотез разнообразны, но у них единая логическая схема построения, которую представим на рис. 1



Наблюдаемым значением статистического критерия называется значение критерия, которое рассчитано по выборочной совокупности, подчиняющейся определённому закону распределения.


 

 

 

 

 

 

 

 

 

 

Критическая область, область принятия гипотезы. Критические точки. Основной принцип проверки нулевой гипотезы. Право-, лево- и двухсторонняя критическая область

Критической областью называется множество возможных значений статистического критерия, при которых основная гипотеза отвергается. 

Положение критической области на множестве значений статистики   зависит от формулировки альтернативной гипотезы  . Например, если проверяется гипотеза  , а альтернативная гипотеза формулируется как  , то критическая область размещается на правом (левом) "хвосте" распределения статистики  , т. е. имеет вид неравенства  , где   — значения статистики  , которые принимаются с вероятностями соответственно   и   при условии, что верна гипотеза  . В этом случае критерий называется односторонним (соответственно правосторонним и левосторонним). Если альтернативная гипотеза формулируется как  , то критическая область размещается на обоих "хвостах" распределения  , то есть определяется совокупностью неравенств   и   в этом случае критерий называется двухсторонним.

Расположение критической области   для различных альтернативных гипотез показано на рис. 2, где   — плотность распределения статистики   критерия при условии, что верна гипотеза  ,   — область принятия гипотезы,  .

Принципы проверки нулевой гипотезы:

  1. Сравнение двух дисперсий нормальных генеральных совокупностей. При заданном уровне значимости   проверяется нулевая гипотеза, состоящая в том, что генеральные дисперсии рассматриваемых совокупностей равны между собой: 

В качестве критерия проверки нулевой гипотезы принимают случайную величину отношения большей исправленной дисперсии к меньшей 

Величина   имеет распределение Фишера-Снедекора, которое зависит только от чисел степеней свободы   и  . 

  1. Сравнение двух средних нормальных генеральных совокупностей с известными дисперсиями. Проверяется нулевая гипотеза о равенстве генеральных средних рассматриваемых совокупностей с заданными или вычисляемыми дисперсиями. В качестве критерия проверки нулевой гипотезы примем случайную величину

  1. Сравнение выборочной средней с гипотетической генеральной средней нормальной совокупности. По выборочной средней при заданном уровне значимости проверяется нулевая гипотеза   о равенстве генеральной средней   гипотетическому значению  . В качестве проверки нулевой гипотезы примем случайную величину

которая распределена нормально.

  1. Сравнение наблюдаемой относительной частоты с гипотетической вероятностью появления события. При заданном уровне значимости   проверяется нулевая гипотеза, состоящая в том, что неизвестная вероятность   появления события равна гипотетической вероятности   серии повторных независимых испытаний.

В качестве критерия проверки нулевой гипотезы принимаем случайную величину

 

 

 

 

 

 

 

Понятие уровня значимости. Нахождение критических точек

Уровнем значимости а называется вероятность совершения ошибки первого рода.

Значение уровня значимости а обычно задаётся близким к нулю (например, 0,05; 0,01;0,02 и т. д.), потому что чем меньше значение уровня значимости, тем меньше вероятность совершения ошибки первого рода, состоящую в опровержении верной гипотезы Н0.

Уровни значимости

1. 1-й уровень значимости: р ≤ 0,05.

Это 5%-ный уровень значимости. До 5% составляет вероятность того, что мы ошибочно сделали вывод о том, что различия достоверны, в то время как они недостоверны на самом деле. Можно сказать и по-другому: мы лишь на 95% уверены в том, что различия действительно достоверны. В данном случае можно написать и так: P>0,95. Общий смысл критерия останется тем же.

2. 2-й уровень значимости: р ≤ 0,01.

Это 1%-ный уровень значимости. Вероятность ошибочного вывода о том, что различия достоверны, составляет не более 1%. Другими словами, мы на 99% уверены в том, что различия действительно достоверны. В данном случае можно написать и так: P>0,99. Смысл останется тем же.

3. 3-й уровень значимости: р ≤ 0,001.

Это 0,1%-ный уровень значимости. Всего 0,1% составляет вероятность того, что мы сделали ошибочный вывод о том, что различия достоверны. Это — самый надёжный вариант вывода о достоверности различий. Можно сказать и по-другому: мы на 99,9% уверены в том, что различия действительно достоверны. В данном случае можно написать и так: P>0,999. Смысл опять-таки останется тем же.

Критическими точками или квантилями называются точки, разграничивающие критическую область и область принятия гипотезы.

Рассмотрим вероятностное пространство   и   — вероятностная мера, задающая распределение некоторой случайной величины  . Пусть фиксировано  . Тогда  -квантилью (или квантилью уровня  ) распределения   называется число  , такое что

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Проверка гипотезы о равенстве дисперсий двух нормальных генеральных совокупностей (критерий Фишера-Снедекора)

Рассмотрим две случайные величины Х и У, каждая из которых подчиняется нормальному закону с дисперсиями  . Пусть из этих генеральных совокупностей извлечены  две выборки объёмами п1 и п2 . Проверим гипотезу Н0  о том, что  относительно альтернативной гипотезы Н1 , заключающейся в том, что    

Информация о работе Проверка статистических гипотез