Проверка статистических гипотез
Контрольная работа, 17 Марта 2014, автор: пользователь скрыл имя
Краткое описание
Данная работа создается с целью ознакомления с основными понятиями и методами математической статистики как средства решения задач физического, химического, биологического и иного характера, встречающихся как в процессе изучения профильных дисциплин, так и в дальнейшей профессиональной деятельности.
В тексте этой работы будут описаны основных понятия статистической проверки гипотез и произойдет закрепление их практически.
Содержание
Введение
Понятия статистической гипотезы, нулевой и конкурирующей гипотез
Понятие статистического критерия. Наблюдаемое значение критерия
Критическая область, область принятия гипотезы. Критические точки. Основной принцип проверки нулевой гипотезы. Право-, лево- и двухсторонняя критическая область
Понятие уровня значимости. Нахождение критических точек
Проверка гипотезы о равенстве дисперсий двух нормальных генеральных совокупностей (критерий Фишера-Снедекора)
Проверка гипотезы о равенстве математических ожиданий двух генеральных нормальных совокупностей в случае, когда дисперсии неизвестны и одинаковы (t-критерий, z-критерий)
Проверка гипотезы о законах распределения (критерий Пирсона)
Практическое решение задач
Заключение
Список литературы
Прикрепленные файлы: 1 файл
SAMOSTOYaTEL_NAYa_PO_MATEMATIKE.docx
— 162.57 Кб (Скачать документ)
ГОСУДАРСТВЕННОЕ
БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ
ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО
ОБРАЗОВАНИЯ
«КУРСКИЙ ГОСУДАРСТВЕННЫЙ
МЕДИЦИНСКИЙ УНИВЕРСИТЕТ» МИНИСТЕРСТВА
ЗДРАВООХРАНЕНИЯ
РОССИЙСКОЙ ФЕДЕРАЦИИ
(ГБОУ ВПО КГМУ)
Зав. кафедрой физики,
информатики и математики,
доцент Снегирева Л. В.
Самостоятельная работа по математике №1
Тема: «Проверка статистических гипотез».
Выполнила:
студентка лечебного
факультета, 1 курса, 19 группы
Середенко Софья Михайловна.
Проверила:
Тарасова С.А.
Курск 2014
План
- Введение
- Понятия статистической гипотезы, нулевой и конкурирующей гипотез
- Понятие статистического критерия. Наблюдаемое значение критерия
- Критическая область, область принятия гипотезы. Критические точки. Основной принцип проверки нулевой гипотезы. Право-, лево- и двухсторонняя критическая область
- Понятие уровня значимости. Нахождение критических точек
- Проверка гипотезы о равенстве дисперсий двух нормальных генеральных совокупностей (критерий Фишера-Снедекора)
- Проверка гипотезы о равенстве математических ожиданий двух генеральных нормальных совокупностей в случае, когда дисперсии неизвестны и одинаковы (t-критерий, z-критерий)
- Проверка гипотезы о законах распределения (критерий Пирсона)
- Практическое решение задач
- Заключение
- Список литературы
Введение
Данная работа создается с целью ознакомления с основными понятиями и методами математической статистики как средства решения задач физического, химического, биологического и иного характера, встречающихся как в процессе изучения профильных дисциплин, так и в дальнейшей профессиональной деятельности.
В тексте этой работы будут описаны основных понятия статистической проверки гипотез и произойдет закрепление их практически.
Понятия статистической гипотезы, нулевой и конкурирующей гипотез
Статистической гипотезой называется любое предположение о виде неизвестного закона распределения или о параметрах известных распределений. Предположим, что на основании имеющихся данных есть основания выдвинуть предположения о законе распределения или о параметре закона распределения случайной величины (или генеральной совокупности, на множестве объектов которой определена эта случайная величина). Задача проверки статистической гипотезы заключается в подтверждении или опровержении этого предположения на основании выборочных (экспериментальных) данных.
Статистическая гипотеза называется простой, если она однозначно определяет распределение случайной величины , в противном случае гипотеза называется сложной. Например, простой гипотезой является предположение о том, что случайная величина распределена по нормальному закону с математическим ожиданием, равным нулю, и дисперсией, равной единице. Если высказывается предположение, что случайная величина имеет нормальное распределение с дисперсией, равной единице, а математическое ожидание — число из отрезка , то это сложная гипотеза. Другим примером сложной гипотезы является предположение о том, что непрерывная случайная величина с вероятностью принимает значение из интервала , в этом случае распределение случайной величины может быть любым из класса непрерывных распределений.
Проверка статистической гипотезы означает
проверку соответствия выборочных данных
выдвинутой гипотезе. Параллельно с выдвигаемой
основной гипотезой, рассматривают и противоречащую
ей гипотезу, которая называется конкурирующей или
Нулевой, основной или проверяемой гипотезой называется первоначально выдвинутая гипотеза, которая обозначается Н0.
Конкурирующей или
Например, основная гипотеза Н0 состоит в том, что математическое ожидание μ равно какому-то значению μ0. В этом случае конкурирующая гипотеза Н1 может состоять в предположении, что математическое ожидание μ не равно (больше или меньше) значения μ0:
Н0: μ=μ0; Н1: μ≠μ0, или Н1: μ>μ0, Н1: μ<μ0.
Понятие статистического критерия. Наблюдаемое значение критерия
Статистическим
критерием называется случайная величина,
которая используется с целью проверки
нулевой гипотезы. Статистические критерии
называются соответственно по тому закону
распределения, которому они подчиняются,
т. е. F-критерий подчиняется распределению
Фишера-Снедекора, χ2-критерий подчиняется χ2-распределению,
Статистические критерии подразделяются на следующие категории:
- Критерии значимости. Проверка на значимость предполагает проверку гипотезы о численных значениях известного закона распределения: — нулевая гипотеза. или — конкурирующая гипотеза.
- Критерии согласия. Проверка на согласие подразумевает проверку предположения о том, что исследуемая случайная величина подчиняется предполагаемому закону. Критерии согласия можно также воспринимать, как критерии значимости. Критериями согласия являются:
- Критерий Пирсона
- Критерий Колмогорова
- Критерий Андерсона-Дарлинга
- Критерий Крамера — Мизеса — Смирнова
- Критерий согласия Купера
- Z-тест
- Критерий Жака-Бера
- Критерий Шапиро-Уилка
- График нормальности — не столько критерий, сколько графическая иллюстрация: точки специально построенного графика должны лежать почти на одной прямой.
- Критерии проверки на однородность. При проверке на однородность случайные величины исследуются на факт значимости различия их законов распределения (т.е. проверки того, подчиняются ли эти величины одному и тому же закону). Используются в факторном анализе для определения наличия зависимостей.
Это разделение условно, и зачастую один и тот же критерий может быть использован в разных качествах.
Пример: Пусть дана независимая выборка , где . Пусть есть две простые гипотезы:
Тогда можно определить следующий статистический критерий:
где - выборочное среднее.
Статистические критерии проверки гипотез разнообразны, но у них единая логическая схема построения, которую представим на рис. 1
Наблюдаемым значением статистического критерия называется значение критерия, которое рассчитано по выборочной совокупности, подчиняющейся определённому закону распределения.
Критическая область, область принятия гипотезы. Критические точки. Основной принцип проверки нулевой гипотезы. Право-, лево- и двухсторонняя критическая область
Критической областью называется множество возможных значений статистического критерия, при которых основная гипотеза отвергается.
Положение критической области
на множестве значений статистики
зависит от формулировки альтернативной
гипотезы
. Например, если проверяется
гипотеза
, а альтернативная гипотеза
формулируется как
, то критическая область размещается
на правом (левом) "хвосте" распределения
статистики
, т. е. имеет вид неравенства
, где
— значения статистики
, которые принимаются с вероятностями
соответственно
и
при условии, что верна гипотеза
. В этом случае критерий называется односторонним (
Расположение критической области для различных альтернативных гипотез показано на рис. 2, где — плотность распределения статистики критерия при условии, что верна гипотеза , — область принятия гипотезы, .
Принципы проверки нулевой гипотезы:
- Сравнение двух дисперсий нормальных генеральных совокупностей. При заданном уровне значимости проверяется нулевая гипотеза, состоящая в том, что генеральные дисперсии рассматриваемых совокупностей равны между собой:
В качестве критерия проверки нулевой гипотезы принимают случайную величину отношения большей исправленной дисперсии к меньшей
Величина имеет распределение Фишера-Снедекора, которое зависит только от чисел степеней свободы и .
- Сравнение двух средних нормальных генеральных совокупностей с известными дисперсиями. Проверяется нулевая гипотеза о равенстве генеральных средних рассматриваемых совокупностей с заданными или вычисляемыми дисперсиями. В качестве критерия проверки нулевой гипотезы примем случайную величину
- Сравнение выборочной средней с гипотетической генеральной средней нормальной совокупности. По выборочной средней при заданном уровне значимости проверяется нулевая гипотеза о равенстве генеральной средней гипотетическому значению . В качестве проверки нулевой гипотезы примем случайную величину
которая распределена нормально.
- Сравнение наблюдаемой относительной частоты с гипотетической вероятностью появления события. При заданном уровне значимости проверяется нулевая гипотеза, состоящая в том, что неизвестная вероятность появления события равна гипотетической вероятности серии повторных независимых испытаний.
В качестве критерия проверки нулевой гипотезы принимаем случайную величину
Понятие уровня значимости. Нахождение критических точек
Уровнем значимости а называется вероятность совершения ошибки первого рода.
Значение уровня значимости а обычно задаётся близким к нулю (например, 0,05; 0,01;0,02 и т. д.), потому что чем меньше значение уровня значимости, тем меньше вероятность совершения ошибки первого рода, состоящую в опровержении верной гипотезы Н0.
Уровни значимости
1. 1-й уровень значимости: р ≤ 0,05.
Это 5%-ный уровень значимости. До 5% составляет вероятность того, что мы ошибочно сделали вывод о том, что различия достоверны, в то время как они недостоверны на самом деле. Можно сказать и по-другому: мы лишь на 95% уверены в том, что различия действительно достоверны. В данном случае можно написать и так: P>0,95. Общий смысл критерия останется тем же.
2. 2-й уровень значимости: р ≤ 0,01.
Это 1%-ный уровень значимости. Вероятность ошибочного вывода о том, что различия достоверны, составляет не более 1%. Другими словами, мы на 99% уверены в том, что различия действительно достоверны. В данном случае можно написать и так: P>0,99. Смысл останется тем же.
3. 3-й уровень значимости: р ≤ 0,001.
Это 0,1%-ный уровень значимости. Всего 0,1% составляет вероятность того, что мы сделали ошибочный вывод о том, что различия достоверны. Это — самый надёжный вариант вывода о достоверности различий. Можно сказать и по-другому: мы на 99,9% уверены в том, что различия действительно достоверны. В данном случае можно написать и так: P>0,999. Смысл опять-таки останется тем же.
Критическими точками или квантилями называются точки, разграничивающие критическую область и область принятия гипотезы.
Рассмотрим вероятностное пространство
и
— вероятностная мера, задающая распределение
Проверка гипотезы о равенстве дисперсий двух нормальных генеральных совокупностей (критерий Фишера-Снедекора)
Рассмотрим две случайные величины Х и У, каждая из которых подчиняется нормальному закону с дисперсиями . Пусть из этих генеральных совокупностей извлечены две выборки объёмами п1 и п2 . Проверим гипотезу Н0 о том, что относительно альтернативной гипотезы Н1 , заключающейся в том, что