Доверительный интервал и доверительная вероятность

Автор работы: Пользователь скрыл имя, 08 Декабря 2013 в 12:11, автореферат

Краткое описание

Задачу интервального оценивания в самом общем виде можно сформулировать так: по данным выборки построить числовой интервал, относительно которого с заранее выбранной вероятностью можно сказать, что этот интервал покроет (накроет) оцениваемый параметр.
Для определения точности оценки θ_n^* в математической статистике пользуются доверительными интервалами, а для определения надежности - доверительными вероятностями. Раскроем сущность этих понятий.

Прикрепленные файлы: 1 файл

7_Интервальные_оценки.docx

— 43.05 Кб (Скачать документ)

Практическая  работа №7

ИНТЕРВАЛЬНЫЕ ОЦЕНКИ

 

Основные понятия и формулы

Доверительный интервал и доверительная  вероятность

Точечная оценка оцениваемого параметра 

Доверительный интервал

Доверительная вероятность (надежность)

 

[], где = , =

   

Интервальная оценка математического  ожидания 

Дисперсия известна

Дисперсия не известна

Интервальная оценка среднего квадратичного  отклонения 

Интервальная оценка вероятности  события

Основные умения и навыки:

  • описывать случайную величину с помощью доверительных интервалов;
  • находить интервальные оценки основных характеристик;
  • использовать возможности Exel для построения интервальных оценок.

 

Доверительный интервал и доверительная вероятность       

 Оценки, рассматриваемые ранее, выражались одним числом и поэтому назывались точечными. Однако в ряде задач требуется не только найти для оцениваемого параметра числовое значение, но оценить его точность и надежность. Такого рода задачи очень важны  при малом числе наблюдений, так как конечная оценка  в значительной мере является случайной и приближенная замена на  может привести к серьезным ошибкам.         

 Задачу  интервального оценивания в самом  общем виде можно сформулировать  так: по данным выборки построить  числовой  интервал, относительно которого с заранее выбранной вероятностью можно сказать, что этот интервал покроет (накроет) оцениваемый параметр.

Для определения точности оценки  в математической статистике пользуются доверительными интервалами, а для определения надежности - доверительными вероятностями. Раскроем сущность этих понятий.        

 Доверительным интервалом для параметра называется такой интервал, относительно которого можно с заранее выбранной вероятностью (близкой к единице), утверждать, что он содержит неизвестное значение параметра . Пусть  - несмещенная оценка параметра θ. Требуется оценить возможную при этом ошибку. По определенным правилам находят такое число , чтобы выполнялось соотношение:

   или   .

Равенство означает,  что интервал [], где = , а = , заключает в себе оцениваемый параметр с вероятностью .

  называют доверительной вероятностью или надежностью интервальной оценки, а значение - уровнем значимости. Нижняя и верхняя граница доверительного интервала  и  определяются по результатам наблюдений, следовательно, сам доверительный интервал является случайной величиной. В связи с этим говорят, что доверительный интервал покрывает оцениваемый параметр с вероятностью . Выбор определяется конкретными условиями решаемой задачи. Надежность принято выбирать равной 0,95; 0,99; 0,999 – тогда событие, состоящее в том, что интервал [], покрывает параметр будет практически достоверным.

При этом число  характеризует точность интервальной оценки: чем меньше , тем оценка точнее и наоборот.

На  практике часто встречаются нормально  распределенные случайные величины (или стремящиеся к нормальному). Рассмотрим интервальные оценки для параметров нормального распределения.

 

Интервальная оценка математического ожидания при известной дисперсии           

 Пусть  случайная величина распределена по нормальному закону, причем математическое ожидание неизвестно, а дисперсия известна. Требуется оценить неизвестное математическое ожидание. По наблюдениям найдем точечную оценку математического ожидания. Зададимся вероятностью и найдем такое число , чтобы выполнялось соотношение:   .

Доказано, что построение доверительного интервала в этом случае осуществляется по формуле:

,

где – значение стандартной нормальной величины, соответствующее надежности , а – функция Лапласа (см. таблицу Приложения 2). Очевидно, что увеличение надежности приводит к увеличению функции и соответственно увеличению параметра t, что в свою очередь увеличивает величину . То есть увеличение надежности оценки ведет к снижению ее точности (увеличению погрешности).

При этом точность оценки математического ожидания равна: . Очевидно, что с увеличением объема выборки n величина погрешности уменьшается, т.е. точность оценки повышается. Эта формула позволяет определить необходимый объем выборки для оценки математического ожидания с наперед заданной точностью и надежностью:   .

Для вычисления значения можно воспользоваться статистической функцией НОРМСТОБР(1– α) мастера функций, где .

Пример 1. Анализ доходности акций на основе случайной выборки за 16 дней показал, что средняя доходность составляет 10,37%. Предполагая, что доходность акций подчиняется нормальному закону распределения с известной дисперсией, равной 4%2, определить:

а) ширину доверительного интервала для  средней доходности с надежностью 0,97;

б) надежность того, что точность оценивания составит 0,98%;

в) минимальное число наблюдений, которое  необходимо провести, чтобы с вероятностью 0,99 можно было утверждать, что средняя  доходность заключена в интервале  шириной 3%.

Так как дисперсия нормального  распределения известна, по таблице  Лапласа (Приложение 2):

      а) для значения функции находим значение аргумента = 2,17, откуда ширина доверительного интервала средней доходности () составляет:

     б) из оценки точности математического ожидания следует, что ; для значения аргумента находим значение функции Ф(1,96) = 0,475 и = 2∙0,475 = 0,95, т.е. при надежности 0,95 точность оценивания составит 0,98%;

      в) для  значения функции  находим значение аргумента = 2,58 и по формуле определяем:   , т.е. необходимо провести 12 измерений для обеспечения заданной точности (3%) и надежности (0,99).

 

Интервальная оценка математического ожидания при неизвестной дисперсии           

 Пусть  случайная величина распределена по нормальному закону, причем математическое ожидание и дисперсия неизвестны. Требуется оценить неизвестное математическое ожидание. По наблюдениям найдем точечные оценки и S математического ожидания и дисперсии . Зададимся вероятностью и найдем такое число , чтобы выполнялось соотношение:   .

Доказано, что построение доверительного интервала в этом случае осуществляется по формуле:

,

где – значение функции распределения Стьюдента (t-распределения) (табл. Приложения 3), соответствующее степеням свободы и надежности .

При этом точность оценки математического  ожидания равна:  .

Для вычисления можно воспользоваться статистической функцией СТЬЮДРАСПОБР(α; n - 1) мастера функций, где .

Пример 2. Анализ доходности акций на основе случайной выборки за 16 дней показал, что средняя доходность составляет 10,37% при рассеянии S=2,5%. Предполагая, что доходность акций подчиняется нормальному закону распределения, определить:

     а) верхнюю границу доверительного интервала для средней доходности с надежностью 0,95;

     б) надежность того, что средняя доходность заключена в интервале [].

Так как дисперсия нормального  распределения неизвестна (и по выборке  определена ее точечная оценка) используем функцию распределения Стьюдента (Приложение 3):

     а) для заданной надежности 0,95 и числа степеней свободы = 16 – 1 = 15 найдем значение функции (0,95; 15) = 2,15 и верхняя граница доверительного интервала составит:

.

     б) поскольку интервал симметричен относительно точечной оценки математического ожидания, точность оценки составляет 12,37 – 10,37 = 2%, тогда из формулы определяем параметр :

 и по таблице t-распределения Стьюдента (Приложение 3) для числа степеней свободы = 16 – 1 = 15 берем ближайшее к полученному значению значение надежности 0,99.

 

Интервальная оценка среднего квадратичного  отклонения и дисперсии

Пусть случайная величина распределена по нормальному закону, причем математическое ожидание и дисперсия неизвестны. Требуется оценить неизвестное среднее квадратичное отклонение, используя его точечную оценку S, найденную по выборке. Зададимся вероятностью и найдем такое число , чтобы выполнялось соотношение:

 (при  ).

Поскольку дисперсия и среднее квадратичное отклонение всегда положительны, то в общем случае приведенное соотношение уточняется:

 

Можно доказать, что построение доверительного интервала в этом случае для среднего квадратичного отклонения осуществляется по формуле:

,

где q – значение функции распределения Пирсона (*2-распределения) (Приложение 4), соответствующее степеням свободы и надежности .

При этом точность оценки среднего квадратичного  отклонения равна:  .

Для построения доверительного интервала  для дисперсии нижнюю и верхнюю  границу интервала среднего квадратичного отклонения возводят в квадрат.

Для вычисления параметра q можно воспользоваться статистической функцией ХИ2ОБР(α; n - 1) мастера функций, где .

Пример 3. Для анализа производительности труда были отобраны 15 работников предприятия. На основании проведенных испытаний была получена оценка исправленного среднего квадратичного отклонения 20 изд./ч. Предполагая, что производительность труда работников подчиняется нормальному закону распределения определить:

     а) с надежностью  0,95 границы доверительного интервала  для дисперсии;

     б) надежность  того, что истинное значение среднего  квадратичного отклонения заключено  в интервале [6 изд./ч.; 34 изд./ч.].

     а) для заданной надежности 0,95 и числа степеней свободы = 15 – 1 = 14 по Приложению 4 найдем значение q = q(0,95;14) = 0,48; тогда границы доверительного интервала соответственно равны:

=   и  ,

т. е. доверительные интервалы для среднего квадратичного отклонения [10 изд./ч.; 30 изд./ч.] и для дисперсии [108 (изд./ч.)2; 876 (изд./ч.)2].

     б) поскольку интервал симметричен относительно точечной оценки среднего квадратичного отклонения точность оценки составляет 34 – 20 = 14 изд./ч., тогда из формулы определяем параметр q:

 и по таблице *2-распределения Пирсона (Приложение 4) для числа степеней свободы = 15 – 1 = 14 берем ближайшее к полученному значению q значение надежности 0,99.

 

Интервальная оценка вероятности  события

При рассмотрении точечных оценок было показано, что "хорошей" оценкой вероятности события является частость w = m / n, где m – число испытаний, в которых произошло событие А, а n – общее число независимых испытаний, в каждом из которых событие А может произойти с вероятностью р или не произойти с вероятностью q = 1 – р (т.е. последовательность испытаний Бернулли).

Зададимся вероятностью и найдем границы, чтобы выполнялось соотношение:

.

Можно доказать, что построение доверительного интервала для вероятности в этом случае (при больших значениях n) осуществляется по формуле:

,

где – значение стандартной нормальной величины, соответствующее надежности , а – функция Лапласа (см. таблицу Приложения 2).

При этом точность оценки вероятности равна: .

Пример 4. При проведении анализа эффективности рекламы инструментальных наборов, размещенной в интернете, была организована случайная выборка, объем которой составил 500 человек. В результате проведенного опроса выяснилось, что для 200 человек источником информации послужили объявления, размещенные в сети. В предположении о биномиальном законе распределения определить:

     а) с надежностью 0,95 нижнюю границу вероятности того, что один случайно отобранный покупатель воспользовался рекламой в интернете;

     б) надежность  того, что использование рекламы  в интернете будет находиться  в интервале [0,30;0,50].

Так как объем выборки  достаточно большой, используем для  построения доверительного интервала  функцию Лапласа (Приложение 2):

     а) для заданной надежности 0,95 определим значение функции Ф() = 0,95 /2 = 0,475, по таблицам функции Лапласа находим значение аргумента = 1,96, откуда нижняя граница доверительного интервала вероятности:   .

     б) поскольку интервал симметричен относительно точечной оценки вероятности точность оценки составляет , откуда , по таблице Приложения 2 найдем значение функции Лапласа Ф(4,56) = 0,499998, но = 2∙0,499998 = 0,999996, т.е. практически достоверное событие.

 

Задачи  для самостоятельной работы

Задача 1. Случайная величина распределена по нормальному закону с дисперсией равной 9. Сделана случайная выборка с возвратом объема n = 25. Найти с надежностью 0,99: а) точность выборочной средней; б) интервальную оценку для неизвестного математического ожидания; в) доверительный интервал, если выборочная средняя равна 20,12.

Информация о работе Доверительный интервал и доверительная вероятность