Критерий Стьюдента

Автор работы: Пользователь скрыл имя, 16 Октября 2013 в 21:45, реферат

Краткое описание

Критерий t Стьюдента направлен на оценку различий величин средних и двух выборок X и Y, которые распределены по нормальному закону. Одним из главных достоинств критерия является широта его применения. Он может быть использован для сопоставления средних у связных и несвязных выборок, причем выборки могут быть не равны по величине.

Прикрепленные файлы: 1 файл

testy_po_kombinatorike.doc

— 1.46 Мб (Скачать документ)

 

 Т - Критерий Стьюдента

Критерий t Стьюдента  направлен на оценку различий величин  средних   и   двух выборок X и Y, которые распределены по нормальному закону. Одним из главных достоинств критерия является широта его применения. Он может быть использован для сопоставления средних у связных и несвязных выборок, причем выборки могут быть не равны по величине.

Случай  несвязных выборок

В общем случае формула для расчета по t - критерию Стьюдента такова:

где 

Рассмотрим сначала равночисленные выборки. В этом случае n1 = n2 = n, тогда  выражение (9.2) будет вычисляться  следующим образом:

 

 

В случае неравночисленных выборок  , выражение будет вычисляться следующим образом:

 

 

В обоих случаях  подсчет числа степеней свободы  осуществляется по формуле:

где n1 и n2 соответственно величины первой и второй выборки.

Понятно, что  при численном равенстве выборок k = 2   n - 2.

Рассмотрим пример использования t - критерия Стьюдента  для несвязных и неравных по численности выборок.

Пример: Психолог измерял время сложной сенсомоторной реакции выбора

(в мс) в контрольной  и экспериментальной группах.  В экспериментальную группу (X) входили  9 спортсменов высокой квалификации. Контрольной группой (Y) являлись 8 человек, активно не занимающихся спортом. Психолог проверяет гипотезу о том, что средняя скорость сложной сенсомоторной реакции выбора у спортсменов выше, чем эта же величина у людей, не занимающихся спортом.

Результаты эксперимента представим в виде табл. 9, в которой произведем ряд необходимых расчетов:

Таблица 9

Группы

Отклонение от среднего

Квадраты отклонения

 

X

Y

1

504

580

- 22

- 58

484

3368

2

560

692

34

54

1156

2916

3

420

700

- 106

62

11236

3844

4

600

621

74

- 17

5476

289

5

580

640

54

- 2

2916

4

6

530

561

4

- 77

16

5929

7

490

680

- 36

42

1296

1764

8

580

630

54

- 8

2916

64

9

470

-

- 56

-

3136

-

Сумма

4734

5104

0

0

28632

18174

Среднее

526

638

       

Средние арифметические составляют в экспериментальной  группе  , в контрольной группе 

Разница по абсолютной величине между средними

 

 

Подсчет выражения  дает:

 

 

Тогда значение  , вычисляемое по формуле (9.1), таково:

Число степеней свободы   = 9 + 8-2= 15. По табл. 17 приложения 6 для данного числа степеней свободы находим  :

2,13 для P   0,05

2,95 для P   0,01

4,07 для P   0,001

Строим ``ось значимости'':

Таким образом, обнаруженные психологом различия между  экспериментальной и контрольной  группами значимы более чем на 0,]% уровне, или, иначе говоря, средняя  скорость сложной сенсомоторной реакции выбора в группе спортсменов существенно выше, чем в группе людей, активно не занимающихся спортом.

В терминах статистических гипотез  это утверждение звучит так: гипотеза   о сходстве отклоняется и на 0,1% уровне значимости принимается альтернативная гипотеза   - о различии между экспериментальной и контрольными группами.

Случай  связных выборок

В случае связных  выборок с равным числом измерений  в каждой можно использовать более  простую формулу t - критерия Стьюдента.

Вычисления значений   осуществляется по формуле:

 

 

где   - разности между соответствующими значениями переменной X и переменной Y, а   среднее этих разностей.

В свою очередь  вычисляется по следующей формуле:

 

 

Число степеней свободы k определяется по формуле k = n - 1

Рассмотрим пример использования t - критерия Стьюдента  для связных и, очевидно, равных по численности выборок.

Пример: Психолог предположил, что в результате научения время решения эквивалентных задач ``игры в 5'' (т. е. имеющих один и тот же алгоритм решения) будет значимо уменьшаться. Для проверки гипотезы у восьми испытуемых сравнивалось время решения (в минутах) первой и третьей задач. Решение задачи представим в виде табл. 10.

Таблица 10

№ испытуемых

1 задача

2 задача

1

4,0

3,0

1,0

1,0

2

3,5

3,0

0,5

0,25

3

4,1

3,8

0,3

0,09

4

5,5

2,1

3,4

11,56

5

4,6

4,9

-0,3

0,09

6

6,0

5,3

0,7

0,49

7

5,1

3,1

2,0

4,00

8

4,3

2,7

1,6

2,56

Суммы

37,1

27,9

9,2

20,04


Вначале произведем расчет по формуле:

 

 

Затем применим формулу:

 

 

И, наконец, следует  применить формулу. Получим:

Число степеней свободы: k = 8 - 1 = 7 и по табл. 17 приложения 6 находим  :

2,37 для P   0,05

З,50 для P   0,01

5,41 для P   0,001

Строим ``ось значимости'':

Таким образом, на 5% уровне значимости первоначальное предположение подтвердилось, действительно, среднее время решения третьей задачи существенно меньше среднего времени решения первой задачи. В терминах статистических гипотез полученный результат будет звучать так: на 5% уровне гипотеза   отклоняется и принимается гипотеза   -- о различиях.

Для применения t - критерия Стьюдента необходимо соблюдать  следующие условия:

Измерение может  быть проведено в шкале интервалов и отношений.

Сравниваемые  выборки должны быть распределены по нормальному закону.

Критерий Фишера в оценке альтернативных

 
вариантов эконометрических моделей. 
 
Одним из способов сравнения альтернативных вариантом эконометрических моделей является метод наименьших квадратов. Допустим мы имеем два альтернативных варианта эконометрических моделей для одного и того же процесса. 
 
 (1) 
 
 , (2) 
 
которые могут различаться как по составу независимых переменных ( ) и по значением параметров ( ), так и по виду функциональных зависимостей  ,   . 
 
Набор статистических данных для исследуемого процесса представлен таблицей: 
 
 
 
 
 
……………………….. 
 
 (3) 
 
……………………….. 
 

 
Заметим, что не все независимые переменные из статистических данных могут входить в эконометрические модели, а наборы переменных в моделях также могут различаться. Затем подсчитываются суммарные квадратические отклонения для каждой модели. 
 
 (4) 
 
 , (5) 
 
где   и   - вычисляемые значения зависимой переменной для первой и второй моделей соответственно. 
 
Более «подходящей» является та модель, суммарное квадратическое отклонение для которой будет меньше. 
 
Сравнение «качества» двух различных альтернативных вариантов эконометрических моделей можно производить и по критерию Фишера. Его величина в таком случае подсчитывается по формуле: 
 
 , (6) 
 
где через   - обозначено число независимых переменных в модели (1), а через   - число независимых переменных во второй модели (2). Этот критерий является двухсторонним, т.е. его значение позволяет оценить более подходящую модель или утверждать, что они практически равноценны.  
 
Предварительно вычисляется табличное значение критерия Фишера  , (7) 
 
где   и   число степеней свободы, а   - заданный уровень доверительного интервала.  
 
Если выполняются неравенства  
 
 (8) 
 
то рассматриваемые альтернативные варианты эконометрических моделей считаются равносильными по степени их соответствия реальному процессу. 
 
Если же выполнено неравенство 
 
 (9) 
 
то выбирается первый вариант модели (1). 
 
Ели выполняется неравенство 
 
 (10) 
 
то выбирается вторая модель (2) как лучше отражающая реальный процесс. 
 
 
^ Частные корреляции взаимосвязи между факторами. 
 
Обычно кроме исследования таблиц парных корреляционных коэффициентов связи переменных используют коэффициент частной корреляции. При этом исследуется связь между факторами при условии, что некоторые из них или даже все остальные факторы остаются неизменными. 
 
Коэффициент частной корреляции между зависимой переменной   и независимой переменной   при условии, что фактор   закреплен на постоянном уровне (считается постоянным) вычисляется по формуле: 
 
 (11) 
 
где   - коэффициент корреляции влияния независимой переменной   - на зависимую переменную  ,   - коэффициент парной корреляции двух независимых факторов   и   . 
 
Если считается неизменным только один фактор, то такой коэффициент называется коэффициентом частной корреляции первого порядка. Если же постоянными считаются два фактора, то он называется коэффициентом частной корреляции второго порядка, и т.д. По числу переменных, считающимися постоянными, определяется порядок частной корреляции. Обычный коэффициент парной корреляции в этом смысле является частным коэффициентом корреляции нулевого порядка.  
 
В выражении (10) коэффициент частной корреляции первого порядка выражается через корреляционные коэффициенты нулевого порядка. Далее коэффициенты частной корреляции более высоких порядков определяются по индукции через коэффициенты частной корреляции более низких порядков. Приведем общую формулу определения частной корреляции   - го порядка через частные корреляции   - го порядка. 
 
 (11) 
 
Легко понять, что значения частных корреляций произвольных порядков меняются от –1 до 1, т.е. их абсолютная величина не превосходит 1. Следует отметить, что малость коэффициентов частной корреляции низких порядков не гарантирует малости коэффициентов частной корреляции более высоких порядков. Например, коэффициенты   могут быть оба малы, а вот коэффициент   может иметь достаточно большое значение. Например, при   значение   может быть значительно больше, чем значение  . Коэффициент частной корреляции более высокого порядка может увеличиваться и за счет отрицательного значения произведения  . 
 
 
^ Стандартизированное уравнение  
 
линейной множественной регрессии. 
 
Если коэффициенты парной корреляции  независимых переменных близки к нулю, т.е. между независимыми факторами   ,   нет корреляционной зависимости, то в качестве коэффициентов влияния независимых факторов   на зависимую переменную   в линейной регрессионной модели могут быть взяты коэффициенты парных корреляций  . Однако, если факторы-аргументы не являются случайными величинами, то коэффициенты корреляции не могут быть использованы при построении уравнения линейной регрессии, так как они не могут быть интерпретированы как показатели тесноты связи между факторами и зависимой переменной. 
 
Существенность вводимых факторов в случае линейной множественной регрессии может быть проверена одновременно с существенностью коэффициентов регрессии. 
 
Для проверки существенности влияния вычисляется отношение  
 
, (12) 
 
где  ,   - коэффициент множественной регрессии;   - среднее квадратическое отклонение этого коэффициента. 
 
Если   взятого по таблицам t-распределения Стьюдента, то с заданной вероятностью не отвергается гипотеза, что соответствующий коэффициент регрессии   в генеральной совокупности (который не известен, и который нужно оценить по данным выборки) равняется нулю. При этом   - ый фактор в таком случае признается несущественным для построенного уравнения регрессии. 
 
При проведении исследования может оказаться, что вычисленные значения   для нескольких факторов не превышают   . В этом случае несущественные факторы из уравнения регрессии исключаются поочередно, начиная с наименьшего по абсолютной величине  . Фактор, соответствующий минимальному значению   , из уравнения регрессии исключается, и после этого заново решается система линейных относительно параметров уравнений. Затем вновь вычисляются значения   для всех оставшихся в уравнении коэффициентов, определяется минимальное значение   , которое сопоставляется с   . Если окажется, что это минимальное значение   , то фактор   , соответствующий этому минимальному  исключается из функционала. 
 
Процесс исключения коэффициентов и факторов из уравнения повторяется до тех пор, пока не будет выполняться соотношение   для всех  . В этом случае все остающиеся в уравнении переменные   будут являться существенными. 
 
После указанных действий и в предположении взаимной независимости между собой существенных переменных мы придем к уравнению линейной регрессии 
 
 (13) 
 
в котором коэффициенты между собой уже не связаны. Их численные значения зависят от выбранных единиц измерения каждого из факторов. Чтобы коэффициенты регрессии стали сравнимы по величинам, приведем коэффициенты уравнения к стандартизированному масштабу. Для этого все переменные приводят к безразмерным, так называемым стандартизированным, единицам измерения. Достигается это следующими преобразованиями: 
 
 
 
 (14) 
 
где   и   - значения исходных переменных в исходном, т.е. натуральном масштабе,   ,   - средние значения этих переменных,   и   - соответствующие значения факторов в стандартизованном масштабе. Свободный член   в стандартизированном уравнении линейной множественной регрессии отсутствует, т.е.   и уравнение имеет вид: 
 
 (15) 
 
В этом уравнении уже все переменные выражены в сравнимых единицах измерений. Коэффициенты   этого уравнения называются коэффициентами регрессии в стандартизированном масштабе. Для их определения необязательно снова решать систему линейных уравнений. Переход от коэффициентов   к коэффициентам   может осуществляться по формулам  
 
 (16) 
 
где   - соответствующие средне квадратические отклонения.  
 
На практике часто уравнение регрессии в стандартизированном виде содержит еще один фактор – время (t). В этом случае оно имеет вид: 
 
 (17)




Информация о работе Критерий Стьюдента