Какие гипотезы можно проверять с помощью двухвыборочного критерия Вилкоксона?

Рефераты, курсовые, дипломные, контрольные (предпросмотр)

Тип: Курсовая работа. Файл: Word (.doc) в архиве zip. Категория: Математика
Адрес этого реферата http://referat-kursovaya.repetitor.info/?essayId=20177 или
Загрузить
В режиме предпросмотра не отображаются таблицы, графики и иллюстрации. Для получения полной версии нажмите кнопку «Загрузить». Рефераты, контрольные, дипломные, курсовые работы предоставляются в ознакомительных целях, не для плагиата.
Страница 1 из 3 [Всего 3 записей]1 2 3 »

Установлено, что двухвыборочный критерий Вилкоксона (Манна-Уитни) предназначен для проверки гипотезы H0 : P(X Y) = 1/2, где X - случайная величина, распределенная как элементы первой выборки, а Y - второй. Разобраны три примера. В прикладной математической статистике часто рассматривают вероятностную модель двух независимых выборок числовых результатов наблюдений. Первая выборка описывается набором m случайных величин X1, X2, ... , Xm, имеющих одну и ту же функцию распределения F(x), а вторая выборка - набором n случайных величин Y1, Y2, ... , Yn, имеющих одну и ту же функцию распределения G(x), причем все эти m+n случайных величин X1, X2, ... , Xm, Y1, Y2, ... , Yn независимы в совокупности. Без ограничения общности можно считать, что m # n, в противном случае выборки можно поменять местами. Обычно предполагается, что функции F(x) и G(x) непрерывны и строго возрастают. Из непрерывности этих функций следует, что с вероятностью 1 все m+n результатов наблюдений различны. В реальных статистических данных иногда встречаются совпадения, но сам факт их наличия - свидетельство нарушений предпосылок только что описанной базовой математической модели. Статистика S двухвыборочного критерия Вилкоксона определяется следующим образом. Все элементы объединенной выборки X1, X2, ..., Xm, Y1, Y2, ... , Yn упорядочиваются в порядке возрастания. Элементы первой выборки X1, X2, ..., Xm занимают в общем вариационном ряду места с номерами R1, R2, ..., Rm, другими словами, имеют ранги R1, R2, ..., Rm . Тогда S = R1 + R2 + ... + Rm . Статистика U Манна-Уитни определяется как число пар (Xi, Yj) таких, что Xi Yj , среди всех mn пар, в которых первый элемент - из первой выборки, а второй - из второй. Как известно [1, с.160], U = mn + m(m+1)/2 - S . Поскольку S и U линейно связаны, то часто говорят о критерии Вилкоксона (Манна-Уитни). Не будем обсуждать здесь вопросы истории и терминологии, относящиеся к S и U. Критерий Вилкоксона - один из самых известных инструментов непараметрической статистики (наряду со статистиками типа Колмогорова-Смирнова и коэффициентами ранговой корреляции). Свойствам этого критерия и таблицам его критических значений уделяется место во многих монографиях по математической и прикладной статистике (см., например, [1-3]). Однако в литературе имеются и неточные утверждения относительно возможностей критерия Вилкоксона. Так, одни полагают, что с его помощью можно обнаружить различие между функциями распределения F(x) и G(x). По мнению других, этот критерий нацелен на проверку равенства медиан распределений, соответствующих выборкам. И то, и другое, строго говоря, неверно. Настоящая статья написана, чтобы внести ясность в рассматриваемый вопрос. Ссылки на публикации с неточными и ошибочными утверждениями не приводим по нескольким причинам. Во-первых, таких публикаций слишком много. Во-вторых, некоторые из них после исключения ошибок представляют ценность для практически работающего статистика. В-третьих, зачем создавать рекламу плохим книгам. И т.п. Введем некоторые обозначения. Пусть F-1(t) - функция, обратная к функции распределения F(x). Она определена на отрезке [0;1]. Положим L(t) = G(F-1(t)). Поскольку F(x) непрерывна и строго возрастает, то F-1(t) и L(t) обладают теми же свойствами. Важную роль в дальнейшем изложении будет играть величина a = P(X Y) . Как нетрудно показать, a = P(X Y) = . Введем также b2 = - (1 -a)2 , g2 = - a2 . Тогда математические ожидания и дисперсии статистик Вилкоксона и Манна-Уитни согласно [1, с.160] выражаются через введенные величины: E(U) = mna , E(S) = mn + m(m+1)/2 - E(U) = mn(1- a) + m(m+1)/2, D(S) = D(U) = mn [ (n - 1) b2 + (m - 1) g2 + a(1 -a) ] . (1) Когда объемы обеих выборок безгранично растут, распределения статистик Вилкоксона и Манна-Уитни являются асимптотически нормальными (см., например, [1, гл.5 и 6]) с параметрами, задаваемыми формулами (1) . Если выборки полностью однородны, т.е. их функции распределения совпадают, справедлива гипотеза H0: F(x) = G(x) при всех x, (2) то L(t) = t и a= 1/2. Подставляя в формулы (1), получаем, что E(S) = m(m+n+1)/2, D(S) = mn(m+n+1)/ 12 (3) . Следовательно, распределение нормированной и центрированной статистики Вилкоксона T = ( S - m(m+n+1)/2) (mn(m+n+1)/ 12 ) - 1/2 (4) при росте объемов выборок приближается к стандартному нормальному распределению (с математическим ожиданием 0 и дисперсией 1). Правила принятия решений и таблица критических значений для критерия Вилкоксона строятся в предположении справедливости гипотезы полной однородности, описываемой формулой (2). А что будет, если эта гипотеза неверна? Другими словами, какова мощность критерия Вилкоксона? Пусть объемы выборок достаточно велики, так что можно пользоваться асимптотической нормальностью статистики Вилкоксона. Тогда в соответствии с формулами (1) статистика T будет асимптотически нормальна с параметрами E(T) = ( 12mn ) 1/2 (1/2 - a) (m+n+1) - 1/2 , D(T) = 12 [(n - 1) b2 + (m - 1) g2 + a(1 -a) ] (m+n+1) - 1 . (5) Из формул (5) видно большое значение гипотезы H01: a = P(X Y) = 1/2 . (6) Если эта гипотеза неверна, то, поскольку m # n, справедлива оценка u E(T) u $ ( 12m n (2n+1) - 1) 1/2 u 1/2 - au , а потому u E(T) u безгранично растет при росте объемов выборок. В то же время, поскольку b2 # # 1, g2 # # 1, a(1 -a)#1/4, то D(T) # 12 [(n - 1) + (m - 1) + 1/4] (m+n+1) - 1 # 12. (7) Следовательно, вероятность отклонения гипотезы H01 , когда она неверна, т.е. мощность критерия Вилкоксона как критерия проверки гипотезы (6), стремится к 1 при возрастании объемов выборок, т.е. критерий Вилкоксона является состоятельным для этой гипотезы при альтернативе АH01: a = P(X Y) ё 1/2 . (8) . Если же гипотеза (6) верна, то статистика T асимптотически нормальна с математическим ожиданием 0 и дисперсией, определяемой формулой D(T) = 12 [(n - 1) b2 + (m - 1) g2 + 1/4 ] (m+n+1) - 1 . (9) Гипотеза (6) является сложной, дисперсия (9), как показывают приводимые ниже примеры, в зависимости от значений b2 и g2 может быть как больше 1, так и меньше 1, но согласно неравенству (7) никогда не превосходит 12. Приведем пример двух функций распределения F(x) и G(x) таких, что гипотеза (6) выполнена, а гипотеза (2) - нет. Поскольку и a = 1/2 в случае справедливости гипотезы (2), то для выполнения условия (6) необходимо и достаточно, чтобы а потому естественно в качестве F(x) рассмотреть функцию равномерного распределения на интервале (-1 ; 1). Тогда формула (11) переходит в условие Это условие выполняется, если функция (G(x) - (x + 1)/2 ) является нечетной. Пример 1. Пусть функции распределения F(x) и G(x) сосредоточены на интервале (-1 ; 1), на котором F(x) = (x + 1)/2 , G(x) = ( x + 1 + 1/p sin px ) / 2 . Тогда x = F-1(t) = 2t - 1, L(t) = G(F-1(t)) = (2 t + 1/p sin p(2t - 1)) / 2 = t + 1/2p sin p(2t - 1) . Условие (11) выполнено, поскольку функция (G(x) - (x + 1)/2 ) является нечетной. Следовательно, a = 1/2 . Начнем с вычисления Поскольку d(t + 1/2p sin p(2t - 1)) = (1 + cos p(2t - 1) ) dt, то С помощью замены переменных t = (x +1) / 2 получаем, что В правой части последнего равенства стоят табличные интегралы [4, с.71]. Проведя соответствующие вычисления, получаем, что в правой части стоит 1/8 ( - 4/ p2) = - 1/(2 p2). Следовательно, g2 = 1/12 - 1/(2 p2) = 0,032672733... Перейдем к b2 . Поскольку С помощью замены переменных t = (x+1) / 2 переходим к табличным интегралам [4, с.65]: Проведя необходимые вычисления, получаем, что b2= 1/12 + (4p)-1( - 2/p) +0+ (8p2)-1 = 1/12 - 3(8p2)-1 = 0,045337893... Следовательно, для рассматриваемых функций распределения нормированная и центрированная статистика Вилкоксона (см. формулу (4)) асимптотически нормальна с математическим ожиданием 0 и дисперсией (см. формулу (9)) D(T) = ( 0,544 n + 0,392 m + 2,064 ) (m+n+1) - 1 . Как легко видеть, дисперсия всегда меньше 1. Это значит, что в рассматриваемом случае гипотеза полной однородности (2) при проверке с помощью критерия Вилкоксона будет приниматься чаще, чем если она на самом деле верна. На наш взгляд, это означает, что критерий Вилкоксона

RSSСтраница 1 из 3 [Всего 3 записей]1 2 3 »


При любом использовании материалов сайта обязательна гиперссылка на сайт «Репетитор».
Разработка и Дизайн компании Awelan
www.megastock.ru
Проверить аттестат