Для проверки гипотезы что эффекты уровней отсутствуют применяется критерий
Критерии проверки статистических гипотез
СТАТИСТИЧЕСКИЕ ГИПОТЕЗЫ
Статистической гипотезой (гипотезой) называется любое утверждение об изучаемом законе распределения.
Пример статистических гипотез:
Нулевая гипотеза (Н0)- предположение о том, что между параметрами генеральных совокупностей нет различий, то есть эти различия носят не систематический, а случайный характер.
Пример1. Нулевая гипотеза записывается следующим образом:
H0: µ1=µ2 (нулевая гипотеза заключается в том, что генеральное среднее одной совокупности равно генеральному среднему другой совокупности).
Альтернативная гипотеза (Н1) – предположение о том, что между параметрами генеральных совокупностей есть достоверные различия.
Пример 2. Альтернативные гипотезы записываются следующим образом:
О критериях проверки статистических гипотез можно прочесть в книге «Компьютерная обработка данных экспериментальных исследований»
Необходимо отметить, что до получения исследователем экспериментальных данных необходимо сформулировать статистическую гипотезу и задать уровень значимости α. При выборе уровня значимости исследователь должен исходить из практических соображений, отвечая на вопрос: какую вероятность ошибки он считает допустимой. В области физической культуры и спорта чаще всего задают уровень значимости α=0,05.
КЛАССИФИКАЦИЯ КРИТЕРИЕВ ЗНАЧИМОСТИ
Критерии проверки статистических гипотез (критерии значимости) можно разделить на три большие группы:
Критерии согласия называются критерии значимости, применяемые для проверки гипотезы о законе распределения генеральной совокупности, из которой взята выборка. Для проверки статистической гипотезы чаще всего используются следующие критерии согласия: критерий Шапиро-Уилки, критерий хи-квадрат, критерий Колмогорова-Смирнова.
Параметрические критерии – критерии значимости, которые служат для проверки гипотез о параметрах распределений (чаще всего нормального). Такими критериями являются: t-критерий Стьюдента для независимых выборок, t-критерий Стьюдента для связанных выборок, F-критерий Фишера.
Непараметрические критерии – критерии значимости, которые для проверки статистических гипотез не использует предположений о распределении генеральной совокупности. В качестве примера таких критериев можно назвать критерий Манна-Уитни и критерий Вилкоксона.
Проверка гипотез
Общий обзор
Часто делают выборку, чтобы определить аргументы против гипотезы относительно популяции (генеральной совокупности). Этот процесс известен как проверка гипотез (проверка статистических гипотез или проверка значимости), он представляет количественную меру аргументов против определенной гипотезы.
Установлено 5 стадий при проверке гипотез:
Определение нулевой и альтернативной гипотез, уровня статистической значимости
При проверке значимости гипотезу следует формулировать независимо от используемых при ее проверке данных (до проведения проверки). В таком случае можно получить действительно продуктивный результат.
Всегда проверяют нулевую гипотезу (), которая отвергает эффект (например, разница средних равняется нулю) в популяции.
Например, при сравнении показателей курения у мужчин и женщин в популяции нулевая гипотеза означала бы, что показатели курения одинаковые у женщин и мужчин в популяции.
Затем определяют альтернативную гипотезу (), которая принимается, если нулевая гипотеза неверна. Альтернативная гипотеза больше относится к той теории, которую собираются исследовать. Итак, на этом примере альтернативная гипотеза
заключается в утверждении, что показатели курения различны у женщин и мужчин в популяции.
Разницу в показателях курения не уточнили, т.е. не установили, имеют ли в популяции мужчины более высокие или более низкие показатели, чем женщины. Такой подход известен как двусторонний критерий, потому что учитывают любую возможность, он рекомендуется постольку, поскольку редко есть уверенность заранее в направлении какого-либо различия, если таковое существует.
В некоторых случаях можно использовать односторонний критерий для гипотезы , в котором направление эффекта задано. Его можно применить, например, если рассматривать заболевание, от которого умерли все пациенты, не получившие лечения; новый препарат не мог бы ухудшить положение дел.
Уровень значимости. Важным этапом проверки статистических гипотез является определение уровня статистической значимости , т.е. максимально допускаемой исследователем вероятности ошибочного отклонения нулевой гипотезы.
Получение статистики критерия, определение критической области
После того как данные будут собраны, значения из выборки подставляют в формулу для вычисления статистики критерия (примеры различных статистик критериев см. ниже). Эта величина количественно отражает аргументы в наборе данных против нулевой гипотезы.
Критическая область. Для принятия решения об отклонении или не отклонении нулевой гипотезы необходимо также определить критическую область проверки гипотезы.
Выделяют 3 вида критических областей:
Рис. 1 Двусторонняя критическая область
Рис. 2 Левосторонняя критическая область
Рис. 3 Правосторонняя критическая область
— заданный исследователем уровень значимости.
Для краткости можно записать и так:
| K | 0,05, то аргументов недостаточно, чтобы отвергнуть нулевую гипотезу. Не отвергая нулевую гипотезу, можно заявить, что результаты не значимы на 5% уровне. Данное заключение не означает, что нулевая гипотеза истинна, просто недостаточно аргументов (возможно, маленький объем выборки), чтобы ее отвергнуть.
Уровень значимости (т.е. выбранная «граница отсечки») 5% задается произвольно. На уровне 5% можно отвергнуть нулевую гипотезу, когда она верна. Если это может привести к серьезным последствиям, необходимо потребовать более веских аргументов, прежде чем отвергнуть нулевую гипотезу, например, выбрать значение = 0,01 (или 0,001).
Определение результата только как значимого на определенном уровне граничного значения (например 0, 05) может ввести в заблуждение. Например, если р = 0,04, то нулевую гипотезу отвергаем, но если р = 0,06, то ее не отвергли бы. Действительно ли они различны? Мы рекомендуем всегда указывать точное значение р, обычно получаемое путем компьютерного анализа.
Проверка гипотез против доверительных интервалов
Доверительные интервалы и проверка гипотез тесно связаны. Первоначальная цель проверки гипотезы состоит в том, чтобы принять решение и предоставить точное значение р.
Доверительный интервал (ДИ) количественно определяет изучаемый эффект (например, разницу в средних) и дает возможность оценить значение результатов. ДИ предоставляют интервал вероятных значений для истинного эффекта, поэтому его также можно использовать для принятия решения даже без точных значений р.
Проверка статистических гипотез: основные понятия и примеры
Статистические гипотезы: основные понятия. Шаги проверки гипотез
Например, необходимо выяснить, значительно ли отличается средний объём продаж после проведения рекламной кампании от среднего объёма продаж после проведения рекламной кампании. Если ответ на этот вопрос положителен, то можно сделать вывод о том, что изменения являются результатом рекламной кампании.
Выводы, полученные путём проверки статистических гипотез, носят вероятностный характер: они принимаются с некоторой вероятностью. Статистическая гипотеза может быть также предположением о свойствах двух совокупностей, если, например, в ходе мероприятий имело место воздействие только на одну совокупность и необходимо сделать вывод о том, было ли это воздействие результативным.
Шаги проверки статистических гипотез следующие:
Рассмотрим эти шаги и связанные с ними понятия подробнее.
Статистические гипотезы: основная и альтернативная
Приведём примеры того, как формулируются основная и альтернативная гипотезы.
Пример 1. До и после проведения рекламной кампании были собраны данные о среднем объём продаж.
Основная гипотеза H 0 : средний объём продаж до проведения рекламной кампании незначительно отличается от среднего объёма продаж после проведения рекламной кампании.
Альтернативная гипотеза H 1 : средний объём продаж изменился после проведения рекламной кампании.
Пример 2. После изменения конфигурации компьютерной сети были собраны случайным образом 200 замеров скорости передачи сообщений.
Основная гипотеза H 0 : изменение конфигурации не имело эффекта.
Альтернативная гипотеза H 1 : эффект от изменения статистически значим.
Статистические критерии для проверки гипотез
По значению этой характеристики принимается решение, принимать основную гипотезу или нет. Статистические критерии бывают двух видов:
Свойства статистического критерия:
Уровень значимости α, ошибки первого и второго рода
При проверке гипотезы всегда существует вероятность того, что будет сделано ошибочное заключение. Существуют два рода ошибки.
Со значением уровня значимости связано значение уровня доверия p.
Пример 3. В лаборатории фармацевтического предприятия делается контрольный замер на соответствие контрольного состава лекарственных препаратов стандарту. Какие варианты гипотез могут быть предложены?
В первом случае, принимая во внимание, что вероятность принятия основной гипотезы высока, мы имеем высокий риск нежелательных последствий принятия неверной гипотезы. Во втором случае, даже если мы будем вынуждены принять гипотезу, что лекарственные препараты не соответствуют стандарту, а на самом деле имеет место ошибка второго рода, придётся провести дополнительные контрольные замеры и более тщательно провести анализ химического состава. В любом случае, это повлечёт за собой более тщательный анализ, а риск нежелательных последствий может оказаться не столь значимым.
По причинам, которые мы выяснили в примере 3, статистические гипотезы часто формулируются следующим образом: «статистическая значимость между факторами незначима», «выборки незначимо отличаются по своим свойствам», «фактор не имеет значимого влияния на исследуемый процесс».
Нахождение границ области принятия гипотезы
В случае, если используется односторонний критерий, ОПГ включает в себя подмножество положительных значений критерия. В таком случае у критерия есть только одна критическая область.
В случае, если используется двусторонний критерий, который может принимать как положительные, так и отрицательные значения, у него имеются две критические области: подмножество отрицательных и подмножество положительных значений критерия, при которых гипотеза не может быть принята.
На этом шаге требуется найти такое подмножество значений критерия, к которому значение выбранного критерия будет принадлежать с вероятностью p. Точнее, необходимо найти крайние значения критерия в этом подмножестве.
Поэтому процедура нахождения границ области принятия гипотезы сводится к решению следующей задачи:
вероятность того, что значения критерия принадлежат области принятия гипотезы,
левое и правое критические значения области принятия гипотезы (критические точки).
То есть задача решается путём взятия обратной функции от прямой функции распределения.
Обратным значением функции распределения с аргументом b является такое значение случайной величины a, при котором выполняется следующее условие:
.
В случае с односторонним критерием получаем следующую формулу для нахождения критической точки:
.
Вне зависимости от типа критерия для того, чтобы найти квантили функции распределения, которому подчиняется критерий, необходимо знать параметры этой функции (например, если критерий подчиняется нормальному закону, то его параметрами являются математическое ожидание и стандартное отклонение). Значение параметров оценивается на выборках.
Вывод о принятии или отвержении основной гипотезы
В случае, если значение критерия, найденное на выборочных значениях наблюдений принадлежит области принятия гипотезы, делается вывод о том, что нет возможности отвергнуть основную гипотезу.
В случае, если критерий принадлежит критической области, делается вывод о том, что нет возможности принять основную гипотезу. В таком случае принимается альтернативная гипотеза.
На рисунке ниже синим цветом изображена ось всевозможных значений критерия R, другие обозначения иллюстрируют попадание значения критерия в область принятия гипотезы или критическую область.
Для того, чтобы быть в большей степени уверенности в своих суждениях о верности или неверности гипотезы, предпочитают применять несколько критериев и сравнивать результаты. Если в нескольких случаях критерий не смог попасть в область принятия гипотезы, то говорят, что получили согласованный результат и скорее всего гипотеза является ложной.
Проверка гипотезы о среднем генеральной совокупности
Часто бывает необходимо проверить, значимо ли отличается средний показатель совокупности от некоторого заданного значения, например, стандарта. В этом случае основная и альтернативная гипотезы могут быть записаны так:
;
.
При проверке гипотезы о среднем выборки в качестве статистического критерия часто применяется t-критерий Стьюдента, однако следует помнить, что этот критерий применим лишь тогда, когда данные выборки подчиняются нормальному закону распределения. Критические значения критерия, соответственно выбранному уровню значимости α и степени свободы v можно найти в приложениях книг по статистике, а если гипотеза проверяется с помощью компьютерной программы, например, STATISTICA, то программа выбирает его.
— среднее выборки,
— некоторое заданное среднее значение, например, стандарт,
— критическое значение t-критерия Стьюдента.
Пример 4. Производитель кваса решил выяснить, работает ли устройство заполнения бутылок соответственно стандарту. Основная и альтернативные гипотезы сформулированы так:
Для проверки случайным образом выбрали 20 бутылок, средний незаполненный уровень составил мм, стандартное отклонение
мм.
Получаем фактическое значение статистического критерия:
.
Критическое значение t-критерия Стьюдента:
.
Так как , то есть фактическое значение статистического критерия меньше критического значения, то фактическое значение попадает в область принятия гипотезы. Следовательно, нет возможности отвергнуть основную гипотезу о том, что средний уровень незаполненности бутылки незначимо отличается от 50 мм.
Проверка гипотезы о виде закона распределения выборки
Статистические гипотезы для этой проверки формулируются следующим образом.
Основная гипотеза H 0 : распределение выборки незначимо отличается от предполагаемого (нормальное, экспоненциальное и др.).
Альтернативная гипотеза H 1 : распределение выборки значимо отличается от предполагаемого.
Критерий согласия показывает степень отличия эмпирической функции распределения (то есть значения, полученного из выборки) от гипотетической (теоретической, то есть предполагаемой до наблюдения). Чем меньше значение критерия, тем больше степень похожести эмпирического и теоретического распределений.
Применяются критерий хи-квадрат Пирсона и критерий Колмогорова-Смирнова. Однако существуют ограничения этих критериев. Для критерия хи-квадрат: в каждом интервале должно быть не менее 10 наблюдений. Для критерия Колмогорова-Смирнова: объём выборки должен быть более 50.
Формула оценки значения критерия хи-квадрат Пирсона:
,
Значение критерия Колмогорова-Смирнова рассчитывается следующим образом:
,
— эмпирическая функция распределения,
— теоретическая функция распределения.
Область принятия гипотезы:
,
,
Даже при проверке статистической гипотезы на компьютере область принятия гипотезы в этом случае нужно рассчитывать самостоятельно.
Пример 5. Имеются данные некоторой выборки. Используя критерии хи-квадрат и Колмогорова-Смирнова, при уровне значимости α=0,05 проверить гипотезы о
а) нормальном распределении;
б) равномерном распределении.
Решение.
а) Получены следующие значения критериев:
критерий хи-квадрат: 2,72 (число степеней свободы: 4; границы ОПГ: (0; 5,99));
критерий Колмогорова-Смирнова: 0,08 (границы ОПГ: (0; 0,18)).
Вывод относительно проверяемой гипотезы: с вероятностью 95% принимается основная гипотеза о том, что генеральная совокупность распределена по нормальному закону.
б) Получены следующие значения критериев:
критерий хи-квадрат: 8,45 (число степеней свободы: 3; границы ОПГ: (0; 5,99));
критерий Колмогорова-Смирнова: 0,21 (границы ОПГ: (0; 0,18)).
Вывод относительно проверяемой гипотезы: с вероятностью 95% отвергается основная гипотеза о том, что генеральная совокупность распределена по равномерному закону.
Проверка гипотезы об однородности выборок
Существует два вида гипотез об однородности выборок. Может быть проверена однородность выборок «в слабом»: выборки однородны «в слабом», если незначимо отличаются их параметры, прежде всего, среднее. Может быть проверена однородность выборок «в сильном»: выборки однородны «в сильном», если незначимо отличаются их законы распределения.
С помощью критерия Стьюдента проверяется гипотеза об однородности выборок «в слабом». В этом случае основная гипотеза формулируется следующим образом: математическое ожидание первой выборки незначимо отличается от математического ожидания второй выборки. Формально это записывается так: .
Критерий рассчитывается по формуле:
и
— дисперсии первой и второй выборок;
Критерий может принимать значения от минус бесконечности до плюс бесконечности. Чем ближе значения критерия к нулю, тем больше вероятность, что основная гипотеза будет верной (при этом знак не имеет значения).
При проверке гипотезы об однородности выборок с помощью критерия Стьюдента необходимо помнить, что к выборкам выдвигаются допущение, нарушение которых не позволяет применить критерий:
Пример 6. Имеются данные некоторой выборки. По ним в пакете программных средств STATISTICA вычислены следующие показатели:
Среднее 1-й выборки | Среднее 2-й выборки | t-критерий | Число степеней свободы | p-level |
19,60 | 28,21 | -1,38 | 48 | 0,17 |
Область принятия гипотезы при уровне значимости α = 0,05 : (-2,01; 2,01)
Сделать вывод об однородности выборок.
Значение t-критерия попадает в область принятия гипотезы. Может быть принята основная гипотеза о том, что математическое ожидание первой выборки незначимо отличается от математического ожидания второй выборки. Таким образом, проверена гипотеза об однородности выборок в слабом.
С помощью критерия Колмогорова-Смирнова проверяется гипотеза об однородности выборок «в сильном», то есть о том, что функции распределения выборок незначимо отличаются друг от друга. За основу критерия Колмогорова-Смирнова выступает статистика
—
максимальная по модулю разность между двумя функциями распределения выборок x и y.
Критерий рассчитывается по формуле
Границы области принятия гипотезы определяются следующим образом:
.
Если критерий принадлежит области принятия гипотезы, то при заданном уровне значимости α нет возможности её отвергнуть, следовательно, принимается гипотеза о том, что выборки однородны «в сильном».
Гипотезы об однородности выборок могут быть выдвинуты как в исследованиях поведения человека, так и технических науках.
Пример 7. По данным некоторой выборки получены следующие показатели:
Макс. отриц. разность | Макс. полож. разность | Значение критерия K.S. | p-level |
-0,2 | 0,08 | 0,117 | >10 |
Область принятия гипотезы при уровне значимости α = 0,05 : (0; 0,189)
Сделать вывод об однородности выборок.
Значение критерия попадает в область принятия гипотезы. Следовательно, принимается основная гипотеза о том, что функции распределения двух выборок незначимо отличаются. Таким образом, выборки однородны «в сильном».