Для чего нужен параметр стьюдента

Критерий Фишера и Стьюдента

С помощью критерия Фишера оценивают качество регрессионной модели в целом и по параметрам.

Для этого выполняется сравнение полученного значения F и табличного F значения. F-критерия Фишера. F фактический определяется из отношения значений факторной и остаточной дисперсий, рассчитанных на одну степень свободы:

Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдента

где n — число наблюдений;

m — число параметров при факторе х.

F табличный — это максимальное значение критерия под влиянием случайных факторов при текущих степенях свободы и уровне значимости а.

Уровень значимости а — вероятность не принять гипотезу при условии, что она верна. Как правило а принимается равной 0,05 или 0,01.

Если Fтабл > Fфакт то признается статистическая незначимость модели, ненадежность уравнения регрессии.

Таблицы по нахождению критерия Фишера и Стьюдента

Таблицы значений F-критерия Фишера и t-критерия Стьюдента Вы можете посмотреть здесь.

Табличное значение критерия Фишера вычисляют следующим образом:

Для нахождения табличного значения критерия Стьюдента определяют число степеней свободы, которое определяется по формуле n — m — 1 и находят его значение при определенном уровне значимости (0,10, 0,05, 0,01).

Критерии Стьюдента

Для оценки статистической значимости модели по параметрам рассчитывают t-критерии Стьюдента.

Оценка значимости модели с помощью критерия Стьюдента проводится путем сравнения их значений с величиной случайной ошибки:

Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдента

Случайные ошибки коэффициентов линейной регрессии и коэффициента корреляции определяются по формулам:

Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдента

Сравнивая фактическое и табличное значения t-статистики и принимается или отвергается гипотеза о значимости модели по параметрам.

Зависимость между критерием Фишера и значением t-статистики Стьюдента определяется так

Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдента

Как и в случае с оценкой значимости уравнения модели в целом, модель считается ненадежной если tтабл > tфакт

Видео лекциий по расчету критериев Фишера и Стьюдента

Для более подробного изучения расчетов критериев Фишера и Стьюдента советуем посмотреть это видео

Лекция 1. Критерии и Гипотезы

Лекция 2. Критерии и Гипотезы

Лекция 3. Критерии и Гипотезы

Определение доверительных интервалов

Для построения доверительного интервала определяется предельная ошибка А для обоих показателей:

Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдента

Формулы для нахождения доверительных интервалов выглядят так

Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдента

Прогнозное значение у определяется с помощью подстановки в
уравнение регрессии прогнозного значения х. Вычисляется средняя стандартная ошибка прогноза

Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдента

Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдента

и находится доверительный интервал

Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдента

Задача регрессионного анализа в предмете эконометрика состоит в анализе дисперсии изучаемого показателя y:

Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдента

Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдентаобщая сумма квадратов отклонений (TSS)

Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдентасумма квадратов отклонений, обусловленная регрессией (RSS)

Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдентаостаточная сумма квадратов отклонений (ESS)

Долю дисперсии, обусловленную регрессией, в общей дисперсии показателя у характеризует коэффициент детерминации R, который должен превышать 50% (R 2 > 0,5). В контрольных по эконометрике в ВУЗах этот показатель рассчитывается всегда.

Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдента

Любые задачи по эконометрике решаются здесь

Источник

6.1 Параметрические критерии

В группу параметрических критериев методов математической статистики входят методы для вычисления описательных статистик, построения графиков на нормальность распределения, проверка гипотез о при­надлежности двух выборок одной совокупности. Эти методы основыва­ются на предположении о том, что распределение выборок подчиняется нормальному (гауссовому) закону распределения. Среди параметрических критериев статистики нами будут рассмотрены критерий Стьюдента и Фишера.

6.1.1 Методы проверки выборки на нормальность

Чтобы определить, имеем ли мы дело с нормальным распределением, можно применять следующие методы:

1) в пределах осей можно нарисовать полигон частоты (эмпирическую функцию распределения) и кривую нормального распределения на основе данных исследования. Исследуя формы кривой нормального распределения и графика эмпирической функции распределения, можно выяснить те параметры, которыми последняя кривая отличается от первой;

2) вычисляется среднее, медиана и мода и на основе этого определяется отклонение от нормального распределения. Если мода, медиана и среднее арифметическое друг от друга значительно не отличаются, мы имеем дело с нормальным распределением. Если медиана значительно отличается от среднего, то мы имеем дело с асимметричной выборкой.

3) эксцесс кривой распределения должен быть равен 0. Кривые с положительным эксцессом значительно вертикальнее кривой нормального распределения. Кривые с отрицательным эксцессом являются более покатистыми по сравнению с кривой нормального распределения;

4) после определения среднего значения распределения частоты и стандартного oтклонения находят следующие четыре интервала распределения сравнивают их с действительными данными ряда:

а) Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдента— к интервалу должно относиться около 25% частоты совокупности,

б) Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдента— к интервалу должно относиться около 50% частоты совокупности,

в) Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдента— к интервалу должно относиться около 75% частоты совокупности,

г) Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдента— к интервалу должно относиться около 100% частоты совокупности.

6.1.2 Критерий Стьюдента ( t-критерий)

Критерий позволяет найти вероятность того, что оба средних значения в выборке относятся к одной и той же совокупности. Данный критерий наиболее часто используется для проверки гипотезы: «Средние двух выборок относятся к одной и той же совокупности».

При использовании критерия можно выделить два случая. В первом случае его применяют для проверки гипотезы о равенстве генеральных средних двух неза­висимых, несвязанных выборок (так называемый двухвыборочный t-критерий). В этом случае есть контрольная группа и экспериментальная (опытная) группа, количество испытуемых в группах может быть различно.

Во втором случае, когда одна и та же группа объектов порождает числовой матери­ал для проверки гипотез о средних, используется так называемый парный t-критерий. Выборки при этом называют зависимыми, связанными.

Статистика критерия для случая несвязанных, независимых выборок равна:

Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдента(1)

где Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдента, Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдента— средние арифметические в эксперименталь­ной и контрольной группах,

Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдента— стан­дартная ошибка разности средних арифметических. Находится из формулы:

Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдента, (2)

где n 1 и n 2 соответственно величины первой и второй выборки.

Если n 1= n 2, то стандартная ошибка разности средних арифметических будет считаться по формуле:

Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдента(3)

где n величина выборки.

Подсчет числа степеней свободы осуществля­ется по формуле:

Далее необходимо срав­нить полученное значение t эмп с теоретическим значением t—рас­пределения Стьюдента (см. приложение к учеб­никам статистики). Если t эмп t крит, то гипотеза H 0 принимается, в противном случае нулевая гипотеза отвергается и принимается альтернативная гипотеза.

Таблица 1. Результаты эксперимента

Первая группа (экспериментальная) N 1=11 человек

Вторая группа (контрольная)

12 14 13 16 11 9 13 15 15 18 14

13 9 11 10 7 6 8 10 11

Общее количество членов выборки: n 1=11, n 2=9.

Расчет средних арифметических: Хср=13,636; Y ср=9,444

Стандартное отклонение: s x=2,460; s y =2,186

По формуле (2) рассчитываем стандартную ошибку разности арифметических средних:

Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдента

Считаем статистику критерия:

Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдента

Сравниваем полученное в эксперименте значение t с табличным значением с учетом степеней свободы, равных по формуле (4) числу испытуемых минус два (18).

Табличное значение tкрит равняется 2,1 при допущении возможности риска сделать ошибочное сужде­ние в пяти случаях из ста (уровень значимости=5 % или 0,05).

Если полученное в эксперименте эмпирическое значение t превы­шает табличное, то есть основания принять альтернативную гипотезу (H1) о том, что учащиеся экспериментальной группы показывают в среднем более высокий уровень знаний. В эксперименте t=3,981, табличное t=2,10, 3,981>2,10, откуда следует вывод о преимуществе эксперимен­тального обучения.

Здесь могут возникнуть такие вопросы:

1. Что если полученное в опыте значение t окажется меньше табличного? Тогда надо принять нулевую гипотезу.

2. Доказано ли преимущество экспериментального метода? Не столько доказано, сколько показано, потому что с самого начала допускается риск ошибиться в пяти случаях из ста (р=0,05). Наш эксперимент мог быть одним из этих пяти случаев. Но 95% возможных случаев говорит в пользу альтернативной гипотезы, а это достаточно убедительный аргумент в статистическом доказательстве.

3. Что если в контрольной группе результаты окажутся выше, чем в экспериментальной? Поменяем, например, местами, сделав Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдентасредней арифметической эксперимен­тальной группы, a Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдента— контрольной:

Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдента

Отсюда следует вывод, что новый метод пока не про­явил себя с хорошей стороны по разным, возможно, при­чинам. Поскольку абсолютное значение 3,9811>2,1, принимается вторая альтернативная гипотеза (Н2) о пре­имуществе традиционного метода.

В случае связанных выборок с равным числом измерений в каждой можно использовать более простую формулу t-критерия Стьюдента.

Вычисление значения t осуществляется по формуле:

Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдента(5)

Sd вычисляется по следующей формуле:

Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдента(6)

Если t эмп t крит, то нулевая гипотеза принимается, в противном случае принимается альтернативная.

Пример 2. Изучался уровень ориентации учащихся на художественно-эстети­ческие ценности. С целью активизации формирования этой ориентации в экспериментальной группе проводились бе­седы, выставки детских рисунков, были организованы по­сещения музеев и картинных галерей, проведены встречи с музыкантами, художниками и др. Закономерно встает вопрос: какова эффективность проведенной работы? С целью проверки эффективности этой работы до начала эксперимента и после давался тест. Из методических со­ображений в таблице 2 приводятся результаты небольшо­го числа испытуемых. [2]

Таблица 2. Результаты эксперимента

до начала экспери­мента (Х)

Вначале произведем расчет по формуле:

Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдента

Затем применим формулу (6), получим:

Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдента

И, наконец, следует применить формулу (5). Получим:

Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдента

Число степеней свободы: k =10-1=9 и по таблице При­ложения 1 находим tкрит =2.262, экспериментальное t=6,678, откуда следует возможность принятия альтерна­тивной гипотезы (H1) о достоверных различиях средних арифметических, т. е. делается вывод об эффективности экспериментального воздействия.

6.1.3 F — критерий Фишера

Критерий Фишера позволяет сравнивать величины выбороч­ных дисперсий двух независимых выборок. Для вычисления Fэмп нуж­но найти отношение дисперсий двух выборок, причем так, что­бы большая по величине дисперсия находилась бы в числителе, а меньшая – в знаменателе. Формула вычисления критерия Фи­шера такова:

Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдента(8)

где Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдента— дисперсии первой и второй выборки соответственно.

Так как, согласно условию критерия, величина числителя должна быть больше или равна величине знаменателя, то значе­ние Fэмп всегда будет больше или равно единице.

Чис­ло степеней свободы определяется также просто:

В Приложе­нии 1 критические значения критерия Фишера находятся по величинам k 1 (верхняя строчка таблицы) и k 2 (левый столбец таблицы).

Если t эмп> t крит, то нулевая гипотеза принимается, в противном случае принимается альтернативная.

Пример 3. В двух третьих классах проводилось тестирование умственного развития по тесту ТУРМШ десяти учащихся. [3] Полученные значения величин средних достоверно не различались, однако психолога интересует вопрос — есть ли различия в степени однородности показателей умственного развития между классами.

Решение. Для критерия Фишера необходимо сравнить дис­персии тестовых оценок в обоих классах. Резуль­таты тестирования представлены в таблице:

Рассчитав дисперсии для переменных X и Y, получаем:

Тогда по формуле (8) для расчета по F критерию Фишера находим:

Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдента

6.2 Непараметрические критерии

Сравнивая на глазок (по процентным соотношениям) результаты до и после какого-либо воздействия, исследователь приходит к заключению, что если наблюдаются различия, то имеет место различие в сравниваемых выборках. Подобный подход категорически неприемлем, так как для процентов нельзя определить уровень достоверности в различиях. Проценты, взятые сами по себе, не дают возможности делать статистически достоверные выводы. Чтобы доказать эффективность какого-либо воздействия, необходимо выявить статистически значимую тенденцию в смещении (сдвиге) показателей. Для решения подобных задач исследователь может использовать ряд критериев различия. Ниже будет рассмотрены непараметрические критерии: критерий знаков и критерий хи-квадрат.

6.2.1 Критерий знаков ( G-критерий)

Критерий предназначен для срав­нения состояния некоторого свойства у членов двух зави­симых выборок на основе измерений, сделанных по шка­ле не ниже ранговой.

Нулевая гипотеза формулируются следующим обра­зом: в состоянии изучаемого свойства нет значимых различий при первичном и вторичном измерениях. Альтернативная гипотеза: законы распределения величин X и У различны, т. е. состояния изучаемого свойства существенно раз­личны в одной и той же совокупности при первичном и вторичном измерениях этого свойства.

Ста­тистика критерия (Т) определяется следую­щим образом:

Пример 4. Учащиеся выполняли контрольную ра­боту, направленную на проверку усвоения некоторого понятия. Пятнадцати учащимся затем предложили электронное пособие, составленное с целью фор­мирования данного понятия у учащихся с низким уров­нем обучаемости. После изучения пособия учащиеся снова выполняли ту же контрольного работу, которая оценивалась по пятибалльной системе.

Результаты двукратного выполнения ра­боты представляют измерения по шкале по­рядка (пятибалльная шкала). В этих условиях возмож­но применение знакового критерия для выявления тенденции изменения состояния знаний учащихся после изучения пособия, так как выполняются все допуще­ния этого критерия.

Результаты двукратного выполнения работы (в бал­лах) 15 учащимися запишем в форме таблицы (см. табл. 1). [4]

Источник

Основные статистические критерии. t-критерий Стьюдента

В целях проведения качественного исследования и получения достоверных результатов для дальнейшего анализа и принятия окончательного решения используют различные способы, методы и инструменты. Порой бывает неважно, в какой научной области или отрасли действует автор. Важно лишь грамотно подобрать и использовать необходимые критерии. Одними из таких универсальных параметров являются так называемые статистические критерии, среди которых особое внимание следует уделить t-критерию Стьюдента.

Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдента

В целях проведения качественного исследования и получения достоверных результатов для дальнейшего анализа и принятия окончательного решения используют различные способы, методы и инструменты. Порой бывает неважно, в какой научной области или отрасли действует автор. Важно лишь грамотно подобрать и использовать необходимые критерии. Одними из таких универсальных параметров являются так называемые статистические критерии, среди которых особое внимание следует уделить t-критерию Стьюдента.

Что это такое?

Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдентаЭтапы проведения исследования

t-критерий Стьюдента – это статистический метод исследования, позволяющий производить сравнение параметров из двух разных выборок, областей. По результатам такого анализа исследователь может делать вывод о сходстве или различии анализируемых объектов. Данный метод успешно используется как в повседневной жизни, так и в различных областях науки (психология, математика, экономика и пр.) и отраслях.

t-критерий Стьюдента чаще всего используется в целях установления взаимосвязи между элементами разных групп. Например, исследователь может анализировать поведение и состояние пациентов с хроническим заболеванием (например, сахарный диабет второго типа) и здоровых людей или имеющих сахарный диабет первого типа и пр.

Нужна помощь преподавателя?

Мы всегда рады Вам помочь!

Этапы применения t-критерия Стьюдента

При использовании t-критерия Стьюдента важно, чтобы объекты исследования или анализируемые выборки были распределены равномерно и имели хотя бы минимальное взаимодействие: относились к одной и той же среде, выполняли одно и то же задание и пр. Данное правило называется принципом нормального распределения, когда изучаемые явления/процессы:

t-критерий Стьюдента лучше всего использовать в случаях, когда известны средние значения выборки. Например, эксперт намерен проанализировать средний возраст жителей Сибири и средний возраст россиян по стране. При использовании указанной статистической методики он сможет проверить гипотезу: продолжительность жизни в Сибири дольше, чем в среднем по стране. Для этого достаточно сравнить средние показатели по указанному региону и России. Если отклонений в возрасте не будет, то гипотеза считается верной. Если же будет выявлено некое различие, то важно рассчитать это отклонение.

Схема применения t-критерия Стьюдента выглядит следующим образом:

Чаще всего сравнивают средние показатели конкретного явления, процесса и пр. Для расчета этого критерия можно воспользоваться следующей формулой:

Как используется t-критерий Стьюдента в разных областях науки?

t-критерий Стьюдента – универсальное средство для анализа ситуации, позволяющее установить наличие связей между разными группами элементов. В частности, он успешно применяется в психологии и медицине при проведении различных экспериментов и наблюдений. Исследователи могут сравнивать две группы людей с одним и тем же заболеванием на разных стадиях. Например, первая группа – лица с первичным инсультом, вторая группа – лица со вторичным (неоднократным) инсультом. Гипотеза может быть любой: продолжительность жизни и после первичного инсульта выше чем после вторичного или физическая активность лиц с первичным заболеванием лучше, чем со вторичным и пр.

Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдентаПрименение t-критерия Стьюдента в различных науках

Также t-критерий Стьюдента часто используется в экономике, когда требуется апробировать полученные исследователем результаты. Например, он может сравнивать показатели разных лет, выявлять их динамику и прогнозировать дальнейшее развитие событий (этих же показателей). Здесь автор эксперимента выдвигает гипотезу: анализируемые показатели увеличатся или наоборот уменьшатся.

Ярким примером применения t-критерия Стьюдента является следующая ситуация:

Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдентаРешение ситуации с помощью t-критерия Стьюдента

Трудности с учебой?

Помощь в написании студенческих и
аспирантских работ!

Источник

Когда и как применять Критерий Стьюдента (t-test), проверка нормальности данных в среде R

Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдента

Наступила осень, а значит, настало время для запуска нового тематического проекта «Статистический анализ с R». В нем мы рассмотрим статистические методы с точки зрения их применения на практике: узнаем какие методы существуют, в каких случаях и каким образом их проводить в среде R. На мой взгляд, Критерий Стьюдента или t-тест (от англ. t-test) идеально подходит в качестве введения в мир статистического анализа. Тест Стьюдента достаточно прост и показателен, а также требует минимум базовых знаний в статистике, с которыми читатель может ознакомиться в ходе прочтения этой статьи.

Примечание_1: здесь и в других статьях Вы не увидите формул и математических объяснений, т.к. информация рассчитана на студентов естественных и гуманитарных специальностей, которые делают лишь первые шаги в стат. анализе.

Примечание_2: перед прочтением, я рекомендую ознакомиться с этой статьей, чтобы вспомнить базовые понятия описательной статистики, такие как медиана, стандартное отклонение, квантили и прочее.

Что такое t-тест и в каких случаях его стоит применять

В начале следует сказать, что в статистике зачастую действует принцип бритвы Оккамы, который гласит, что нет смысла проводить сложный статистический анализ, если можно применить более простой (не стоит резать хлеб бензопилой, если есть нож). Именно поэтому, несмотря на свою простоту, t-тест является серьезным инструментом, если знать что он из себя представляет и в каких случаях его стоит применять.

Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдента

Нормальное распределение данных и методы его оценки qqplot и shapiro.test

Нормальное распределение данных характерно для количественных данных, на распределение которых влияет множество факторов, либо оно случайно. Нормальное распределение характеризуется несколькими особенностями:

Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдента

Давайте создадим случайную выборку с нормальным распределением на языке программирования R, где общее количество измерений = 100, среднее арифметическое = 5, а стандартное отклонение = 1. Затем отобразим его на графике в виде гистограммы:

Ваш график может слегка отличаться от моего, так как числа сгенерированы случайным образом. Как Вы видите, данные не идеально симметричны, но кажется сохраняют форму нормального распределения. Однако, мы воспользуемся более объективными методами определения нормальности данных.

Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдента

Одним из наиболее простых тестов нормальности является график квантилей (qqplot). Суть теста проста: если данные имеют нормальное распределение, то они не должны сильно отклоняться от линии теоретических квантилей и выходить за пределы доверительных интервалов. Давайте проделаем этот тест в R.

Как видно из графика, наши данные не имеют серьезных отклонений от теоретического нормального распределения. Но порой при помощи qqplot невозможно дать однозначный ответ. В этом случае следует использовать тест Шапиро-Уилка, который основан на нулевой гипотезе, что наши данные распределены нормально. Если же P-значение менее 0.05 (p-value Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдента

Провести тест Шапиро-Уилка в R не составит труда. Для этого нужно всего лишь вызвать функцию shapiro.test, и в скобках вставить имя ваших данных. В нашем случае p-value должен быть значительно больше 0.05, что не позволяет отвергнуть нулевую гипотезу о том, что наши данные распределены нормально.

Запускаем t-тест Стьюдента в среде R

Итак, если данные из выборок имеют нормальное распределение, можно смело приступать к сравнению средних этих выборок. Существует три основных типа t-теста, которые применяются в различных ситуациях. Рассмотрим каждый из них с использованием наглядных примеров.

Одновыборочный критерий Стьюдента (one-sample t-test)

Одновыборочный t-тест следует выбирать, если Вы сравниваете выборку с общеизвестным средним. Например, отличается ли средний возраст жителей Северо-Кавказского Федерального округа от общего по России. Существует мнение, что климат Кавказа и культурные особенности населяющих его народов способствуют продлению жизни. Для того, чтобы проверить эту гипотезу, мы возьмем данные РосСтата (таблицы среднего ожидаемого продолжительности жизни по регионам России) и применим одновыборочный критерий Стьюдента. Так как критерий Стьюдента основан на проверке статистических гипотез, то за нулевую гипотезу будем принимать то, что различий между средним ожидаемым уровнем продолжительности по России и республикам Северного Кавказа нет. Если различия существуют, то для того, чтобы считать их статистически значимыми p-value должно быть менее 0.05 (логика та же, что и в вышеописанном тесте Шапиро-Уилка).

Загрузим данные в R. Для этого, создадим вектор со средними значениями по республикам Кавказа (включая Адыгею). Затем, запустим одновыборочный t-тест, указав в параметре mu среднее значение ожидаемого возраста жизни по России равное 70.93.

Несмотря на то, что у нас всего 7 точек в выборке, в целом они проходят тесты нормальности и мы можем на них полагаться, так как эти данные уже были усреднены по региону.

Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдента

Загрузим данные в среду R. Кроме проверки нормальности данных, будет полезно построить «график с усами», на котором можно видеть медианы и разброс данных для обеих выборок.

Как видно из графика, медианы выборок не сильно отличаются друг от друга, однако разброс данных гораздо сильнее на севере. Проверим отличаются ли статистически средние значения при помощи функции t.test. Однако в этот раз на место параметра mu мы ставим имя второй выборки. Результаты теста, которые Вы видите на рисунке снизу, говорят о том, что средняя урожайность картофеля на севере статистически не отличается от урожайности на юге (p = 0.6339).

Для чего нужен параметр стьюдента. Смотреть фото Для чего нужен параметр стьюдента. Смотреть картинку Для чего нужен параметр стьюдента. Картинка про Для чего нужен параметр стьюдента. Фото Для чего нужен параметр стьюдента

Двувыборочный для зависимых выборок ( dependent two-sample t-test )

Заключение

Статья получилась довольно длинной, зато теперь Вы знаете: что такое критерий Стьюдента и нормальное распределение; как при помощи функций qqplot и shapiro.test проверять нормальность данных в R; а также разобрали три типа t-тестов и провели их в среде R.

Сравнение двух средних в Excel — на http://arhiuch.ru/lab20.html

Здравствуйте! Благодарю за подробное пояснение по теме t-критерия. Пытаюсь провести сравнительный анализ в своей магистерской диссертации по двум независимым выборкам. Шкал у меня несколько. В результате анализа с помощью программы SPSS какие-то значения по критерию равенства дисперсий Ливиня оказались меньше 0,05. Насколько я понимаю, использование t-критерия в этом случае будет неправомерным. Что посоветуете в этом случае?

Здравствуйте! Спасибо за Ваш комментарий. К сожалению, ни с SPSS, ни с критерием Ливиня мне не доводилось работать, поэтому помочь не в силах.

Добрый день, извините, что не по теме. Пишу дипломную работу и мне нужно оценить 2 уравнения методом максимального правдоподобия в R. Нигде не могу найти про это в интернете.Вы не знаете как это можно сделать?

Здравствуйте, Ганс!
Да, профиль действительно не мой, поэтому вряд ли могу помочь. Однако, посмотрите вот эту статью про R пакет «systemfit»: https://cran.r-project.org/web/packages/systemfit/vignettes/systemfit.pdf

Здравствуйте, Айгуль!
Вот функция, которую Вы ищете: https://www.math.ucla.edu/

Здравствуйте! Подскажите какой (и как) построить график чтобы охарактеризовать характер отличий некоторых показателей в группе за полом? Результаты по критерию Т-Стьюдента. спасибо)

Здравствуйте, Богдана!
Надо построить так называемый «ящик с усами», по-английски — boxplot.
Для этого запустите команду boxplot внутри которой сравниваемые Вами колонки с данными:
boxplot(Column_1, Column_2)
В легенде также обычно указывают значение p-valueю
Если не сможете сами разобраться, кидайте на яндекс диск свой файл, я Вам покажу решение.

Здравствуйте, спасибо за статью. У меня есть некоторые вопросы по поводу проверки на нормальность. Можно ли принять нормальность данных на основе только графического анализа? У меня получилось так, что графически данные выглядят как нормальные (идеальная колоколообразная плотность и прямая квантилей), но формальные тесты показывают, что данные ненормальные (за исключением почему-то теста Пирсона).
https://yadi.sk/i/oS2f7XY8edU_Ng — вот данные, проверял первый столбик с объемом легких (LungCap). По логике вещей, они и должны быть нормальными, в основном физические хар-ки людей, такие как рост, вес и т.д. ведь распределены нормально.

Спасибо за интересный вопрос. Я с Вами абсолютно согласен: как мы и ожидаем в данном случае распределение Ваших данных близко к нормальному (что хорошо видно и на гистограмме, и на QQ plot). Игнорируйте Shapiro и спокойно используйте параметрические методы (например, t-test).

Shapiro test имеет ряд ограничений, одно из которых — его ненадежность при работе с относительно большими выборками. В этом случае малейшее отклонение от нормального распределения ведет к крайне малому значению p-value. По этой причине, рекомендуется прежде всего полагаться на QQ plot, подобнее об этом можете почитать здесь (там описан практически Ваш случай): https://stats.stackexchange.com/questions/284033/qq-plot-looks-normal-but-shapiro-wilk-test-says-otherwise/284035

«Результаты t-теста говорят о том, что средняя ожидаемая продолжительность жизни у жителей Северного Кавказа (74.6 лет) действительно выше, чем в среднем по России (70.93 лет), а результаты теста являются статистически значимыми (p ↓

Здравствуйте, Виталий!
Спасибо, что сообщили. Очепятка исправлена:-)

Добрый вечер! Как Вы доступно и легко объясняете!Спасибо!
Что Вы можете рассказать о тесте Колмогорова-Смирнова, тест пропорций и биноминальном тесте? в каких случаях их лучше использовать?

Вам спасибо, что читаете этот блог! Я думаю написать о некоторых из этих тестов в Августе-Сентябре этого года. Пока работаю над другими статьями (про R пакеты).

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *