t-тесты и значения p
Примечание: в этом видео опущена часть определения p-значения, которую необходимо рассмотреть после просмотра этого видео. P-значение — это вероятность, которую нулевая гипотеза присваивает вашему наблюдаемому различию *или более экстремальным различиям*. Например, предположим, что средний рост в данной стране составляет 1,7 метра. Вы задаётесь вопросом, является ли какая-либо субпопуляция в определённом географическом регионе более высокой. Итак, вы используете нулевую гипотезу H0: средний рост = 1,7 метра. Вы составляете случайную выборку и измеряете выборочное среднее значение x = 1,9 метра. Вы вычисляете p-значение p = 0,04, что означает, что существует 4%-ная вероятность, согласно нулевой гипотезе, измерить разницу в 0,2 метра *или больше*. Символически мы представляем это как P(X ≥ x | H0), где X — измеряемая выборочная статистика (средний рост), x — фактическое значение, полученное вами в конкретной выборке, а «|» означает «при условии», а H0 — это нулевая гипотеза. В целом, последняя часть означает «при условии, что мы предполагаем, что нулевая гипотеза верна». Введение: что такое p-значение? Это не вероятность того, что альтернативная гипотеза верна. Это также не вероятность того, что нулевая гипотеза верна. P-значение показывает, насколько вероятно, согласно нулевой гипотезе, ваши ДАННЫЕ (или более экстремальные данные). Если p-значение меньше 0,05, то единственный способ, которым нулевая гипотеза может объяснить ваш набор данных, — это назвать это невероятно редкой статистической флуктуацией. В таких обстоятельствах мы решаем, что нулевая гипотеза — неверное предположение, и отвергаем её. Вместо этого мы приходим к выводу, что наблюдаемое различие в выборке должно объясняться чем-то другим (истинным различием в генеральной совокупности в целом). После просмотра этого видео есть ещё несколько вещей для изучения: Гипотетическое нулевое значение не всегда равно 0, как показано в примере выше. t-критерий может быть односторонним (где рассматриваются только наиболее экстремальные различия на той же стороне распределения, что и наблюдаемая разница) или двусторонним (где рассматриваются наиболее экстремальные различия на обеих сторонах распределения как наблюдаемая разница). [Для студентов магистратуры по статистике:] вы узнаете, что можно выдвинуть простую нулевую гипотезу, основанную на одном значении из пространства параметров (например, H0: µ = 1,7 метра), или сложную нулевую гипотезу (например, H0: µ ≤ 1,7 метра).