Формула для расчета t-критерия Стьюдента при сравнении относительных величин (например, процентов или долей) зависит от того, являются ли эти величины:
Независимыми: Относительные величины из разных, не связанных между собой групп. Зависимыми (парными): Относительные величины, измеренные в одних и тех же объектах (например, до и после воздействия).
A. Независимые Относительные Величины
Для сравнения двух независимых относительных величин часто используют t-критерий Стьюдента для независимых выборок, но с модификациями, учитывающими, что мы имеем дело с долями/процентами. Вот формула:
T = (p1 — p2) / sqrt(p(1-p)(1/n1 + 1/n2))
Где:
- p1 — относительная величина (доля/процент) в первой группе p2 — относительная величина (доля/процент) во второй группе n1 — размер выборки первой группы n2 — размер выборки второй группы p — общая относительная величина (общая доля/процент) для обеих групп, рассчитывается как:
· p = (x1 + x2) / (n1 + n2)
Где:
- x1 — количество “успехов” (событий) в первой группе (т. е., x1 = p1 * n1) x2 — количество “успехов” (событий) во второй группе (т. е., x2 = p2 * n2)
sqrt() — квадратный корень
Степени свободы (df):
Для этого случая степени свободы рассчитываются как:
Df = n1 + n2 — 2
Условия Применимости:
Эта формула является приближенной и работает хорошо, если выполнены следующие условия:
- Размеры выборок (n1 и n2) достаточно велики (обычно > 30). Относительные величины не слишком близки к 0 или 1 (или 0% и 100%). Часто рекомендуется, чтобы n1 * p1, n1 * (1 — p1), n2 * p2 и n2 * (1 — p2) были больше 5 или 10.
Альтернативные методы (если условия не выполняются):
- Z-критерий для пропорций: При больших выборках можно использовать Z-критерий для сравнения пропорций, который является асимптотически эквивалентным t-критерию при больших степенях свободы. Точный критерий Фишера (Fisher’s Exact Test): Для малых выборок или когда условия для t-критерия или Z-критерия не выполняются, следует использовать точный критерий Фишера. Коррекция Йейтса (Yates’ correction for continuity): В некоторых случаях рекомендуется применять коррекцию Йейтса для непрерывности, особенно при небольших выборках, чтобы уменьшить ошибку, связанную с аппроксимацией дискретных данных непрерывным распределением.
B. Зависимые (Парные) Относительные Величины
Если относительные величины являются зависимыми (например, измерены до и после воздействия на одних и тех же объектах), используется парный t-критерий. В этом случае, вы работаете с Разностями между относительными величинами для каждой пары.
Рассчитайте разность (d) для каждой пары: d = p_после — p_до (или наоборот, главное — последовательность). Рассчитайте среднюю разность (d̄): d̄ = (Σ d) / n, где n — количество пар. Рассчитайте стандартное отклонение разностей (sd):
4. sd = sqrt(Σ (d — d̄)^2 / (n — 1))
Рассчитайте t-критерий:
6. t = d̄ / (sd / sqrt(n))
Степени свободы (df):
Для парного t-критерия степени свободы рассчитываются как:
Df = n — 1
В обеих ситуациях (независимые и зависимые величины):
- После расчета t-критерия и определения степеней свободы, необходимо сравнить полученное значение t с критическим значением t-распределения (из таблицы или с помощью статистического программного обеспечения) для заданного уровня значимости (alpha, обычно 0.05) и количества степеней свободы. Если абсолютное значение t-критерия превышает критическое значение, то разница между относительными величинами считается статистически значимой.
Важно!
- Выбор правильной формулы зависит от типа данных (независимые или зависимые) и от выполнения условий применимости. Всегда проверяйте предположения, лежащие в основе t-критерия (нормальность распределения, равенство дисперсий, если применимо) или используйте непараметрические альтернативы, если предположения не выполняются. Для сравнения долей, часто используют непараметрические критерии, такие как критерий хи-квадрат (chi-squared test) или точный критерий Фишера. Используйте статистическое программное обеспечение (например, R, Python, SPSS) для выполнения расчетов и проверки статистической значимости. Это поможет избежать ошибок и предоставит более точные результаты.