3. H0: выборка происходит из нормально
распределенной генеральной совокупности
со средним значением µ0 :
00 : H
Author: Sergey Mastitsky
4. xS
x
t 0
• Если t попадает за пределы области принятия, H0 отклоняется
• Тождественно: рассчитывается вероятность получить наблюдаемое (или
более высокое) значение t при верной H0. При P < 0.05, H0 отклоняется
Author: Sergey Mastitsky
8. H0: обе выборки происходят из одной и
той же генеральной совокупности:
210 : H
Author: Sergey Mastitsky
9. Если t оказывается за пределами области принятия, H0
отклоняется
Тождественно: рассчитывается вероятность получить
наблюдаемое (или более высокое) значение t при
верной H0. При P < 0.05, H0 отклоняется
2121
21
,21
xxxx
xx
SSSгде
S
xx
t
Только если дисперсии не различаются.
Иначе используется тест Уэлча
Author: Sergey Mastitsky
10. # Наборы данных из книги Peter Dalgaard
(2008):
> library(ISwR)
# Дневной расход энергии у женщин с
избыточным и недостаточным весом:
> data(energy)
> attach(energy)
> energy
Author: Sergey Mastitsky
14. При сравнении двух средних R автоматически
выполняет тест Уэлча. Мы можем легко
проверить необходимо ли это, сравнив групповые
дисперсии:
> var.test(expend ~ stature)
Author: Sergey Mastitsky
15. Чувствителен к отклонениям от
нормального распределения
Неприменим к зависимым выборкам
Author: Sergey Mastitsky
16. 6.4. Формальные методы
проверки нормальности
распределения
Подробнее см.:
http://r-analytics.blogspot.de/2012/06/blog-post_14.html
21. t-тест довольно устойчив к небольшим
отклонениям от условия нормальности
Однако часто при работе с биологическими
данными отклонения будут слишком большими
=> следует использовать непараметрический
аналог, ранговый критерий Уилкоксона
Author: Sergey Mastitsky
22. # Суточное потребление энергии у женщин:
> wilcox.test(d.intake, mu = 7725)
Author: Sergey Mastitsky
23. # Сравнение расхода энергии у женщин с
избыточным и недостаточным весом:
> wilcox.test(expend ~ stature)
Author: Sergey Mastitsky
24. При числе наблюдений <6 тест просто по
определению не может быть значимым на
уровне 5%
Тест также чувствителен к наличию значений
с одинаковыми рангами – в этих случаях
точные значения P вычислить невозможно (но
это не является проблемой при больших
выборках)
Author: Sergey Mastitsky
26. Наблюдения выполняются
на одних и тех же
экспериментальных
единицах
Рассчитываются
индивидуальные разницы,
которые потом
усредняются и
сравниваются с ожидаемой
средней разницей
До После
Author: Sergey Mastitsky
27. > library(ISwR)
# Потребление энергии у женщин в пред- и
пост-менструальный период
> data(intake)
> intake
pre post
1 5260 3910
2 5470 4220
3 5640 3885
...
Author: Sergey Mastitsky
32. Предположим, мы исследовали 2
популяции некоторого вида моллюсков
В популяции 1, 24 из 158 (15.2%) моллюсков
оказались заражены паразитами
В популяции 2, зараженными были 15 из 165
(9.1%) моллюсков
Насколько существенны различия между
этими двумя популяциями по уровню
зараженности?
Author: Sergey Mastitsky
33. # Данные должны быть представлены в виде двух
векторов
# Один вектор содержит число “успешных
испытаний”:
> infected <- c(24, 15)
# Второй – общее число “испытаний” :
> examined <- c(158, 165)
Author: Sergey Mastitsky
35. Две (или более) пропорции можно также
сравнить при помощи критерия хи-квадрат:
chisq.test()
Данные должны быть представлены в виде
таблицы сопряженности 2x2
E
EO 2
2 )(
Author: Sergey Mastitsky
38. Когда ожидаемые частоты ≤5, критерий хи-
квадрат неприменим
В таких случаях следует использовать
точный критерий Фишера
Предположим, что данные по моллюскам
выглядели так:
> infected <- c(1, 9)
> examined <- c(9, 14)
Author: Sergey Mastitsky