Student’s t-test 是由William Sealy Gosset 于1908年发表的统计检验方法,是我们通常所说的t-test,常用于检验样本的均值。
- 单样本时,检验样本均值是否等于某一数值;
- 双样本时,检验两个样本的均值是否相等。
Student’s t-test的使用前提是
- 两个样本均来自正态总体,
- 两个样本的方差需相等(即方差齐性)。
- 对于第一个条件,可以用一些test来检验其正态性,比如Shapiro-Wilk test,Kolmogorov-Smirnov test,或者用Q-Q plot;
- 而方差齐性可通过F-test, Levene’s test, Bartlett’s test 等来检验。
T-test的应用
- paired-sample:检验配对的样本之间的均值差异。比如对于同一组样本的两次测量结果之间的比较;又比如临床试验中两组年龄和性别上matched 样本。
- independent sample:表示随机的两个样本之间的均值检验。比如检验两个班的月考数学成绩。
R语言实现t-test检验
函数:t.test(x, y = NULL, alternative = c(“two.sided”, “less”, “greater”), mu = 0, paired = FALSE, var.equal = FALSE, conf.level = 0.95, …)
部分参数说明: x, y: 我们这里主要讲two-sample 检验,所以x和y两个向量都需要提供,表示两个不同的样本。 alternative: 选择时单侧检验还是双侧检验; mu: 单样本检验的时候用的参数; paired: 是否为配对样本检验; var.equal: 这个参数选择是否样本方差一样,默认是方差不一样,这时候底层实现使用的welch’s t-test;如果方差一样,选择TRUE,则底层实现使用的是student’s t-test。
使用Student’s t-test需要注意的地方 (t-test的缺点):
使用t-test,还需要考虑 两个样本的大小,以及两个样本量是否相等的问题。
- paired-sample,两个样本量自然是相等的。
- independent sample 的检验:对于equal-size 的两个样本的t-test ,不管是方差齐或不齐,都能得到非常robust的结果;而unequal-size的两个样本就不能确定了。这表明当样本量一样时,t-test对于方差并不敏感;反之,当样本量大小不等时,使用t-test就不安全了。而当两个样本并非来自正态总体时,不管是sample-size相等或是不等,结果也都不太好。 这表明,t-test对于正态性比较敏感。