michael 2007-9-4 12:01
【转】一些小故事,由t值和p值想到的
回帖过程中,想起一个我自己关于t值(这里就以t检验为例吧)和p值的学习过程,抛个砖头,希望能引起大家的思考。
uN)PS3cL
3f{Gs1q&Wm
大学刚开始学习统计课程时,接受的是中文教材中列出的检验步骤,确定显著性水平,确定t界值,然后用样本t值比较t界值是一个标准的过程,这个时候接触到的还有查表啊,等等一系列前信息时代的操作。到了大三,系里一位水平颇佳的女老师上非参数统计,上来就是“你们老看什么t值啊,为什么不看p值?”,从此第一次听到了p值这个说法。也开始理解t值和p值的等价性,以及判别条件“t值vs. t界值”和“p值vs. 显著性水平”的等价性。但是我当时有一个疑惑,既然统计等价,为什么老师推荐p值呢?可惜她卖了关子,我们就似懂非懂的问道“老师,考试会考这个吗”,呵呵,大学时代啊
JNwP&P0m'}Y
v({
0yPNY Si?
后来知道的东西多了一些,尤其是研究生阶段,偶然会听到一些大统计学家八卦,往往收益匪浅。也开始明白Neyman和Pearson的时代,发明了检验方法后,用t值和t界值比较是一个自然的做法,20世纪初的光景啊,能给出t分布表就不错了,p值是一个仅仅存在于理论的概率罢了。后来,就是大家都知道的,随便一个统计软件,哗啦什么都给输出来了,p值往往也是一目了然。
/iN$nw N L
i#Xr&]Kw
后来有位来自加州Davis老师给MBA上统计,这位老师在商学院中10年有9年拿了年度最佳老师(打败了finance,marketing....),据说把商务统计学教得出神入化,要求学生写得统计分析报告是给家中姥姥都看得懂的,我不知道姥姥是不是看得懂,我是助教,我判final report时常拍案叫绝。第一堂课上,他谈p值,之前谈了一堆祖母做蛋糕如何控制时间的时候,谈到……这个p值可以理解为你下结论的风险。我受过精算学训练,知道什么是风险,可是突然听到这么个词语,有些发闷。有意思的是,当时课堂上做着另外一位当今的大统计学家,时序领域,英国来的。他是路过,来听听。后来我问他,这个解释如何?他说“某种程度上可以这么理解”,我并不知道“哪些情况下不可以这么理解”,但是我喜欢上这个解释。之后,无论是我给咨询师做咨询,还是自己带项目给乙方做解释,还是和其他各个专业的人合作学术论文讨论问题,我都喜欢这么解释我的检验。这个不一定严格,但是make sense,容易理解。大家觉得呢?
*k S
D(D
|c6UO z
H+L uB(B|E'd
这两年看学术文章,尤其是JF,JFQA,JFE等上顶级的金融学术文章,感觉早二十年大家喜欢报告统计量和2倍标准差,近些年的文章,尤其是样本量较小,都是直接报告p值,一目了然。