◇◇新语丝(www.xys.org)(xys7.dxiong.com)(xys.ebookdiy.com)(xys2.dropin.org)◇◇   从“小崔考察转基因”谈统计学的重要性   作者:种田农民   崔永元先生自称耗费百万巨资赴美调查转基因,精神可嘉,值得学习,在两 会前夕公开其调查视频,成功引起关注,也值得我们非专业的科普人士学习。今 天才有空完整看完了其发布的调查视频。此前有多为专家和网友对调查存在的问 题和错误发表了全面的评论,我不再累述,但有一个问题却值得讨论。科学调查 中如何正确使用统计学方法和手段?   几乎每个问题,不管是科学还是社会问题或者任何问题,你总能找到支持者 或者反对者。因此如果要通过调查的方法来回答一个问题“是”或者“否”,需 要遵循以下几个原则:   1)样本要足够大。如果一个班级有60人,随机调查了30个人,15个男生, 15个女生,发现女生的身高平均比男生的高,于是得出结论,这个班女生身高比 男生身高高,这个推论是合适的。但显然不能推而广之,全校或者全国的女生都 比男生高。因为相对于60人的班级,30人的样本足够大了。但对于有几万人,或 者几千万人的群体,30人的样本是远远不够的。崔永元的调查就犯了这个错误, 对于一个涉及超大群体的议题,通过有限对象的采访,就得出倾向性的结论。当 然崔永元也可以反问,对于这样一个涉及面广的议题,谁也无法完成这么大的抽 样,但你可以参考专业机构的调查结果啊。而不能固执的坚持自己所见才为真, 其它的所有数据都是利益集团提供的不可信。比如加州的公投连转基因的标识都 否决了,你能说这个州大部分人反转?   2)抽样要有代表性。还以上边的身高为例,假定我要了解某学校男生和女 生身高的差别,抽样调查10%,学校一共300人,我仍然需要调查30人,但你不能 30人全部从一年级的学生中抽取,而要根据每个年级学生人数的多少等比例分布, 结果才比较可靠。对这个转基因调查而言也一样,显然谁也无法调查采访完所有 的人,但应该做到采访对象的代表性。崔永元调查报告给人的“感觉”是调查对 象很有代表性,有科学家,农场主,政府官员和超市随机的顾客。但这些特定对 象,正如方舟子在他的文章中批驳的一样是精心挑选的倾向性访问对象。比如有 机食品消费只占了美国消费市场的2-4%,这个数字是公开可查的,这个市场的消 费者反对转基因也是显而易见的,可以挑选有机市场的顾客问他们对转基因的态 度,但这个群体显然不能代表所有普通消费者群体。崔永元调查视频中的反对转 基因的采访对象,要么是有机市场的顾客,要么是反转的NGO组织代表,要么并 非专业的退休研究人员,在统计学上可以说抽样缺乏代表性。同时在这样一个科 学的议题上,一个普通民众的观点和一个主流科学家的观点份量是不一样的,从 逻辑上,首先要了解主流科学团体的官方意见,然后听取主流科学家的意见,美 国科学院毫无疑问是主流科学团体,他们对转基因有明确的官方意见,在这个团 体里,农学和医学学部的专家的意见相对于其它学部专家的意见而言也更加可信。 最近几天,正巧美国科学院院士Ronald Phillips先生来我实验室访问,他担任 过美国科学院植物、土壤和微生物学部的主席,相信生物技术是第二次绿色革命 的关键技术,我也有机会向他详细了解了美国科学院相关政策和决定出台的严谨 过程。崔永元先生在这个问题借反转对象的嘴质疑主流科学团体的结论,是为了 迎合部分民众不应迷信科学权威的高大上需求。   3)统计分析的相关性需要多证据支持。相关分析在研究中被普遍使用,对 结果的解读需要一般民众都缺乏的专业背景知识。事实上我们很容易找到没有任 何逻辑联系的两组数据的相关性,任何严谨研究不会仅仅根据这种相关性而做出 任何结论。崔永元重点推崇的退休教授南希的分析事实上就是统计学上的笑话和 中国之前媒体上炒作的转基因的种植导致中国癌症增加的笑话一样,都是缺乏统 计学常识的体现。先不说草甘膦的使用和要讨论的转基因关系到底有多大。就事 论事,草甘膦使用的增加与各种疾病的发生显著正相关,所以推导出草甘膦导致 这些疾病。如果这种逻辑管用,我们很容易算出,GDP的增加是疾病发生的罪魁 祸首;很多人每天早晨醒了推开窗户开见太阳升起,所以太阳每天升起和很多人 早起床显著相关,一样荒谬可笑。草甘膦使用的增加导致各种疾病增加,纪录片 显示的相关系数0.98,其含义是疾病的原因几乎100%是草甘膦导致的。这是一个 惊人的发现,如果它是真的,那么很容易通过动物试验,验证草甘膦能直接导致 提到的疾病发生。之前被《食品化学毒物学》撤稿的论文就是试图通过动物试验 来证明草甘膦可能致癌 http://blog.sina.com.cn/s/blog_4abe58910102etb2.html,而被科学界齐声指 责而被撤稿。相反,有许多的试验证明草甘膦是危害最小的农药之一。   4)试验结果的表述要有统计分析。视频中有多处骇人听闻的场面,比如吃 转基因作物的猪肉闻起来臭,不吃的香;转基因的玉米鸟儿吃的少,不转基因的 玉米鸟儿吃的多。这种未经任何统计分析和严格设计但展示惊人结果的调查手段 其他广大记者完全可以借用,适用于报道任何重大科学发现。包括吃了有机食品 一个月,然后癌症就自然消失了,应该说是广大癌症患者的福音。和张悟本说吃 绿豆可以包治百病如出一撤。要证明转基因的玉米鸟儿吃的少,非转基因的鸟儿 吃得多,统计学上的设计,应该找到多只体态,健康程度等基本一致的鸟儿分成 多组,在严格控制(比如转基因玉米和非转基因的玉米放置的位置,外形,大小 等也要一致)和隔离的情况下,让鸟儿在给定的时间内自由取食,然后统计每种 玉米被取食的多少,经过统计分析,检测是否有统计学上的差别。   5)引用数据要注意质量。人非圣贤,所以难免犯错。尤其是在面对面采访 时,对数据的描述和引用可能错误。但采访者对于事实的描述是很容易核对的。 比如一说有30个诺贝尔奖获得者签名支持转基因,和135个诺贝奖获得者反对转 基因。都是重要的事实描述,如果后者是正确的那将是反对转基因的重要证据, 这应该是很容易核查的,因为获得诺贝奖的科学家数目非常有限,到底是哪135 个诺贝尔奖获得者,在哪里哪个场合下有这个表述。实际情况是这个表述是谎言。   崔永元在视频最后故意通过误导的提问来指责目前各地一些转基因大米的品 尝会是违法的,目前发生的转基因大米品尝会不是品尝未经验证的随意的转基因 产品,BT大米是经过严格验证获得农业部颁发安全生产证书的产品,也就是说程 序上已经认可了它的安全性,黄金大米是国际上已经经过严格安全认证,计划商 业化的产品,华中农大利用相同的技术重新研发的。品尝会是为了进行转基因的 宣传和科普,不是为了验证产品的安全性。转基因的技术本身是中性的,它既可 以导入优良的基因,也可以导入有毒的基因,一般的基因工程实验室,每年都要 产生许多转基因的植株或者产品,在明确安全性之前,包括科研人员自己,当然 也更不会邀请别人品尝自己的未经验证的转基因产品。在整个调查视频中,崔永 元先生使用“试吃转基因产品”代替“品尝目前经过安全认证的的转基因产品”, 是以偏概全。一方面反转派质疑我们利益熏心不敢吃转基因,另一方面我们通过 转基因品尝会向人展示我们愿意吃,并乐意公开吃却被质疑为非法。那应该如何 选择?   这个颇具影响性的调查存在的统计学的漏洞完全可以作为生物统计学课程上 的反面教材,尤其值得文科尤其是传媒专业的学生学习,告诉他们学点统计对于 自己的职业生涯是多么的重要! (XYS20140310) ◇◇新语丝(www.xys.org)(xys7.dxiong.com)(xys.ebookdiy.com)(xys2.dropin.org)◇◇