◇◇新语丝(www.xys.org)(xys.dxiong.com)(xys.dropin.org)(xys-reader.org)◇◇   对基因人和文尧两位回复《从“天赋”基因测试说起》的回复   若望   感谢二位的点评,简要回复如下   1. 对基因人回文的简要回复【】中为基因人原文   【但若望的观点和数据也有明显偏差:全基因组扫描近两年在一些常见病, 包括糖尿病,慢性肠炎(Crohn's disease)等上取得了极大的成功。有心人不妨 总结翻译一下,以正视听。这类研究绝不是纸上谈兵的事。别以为NIH钱多得发 烧。中国目前在这方面的研究应该是相当滞后了。】   极大成功我看有点夸大,无非是一个新方法,发了许多Nature,Science,和 其他高影响因子文章。具体的理论和实际价值如何,需要更专业的人士发表意见。 但综合一些评述和综述文章,目前还就是在纸上谈兵,用英文讲,是根据结果 make story的阶段。这方面研究就得靠NIH投钱,除此之外,没有几个国家投得 起。NIH有很多烧钱项目,但这不意味着它的钱多的发烧(克林顿时代钱是有点多 但也不至于象中国科技部那样发烧)。中国在这方面的研究滞后不可怕,不还有 许多其他发达国家也在滞后着吗。有所为有所不为对中国更为可取。   【全基因组扫描,一个人的费用应该在300-700美金,若望的报价不知从何 而来。考虑到统计的power, 一般研究需要成千上万的样本,200人的项目一般是 严重的underpowered的。已有多篇文章探讨此事。因此,这类研究确是大投入的 大项目。结论正确,数据错误。立场有偏。】   $1400的报价是在NIH 08年的一个专门会议上听说的最低价。这个价一直在 降,但还没听说降到300-700,当然一些芯片公司号称全基因扫描,但实际上他 们的芯片做不到,能测范围越小当然价格会越低。对价格的问题,这里有个链接 大概有个说明 (http://nextbigfuture.com/2008/03/genome-sequencing-costs-continue-to .html),另外也可参考国家基因组研究所(The National Human Genome Research Institute (NHGRI))2007年九月发布的千元基因组研究计划书( “$1,000 Genome” Grants: http://grants.nih.gov/grants/guide/rfa-files/RFA-HG-07-020.html). 基因 人回文中“考虑到统计的power, 一般研究需要成千上万的样本,200人的项目一 般是严重的underpowered的。”这句是不严谨的。Power大小取决于统计显著性, 样本大小,数据敏感性,和各样本相似程度(或者说叫effect size)。另外数据 分析中进行比较的次数也必须要考虑进去。200人的样本对全基因扫描来说是太 少了点。既然基因人指出Underpower的问题,那我的原文中200 左右应该更精确 地表达为目前基因定位研究往往需要成百上千的样本,虽然200左右的全基因扫 描研究结果照样能发在Science上(Klein et al, Science, 308: 385-389, 2005, 96 cases and 50 controls) (前提是能提供其他的佐证)。超过万名以上被试的 同时收集基因信息的项目本人只知道Framingham heart study (http://www.nhlbi.nih.gov/about/framingham/index.html), 极有可能连这样 大的项目都还没有收集到万份以上的基因信息更不用说全基因扫描了。基因人对 原文的总结“结论正确,数据错误。立场有偏。”中“数据错误”下的太武断, 至少也是以偏概全吧。“立场有偏”是对的!既然说了,就不能骑墙,我是要表 明这种研究不适合放到中国去做。   2. 以下是对文尧回帖的回复【】中为文尧原文   【首先,我同意若望的看法,目前阶段通过检测DNA突变进行个体筛选还是 不成熟的,我也谴责这种不负责任的做法。但是这不代表目前进行的基础研究是 站不住脚的,科学研究本来就是有一定的探索性和风险性,不能像开公司一样要 求必须有可以看见的商业价值。下面就文章中我有不同意见的地方一一评论。】   原文并不持“目前进行的基础研究是站不住脚的”的观点。个人认为即便基 础研究也应该有所为有所不为,尤其对发展中国家而言。基因定位能比发病机理, 生化反应机制更基础吗?   【“只有极少数的疾病(比如血友病)已被证明与某种基因变异有确切的因果 关系。” 目前人们已经确定了超过5,000种单基因病的基因变异,拥有这些变 异的个体一般是100%发病。】   我说的极少数是有误导性,严格讲是相对于疾病总数来说。文帖在这里不够 准确,应该是人类迄今已发现10000种单基因病,至于拥有这些变异的个体是否 发病要看是否显性是否和X,Y连锁等因素。   【“尽管这已是标准做法,但其研究结果往往不能被重复。我承认重复的可 能性不太高,但成功重复出来的例子也不少。近几年来全基因组关联的文章已经 发表的很多了,很多里面都包含了重复实验。】   注意“往往”两字,这其实不单是我的看法,你看看众多杂志的Editorial 或Review就会发现对这些研究的质疑。   【“主要原因是按个体行为或表现分类时往往会有很大的不确定性。比如同 一   个体按不同标准分类有可能被分到完全不同的组中。”  这只是造成结果 难以重复的一种原因,而且不是实践中造成难以重复最主要的原因。】   我看这就是主要原因。重复往往需要独立的样本,不同地方样本源差异性很 大(这里讲的是同一族群比如北高加索人)导致了很大的分类不确定性。而且不 同时间采集的样本行为数据也差距很大,比如说Framingham heart study数据库 中采集样本跨越几十年,几十年中环境社会风气等对人类行为的影响有目共睹 (比如吸烟吸毒等),如果不加考虑直接利用这些数据,其结果的不确定性可想而 知。   【“从研究角度来看,基因定位已成为费钱费时的体力活,再加上有许多不 良学者篡改数据,我觉得中国很不适合进行这种烧钱的研究。”   若望有点看不起体力活,这是个人意见不同,在下不予置评。至于不良学者 篡改数据的几率在这个领域内是不是比别的科研领域高,目前也没有数据支持, 但我估计可能不会有很大的偏差。】   仅凭片言只语就判断我看不起体力活,未免草率了点。我是觉得中国眼下更 应该做一些更有基础研究价值的项目,而不是将有限的经费投入这费钱费时的项 目中。   【“更要提起注意的是,基因定位研究中时下最热的全基因扫描技术烧钱更 为厉害。按目前的价格,单个人的全基因扫描大概要1400美金,通常一个项目需 要招募200左右的志愿者,算下来就是28万还不包括其他费用。”   很不幸,全基因组关联研究实际的费用比若望估算的还要多,因为一般来说 200个志愿者是远远不够的,比如英国Wellcome基金会资助的WTCCC的一个研究包 含了1万7千个个体,烧钱就更厉害了。】   在上一篇回文中我已更正了这一点,200个是很低估了。你说的1万7千个个 体我没看到,或者是所有数据的总和,不管怎样,Wellcome很有钱,他们不仅仅 支持基因的项目,整个UCL的一个系的大部分基金都是他们的。所以烧的起。   【“但在“敢”字当头的中国学术界,这也是可能的事。说不定科技部已开 始立项了呢。”   “敢”字当头不见得是坏事,更何况全基因组关联研究已经出现两三年了, 现在立项也不见得就是多么胆大妄为的行为,全基因组关联研究方面的突破被 science杂志列为2007年十大科技进展的首位,我想也是有其道理的。当然,也 可以等欧美国家作出突破之后咱们再借过来用,也没什么不可以。至于科技部的 立项与否,若望可以写信咨询,也可以写信表达自己的意见,写到新语丝就没什 么作用了。】   如果只是激一时之愤,“敢”就是鲁莽,轻率,这就是坏事了。这具体就不 用再举证了吧。Science是一个被高估的杂志,它也并非科技界的终审法官。这 些突破(应该说是发现,和发明创造不一样的)确实很有意义。每项严谨的研究都 会有其意义。   科技部的衙门深那,我等草民只能在方舟子的宝地发发牢骚。   【不到之处,请若望指正。】   我也是门外汉,偶尔有机会接触了几个基因定位的牛人包括GWAS的几个 Hapmap的几个,了解了一些情况,在这闲聊几句。还望更多方家点评! (XYS20080512) ◇◇新语丝(www.xys.org)(xys.dxiong.com)(xys.dropin.org)(xys-reader.org)◇◇