◇◇新语丝(www.xys.org)(xys4.dxiong.com)(www.xysforum.org)(xys2.dropin.org)◇◇   周志华教授的原罪   作者:神雕侠侣   -- 引子   关于周志华是否抄袭的争执本来不甚关心,不小心看到了诸多激扬的文字, 忍不住好奇翻看了这几篇老文章,心中有些思绪不吐不快。各种曲折我就不赘述 了,愿意看的人自己去看吧,我也不去根据论文发表时间和署名的顺序做无端之 揣测,只是就事论事的就争议的关键之处说说我的看法。   我这里不会说引用者如何如何,引用者为何不提两者的联系如何如何,因为 太多的似懂非懂的引用者了,太多的山头和关系的问题了,太多的跟风的研究者 了。所以我只希望大家用自己的眼睛去读去看去判断。   -- 指控   指控者说周的所谓抄袭,并非是拷贝粘贴那么简单,而是剽窃了Perrone文 的观点并且将Perrone文的重要公式改头换面,同时只字不提Perrone文给读者造 成一种周似乎对Perrone工作一无所知之假象。   那么到底是什么观点和什么公式是如此重要以至于成为争执的焦点呢,就是 所谓 many could be better than all (MBTA),也就是用多个分类器集成学习 的时候,用一部分可能比用全部的要好。大家可能会说,这不是废话么,你在一 堆分类器里面掺一堆巨烂无比的输出全是noise的分类器肯定是不好的呀(其实 我也认为是废话,呵呵)。这是周文最重要之卖点,用周自己的话说:   “有上面的介绍(以及后面关于我们工作发展的介绍)可以看出,我们的工 作的出发点、思想、以及主要贡献,和[文1]是完全不同的。其实,只要读一下 [文1]的摘要就可以知道,[文1]提出的方法的第一个性质就是:`It efficiently uses all the networks of a population – none of the networks need be discarded',即它使用所有学习器进行集成,而这和我们的 贡献——'many could be better than all',即使用部分而不是所有学习器进 行集成是截然不同的。” (这里的[文1]就是Perrone文)   那么到底Perrone文有没有提到MBTA呢,很不幸,Perrone文Page12白纸黑字 写得太清楚不过了   "From this comparison, we find that we should add the new net to the population if the following inequality is satisfied:"   "Now, if a network does not satisfy this criterion, we can swap it with the next untested network in the ordered sequence."   也就是说Perrone文已经事实上清楚地说出来MBTA的观点了,这两句话里面 提到的这个inequality和criterion就是那个关键的公式。我们现在来看公式的 问题,关于这个关键的公式,周的辩解称:   “从式17开始到20,通过讨论使用N个和N-1个学习器结果的差别,我们得到 了选择性回归集成的理论结果,这才是我们在[文2]的理论推导中的贡献。”   那么Perrone文Page12的公式和周文20式到底有何关系,是费劲周折才能互 推呢,还是能够一眼望穿的障眼法呢,很不幸是后者。这两个公式的区别仅仅在 于周20式两边同除(N-1)^2就是Perrone文Page12式。有人要问,为何大于号小于 号不同,那是因为Perrone式说的是include的条件,周式说的是exclude的条件, 自然相反;有人又要问,为何一个是(2N+1)一个是(2N-1)呢,小盆友,这与你选 N是多少有关系;另外我还想废话一句,周式中的k就是Perreon式中的new,呵呵。 有格物致知精神的不妨自己去看看。   话说到这里,但凡是有正常理智的人都不难看出来,指控者的指控是相当到 位和犀利的,而周对指控的辩解不仅没有撇清自己,反而落下了更多的口实,因 为周特意强调的MBTA和奉为主要贡献之列的20式都是Perrone文中已有的,说周 文抄袭不太准确,说是剽窃当无疑义。周实在是小觑了指控者的眼力,既然能跳 出来绝对不是善茬。   -- 感慨   那么为什么周文还能被IJCAI接受呢,为什么还有不少引用呢,为什么那么 多人不追究这件事呢。呵呵,简单的回答就是世界太复杂。君不见举世著名的 Taniyama-Shimura-Weil猜想事实上没有Taniyamo和Weil什么事么,君不见解三 次方程的果尔丹公式剽窃自塔塔尼亚么,君不见太多的水文泛滥于牛会么。有太 多的所谓做学术的人不求甚解了,懒惰的大众从来都倾向于接受既定观点,有现 成的Review鲜有人去读原始文献即使这文献很重要,而历史从来都只记得胜利者 的光鲜。   周到底会因此事如何呢,我的看法是没有丝毫影响。其一周在国内已根深叶 茂,地位不易撼动,其二周文与Perrone文之联系没有那么明显,周的改头换面 的功夫确实做得足,其三历时太久了。   末了感慨几句。周是聪明人,上位快,不过留下的这原罪却宣告了一个小小 的神话的破灭,这原罪也再一次告诉人们现实之残酷 -- 太多光鲜亮丽之上覆盖 着虚伪的面具。让我感到失望的是,有那么多的自称是学machine learning的年 轻人都不愿意用自己的眼睛去做看,用自己的理智去思考,或者是有了正确的判 断却出于某种目的而替周辩护,这是尤令我感到悲哀的。   最后,补上几句。不免有人会跳出来说我是倒周一派,或者如果我说我之前 是挺周的话,有人会说我是伤心倒戈的粉丝。其实我只是一名看客,一棵有那么 点判断力的芦苇而已。以一句话结束,吾爱吾师,吾更爱真理。 (XYS20091029) ◇◇新语丝(www.xys.org)(xys4.dxiong.com)(www.xysforum.org)(xys2.dropin.org)◇◇