◇◇新语丝(www.xys.org)(xys6.dxiong.com)(xys.liruqi.info)(xys2.dropin.org)◇◇   光天化日之下的学术腐败   ——电子科大生物医学工程博士点授植物保护学博士是否合规   作者:良知   尧德中教授是电子科大生物医学工程(一级学科)博士授权点与博士后流动 站的学科负责人,头上有许多耀眼的光环:长江学者,国家杰出青年基金获得者, 全国优秀教师,新世纪百千万人才工程国家级人选,生命科学与技术学院院长, 神经信息教育部重点实验室主任,四川十佳青年,四川省政协常委……等。看到 他2010年指导的一篇题为《三化螟和斑潜蝇发生预测模型的研究与应用》的博士 论文通过答辩,感到很奇怪,论文属于植物保护学中的病虫害防治,与生物医学 工程及尧教授的研究方向风马牛不相及。遂找到该论文,一读之下不禁大吃一惊: 该论文不仅水平远远达不到博士水平,而且有许多初级的常识性错误及重要数据 的错误,居然堂而皇之地拿到学位,其荒唐程度真是前无古人。论文作者是何方 神圣?一查才知,该博士生杨林楠与尧德中是西南师范大学本科的同班同学,现 在是云南省农业大学基础与信息工程学院院长,这位特殊的学生没有在电子科大 上过一天课,三年时间修完全部学分拿到学位(该博士点学制四年),而普通博 士生作为尧教授的廉价劳动力至少要六年才能毕业。   论文质疑如下:   一、十分初级的常识性错误。   1. 数据标准化(即无量纲处理)是一个非常基本的操作,但论文实际使用 的标准化公式P34页4-11、P40页4-18是错误的公式(显然是将极差标准化公式写 错用错),此式数值标准化结果可能超出[-1,1]范围。   2. P35页,使用4-12的公式求相关系数,相关系数是这样求的吗?4-13的相 关系数矩阵居然是n×m维的(n是样本数量,m是因素的数量)。   3. P18页描述一个“L层的n个单元的BP网络”,先不说这句话本身就是错误 表述,接下来的图2-3却是一个有L个输入的单神经元的单层网,接下来P19页的 算法(2-20~2-24)又是单层多输出网的算法。该算法在P32页作为模型实现又 被描述一次(4-3~4-7)。但在P42页具体计算时却是“建立一个3层神经网络, 输入层3个神经元,隐层10个神经元,输出层1个神经元”(实际应是2层网,输 入层不算神经元),与前面两次描述的算法根本不是一回事(单层网只有一个输 出层权矩阵,2层网却有两个权矩阵,而且隐层权矩阵误差估计与输出层差别很 大)。这种前后矛盾百出的描述只能说作者连神经网络最基本的概念都没有搞清。   4. P42、P43页对训练过程的描述“将标准化后的2000年到2005年的第一代 斑潜蝇发生高峰期发生量作为输出量”,“经过3次训练精度为3.91389e-10,此 神经网络的训练过程收敛水平较高,训练模型可以认为是稳定的模型”再度映证 作者连最基本的神经网络概念都没有,人工神经网络需要大样本是一个常识,而 此文仅6个样本(本身这个模型就是不可信的,且最后连讨论都没有!),神经 网络训练次数指的是所有样本训练一轮的次数,一般都要成千上万次,此文仅3 次(代)训练即收敛?而且据此说模型是稳定的模型,简直是一个笑话。   5. P37页表4-1是建水县斑潜蝇1999~2007年1~12个月的月发生量数据。接 下来表4-2是1999~2007年3、4月份发生量的数据,表4-2的发生量不知是如何由 表4-1得到的?   6.主成份分析计算过程P41页居然连相关系数矩阵,特征值、贡献率、累计 贡献率排序表都未给出;神经网络训练过程P43页求解方法、工具、连接权矩阵 也未给出,这恐怕是初学者都知道的常识,博士论文竟然不知!   二、数据错误和矛盾   1. P38页:进行聚类分析,没有过程,聚类使用欧氏距离作为聚类距离,可 是这些简单的欧氏距离计算全部是错误的,聚类的结果也是错误的。   2. P39页表4-4,最简单的平均值居然几乎全部算错(仅四月份的最高气温 近似正确),最大偏差4月份降雨量达到11.4。   3. 错误数据加上式4-18这个错误的标准化公式,致使表4-5所有91个数据 都是错误的(这是十分重要的基础数据),由此以后的相关系数矩阵、特征值、 特征向量、主成份的表达式等全部都是错误的,结论当然也是错的。也就是说, 论文的主要部分从数据到结论都是错误的,但居然预测得到(P43页)“2006年 斑潜蝇的预测发生量为60.6,实际发生量为64.9,比较符合实际情况,预测精度 较高”,这不是明显编造数据和结果吗?   4. P38页,聚类分析结果得出2007年数据“不排出是实验误差和统计误差造 成的”不可信数据,并且将之排除主成分之外。P29页却用这个数据进行模型验 证,这不是明显矛盾吗?   三、整篇论文使用常规技术手段(如回归,主成份分析等),没有任何研究 和创新的迹象,仅只是将别人收集的数据代入已知公式和算法而已。没有数据采 集的设计,没有模型的改进,甚至连基本的模型参数讨论都没有。如神经网络模 型(这是唯一能和尧教授研究方向沾得上边的):层数、隐层神经元的个数、权 向量的初始化方法、学习率、激活函数、隐层误差估计、样本数量等等都是需要 深入研究、实验和讨论的,特别是只有6个的小样本。这样的博士论文估计只需 一个星期时间也就能完成了。   四、以主成份分析结果的主成份复合因子作为输入来建立神经网络,无疑是 在建立神经网络时人为地加上误差,而这居然作为论文所谓“创新点”,而且, 论文对用原始因子建立的网络与用主成份建立的网络对比研究连提都没有提到, 不知道如何支持创新点之说。   五、论文涉及的斑潜蝇和三化螟本身是二个平行问题,没有任何新方法,论 文这样写只是为了增加篇幅,蒙混过关,所以文中重复描述多达几十处数万字。   六、最后的应用(时空GIS)只是空泛描述,没有一点实际内容,甚至连一 幅应景的地图都没有(模型和结论都有错,如何应用?)。   试问:   1.生物医学工程博士点授植物保护学博士是否合规?尧德中的研究方向、招 生方向与农业病虫害防治毫无关系,为何能带这样的博士生?电子科大为何放任 这种行为?(尧的招生和研究方向是:神经信息工程、医学成像与图像处理)。   2.尧德中教授的学术水平和学术道德到底有多高?这样的论文是否达到博士 水平?该生是如何修满学分、如何通过层层关卡拿到学位的?   现将带截图的质疑文档(xxlz.doc)及论文一并寄上,期望得到方先生求证。 (XYS20111214) ◇◇新语丝(www.xys.org)(xys6.dxiong.com)(xys.liruqi.info)(xys2.dropin.org)◇◇