◇◇新语丝(www.xys.org)(xys.dxiong.com)(xys1.dyndns.org)(xys888.dyndns.org)◇◇ 痛斥徐德江的伪科学 李逊永 徐德江(下文简称徐)关于汉字和汉语的一系列谬论和他对国家语言文字工作 的攻击,其根源是他对语言和文字的基本属性有着完全错误的,反科学的认识。语 言是作为人类最重要的交际工具的一个语音和语义相结合的语言信息的编码系统和 信号系统。语言信息由两部分(方面)组成:语义是它的内容方面,语音是它的形式 方面(或物质载体)。文字则是记录语言的工具,是由语言派生的,是第二性的产 物。世界上至今仍有不少语言没有文字,就是明证。至于有人认为文字对语言有反 作用,那说的是另外一个问题。即便这一观点能够成立,也不能否定语言第一性, 文字第二性,后者是由前者派生的科学结论。没有语言,就不会有文字的产生。灵 长目动物没有真正意义上的语言,所以也没有灵长目的文字。文字之所以是文字, 就因为它具有记录语言这一功能,否则就不是文字,而是别的什么事物了。至于文 字兼有的审美价值,这并非是文字的本质属性,不仅汉字如此,全世界的文字都是 如此。上述一切对语言文字的研究者来说是最浅显的基本常识,在徐的脑海里却是 乱麻一团:他经常把"语言"和"文字"这两个不同的基本概念混为一谈,使听者或读 者如坠入五里雾中,感到徐是在胡言乱语。徐的同伙的李敏生在其《汉字哲学初探》 中毫无道理地反对文字是记录语言的符号系统这一正确的科学结论。对此,伍铁平 教授已在《北方论丛》2002年No.2所刊长文《不要玷污历史唯物主义和唯物辩证法, 维护语言文字科学的尊严》中对徐、李进行了深刻的批驳,请参阅。 既然文字是记录语言的工具,自然要从语言信息的两个方面或至少从其中一个 方面着手去描写和把握其记录的对象-语言。当今世界上大多数语言用的是拼音文 字,也即是从语言信息的物质载体(语音)方面去描写和记录语言。人类的语言信 息采用语音充当其物质载体是生物长期进化的结果:较低等的生物采用化学物质 (表现为气味等)作为信息载体进行交际(communication),后来发展为使用形体 动作,再后来发展为采用声音作为信息载体进行交际(但生物低阶段使用的手段, 到生物发展的高阶段,其中不少仍在使用)。这已为现代生物交际学所证明。人类 的语言信息是有声信息,其语音特点是可分解,即为articulated sounds,不同于 一般动物的声音。在一定的意义上说,这也是生物发展经过长期自然选择的结果①。 "有声"是人类语言的本质属性之一。拼音文字正是从本质上把握住语言的内在属性, 直接从语言信息的语音方面去描写和记录语言,这是很经济的途径。当今世界上大 多数语言采用拼音文字,绝非偶然,也并非完全出于政治或经济的原因,而主要是 出于科学性的要求。尤其在当今信息时代,情况更是如此。当然,有些拼音文字, 如英、法语的很多词的拼写法反映的是古代的发音,由于历史变迁等原因,这些词 的现代发音与古代相比已大相径庭,结果造成这些词的读音和拼写脱节(如英语的 through读成〔θru:〕)。但是借助读音规则,这些词在多数情况下,仍能准确 读出,如英语四大基本读音规则可涵盖50%以上的常用词的读音,给初学者和外国 学习者带来很多方便。至于二战后创建的新兴拼音文字,则都相当科学。经过几年 来广大语言文字工作者对徐的批判,徐至今仍在《汉字文化》2002 No.1上胡说八 道:汉字比拼音文字更科学。这纯粹是不懂装懂,须知上述拼音文字中现代读音和 拼写法脱节的情况和汉字不能拼读是两种性质的问题,不能同日而语。对此伍铁平 教授已著文批评(见杨玉圣"学术与批评网"www.acriticism.com)。笔者认为:一 切怀疑,甚至贬低拼音文字的合理性的论调是没有根据的。至于徐等人拼命攻击"汉 语拼音方案",用恶毒的语言漫骂它是"低能弱智"、"堕落"②,这不仅是对1958年 我国全国人民代表大会第五次会议正式通过的汉语拼音方案的无端攻击与污蔑,更 是硬把汉字(2000年10月31日全国人民代表大会常委会第18次会议通过的《中华人 民共和国国家通用语言文字法》确定的法定文字)和汉语拼音方案(法定的发挥注 音等功能的辅助性符号系统)这两种主次分明、又互为补充的记录汉语的符号体系 故意地、人为地对立起来,别有用心地捧一个压一个。众所周知,推行汉语拼音方 案是我国三大语文政策中的一项政策。徐等一小撮人如此恶毒攻击,是名目张胆地 向最高立法机构通过的法律挑衅,是我国法律决不允许的!在实践中徐等人毫无根 据地拼命鼓吹"不用拼音方案注音学习汉字更容易"以及安子介的"汉字联想教学法"③ (笔者为其所取的名称。对安氏的这一办法许多小学教师都不同意。许多小学教师 仍认为拼音方案是不可或缺的注音符号,而且学生查字典用拼音最方便、迅速,说 明拼音方案已深入人心),其实至今不见徐的所谓的"试验"有实验报告发表并得到 学术界和教育界的公认。徐攻击拼音方案,倒行逆施,不仅用心叵测,而且严重违 反了我国法律。然而事与愿违,他们这种违背广大人民意愿的做法恰恰暴露了他们 用漫骂和攻击来掩盖自己理论上的无知和兜售其伪科学私货的企图。任何有良知的 中国人都不能容忍这种践踏自己国家的语言文字工作和违反语言文字法的粗暴行为, 就连许多明白事理的国际友人也都对此纷纷愤慨不已,斥之为伪科学④。汉字是记 录汉语的符号体系,但走的是另一条完全不同于拼音文字的历史道路。汉字不是拼 音文字,而是所谓"半表意半表音"⑤的特殊文字:现代汉字不是通过拼音手段去记 录汉语,而是用由若干种类的笔划所组成的特定符号(方块字)同汉语中特定的词 义或语素的意义约定地联系起来,至于某一汉字的读音,基本上并不能由该汉字本 身来提供。在许多汉字(形声字)中,有所谓的"声旁",但当今汉字在多数情况下, 它所提供的语音信息既不充分,又不准确。某一个特定的方块字基本上⑥都一方面 约定地与某一特定的语义相联系,同时另一方面又在不少情况下约定地与某一特定 的音节的发音相联系。也就是说,在现代汉字中,除个别字外,成字的理据性已经 不是很明显了。 一个汉字通常代表汉语里的一个音节。汉语是以单音节语素为主的语言,所以 汉字比较适应于记录汉语。但是并非说拼音方案就不适合记录汉语,或者说汉语只 能用汉字去记录,这些都是本末倒置的片面说法。《中国大百科全书语言文字卷》 第195页"汉字"条中正确指出:汉字本身不都能确切地表示语音。汉字中的象形字 和指事字都不表音。汉字中形声字最多,占汉字的80%以上。在字形结构上,形声 字一半是表意的形,一半是声。表声的部分跟字音相同的固然不少,可是也有很多 不相同的,如"词"、"资"、"堂"之类,它们的声旁只是表其韵母与字音相同但声母 不同。另外还有"涤"、"仍"、"特"之类,其声旁跟字音完全不同,很难看出应该怎 样读。这时声旁也就失去了表音的作用。声旁跟字音不相应,主要有两个原因:一 是古今音异,二是前人造字,声旁与字音本不相同,只取其相近。汉字本身既不能 明确表音,每个字就只能按照字典所注的读音来读了,而注音就要靠拼音方案。徐 攻击它,妄图取消它,是要我们倒退到反切的老路上去吗?还是要我们大家都不用 读出汉字,直接用写"无声的"汉字来交流思想,就象李敏生主张的用汉字"直接表 示观念、思维和思想"○7?不知道李自出生起同他的父母是不是不用说话,只靠写 汉字来沟通。李自称是学的马克思主义哲学的(?),搞过"汉字的哲学"(?), 大概有点"不同凡响"!?反正我们一般凡人是做不到的。 一个汉字基本上是一个音节,而不是组成音节的音素。由于汉语音系(phonology) 的客观规律作用的结果,汉语的音节数量有限⑧,而要记录的汉字数量极其庞大, 所以形成了大量的同音异形异义字。常用汉字至少有六七千字,对记忆是一个极大 的负担。徐等人挖空心思想回避和掩盖这个事实,拿少数几个汉字做"教学试验", 就大吹大擂,说汉字"易写、易认、易记",完全是不顾事实的欺骗读者的行为,在 实践中最后必定碰得头破血流。此外,汉字又有一字多音、一字多义现象,如"说" 有yue(在古汉语中,义同"悦")、shuo(说话)和shui(游说)三个读音,三个意 义,各表三个词。另外,汉字在记录语言时,每个字都有一定的约定俗成的用法, 例如shi可见于下列词里:城市、表示、战士、方式、考试、教室、形势、解释、合 适、事情、世界。这里每个词都有一定的写法,不能写错,写错了就称为"白字"。 正由于上述原因,汉字的辨认和记忆显得特别困难;每一个汉字都要记清它的形、 义、音,任务繁重。 现代汉字的这种状况是它长期历史发展的结果。众所周知,汉字是从象形文字 发展而来。例如"山"最初是一个很形象的图象。就是这个图象和"山"这个词的词义 直接联系起来,并通过这种联系赋予该图象以"shan"的读音。后来这种图象经过"意 象"(image)阶段(这里指的是介于"象形"图象和"方块字"符号之间的一种过渡形 式,其特点是图画线条逐渐向笔划靠拢,这可从今天人们常把图像 简化为 这类实例中看出;又如甲骨文 或 或 演变为小篆的 ,再进一步演变 为 楷书的"山"),进一步抽象化和简单化,图像性减少,众多的线条转化为数 量有限的若干种笔划,组成一种方形结构的图像符号,才一步步发展为现代汉字。 从甲骨文起(汉字学界一般认为它已经是较发达的文字)除象形字外,还有指事字 (如"上"、"下")和会意字(如"化"、"明"等),也已经出现了少数形声字(如 "河"等)。到后来,形声字越来越多,总的趋势是汉字的表音成分增加。徐等人胡 吹说:汉字是"超时间的文字"。从以上所述可看出,这是不符合事实的夸大之词: 汉字无论从结构还是从形体来说,都经历了巨大和显著的变化。这是驳斥徐记伪科 学的又一有力明证。 文字是记录语言的符号体系,既有很强的技术性,又往往是在历史长河中自然 形成的(新创建的文字除外)。它受到社会文化体制、传统和使用习惯的制约,往 往滞后于语言的变化与发展。特别是一些历史悠久的文字,其优点和缺点常常是缠 结在一起,难分难解。语言文字科学工作者的任务是如实地、科学地认识它们,权 衡利弊,扬长避短,引导和改善它,使之不断适应时代发展的需要。由于文字记录 语言的途径和方式方法多种多样,被记录的语言本身又是个复杂的编码系统(笔者 称之为"一级编码"),文字编码(笔者称之为"二级编码")在技术上往往遇到特殊 的困难,在技术手段的优缺点的取舍上不易找到平衡点,所以我们说;世界上没有 也不可能有十全十美的文字系统。"十全十美"这只是人们理想化的产物。汉字也不 例外:其优缺点并存。由于现代汉字终究不能摆脱图象的桎梏,不能改变其在多数 场合不能读出的根本弱点(正因为如此,所以才要有拼音方案来辅助注音),在当 今信息时代的大潮中不能很好地适应现代信息科学技术发展的需要,这也是事实, 并为任何一个稍有IT(信息和技术工程)知识的中国人所深切感受,并有切肤之痛。 其主要表现是: 一、由于汉字不是拼音文字,输入编码(笔者称之为"三级编码")相当困难。 虽经过多年努力,耗费大量人力、财力,仍未圆满解决。目前国内外已有一千多种 汉字录入编码输入法,在可预见的将来还无法统一。现行汉字编码法大体有四类: 1,数字编码法:给每个汉字赋予一个专门的数码,输入方便,无重码,但数 码难以记忆,不易推广。凡超出中华人民共和国《信息交换用汉字编码字符集》 (GB2312-80)规定的汉字,便输不进去。不适用于图书馆等地方。军队中曾经用 过,要求操作人员像背电报码一样死记硬背大量数码符号,只有军人才能做到。 2,字音编码法:从语音入手,大多以汉语拼音方案和GB2312-80为基础。据笔 者所知,这类软件使用人数最多,尤其在国外。缺点是重音字多,往往要在几个 同音异形字中选定一个,操作时容易出错(从网上文字可看出,出错率极高)且 影响速度。多数这类软件不允许超出GB。有一学校因校名中含一古地名字,无法 输入,结果该校长期不能列入网上的学校名单。后来用了一个来自国外的大型汉 字库软件,才解决问题,但操作时不可避免地仍有麻烦。说到汉字库,顺便再举 个例子,说明汉字遇到的许多挑战:现在微软开发的OFFICE XP中,有一个四、 五万字的大字库,其中每个字都标出其在《康熙字典》和《汉语大字典》中的页 码,但由于没有一个理想的输入法,只好勉强搞了个区位码,输入速度之慢,令 人无法忍受⑨。 3,字形编码法:从汉字字形入手:将汉字字形信息分解归类,给出编码,如 五笔字形等。优点是有时操作者即便读不出的汉字往往也能输入,缺点是汉字字 形分析困难,不易掌握,熟练更难。 4,形音编码法:把2,3种编码法结合起来编码,重码率低,但熟练掌握也非 易事。 二,以上各类软件均占相当数量的内存或硬盘或增加汉卡,影响机器运行速 度,提高硬件成本。特别是汉字不由字母组成,笔划稍多的字,在屏幕上不易分 辨,(例如,笔者下面要向徐"大师"请教的两个汉字,就完全看不清。不信,读 者自己可立即亲自验证。)故每个汉字必须占相当于拉丁化拼音文字中两个字母 的位置,而汉字标点符号等又绝不可能占两个字母的位置。这种不统一给汉字输 入软件带来了编码技术上的严重障碍,虽有办法解决,但版面不够美观,软件可 靠性、安全性差。移行等操作时,往往由于出现"半个汉字"的原因而造成乱码, 破坏整个段落。这个问题几经努力已有所改善,但错误和故障还是时有出现,特 别是在网页和电子邮件中屡见不鲜。当然,问题总能解决,但仍不可避免地要加 大软件的复杂性,从而影响硬件的速度和成本,并降低软件的可靠性和安全性, 而要提高上述性能,就又要加大软件的复杂性,结果形成恶性循环,为此无休止 地付出沉重代价。 三、汉字编码复杂,而且与目前计算机键盘很不适应。输入时、输入后转换 环节多了许多,输入者和机器出错率大增,系统有时又互不兼容,加上香港、台 湾用繁体,有的机器又缺乏自动转换机制,结果也造成乱码、怪字或干脆打不开 文件,甚至死机。 四、汉字文字信息处理专家还有很多至今尚未解决或解决得不好的问题,笔 者上述论述只能是挂一漏万。 总之,汉字输入的问题,并非如徐所说的那样:问题已经解决。事实上,汉 字信息处理,远不止仅一个输入问题(当然,当前还是个关键问题),例如词和 短语的连写问题等,都远未解决。这并非是徐等几个不懂装懂的假学者靠乱捧汉 字所能解决的问题。科学是老老实实、脚踏实地的事情。比不得徐等几个,靠着 别人的钱,搞个学会,办个杂志,想怎么吹嘘自己就怎么吹。徐如果真有本事, 请拿出哪怕一个有关汉字信息处理的具体成果来!你发表了那么多的伪科学谬论, 却要我们搞IT的科研工作者向你顶礼膜拜,这是痴心妄想!事实上,汉字信息处 理的事业,任重而道远。大家不要相信徐的胡言乱语,要更加发奋努力,在汉字 信息处理上取得突破性进展! [注释] ①参见《大脑如何思维》,威廉.卡尔文(诺贝尔奖金获得者)著,杨雄理、梁 培基译,上海科学技术出版社,1996。 ②见《汉字文化》1996年第3期"迟之再"的文章。 ③安子介用英语写的《解开汉字之谜》一书,主要是为外国人学习汉字而作。 书中把许多形声字任意曲解成会意字。徐则在金钱的驱动下,把该书吹捧为"最 科学的汉字学理论体系",则完全是谄媚之词。本来作为一种教汉字的方法,安 氏把占现代汉字多数(80%)的形声字都解释成会意字(办法是给每个汉字都随 意编个故事,如"雷":天上下雨,落到田里,同时有轰鸣声,即为"雷",讲给 孩子们或外国人听,以引起兴趣,增强记忆),虽并无理据,却也无可厚非,但 绝不是科学体系。有些小学教师在课堂用此法教汉字(自己编故事,也让孩子编) 是可以的,但效果一般,并未有奇迹发生。显然,也应允许和鼓励多数有不同意 见的教师采用或创造别的方法教汉字(包括用拼音方案注音)。徐有什么资格拼 命攻击拼音方案,对全国小学教师指手划脚,把并不同意采用安氏方法的人都看 成是对立面呢?何况,安氏所说"联想是一切发明之母",过分夸大了联想在发明 中的作用:发散性(联想)思维仅是导致发明的一种思维方式,而不是全部,更 不是"母"。安氏自以为发了精辟之言,其实是片面之谈,科学上是站不住脚的。 ④见"Pseudo-science in the Chinese linguistics circle: A brief summary of the ongoing academic dispute between Xu Dejiang and Wu Tieping",莫 大伟(David Moser)作,载《外语教学与研究》2001第6期。另外,笔者2001年 访美与美国学者交谈时,宾州大学亚州和中东研究系主任Victor Mair(自取中 文名"梅维恒")教授等许多语言学家都对徐的所作所为,十分愤慨。 ⑤关于汉字的性质,汉文字学界有不同意见。笔者本人持此种观点,但由于本文 主题限制,不能展开讨论,留待来日,另文求教国内外专家。 ⑥我们之所以说"基本上",是因为汉字有时可以用来表示无意义的音节,如"葡"、 "蜈"等。 ⑦对李的这种谬论,伍铁平教授已在《北方论丛》2002年No.1上著文批驳。 ⑧汉语一共有多少种音节,一直没有明确的说法。聂志平副教授来函称:根据胡 裕树《现代汉语》(1995年上海教育出版社)552--560页上的《附录八普通话声 韵配合总表》计算,现代汉语音素音节为401个。同书161页又说,现代汉语的音 节"分声调计算也只有一千二百个左右"。经细查,如把声调考虑在内,总共1150 个音节。 ⑨刘泽民副教授来函提供此例,在此谨表谢意。 ◇◇新语丝(www.xys.org)(xys.dxiong.com)(xys1.dyndns.org)(xys888.dyndns.org)◇◇