top of page

汉语与汉语书写阅读符号

(修改版)

谢宝瑜

相信先民们最早用来交流的是最容易发出的几个音。例如,几乎在所有的语言中,母亲这个意义都是用ma或者它的变音来表示的。也许是因为ma这个音最好发,所以立即被赋予了对于婴儿来说是最重要的意义。其它容易发出的声音还有ba, ti, du等,这些音几乎在所有的语言中都可以见到。

 

显然,最容易发出的几个音是远远不够用的。先民们需要有更多的声音来表达更多的意义。于是,人们不得不寻找其它的办法。

 

一个办法是挖掘人类发音器官的潜力,创造出更多独特的声音来。像俄语中的大舌颤音,法语中的小舌颤音,布须曼语中的啧舌吸气音,等等,稀奇古怪,五花八门。第二个办法是用两个或者两个以上的音(音节)来表达一个特定的意义。这样,通过排列组合,很少的几个音就可以表达很多不同的意义了。

 

日语也许把这第二个办法推向了极致。日语使用的音(音节)很少,一个意义可以由好几个音(音节)来表达。这个办法的好处是可以充分利用那些容易发出的声音。坏处是表达时需要使用的音节数量太多。为了让说话的速度跟上思维的速度,日本人不得不加快讲话的速度,噼里啪啦的,听起来就像是在打机关枪。反过来,用这么快的速度说话,也必须使用最容易发的音。在这种速度下如果还要嚼舌头,就很有可能会把舌头嚼下来的。

 

我猜,像英语这样的印欧语系的语言,最早也是像日语一样,用了很多个音节来表达一个意义。我甚至相信古印欧语(雅利安语)最初使用的音节比日语还要多。于是,古雅利安人不得不拼命加快说话的速度。然而,他们讲得再快,即使到了口吐白沫的程度,也不能跟上思维的速度。他们没有其它的办法,只好偷工减料,省掉一些元音。于是,我们就在印欧语系的语言里见到了很多辅音连缀。假设本来是用三个音gereato来表达“大”这个意义,如果把g后面的e和t后面的o省去,三个音就变成了一个音great 。这样,即使是慢慢地说话,也容易赶上思维的速度了。(假想而已,当不得真。)我这样猜并不是完全没有根据的。例如,加拿大城市Toronto,原来的发音一直是Toronto,近年来电视台和广播里的一些播音员却喜欢省去第一个o,把它读为Tronto。既然英语中省略元音的现象现在可以出现,古代难道就不能出现吗?

 

与上面谈到的两种情况不同,汉语另辟蹊径,引入了音调这东西。同样的一个音(音节),变一个调,就可以表达一个新的意义了。不知道原始汉语中有多少个音调。现代的普通话有四个音调(轻声很少,可以略去),现代的广州话有九个音调(实际上只有六个,另外三个是入声)。就算原始汉语只有四个音调吧。用了这个办法以后,同一个音可以表达四个意义。这就是说,在最初的阶段,汉语比其他任何语言都优越,因为它的容量特别大,每一个音都要顶其他语言的四个音。当然,当别的语言开始用多个音节来表示一个意义以后,其容量一下子就上去了。相对而言,汉语最初的优势也变小了。

 

现在让我们来看看先民们创造文字的过程:

 

现在知道,最古老的文字是苏美尔人的楔形文字。最初有一千多个符号,表意和表音结合,后来减少为四百多个符号,演变成了一种音节文字。

 

第二古老的是古埃及文。古埃及文是一个混合体,其中有一些是表意的符号,一些纯粹表音的符号。此外,古埃及文还有一些限定符,加在单词的最后以限定语意的范围。

 

汉字也是一种很古老的文字,其符号既表意又表音。

 

苏美尔文发展成一种音节文字的过程,可以借用汉字来说明。我们知道,汉字和其它古文字一样,最初都是象形的。“日”字最初是一个圆圈中间加个点,“马”字最初是画的一匹马,等等。产生了一定数量的符号后,所有可能出现的音节都有了一个或者多个符号。这时候人们可以把同音字交换着使用,还可以选择最常见的那个字来表示这个音。现代汉语中的“而”字最早的意思是颊毛,而“我”字则是古代的一种武器。由此可见,用原先表示甲意义的符号来表示乙意义,不仅可能,而且实际发生过。此外,古汉语中有大量的通假字。这一现象也表明,至少在某个时期内,汉字系统有向音节文字发展的趋势。假设汉字朝这条道路继续走下去,例如把“越”“阅”等字淘汰,只保留“月”字来表示yuè这个音(音节),汉语的书写系统就会演化为一种音节文字。估计苏美尔语的文字正是如此。人们在创造了一千多个符号之后就意识到,他们已经不必创造新的符号了。接着,他们淘汰了那些重复了的符号,把楔形文字改造成了一种音节文字。

 

古埃及文中表意的符号和日语汉字类似,表示一个或者多个音节,容易理解,就不多谈了。其表音的符号却涉及到了拼音。

 

一般人脑子里的拼音,大约是英语,法语,俄语等印欧语系的文字,里面有辅音字母,也有元音字母。古埃及文的拼音却和这些文字不一样,它只有表示辅音的符号,没有表示元音的符号。

 

借用英语来说明:

 

我们知道,在极个别极特殊的情况下,我们在拼写英语单词的时候可以省去元音,只用辅音。例如,我们可以用pls来表示please,用thx 来表示thanks,用pmt来表示payment,等等。于是Pls cl m就是Please call me的意思了。然而,英语中的元音音素很丰富,而且出现不大规则,这种办法不能大量使用。如果通篇文章都是这种拼法,那就没法阅读和理解了。

 

估计古埃及语同现代的阿拉伯语和希伯来语一样,属于闪米特语系。这类语言辅音丰富,元音音素的数量较少,而且出现极有规律。一个词只要给出了辅音,人们就可以知道这个词中的元音是什么。因此,记录此类语言的时候,就没有必要把元音也拼出来。

 

那么,为什么苏美尔人的文字演变成了一种音节文字,而古埃及文却正在朝辅音拼写文字的方向演变呢?仍然借用英语来说明。

 

我们知道,在英语中,一个音节可以只有一个元音,如 eye,可以是一个辅音加一个元音,如me,可以是辅音加元音加辅音,如cat,还有各种各样的辅音连缀也能和元音组合在一起,如blue, able, thanks,等等。这些组合非常多,如果每个音节都用一个符号来表示,那就需要成千上万个符号。相信古埃及语也是这样,因为音节太多,所以不能发展成为音节文字。

 

既然创造和使用太多的符号很不方便,而古埃及语同其他闪米特语言一样,元音和辅音极容易“剥离”,用已有的符号来表示单纯的辅音,然后再用这些辅音来拼写单词,就是最佳的选择了。这就是说,古埃及文实际上正在由表意向拼写过渡。后来出现的腓尼基文也属于闪米特语系。它继承了古埃及文中的这种拼写方式,抛弃了古埃及语中的表意符号,创造了一系列表音符号(字母),成为真正的拼写文字。最早的拼写文字出现在闪米特语言中的现象显然不是偶然的。

 

再后来的希腊人有苏米尔人的楔形文字和腓尼基人的辅音字母可以借鉴。希腊语音节应该也很多,所以很难使用楔形文字(音节文字)。古希腊人只好引进腓尼基人的字母。因为希腊语属于印欧语系,元音非常丰富,如果只有辅音字母,人们就无法把词的意思猜出来。为了解决这个问题,他们的把这套字母加以改造,引入了元音字母。从此以后,世界上才有了我们熟悉的拼音文字。

 

现在该谈汉语了。

 

在讨论苏美尔文的时候,我提到过汉语的早期的书写系统有演化成为音节文字的可能。我这样说,是基于汉语的音节本身数量比较少。现代的汉语普通话加上音调也只有一千多个音节,属于可以控制的范围。如果不算音调,就只有四百多个音节。

 

我想,如果汉语是在一个非常狭小的地理范围内发展起来的,而这个地理范围内的人都说一种单一的方言,那么汉字就很可能会演变成一种音节文字。如果汉字是在一个极为广大的地理范围内发展起来的,很多方言区的人为汉字的发展做出了贡献,而各个方言区的同音字又不同。这么一来,一个字在不同的方言区有不同的发音或者声调,没法进行淘汰,所以汉字很难演化为音节文字。真实的历史似乎正是这后面的这种情况。借用一个现代的例子来说明古代的情况:助词“的”和“得”在北京话中都发de,是同音字,在四川话中却不是,前者发li,后者发dei。因此,很多北京人写“好得很”这个短语的时候往往会情不自禁地用“的”来代替“得”,写成“好的很”,企图制造一个“通假字”。四川人对这两个字却分得很清,不会这样做。由于四川人和很多其它方言区的人“从中作梗”,“的”和“得”这两个助词就很难合并成一个。

 

那么,汉语的早期书写系统有没有向拼音文字演化的可能呢?

 

举一个例子:古代汉语中有个“诸”字。教科书里面说它是“之于”的合音。这就是说,古人已经知道,如果把“之”字的声母和“于”字的韵母拼在一起,它的“合音”就是“诸”。后来人们使用反切的办法来注音,其原理同这个“合音”完全一样。比起希腊文、拉丁文等拼音文字来,“合音”的拼写方法更复杂,因为“合”的人必须先把一个字的声母和韵母找出来,把它的韵母去掉,把另一个字的声母和韵母找出来,把声母去掉,然后再用前一个字的声母和后一个字的韵母相“合”。既然连这么复杂的拼法也会,要搞一套单纯的声母和单纯的韵母应该很容易。这就是说,对于讲汉语的先民们来说,拼音这个概念并不稀罕,他们也想到过。那么,为什么先民们最终没有搞出一套拼音的文字来呢?

 

这个问题恐怕很难从正面回答,也许只能反过来推。这就是说,我们也许可以先讨论一下大陆地区制定的《汉语拼音方案》,从结果来推测原因。(台湾地区的《注音二式》是设计来为汉字注音的,不能作为文字使用,因此我们不讨论。)

 

先请大家读一段用拼音拼写的东西:

 

Yī fāng yòu yī fāng shuǐtián, yī piàn yòu yī piàn chítáng, zhīzú ér níngjìng. Wúshùde xiǎo hé xiǎo hú, fú yún zài nàlǐ mèngyóu. Yēzǐshù jiǎnqiēzhe tiānkōng, rang tā gèng yōuyǎ yīdiǎn bà! Mángguǒshù jiāng yǐngzǐ liú gěi shùxiàde huācǎo, yě dǒuluò xiē yángguāngde suìxiè. Yī piàn shuǐtián, gānggāng shōugē wánbì, dàn bing bú gūjì. Tā mòmòde tǎng zài nàlǐ, wàngzhe hémiáo cóng línjū huáilǐ tàntóutànnǎo. Zài ling yī piàn xīnlǜ zhī zhōng, hèsède tiángěng xiàng dà niányú gǒngqǐde jǐbèi.*

 

这是杜欣欣《勿忘我——访泰戈尔故居》中的一小段,估计很多人根本没有读,直接就跳到了这段汉字上来了。拼音读起来实在是太麻烦。

 

《汉语拼音方案》是中国文字改革委员会组织的一些专家学者总结了前人的经验,在1955~1957年间研究制订出来的。该委员会在制定时的目标就是要用它来取代汉字。为此,那些专家学者们考虑到了各种各样的环境:手写,打字,排印,等等,并且作了周密的安排。例如,从语音的角度出发,“ㄠ”这个韵母本来应该用au来表示。但是考虑到汉语中有an这个韵母,而手写的au 和an很相似,不易辨别。于是,他们把au改写成ao,圆满地解决了这个问题。

 

《汉语拼音方案》公布之后,最初的反应非常热烈。据说爱好拼音的人当时办了不少纯拼音的小报和杂志,互相用拼音写信,搞得热火朝天。人们最初相信,只要掌握了普通话,只要熟悉了拼音方法,就可以得心应手地用拼音来书写汉语。于是,我们很快就可以把汉字扔进太平洋中去了。

 

然而事情并不是如此简单。像笔者这样的人说起普通话来虽然有椒盐味,但是能说能听,应该算是掌握了普通话,代表了大多数。如果笔者这样的人不算,那么,真正掌握了普通话的人不会超过20% 的汉语人口。再说熟悉程度。笔者在小学的时候学过拼音。大约在二十年前为了使用电脑,开始用拼音来输入汉字。使用了将近二十年的东西应该算是熟悉了吧?然而,如果现在要让我阅读一段用拼音书写的文字,我仍然会感到头痛。我想,即使是普通话非常好的人,即使她使用拼音来输入汉字的年头比我还要长,她在阅读用拼音书写的文字时仍然会感到头痛。

 

实践证明,拼音很难作为一种独立的文字来使用。鉴于这一事实,中国文字改革委员不得不从原先的立场上后退,给《汉语拼音方案》重新定义,把它说成是为汉字注音的工具。这是一种死要面子的说辞。如果仅仅是给汉语注音,原先的注音符号(ㄅㄆㄇㄈ)就很好用。即使硬要拉丁化,它也不如台湾的《注音二式》。仅就注音的功能而言,《二式》比《拼音》更准确,更合理。因此,在很长一段时期内,拼音仅靠一纸行政命令苟延残喘,没有什么真正的生命力。幸好后来有了电脑,拼音才死里逃生,找到了自己的位置,成了为电脑输入汉字的有力工具,终于有了真正的生命力。

 

是什么因素妨碍了拼音,使得它无法取汉字而代之呢?几十年来,人们作了各种各样的猜测。最普遍的一种意见是,汉语的同音字太多,拼音后很难辨别,所以阅读困难,这是拼音最大的问题。

 

我以前也是这样想的,经过深思后却觉得并非如此。

 

其实,如果静下心来,慢慢地阅读,拼音并不是特别困难。如果你不相信,可以回过头去慢慢地阅读前面所引的那段拼音。你会发现,要读懂这段拼音并不难。问题就在这里:拼音书写的东西必须慢慢阅读!这和我们平时的阅读经验完全不同。

 

先把拼音放下,谈一谈日语。

 

据说日语的音节本身很少,用一套只有五十来个符号的平假名或者片假名就可以全部包括。从理论上来讲,只用一套平假名或者一套片假名就可以把日语的所有词汇拼写出来。从这点出发,日语中的汉字好像完全是累赘。据说,在明治维新以后的一段时期内,日本国内要求废除日语汉字的呼声非常高。这一点可以从留日学生学者鲁迅等人的言论中得到印证。鲁迅等人对汉字深恶痛绝,骂不绝口,应该是受到了日本人的影响。如果当时日本举国上下都盛赞说汉字优美,汉字简洁,汉字好,等等,鲁迅等人的思想再激进,也说不出那些狠话来。反过来,从鲁迅等人带回来的言论中我们也可以感受到当时的日本人骂汉字骂得有多厉害。

 

日语中的假名在一千多年前就出现了。使用假名的原因很简单:日语语法系统和汉语语法系统完全不同,用纯汉字根本无法表达。为此,日本人只好用假名来表示日语中的一些特定的语法现象。我们知道,汉语的词形态没有变化。有人为了好玩,把英语的时态引入汉语。例如,我们在网上可以见到“等待ing”,意思是“正在等待”。这个ing可以放在很多“词干”的后面,如“吃饭ing”,“看书ing”等等。我想,日语中假名的用法就与这里的ing相当。

 

按理说,假名出现后,日本人就应该顺水推舟,用它来拼写日语。仅就语音语法的角度上来看,假名完全可以胜任这一工作。然而,一千多年过去了,我们看到的事实却是,日本语中汉字和假名并存,是世界上最为复杂的书写系统之一。

 

相信大家都有这样的经验:朗读时的阅读速度很慢,默读时的阅读速度很快。我不是这方面的专家,也没有作过这方面的研究。然而,根据我自己的阅读经验,我相信,在默读的时候,文字所表达的声音被人的大脑虚化了。换句话说,虽然文字表达的是声音,但是在阅读的时候,这声音被大脑压缩成了一个很短的印象,变成了“瞬间的抽象的声音”,或者仅仅是一个意义。因此,在阅读一些容易的书籍时,像是在阅读那些简单的言情小说时,文字没有转化为物理的声音,而是转化为“瞬间的抽象的声音”,或者仅仅是一个意义,流入大脑,而大脑可以在瞬间把它处理完,转变成一连串的情节和意象。于是,在火车站候车室等车的几个小时内,我们就可以读完一本言情小说。如果真要一个字一个字地读出来,这本书恐怕要两三天才能读完。古人所说的“一目十行”,指的大概就是这种现象。当然,在阅读严肃的需要思考的读物时,“一目十行”很难做到。但是,无论如何,默读也比朗读快。

 

此外,我还发现,我在阅读用繁体汉字书写的东西时,阅读的速度同阅读用简体汉字书写的东西时完全一样。这似乎是说,大脑处理一个简单的符号所需的时间和处理一个复杂的符号所需要的时间几乎没有什么差别。

 

如果我总结到的这两点经验正确而且带有普遍性,我们就可以解释为什么日语难以用假名来书写了。

 

我们知道,日语中的一个词有很多个音节。如果全部用假名来书写,篇幅会很长。在阅读的时候,眼睛必须扫描很多符号,大脑也必须处理很多符号。这么一来,阅读的速度就会极大地减慢,以至于达到很不舒服的程度。下面是两个从《维基百科,日本汉字》中抄下来的日本汉字:働(はたらくhataraku),躾(しつけshitsuke)。我们可以看到,“働”这个字在日语中代表了四个音节,而“躾”这个字在日语中代表了三个音节。如果大脑处理“働”这个字所需的时间同处理“は”这个假名所需的时间一样,如果这个字代表的四个音节会被大脑压缩成“瞬间的抽象的声音”,或者仅仅是一个意义,那么,阅读这个汉字所需要的时间就比阅读はたらく这四个假名所需要的时间短得多。因此,使用汉字可以大量减少日语文字中的书写符号,提高日语的阅读速度。由此推断,日语用来表达一个意义所需要的音节数量太多,使得用纯假名书写的东西很难阅读,这是日语难以纯假名化的最主要的原因。可见日语的拉丁字母化就更加困难了,因为书写一个词需要使用的拼音字母的数量比需要使用的假名数量还要多。这也是日文中要保留汉字的根本原因。

 

回到汉语拼音上来。如果刚才总结的两点经验成立,那么,我们阅读汉语拼音的时候之所以会感到不舒服,主要是拼写一个音节使用的字母数量太多。

 

现在终于可以回答上面提出的问题了:先民们最终没有搞出一套拼音的文字来,最主要的原因是汉语的多数音节构造复杂,有大量的三元音、双元音和鼻音,需要使用太多的字母来拼写。汉语的同音字太多只是一个次要的问题。例如:“聊天”,两个符号。liáotiān,八个符号。“双双”,两个符号,shuāngshuāng,十二个符号。汉字显然比拼音容易阅读。

 

可见综合书写和阅读的需要,汉字是汉语的最佳书写符号。这就是说,汉语的特点决定了它的书写符号必须是汉字。一切书写符号都必须符合该语言的特点才能够方便地使用。换句话说,有什么样的语言,就有什么样的文字。

 

从以上的讨论中我们还可以得出一个结论:汉字的缺点是难学难记,优点是阅读方便。汉语拼音则相反,它的优点是好学好记,缺点是难以阅读

 

由于电脑的发明,对于多数在中国大陆受过教育的人来说,汉语的书写符号现在已经变成了一个“拉丁-汉字二元系统”:书写用拼音,阅读用汉字。这个系统发挥了汉字和拼音各自的优越性,工作起来目前还比较理想。据说,五笔汉字等其它输入法更快捷,更准确。然而对于大多数人来说,输入汉字不需要那么快,因为我们在“写”的过程中必须思考,所以“下笔”总是很慢,用拼音输入完全可以赶上我们思维的速度。我想,只有打字员才需要五笔汉字等更快捷但是需要花较多时间来学习的输入方法。

 

顺便说说汉字的简化:

 

大陆地区在五六年公布了一批简化汉字,有的字简化得好,有的字简化得糟。然而,整个来说,这批简体字很像是由一帮誊写员搞出来的东西,其着重点似乎是为了减少书写的笔划,没有为初学者和阅读着想,没有综合考虑写与认,写与读之间的关系。在没有发明电脑之前,笔划的多少只是对于誊写员才重要。笔划越少,就可以 写得越快,就可以多挣一些钱。写作的人,不管是写文学作品,科研论文,还是家信情书,都需要思考,都写得很慢,多写几笔,少写几笔,都不会明显地影响写作 的进度。简化汉字把“導”字简化为“导”字,只是为誊写员减少了几笔的负担。对初学者来说,“導”字本来有个声旁,很好记,简化之后反而要死记硬背,增加了学习的负担。“東”字简化为“东”字也是减少了几笔,但是失去了“日在木中”的意象,使得初学者不能通过联想来记住它,也只能死记硬背。再如,把“言”旁一律简化为“讠”只是减少了几划,却凭空增加了一个符号(“言”字在单独使用时不能简化为“讠”)这种简化法除了可以让誊写员少写几笔外,却使得读者和作者必须多死记很多符号,给印刷厂增添成本,现在还浪费了大量的电脑空间。随着电脑的广泛运用,多数人已经很少用笔来书写。以减少笔划为指导思想的汉字简化就显得更加荒唐可笑了。

 

在我看来,真正的简化并不在于笔划多少,而在于是否按照汉字本身的规律,使得简化后的汉字更有规律可循,并且能够充分利用形声、意象、会意等手段,使之好学好记。比如,我个人认为把“衆”字简化为“众”字就比较好,“三人为众”和“三木为森”是一样的逻辑,初学者一下子就记住了。

 

我认为大陆地区的简化汉字应该重新审定,剔除不合理的简化字。

 

建议中国大陆、台湾、日本和海外的专家学者坐在一起,组成一个有权威的委员会,以易学、易用、不割断历史的原则整理汉字,清除冗赘的汉字,使之规范化,系统化,结束汉字在当前的混乱状态,以利于各个汉字区之间的交流,以利于汉字在电脑时代的使用。

 

2011年7月于加拿大多伦多

2017年1月修改

 

* 杜欣欣《勿忘我——访泰戈尔故居》原文:一方又一方水田,一片又一片池塘,知足而宁静。无数的小河小湖,浮云在那里梦游。椰子树剪切着天空,让它更优雅一点吧!芒果树将影子留给树下的花草,也抖落些阳光的碎屑。一片水田,刚刚收割完毕,但并不孤寂。它默默地躺在那里,望着禾苗从邻居怀里探头探脑。在另一片新绿之中,褐色的田埂像大鲇鱼拱起的脊背。

bottom of page