在汉语中同音不同形、义的其它实词与使用频度极高的虚词的组合多如银河沙数,多种搭配都可以做到语法通顺,借助于语法功能与频度统计的人工智能就会出现大量差错,一一纠错不胜其烦,还得借助于其它汉字编码键盘输入。即便是美国耗资惊人的苹果软件,一遇到中国任何地区派出所制作户籍管理数据库那样的简单的任务,面对上万个人名、地名、单位名,也会一筹莫展,弄得错误百出。再说,即使是对万把个通用汉字,对大多数用户来说,读不出或读不准的字太多了,连输入的正确性都无法保证,人工智能就做不上“帮手。这是拼音或语音输入致命的缺陷。
还有,中文世界历来有五大并存:(一)书面语与口头语并存;(二)文言与白话并存;(三)标准普通话“国语”、“官话”与成百上千种方言并存;(四)二万多个正字与三万多个异体字、文献错讹字并存;(五)简体字、俗体字与繁体字并存。笔者从事辞书编纂工作多年,与众多的辞书专家、学者经常进行交流,可是还没有见过一部哪怕是权威的、传世的辞书,或者有哪一个权威的研究机构、学术团体,将上述五大并存造成的汉字正音、正形、正义的历史遗留问题“完全解决”了的。这是迄今为止使众多的辞书专家、学者伤透脑筋的难题。这简直比移动喜马拉雅山还困难。面临这比移山填海还难的汉字文化的历史难题,若有哪一家公司、哪一批“能人”,企望通过编写智能化程序,使拼音快速“想打”或语音输入达到唯一正确性,真是谈何容易!
拼音输入本身就是一种编码,叫做“拼音码”。语音输入还要用键盘编码或鼠标改错。说编码是一种“误区”,这本身就是一种误导。报道提到“近年,一批专家开始尝试走出‘编码’误区”,这将使人误以为过去多年汉字编码的有价值研究都是在“误区”里钻。笔者相信多数“专家”是不会如此缺乏常识与自知之明的。
电脑永远不会超过人脑。电脑人工智能化处理能力毕竟是很有限的。通用电脑,不会淘汰通用键盘。汉字的键盘输入将永远是主流。各种电脑人工智能处理,诸如智能化去重码,或语音输入和手写体输入,只能是键盘输入的一种辅助的、补充的手段。中国人发明了筷子,外国人发明了键盘,使人们手脑并用,使下一代人变得更加聪明,恐怕还会一代一代用下去。科学技术再发展,也决不会导致人类放弃锻炼自己的双手与大脑,只动口不动手,使下一代人变成“完全”、“彻底”的懒汉与傻瓜。
“市”与“巿”
失瑛同志在《采与采》一文中,提出了现代汉字中形体相似、构字率较高而又极易写错的部件问题,是很有意义的。下面再补充介绍这类部件中的“市”与“巿”。
“市”,读shì,五画,从“冖”(垣墙之形)从(古“及”字),二字表意:集市上货物相及,买卖成交。又从“之”表声(省声)。本义是集市贸易场所。属形声字(包会意)。在现代汉字中,“市”既可单独作字,又可作构字部件,由它构成的字主要有:柿、铈(金属元素名)。
“巿”读fú,四画,比“市”少一画,从“一”从“巾”,“巾”的一竖与“一”相交。“巿”即古代的字,俗作“绂”,古代朝觐或祭祀时遮蔽在衣裳前面的一种服饰。从“巾”像连带之形。属象形字。在现代汉字中,“巿”不单独作字,只作构字部件,由它构成的字主要有:肺、沛、旆、霈、芾。
刊kān
“刊”的原义是砍削,所以删改、修订叫“刊误”“刊正”,至理名言叫“不刊之论”。刊印的出版物也叫“刊”,如“刊物”、“报刊”、“副刊”、“月刊”、“季刊”。
“刊”音kān,是个形声字。《说文》:刊,从刀,干声。”可知“刊”是从“干”得声的。但有的人把“刊”误写为从“千”从“刀”就不对了。
“木”作字底写法不同
“木”作字底时,有两种写法。如“花朵”的“朵”,“复杂”的“杂”,同是“木”字作底,写法却不相同。作“朵”字底的“木”字,第二画是一竖,无钩,第三画是撇,第四画是捺,后两画与前两画相交(为叙述方便,我们权称它为无钩的木字底)。作“杂”字底的“木”字,第二画是竖钩,第三画是短撇,第四画是长点,后两画与前两画相交(这种,我们且叫它带钩的木字底)。
“木”作底的字很多,我们可以用记少不记多的方法去区分。在现代汉语的3500个常用字中,“木”作底的字虽有50多个,但带钩的仅有10个,我们只要记住其中的“杀”、“杂”、“条”、“亲”、“茶”、“寨”这6个字就行了,因为“新”、“薪”、“刹”、“涤”
均由前6个字组合而成。除这10个带钩的木字底,其余40多个都是无钩的,这样不就好记了吗?
刍和舀
刍和舀一个是常用字的偏旁,一个是常用字。也可以说它俩都是常用的偏旁。但是它们却常常被人们写错、读错。要区别和记住它们,只要了解字形的演变图就会一目了然了。
这两字乍一看,字形非常相似,细细看来就会发现它们的异同。它们相同的是下面的“臼”
,臼本是舂米的器具,不同的是上部。看的上部是个人(现在的写法是人字的变体),表示人掉进了臼中,这里的“臼”是坑穴,人落入坑里就叫做字。为说明坑很深,人们又在左旁加了个表示“高”的“阜”旁,变成了现在的“陷”字。
“舀”的上部是个“爪”(手),它的本义是用手翻动臼中被舂的粮食,由此引申指“掏取”的意思。
成语中的错别字诊断
黄梁(粱)美梦
[病例]“卢生做‘黄梁美梦’”的遗迹,经他题写碑记,正以崭新的面貌迎接四方来客。”
[诊断]音同形似致误。梁、粱,读音均为liáng。“梁”为房屋构件,故从木;“粱”为谷子统称,去壳后为小米,故从米。“黄粱美梦”典出唐人传奇《枕中记》:有个叫卢生的旅客,在梦中享尽荣华富贵,可待他一觉醒来,店主人蒸的小米饭还未熟呢。“黄粱”即小米。人们常用这则成语来比喻不切实际的幻想。毛泽东《清平乐·蒋桂战争》中便有“洒向人间都是怨,一枕黄粱再现”句。“黄梁”不可解。
各行其事(是)
[病例]“班长可真够厉害的,第一次见面就把大伙训了一通,说是全班必须统一行动,不能各行其事。”[诊断]音同义混致误。事、是,读音均为shì,均可作“行”的宾语,但语义不同。“是”,义为正确:“其是”,即自以为是对的。所谓“各行其是”,即各人按自以为是对的一套去做,表示意志不统一,行动不协调,而不是各人干各人自己的事。
渊源(源远)流长
[病例]“中国诸子百家学说,渊源流长,名家辈出,著作丰富。”[诊断]音近义混致误。“渊源”、“源远”中的“源”,都指本原。源远流长,义为源头很远,水流很长,比喻历史悠久。“源远”和“流长”均为主谓结构,两者构成联合式成语。“源远”和“流长”
还有因果关系。“源远”和“流长”还有因果关系。白居易《海州刺史裴君夫人李氏墓志铭》:“夫源远者流长,根深者枝茂。”因为“源远”,所以“流长”。“渊源”为名词,本指水源,也可泛指事物根源,如“历史渊源”、“家学渊源”等,和“流长”不能搭配。
名躁(噪)一时
[病例]“往西行,是名躁一时的红灯区,专门经营黄色书刊、录像和3X级的电影。”
[诊断]音同形似致误。躁、噪,读音均为zào。“噪”本作“操”,“木”上三口,会意为群鸟争鸣。后人增“口”为形符,其义仍为虫鸟鸣叫。如王籍《入若耶溪》:“蝉噪林愈静,鸟鸣山更幽。”引申指喧腾、轰动,“名噪一时”即声名煊赫,人所共知。躁,《说文》从走,义为疾速,引申指性急气浮,如骄躁、急躁、浮躁等。
曲曲(区区)小数
[病例]“今天对一个单位来说,五千元也许只是曲曲小数,但在当时,却是全院科研经费的一半。”[诊断]音同致误。曲、区,读音均为qū。区区,《广雅·释训》:“小也。”常用来指微不足道的人、事、物。张天翼《春风》:“区区六毛钱,就值得这样天天来讨!”“区区”极言“六毛钱”为不足挂齿的“小数”。又可引申作自称的谦词。曲,义为不直。重叠后可作貌词,形容弯曲的样子,如“曲曲折折的路”、“曲曲弯弯的河”。“曲曲”和大小多少无关。
心心相映(印)
[病例]“陈永贵觉得这酒没有一点水分,喝得心心相映,从中看到了中国一代农民对他的热爱的理解。”[诊断]音近义混致误。映,音yìng,后鼻音;印,音yìn,前鼻音。映、印均可和“相”组词,但词义有别,“映”为照射,“印”为印证。成语“心心相印”,原为佛教禅宗语,出自《黄檗传心法要》:“自如来付法迦叶以来,以心印心,心心不异。
”本义为不凭借语言,可以心印证佛法。“相映”,相互辉映,两者存有距离,不能表现出“相印”的契合无间的意思。
彼彼(比比)皆是
[病例]“这种用法,不中不西,近年来很流行,翻开报纸,彼彼皆是。”[诊断]音同致误。比、彼读音均为bǐ。比为会意字,甲文、金文呈两人相并形,义为靠得很紧,如“鳞次栉比”、“比翼齐飞”。比比,一个挨着一个。“比比皆是”义为到处都是。“彼”为代词,可作指示代词“那”,如“此起彼伏”;也可作人称代词“他”,如“知己知彼”。“彼彼”不可解。
以警(儆)效尤
[病例]“对他们的惩处应罪加一等,从重从严,以警效尤,而绝不可以这样那样的理由姑息养奸。”[诊断]音同义混致误。儆、警,读音均为jǐng,又均有警示、告戒义,但构词习惯不同。成语“以儆效尤”为固定词组,不宜随便改动。在现代汉语中,两字还有微小的差别:“警”一般不单独带宾语;“儆”除了表示警告外还有使约束、使收敛、使畏惧的意思,故《现代汉词词典》的解释是:“让人自己觉悟而不犯过错。”
传种(宗)接代
[病例]“没个男孩还行?你要知道,他可把传种接代看成是人生头等大事。”[诊断]音近义混致误。种,音zhǒng;宗,音zōng。“传种”和“传宗”,都有繁殖延续的意思,但使用范围不同,前用于动植物,后者用于人类。“传宗接代”为联合式结构,“宗”义为宗族,指同一父系的家族;“代”义为世系,如“上代”、“下代”。“传宗”义同“接代”,即旧时生儿子以承接香火的封建意识。“传种”则不和“接代”拾配。
繁体字三误
写繁体字,眼下成了一种时髦。但有些人对繁体字是一知半解,结果往往贻笑大方。经常见到的失误有以下三种情况。
一是张冠李戴。日前路过某理发店,只见招牌上赫然写着“××发廊”。在《汉字简化总表》中,“发”只是读音上相近,意义上并无关联。从“弓”得义,有发射、发表、发达等义项;从“髟”得义,只有头发的意思。人们走进这家“发廊”,不知如何理得头发。还有将“法制”误为“法廊”,“往”误为“往”,都是这类问题。
二是指鹿为马。明明不是简化字,硬认作简化字,再加以繁化,以致驴头不对马嘴。某电影海报上有“皇后”二字,这个“后”字并不是简化字,甲骨文、小篆中都有。这是个会意字,本义指国君,后来才成为后妃之专名。但这幅报上却想当然地把“后”写成繁体字前後的“後”。“皇后”成了“皇後”,不知所云矣!
三是不伦不类。既像繁体字,又像简化字,繁简混杂,成了根本不存在的怪字。比如有人把“观”字写成“觀”,左面是简体,右面是繁体;把“认”字写成“認”,左面是繁体,右面是简体。这种怪字如果只是手写,还无伤大雅,值得注意的是,有些出版物上也时有所见。这类字往往是手刻或电脑拼制的。比如有份杂志的编委名单上出现了“氵仆”姓,这显然是“濮”字之误,编者误以为“仆”可以类推简化为“仆”,结果导致失误。
照相机的“相”和录像机的“像”“camera”传人中国后,被译成“照相机”。这很有道理,因为“相”指物体的外观,照相自然是照物体的外观。和照相机有关的相片、相纸、相册,也都用“相”。多年来,人们已习以为常。其间,虽然有人把“相”写作“像”,但是不成气候,不被我们多数人所接受。
后来
有了录像机,随之而来的还有录像、摄像、录像带、录像片等语词。这些语词中的“像”虽然也有人写成“相”,但是属少数,难与主流抗衡。1996年版的《现代汉语词典》里,“照相机”这个词里用的是“相”,而“录像机”、“摄像机”这两个词里用的是“像”,正反映了当前社会用字的真实面貌。
如果有人问,照相机的“相”和录像机的“像”,能不能用同一个“相”或“像”,我们该怎么回答?从语言学来说,它们表示的是同一语素。汉字是语素文字,既然是同一语素,当然要写成同一个字。那么,为什么又写成了不同的字呢?这只能从历史上找答案。照相机这个词出现较早,在上个世纪末就已经有了吧。1925年鲁迅写《论照相之类》,其中说到“三十年前,S城却已有照相馆了”。民国初年出版的《辞源》已经收了“照相器”词条,这表明那时的习惯是用“相”。录像机、摄像机这一类词语生成很晚,到七八十年代才开始流传。这个时候社会用字的习惯变了,趋俗了。“相”表示物体的外观,有文言色彩,而“像”
表示图像,自然是白话语词。人们不大愿意使用比较费解的“相”,而愿意使用更容易理解的“像”。再从读音来说,“相”“像”自古不同音。《广韵》:息亮切,是去声;像、徐两切,是上声。在北方官话中浊上归去,两个字变成同音;不但同音,而且意义相近,使用上自然容易相通。“相”和“像”是在不同时代形成的不同用字习惯,如今出现在同一个平面上自然显得不协调了。怎么解决?如果都改为“像”可以合乎发展的趋势,但是“相”使用的时间很久,“相”字有家族的成员又很多,影响深远,不可小视。贸然改动,恐难奏效,只有维持现状,等待时间的裁夺,至于有的方言中至今“相”“像”仍旧不同音,情况就更复杂些。不过如今普通话的影响很大,普通话用字的习惯对方言常常有决定的意义。