【美东南随笔】实现汉字拼写,华文走向世界
古老而神奇的汉字,历来被认为是表意兼表形的东方文字。因此她似乎和西方文明中的表音文字、拼音文字利用字根和字缀的拼写方法、拼写规则无缘。汉字不能拼写,也没有成熟的拼写规范可以遵循,这样先入为主的成见,在人们的观念和认识中,根深蒂固,人们也习以为常,认为是天经地义、不可改变的现实。人们一直局限于在汉字整体之外,只有部首这样残缺的成分雷池之内,因因相袭,延续了几千年。
自东汉许慎《说文解字》首次建立540部部首以来,后人逐步精简演变为现行的214个部首。目前公认并流行在华语圈的工具书一般采纳214部部首体系。另外大陆中国有的编著者把部首进一步合并、删减,压缩到201或189部不等。但是由于这并非汉字完整体系的全部,在应用中给海内外教育工作者、教师、学生在学字、查字、用字的生活和教学过程中带来学多不便和困扰。
查许慎的汉字540部部首,实际上是现代意义的部首和一部分与之匹配的字干这两类字的混合体。后世人们对其进行精简和删除,虽然创立了较为合理和适量的214部首体系,同时顾此失彼,丢失了认识与之配套的汉字字干的机会,使有关汉字组字结构的重大秘密的揭晓失之交臂,成为千古遗憾。从此也使汉字合体字的另一半,字干,埋没在历史的长河中数千年而不为人所知。从此中国人认读、查找、检索、书写汉字,下至幼童从启蒙起,上至成人, 除了认识部首,就是学习笔画、笔顺、残缺不全的部件、字的静态结构, 以笔画为基本书写单位写部首,写整个合体字。
最常用的部首查字法,也是以部首为线索,然后计数其余的笔画,找到相应的汉字。长期以来,很少有人注意到在汉字的部首之外,汉字的构字成分另有一番天地。人们认字、记字、写字时,往往习惯于用笔画作为构建汉字字形的基本单位,这原本只适用于独体字的书写方法,用在合体字身上,显然不适宜。但是迄今为止,书写或者表述汉字合体字的构成一直没有一套科学合理的程式和相应技术。试想,汉字作为一种文字体系,只有部首,在部首之外没有相应的构字成分与之匹配,这是一种跛足的、残缺的体系。
作为具体的单个汉字,既然有部首作为汉字的检索依据,有心人自然要问:一个汉字,除了部首之外,另外的部分是什么?是部尾吗?是字身吗?还是字干呢?他们是否有共通的、规律性的东西存在?这另外的神秘成分,究竟在汉字的体系中起什么作用?
假若我们把占汉字绝大多数的合体字比作有生命力的树,把部首看作汉字这棵生命之树的根,那么汉字的其余部分不正是相当于树身的字干吗?以动态的眼光看待汉字,换句话说,汉字的独体字是组字的基本单位,是汉字的源头。这些源头字包括字根和字干。其他具有组字能力的字干分别是二级字干和多级字干。假设通过二百余个字根可以在字典里查到五千至几万个汉字,那么也可以突破原有的思维框架,进一步大胆设想和推定,汉字作为完整的文字体系,以有限的、少量的字根(N1),与其他有限数量(N2)的汉字字干经过某些固定的组合方式,就组成了几千个常用字,乃至上万个通用汉字或更多的汉字。这就是汉字“以字生字”的二元板块构字原理。
这些有限数量的源头汉字究竟有多少?它们到底是哪些字?据文献记载,历史上曾经有人试图整理和归纳汉字部首以外的组字构成规律,比如作为学者的陈独秀先生在上世纪四十年代就分析出几百个汉字“字根、半字根”。 上世纪90年代也有香港学者安子介研究汉字的拼形规律,总结出七十余种汉字组合拼形的类型,终因其过于繁琐、缺少实用性而无法推广。上世纪九十年代有大陆学者张恩普教授提出汉字可以拼写的设想和命题。近年有大陆学人黄晋书提出汉字字元专著(实际就是字根和多级字干的总和)。然而这项工作始终没有彻底圆满完成。其现实价值和实用意义也没有得到学界和社会的普遍认识,更谈不到开发和应用。
今天,在前人研究和探索的基础上,笔者以英文等西方拼音文字的拼写规则为借鉴和启发,以国文常用五千字至一万字为出发点,把原有部首整理为170个,制定为《中华字根表》;把符号化的部首连同其本字(30余个主部)分离出来,编制成《汉字象形符号表》。初步核定部首以外的汉字构成成分即“中华汉字字干”,其总量亦在二百余个初始汉字(独体字),产生《中华字干表(一级)》,加上由此衍生的二级字干和多次组合产生的多级字干(它们本身是可以再次组字的合体字)分别制作《中华字根表(二级)》和《中华字根表(多级)》共三个字干表,形成汉字的字干体系。考订在产生终端字之前,总共有八百余个具有组字能力的汉字,作为字干,配合汉字200个字根,可以构成几千乃至更多的汉字。这个设计和理论至少适用于目前现代通用汉字一万字的这个范围。
就其本质说,汉字的造字过程、组合过程就是汉字的拼写过程的原始依据或蓝图。笔者无意中发现,中国的祖先圣贤其实把汉字的所有拼写规则早已经预先内置在古老的汉字里了。只要用心就可以发现其全部秘密,这就是先人造字时在合体字里面留下的造字接缝。独体字是以单笔笔画,依一定的方式拼出汉字独体字(文)的字形。合体字是以已有的独体字或合体字,和其它独体字或合体字再次组合,拼出新的合体字的字形(字)。既然汉字是“以字造字”发展而来,那么我们可以反过来,逆向分解合体字,再以字拼字,还原汉字合体字的造字组字过程。可惜人们没有注意到独体字拼形和合体字拼写存在着本质上的重大区别,一直以来把合体字的拼写混同于零星笔画的繁琐组合,或者是零星部件和笔画的混合,割裂了合体字各构字成分之间的有机联系。也使得学字识字、写字、记字变得异常缓慢和艰难。寻找汉字的简洁实用的拼写规则,以公式形式确定并使之规范化,就是攻克汉字字形难关的一项重大任务,是迫在眉睫、至关重要的一步。
汉字的拼写方法,是循着每个字的造字线索,组字的方式总结和归纳而来。幸运的是,根据汉字现有的六七种静态结构类型,根据现有通用楷体汉字字库,寻踪探源,还原、复制汉字的造字组字过程,终于发现了汉字合体字的十种动态组字方法,这就是汉字拼写的十大法则。这些拼写类型可以涵盖大约至少95%以上的合体字。特别注意,汉字动态拼写要求对笔画实行静音处置,摒除笔画名称、笔顺、笔画位置的干扰,因为这些程序和步骤在独体字范围之内理应完成。拼写合体字时要像组合积木一样,一律以文字(包括独体字,也包括原始字干、二级字干和多级字干)为基本拼合板块(building blocks),从而以最简捷明了的方式──二元结构,实现方块字动态的快速组字/拼写出汉字。至此,不但完善了汉字字根、字干的汉字结构的完整体系,跳出了笔画的干扰和局限,完成了从偏旁部首向规范化的功能和界限分明的字根、字干完整体系的转换,而且把汉字板块理论付诸实施。由此归纳出绝大部分常用合体字的构字规律,从而为汉字的动态拼写奠定了坚实可靠的技术基础和实际操作的具体步骤和规范。
根据这些拼写规则,为每一种汉字构字方式确定一个特定的符号代表其拼写规则,如同数学公式,x+y=z, 1+2=3。内容就是“汉字字根+汉字字干=目标字(合体字)”,“汉字字根+汉字字根=目标字”,或者“汉字字干+汉字字干=目标字” 。创立了汉字拼写口诀的实用操作步骤, 建立起《汉字字根表》、《原始字干表》、《二级字干表》、《多级字干表》,配上《汉字象形符号表》,以字根表、字干表为纲,所有的合体字为目,以合体字的拼写规则为契机, 提出了“汉字动态导航图”这样一个学习、辨别、认读、记忆、书写汉字的完整的学习汉字、应用汉字的科学、规范化的体系。每个汉字在拼写过程中,都分为初始字、衍生字和终端字这样确定的身份和归属。适当调整字根表和字干表,汉字拼写规则适用于简体字和正体字(繁体字)两种文字体系。至此,人们盼望了几千年的,以动态拼写规则为核心的汉字导航图终于水到渠成,应运而生。
汉字动态拼写的方法和目前的书写汉字的以笔画为书写基本单位的常规做法相比,具有明显的、无法比拟的优势。它摆脱了笔画、笔序在书写合体字时对人脑、视线及操作过程的干扰,克服了笔画繁杂、数量多、部件零散、称说混乱又困难的难以驾驭字形全局结构带给学生的诸多不便和困扰,使辨认、反馈、记忆、书写汉字的各个环节都变的简明而有序。
虽然随着电脑的文字处理功能的不断完善和普及,今后人们用手笔写字的机会和工作量会大大减少,但是人们学字、认字和记忆回想所学汉字时仍然需要一种简单又快捷的汉字字形表达式,也是图像和文字符号的表达式──汉字组字的程式。汉字拼写规则如实地体现了汉字以字生字、以字组字的内在规律,以字根和字干的字形和字音这样的二元双拼形式第一次使汉字也加入了世界上主要的可以快速、动态拼写文字的共性文字序列。这也是记忆汉字的既方便快捷又科学合理的有效门迳。
有充分理由相信,海内外普通民众、广大中外人士,特别是西方非华语的、习惯于拼音文字人士,广大的家长和学生群体,在了解和领会了汉字拼写规则的秘密和优点之后,一定会对中华文明的博大精神、中华文字之中的智慧和奥妙、汉字的神奇魅力所吸引和折服。对千千万万学中文的少年幼年学生,也会产生非比寻常的吸引力。从此以后,无论是写汉字,还是记忆汉字,学生都可以根据汉字拼写规则快速回忆或描述(在大脑中准确检索、分辨和调出)一个字的拼写公式和口诀,大大减轻记忆的负担。普及汉字,使汉字真正走向世界将成为现实而不是梦想。同时静候我们华人社区有望在世界范围也可以举行类似英文蜜蜂拼写大赛那样的华文拼写大赛。
汉字拼写规则及拼写实例:
1.汉字拼写公式中组合方式符号意义如下:
左右式(空档 default mode);垂直式;交错式;包裹式;简省式~;封闭式;嵌入式;叠加式+;等分式;离散式)
注意,除了简省式拼写规则因其特殊性质可根据具体情况分属于各种类型之外,其余每一种拼写公式所代表的组合类型是唯一的和排他的,即字根架一旦确定,字干的配置位置是唯一性的;反之亦然:如果字干架确定,则与之组合的字根的位置也随即确定下来而且是唯一性的。也即是说,一旦组字方式改变,相同的组字成分组字结果肯定是另一个字。如加木=架,木加=枷,木几=机(简体字);木几=机(正体字),几木=朵(简体字),水工=江,工水=汞。
2.中华文字拼写字例:
左右式(空档DEFAULT MODE)日月=明;虫工=虹,土也=地,日青=晴,舌甘=甜,工力=功,