常用及通用字的部件及基元
发表于 2007-8-21 14:16:43 |只看该作者 mfl1335 |倒序浏览
常用及通用字的部件及基元
主旨:
相对于拼音文字而言,汉字可认为是拼形文字。拼形基元应是汉字最小的结构单位,亦可称为汉字字母,可自拆分汉字而得。
汉字的主要缺点是字形结构过于复杂,若能找出一组精简的汉字基元,按照一个标准的笔序,就可较轻易的去组合繁、简通用字。
在拆分实践过程中,去发现汉字的结构问题,建议优化一些字,是本文的另一目标。
1.0
取样范围
无疑的,两岸现行规范字应为取样的首要对象。取样的范围有二:
1.
样本1.(rtc) 常用字:包括大陆规范(陆规)3,500个,台湾规范(台规)5,401个,两者并列为5,451组,分列为7,200字。此5,451个常用字,除包括台规全部常用字(5,401)外,实际上还包括了陆规次常用字1,575个。
2.
样本2.(ptc) 通用字:包括陆规7,000个,台规 5,401个,次常用1719个,两者并列为7,376组,分列为9,784字。其中还包括不在一方规范但在他方规范内的字,以及”一对多”的262个繁体字。笔者为求通用字的部件及基元,所要拆分的字,总共是 9,784个。
2.0
拆分原则
就现有多家部件理论及定义中,我比较同意费锦昌先生的说法。他认为部件是
“现代汉字字形中具有独立组字能力的构字单位,它大于或等于笔画、小于或等于整字。”
因此我的拆分原则只有一条:拆分后的部件,可否与他字”匹配”,作为独立的构字单位,如可就拆;否则就把它当作一个部件。”匹配”意为通用性,是指部件有较强的独立组字能力,可以参与两个以上不同结构的构字。通用性符合部件理论提出的意义,
可视为部件的重要特征。但是在具体运用该原则时,各种理论间存在一定分歧。因此为实践拆分作业,避免拆分的任意性,须定出一些拆分规则。
拆分要避免任意把笔划断开,或重复使用同一笔划,这样才可保持汉字的属性(笔划
数目)于不变。拆分要按照笔序;对于互相交夹的部件,则要按起笔的先后为序;有
次序的拆分才会有利于汉字的学习。
拆分有二义性时,须衡量不同选项的权重大小,以大者为优先:
A. 就部件与部件间的界面言:离 > 接 > 夹(重迭,但笔划不交叉) > 交(重迭,但笔划相
交)
B. 就拆分后的部件言:成字 > 部首 > 构件(可与他字匹配的部件);而就笔划言,多笔
划>单笔划
C. 就有、无理据言:有字理 > 无理据
拆分后的部件,可作为编码的参考。但为求汉字基元 (字母),不少部件须再行拆分。
3.0
拆分规则
1. 拆分后的部件不可全是单笔划,故2笔划的字不拆。
通用字笔划为2 的字有:二十丁厂七卜八人入乂儿九匕几刁了乃刀力又乜,计21个均
作为部件。
2. 部件相离、相接者可拆。
例:明[日月、乞[?乙、个[人丨、么[丿厶、勺[勹丶] 、亍[一丁]
若笔划少的部首不拆时。其相当的繁体或变形部首亦不拆。
例:馬(马)、門(门)、犬(犭)、糸(纟)、食(饣)、言(讠)均不拆。
3. 拆开后的任一部件,如果不能作为他字的构件者,不拆。
例:非 (非的左右部件只可与”非”组字,”非”不分)
4. 相夹部件可拆,部件的次序,依起笔的先后而定。
例:來- [木人人,起笔为木; 夾[大人人,起笔为大; 回[囗口]
5. 相交部件拆分的条件如次:
A. 相交部件如能依笔序分解者可拆。例:
禹- [丿口禸]
弗- [弓 丿丨]
堇- [廿口?] (?之竖笔延长之与口相交)
B. 不照笔序分解,但有字理可依者,亦可拆,例:
夷- [大弓
東- [木日]
6. 基本笔划(单笔划)的拆分
A. 非相交的单笔划:”一 丨 丿 丶 ㄟ 乙” 可拆,如:
丙[一内、歹[一夕、正[一止、 韭[非一、引[弓丨、矛[予丿、乏[丿之、失[丿
夫、釆[丿米、血[丿皿、主[丶王、良[丶艮、户[丶尸、尤[尢丶、乓[丘ㄟ
…。
但组字频率高的独体字或部首,其单笔划不拆出,例:
王(不折为一土);其它如:戈 牛 气 方 禾 白 自 豕…(均不拆)
B. 相交的单笔划则不拆,例:
中、甲、申-- 单笔划 [丨] 与其它部件相交,不拆。
C. 单笔划 [丶 ㄟ] 视同搭挂,不算相交,可拆,例如:
刃[刀丶、丸[九丶、孓[了ㄟ]
[
[ 本帖最后由 mfl1335 于 2007-8-21 23:42 编辑 |