叁 《中国语言生活状况报告(2006)》的汉字应用统计情况为实现语言文字跟踪调查的连续性,在2005年报纸、广播电视、网络 (新闻) 用字用语调查基础上,国家语言资源监测与研究中心利用国家语言资源监测语料库 (包括平面媒体、有声媒体、网络媒体)对2006年报纸、广播电视、网络 (新闻)用字用语的情况再次进行了调查。 调查语料分为平面媒体 (15种报纸——与2005年一样) 、有声媒体 (10家电视台——比2005年少三家,广播节目语料51个栏目)、网络媒体 (5家) 三种,共计1311749个文本文件,1170369879字次 (包括标点、符号及西文字母、数字等; 不包括无法显示的字符) ,其中汉字出现的总字数计978994406字次(指全部语料中汉字出现的总字次) 。调查结果为: 字种数: 指字形不同的汉字,计9231个。与2005年调查的8128个相比,字种数略有上升。这与语料扩大有关系。 覆盖率: 2005年,调查了7亿字的语料,2006年调查的语料大约9亿字。这两年的统计结果如下: 使用频次稳定,比如说2005年覆盖整个语料80%,只用了581个字,覆盖语料90%用了934字,覆盖语料99%用了2314字。2006年的情况是,覆盖语料80%,用了591个字,多了10个字; 覆盖语料90%是958个字,多了24个字; 覆盖语料99%是2377个字,多了63个字。显然2006年用字比2005年用的字在语料覆盖上多了一些,但是,在使用频率最高的前600个字中,只有21个字不同,前1000字中只有34个字不同。 与《现代汉语常用字表》 比较: 2006年用字总表的前2500字,与《现代汉语常用字表》 的一级常用字比较,差距很大,有331个字不在一级常用汉字中。总表的前3500个高频字与 《现代汉语常用字表》 比较,有388字不在 《现代汉语常用字表》里。前7000字与 《现代汉语通用字表》 比较,有517字不在《现代汉语通用字表》 中。这个情况,与2005年的调查情况基本相同。 高频词语用字中,构词能力最强的前10个字为:[6]

这次调查情况说明,语言生活始终处于发展变化之中,但其变化的特点是“稳中有变”。比较现在的用字和过去发布的语言文字用字规范情况说明,我们今天的语言生活已经有了很大的变化。这也给我们提出了一个任务,应该对已有的汉字规范进行修订和调整。
注释[1] 华东师大中国文字研究与应用中心. 商周金文数字化处理系统[Z]. 南宁: 广西教育出版社,2003,11. [2] 徐中舒主编. 汉语大字典[M]. 四川辞书出版社,湖北辞书出版社. 1993. 11: 2232. [3] 王鼎吉.字的基本知识60题[M].北京: 中国和平出版社,1996: 235. [4] 国家语言资源监测与研究中心. 中国语言生活状况报告2005·下编[M]. 北京: 商务印书馆,2006.9: 5-9. [5] 国家语言资源监测与研究中心. 中国语言生活状况报告2005·下编[M]. 北京: 商务印书馆,2006.9: 33-60. [6] 国家语言资源监测与研究中心. 中国语言生活状况报告2006·下编[M]. 北京: 商务印书馆,2007.8: 1-14. |