歷時8年研製的《通用規範漢字表》12日起面向社會公開徵求意見。字表發佈後,社會各領域的現代通用漢字,原則上應使用表內字。
對於每天都要說話、寫字的現代人來說,這套規範解決了哪些問題?對日常生活和學習有何意義?教育部有關負責人和專家對此進行了解讀。
字表分三級 收字8300
國家語委副主任、教育部語言文字資訊管理司司長李宇明說,《通用規範漢字表》是《中華人民共和國國家通用語言文字法》的配套規範,是現代記錄漢語的通用規範字集。
據介紹,《通用規範漢字表》收字8300個。根據字的通用程度,字表劃分為三級:一級字表收字3500個,是使用頻度最高的常用字,主要滿足基礎教育和文化普及層面的用字需要。二級字表收字3000個,使用頻度低於一級字。一級、二級字合起來共6500字,主要滿足現代漢語文本印刷出版用字需要。三級字表則是一些專門領域,包括姓氏人名、地名、科學技術術語、中小學語文教材文言文使用的未進入一、二級字表的較通用的字,共收字1800個,主要滿足與大眾生活和文化普及密切相關的專門領域的用字需要。
每個規範字都有來歷
能夠入選一、二級字表的漢字,是根據其使用頻率來確定的。專家們採用了9個資訊龐大的“語料庫”的數據進行了統計。據北師大文學院講師卜師霞介紹,最為主要的兩個語料庫是“國家語委現代漢語平衡語料庫”和“北京語言大學現代新聞媒體動態流通語料庫”,收錄的漢字量分別為9100萬和3.5億。
“《通用規範漢字表》中收錄的每個字,都有明確的來歷。”北師大文學院講師淩麗君說,漢字中有大量的異體字存在,為了確保字表中收錄漢字的規範性,研製工作組的專家學者們對每個漢字的出處、正異對應關係都進行了檢索和考證,為此甚至查遍了包括《四庫全書》在內的典籍文獻。
罕見姓氏得以被正名
“氾”、“仝”、“谿”、“缐”、“甯”,這些字曾被視為“泛”、“同”、“溪”、“線”、“寧”的異體字或繁體字;但是很少有人知道,它們其實原本也是姓氏。出於對家族傳統的尊重,在此次制定的《通用規範漢字表》中,這些漢字首次以姓氏用字的身份,被保留在三級字表中。
字表研製專家工作組組長、北師大文學院教授王寧以“缐”字舉例說,一些“缐”姓人士曾向專家們反映:“這個字中的部件‘泉’,給人流動的感覺,換作‘線’中的兩個‘戈’,這層美好的意義就被破壞了。”而恢復這些罕見姓氏的本來面貌,將使得標誌血脈傳承的功能和文化內涵的姓氏用字得以保存。
一些漢字能夠收入字表,是基於人性化的考慮。比如“喆”原本被視為“哲”的異體字,但是研製工作組的專家學者們經過調查發現,全國有兩萬多人的名字中選用了這個字。專家們接受了民眾的意見,認為,“喆”字中兩個“吉”並排看起來很祥和,比“哲”字更適合取名,因而把它收入了三級字表,專門作姓名用字使用。
據了解,此次公示的字表中共恢復了51個異體字,調整了6個繁體字。不過這些異體字和繁體字並不能任意使用。王寧教授解釋說,字表做了明確的規定,這些字只能限用於特定的地名或姓氏、人名用字;在一般意義上使用文字時,還不能隨便寫異體字和繁體字。
8300個規範字夠用嗎
曾有一些消息靈通人士提出:現在進入國際編碼的漢字已有近8萬個;此次字表中的規範漢字卻只有8300個,僅憑這些字真的夠用嗎?對此王寧教授回應說:“漢字不是越多越好,而是適用為好。比如全套的《十三經》,是公認的文化經典,詞彙非常豐富,不過才使用了6000左右不重復的字。”
從文字使用頻率的統計來看,真正的通用漢字其實也不多。王立軍教授介紹說:“字頻排列在3000以後的漢字,已經很少使用了;統計表明,僅僅書寫現代漢語文本的用字,一、二級字表的6500字就覆蓋全部語料的99.8%,加上三級字表的1800字,餘下的字用處實際很少了。”
原則上不恢復繁體字
李宇明介紹,對繁體字恢復和類推簡化問題,曾進行過反覆的研討。研製組最終得出的結論是:為了維護社會用字的穩定,字表原則上不恢復繁體字;將類推簡化的範圍嚴格限定在字表以內,以保持通用層面用字的系統性和穩定性;允許字表以外的字有條件使用,但不類推簡化。
本報綜合新華社、北京晚報等報道