光明日报北京6月21日电 记者刘茜从北京语言大学得到消息,我国在汉字字形处理和留学生错字库建设方面获得探索性成果——汉字输入暨识别系统问世,这对于学习汉语的留学生和进行对外汉语教学的老师来说是个利好消息。这个系统有助于解决对外汉语教学中一直以来存在的汉字难学的问题,该系统也可以用于典籍的文字保真输入、检索比对分析和出版,从而推进中华文化的保护和传承推广工作。 据了解,汉字输入暨识别系统已输入国际标准基本字符集中的全部20902个汉字,并输入了一批典型错字,建立了欧美留学生错字数据库。数据库中包含了从50万字、1千多篇留学生作文中抽取的全部错字。建立了高频错误偏旁库,对错字、错误偏旁和错误笔画组合进行了统计分析。 这个系统能使用输入笔或鼠标输入汉字,包括正字、错字和变体字,无须训练就能识别输入的汉字;并能与各种通用编辑器、数据库工具结合,从而能在字形保真的前提下输入留学生的作文,能建立留学生错字数据库,并能利用通用工具的各种功能,像处理正字一样地处理错字、变体字。 |