《声律启蒙》原文文本结构化数据库的设计与实现
打开文本图片集摘要:研究了《声律启蒙》原文文本的声韵格律的虚实对应,设计了对应电子数据库的结构化方式,给出了从文本到数据库数据转换的算法流程,得到的数据库为进一步的智能检索系统提供了基础。关键词:声律启蒙;中文自然语言处理;数据库0.引言清朝康熙年间车万育所作的《声律启蒙》是训练儿童应对、掌握声韵格律的启蒙读物。它分为上下卷,按韵分编,包罗天文、地理、花木、鸟兽、人物、器物等的虚实应对。从单字对到双字对,三字对、五字对、七字对到十一字对,声韵协调,琅琅上口,从中可以得到语音、词汇、修辞的训练。本文研究的主要目的,是以《声律启蒙》原始本为基本参考,利用信息技术和自然语言处理技术全面对其电子化和信