针对古籍文献版面图像切分中存在的过切分和粘连等问题,提出基于犹豫模糊集的古籍汉字图像切分方法。首先,对古籍汉字版面图像进行连通区域搜索,获取版面中的笔画部件,实现古籍汉字的初切分;然后,对过切分汉字进行特征分析,提取过切分区域的特征,利用犹豫模糊集在处理多属性决策问题方面的优势,通过建立犹豫模糊集来判断过切分区域归属同一古籍汉字的隶属度,并据此进行过切分区域的合并;最后,对存在粘连和重叠的汉字采用分段像素跳跃数突变分析方法进行分割。在28 886个古籍汉字上的实验结果显示,可以达到92. 3%的切分准确率和85. 7%的过切分合并准确率。
类型: 期刊论文
作者: 齐艳媚,田学东,左丽娜
关键词: 古籍汉字图像,切分,犹豫模糊集,连通区域
来源: 科学技术与工程 2019年30期
年度: 2019
分类: 工程科技Ⅱ辑,信息科技
专业: 计算机软件及计算机应用
单位: 河北大学网络空间安全与计算机学院
基金: 河北省教育厅河北省高等学校科学技术研究重点项目(ZD2017208)资助
分类号: TP391.41
页码: 232-240
总页数: 9
文件大小: 2777K
下载量: 112
本文来源: https://www.lunwen66.cn/article/cce3dec5d8f503cc8ea09133.html