摘要:
楚系简帛文字的释读一直是古文字学的重点研究方向,然而目前多依赖人工手段对单字形体开展分析,缺少用计算机视觉技术对海量文字图版进行字形识别的尝试。研究针对大量楚系简帛文字图像识别困难的问题,结合楚系简帛文字的内在特征,不局限于单一深度神经网络模型和单一文字图片分析的微观视角,提出了一种基于集成学习策略的楚系简帛文字图像分类方法,即使用四种深度学习网络提取楚系简帛文字图像的共同形态学特征,并以投票形式得到最终的分类结果,从而构建了计算机自动高效识别海量楚系简帛文字图像的技术框架。应用该框架对目前出土的部分简帛材料中的文字图像进行识别,准确率高达96.72%,充分证明了该框架的可行性和有效性,为古文字研究提供了新的路径。
中图分类号: