作者投稿查稿系统 作者须知 | 论文模板 | 版权转让协议
专家审稿 | 编委审稿 主编审稿 | 编辑办公
最新录用 | 当期目录 | 过刊浏览 阅读排行 | 下载排行 | 引用排行
数字人文时代的古典文学文献辑佚对学者提出了两方面的要求。一是要延续传统辑佚学、目录学和版本学的经验,主动对接数字人文领域最新技术方法。在辑佚准备阶段,应结合目录学传统经验明确文献范围;在深挖拓展阶段,应利用GIS 和社会网络分析等数字人文手段获取更多线索;在录入校勘阶段,应长期关注辑佚对象,反复利用最新数据库和资料开展续辑和校勘;在辨伪定本阶段,应灵活运用传统“知人论世”法与数字化考据方法。二是要灵活运用各种数据库与工具。针对检索型数据库,需要预先设置关键词,并结合辑佚所得随时增补调整。在现有检索型数据库中,地方志数据库的辑佚潜力最大,值得加强利用;针对尚未全文化的影像型数据库,可自行编制专题性索引或建设题录数据库,从而为辑佚工作建立新的增长点。此外,一些习见常用的其他领域数据库如知网、读秀等,有时也能为辑佚工作提供意想不到的帮助。
在文化遗产信息资源数量爆炸式增长的态势下,能否高效抽取非结构化数据构成的文化遗产信息资源中的知识,影响着是否能更有效传播和弘扬优秀传统文化。文章以文化遗产信息资源文本为研究对象,提出将其按来源分类,根据不同的知识分布特点选取针对性的关键词提取方法,获得关键词后在知识图谱中检索文化遗产实体与关系,完成知识抽取的路径。实验结果表明,研究所确立的分类关键词提取方法在多个阈值条件下较其他方法有较大提升,能够较好地抽取非结构化数据中的文化遗产知识。