%0 Journal Article %A 项洁 %A 胡其瑞 %T 历史文本的词汇标记及其应用 %D 2021 %R %J 数字人文研究 %P 48-64 %V 1 %N 1 %X

[背景/意义]历史文本是历史学研究的基础素材,通过对文本内容的爬网,历史学家将文本中有意义的信息整理、拼凑并脉络化。历史学是一门研究人在时间中的活动轨迹的学科,在加入地理空间的概念之后,历史文本将变得更加立体。跳脱以往在纸本数据中的线性阅读,对信息时代的历史文本,通过技术的协助增添词汇标记,再利用对标记词汇的分析与可视化,鸟瞰并掌握历史文本中隐含的脉络。[过程/方法]通过探讨历史文本中人物、时间、地名与对象词汇标记对历史研究的意义,描述各种标记的目的与特性,尤其指出词汇标记不只是辨识词汇,还需要达到消歧聚合”的功能。同时介绍两个自动标记工具——“码库思古籍半自动标记平台MARKUS)批次标记工具”(CT Tool)。这两个工具使得大量快速标记人、时、地、物成为可能。[结果/结论]透过实际的研究成果案例,说明如何运用标记过的文本;透过时间、人物、地理与对象词汇标记的实际效益,说明历史文本中的词汇标记及其在历史研究中的应用。最后讨论事件标记的问题,指出事件标记与其他词汇标记本质上的不同。

%U http://dhr.ruc.edu.cn/CN/abstract/article_5.shtml