摘要:
[背景/意义]历史文本是历史学研究的基础素材,通过对文本内容的爬网,历史学家将文本中有意义的信息整理、拼凑并脉络化。历史学是一门研究人在时间中的活动轨迹的学科,在加入地理空间的概念之后,历史文本将变得更加立体。跳脱以往在纸本数据中的线性阅读,对信息时代的历史文本,通过技术的协助增添词汇标记,再利用对标记词汇的分析与可视化,鸟瞰并掌握历史文本中隐含的脉络。[过程/方法]通过探讨历史文本中人物、时间、地名与对象词汇标记对历史研究的意义,描述各种标记的目的与特性,尤其指出词汇标记不只是辨识词汇,还需要达到“消歧” 与“聚合”的功能。同时介绍两个自动标记工具——“码库思古籍半自动标记平台”(MARKUS)和“批次标记工具”(CT Tool)。这两个工具使得大量快速标记人、时、地、物成为可能。[结果/结论]透过实际的研究成果案例,说明如何运用标记过的文本;透过时间、人物、地理与对象词汇标记的实际效益,说明历史文本中的词汇标记及其在历史研究中的应用。最后讨论事件标记的问题,指出事件标记与其他词汇标记本质上的不同。