栏目文章

Select

1. 段玉裁《说文解字注》知识库的构建与应用

沈小妮, 彭炜明, 胡佳佳

数字人文研究 2025, 5 (4): 68-83.

摘要（55）

PDF（pc）（7217KB）（87）

段玉裁《说文解字注》是“说文学”研究的巅峰之作，集中体现了乾嘉学派的学术成就。当前有关《说文解字注》的数字化工作多停留于文本化阶段，尚未实现对其知识体系的深度挖掘与系统呈现。研究以《说文解字注》及其稿本《说文解字读》为底本构建知识库，设计了涵盖五大知识范畴、十个知识集、五十六个知识点的三层分类体系，完成了数万条知识实例的标注与结构化表示；在此基础上，开发了具备原文检索、知识导览与标注管理功能的交互式平台；并以对段玉裁的谐声归部研究为例，验证了知识库的应用潜力。这是数字人文方法在传统语言文字学领域的一次系统实践，为古籍深度数字化与人文研究范式创新提供了重要参考。

相关文章 | 多维度评价 | 评论（0）

Select

2. 融合语义理解与图谱推理的党史文献模糊指代消解方法

冉凌宇

数字人文研究 2025, 5 (4): 84-98.

摘要（53）

PDF（pc）（1903KB）（49）

党史文献因广泛使用化名、代称并蕴含复杂隐性关联，其智能化处理面临严峻挑战。研究提出一种融合多策略语义理解与动态知识图谱推理的模糊指代消解方法，以解决该领域存在的语义鸿沟、时序演变与证据稀疏性三大难题。该方法构建了覆盖万余实体的党史领域词典与化名一真名映射库以注入先验知识；采用领域词典引导的负样本采样策略对预训练语言模型进行微调，增强其对特定表达的语义感知能力；最终在自建的时序知识图谱上，运用时间约束的图神经网络推理算法进行隐性关联挖掘与一致性校验。实验表明，该方法在权威评测指标上综合F1值达到80.6%，显著优于现有基线模型，并能有效发现深层历史关联。研究成果已集成至可视化原型系统，为党史研究提供了可靠的智能化工具。

相关文章 | 多维度评价 | 评论（0）

Select

3. 从探听“修辞回声”走向数字文学史——以定量分析松尾芭蕉在日本近代的接受为例

日比嘉高, 江晖

数字人文研究 2025, 5 (4): 99-117.

摘要（35）

PDF（pc）（2906KB）（58）

研究旨在通过对近代句中松尾芭蕉的接受情况进行定量分析，探索数字人文方法在文学史研究中的潜力。利用日本国立国会图书馆的数字收藏，统计了明治至昭和战前期间文献中芭蕉句的引用频率，并运用Jaccard系数对明治、大正、昭和战前期的大规模句集进行了相似性分析。研究发现，随着时代变迁，芭蕉对句的影响逐渐降低，而以芭蕉批评者著称的正冈子规的句却比明治时期一般句更接近芭蕉的风格。可见计算机定量分析能够捕捉人类难以察觉的表达差异，提取出人类和时代的“无意识修辞”。数字人文方法能够揭示传统研究难以触及的深层规律，为“数字文学史”的构建提供新路径。

相关文章 | 多维度评价 | 评论（0）

Select

4.

面向口述史文本分析的大语言模型提示工程与人机协同策略

马林青, 石佳琪, 曹星宇

数字人文研究 2025, 5 (3): 41-60.

摘要（464）

PDF（pc）（4140KB）（289）

历史研究长期依赖官方档案与精英著述，易导致个体记忆被边缘化。口述史则为重现被忽略的社会生活与个体记忆提供了独特窗口，但其非规范性、高语境依赖性及多维交织的文本特性，使结构化信息抽取和系统分析面临挑战。研究以票证口述史文本为案例，旨在探索并验证一套将大语言模型(LLM)“规训”为能够严格遵循研究指令的学术助手的“人机协同”方法论。研究设计了系统的四阶段渐进式实验，通过“基础指令—规则化指令—程序化约束—小样本学习”的迭代优化，探索如何科学、有效地利用LLM强大的语义理解与指令遵循能力，以实现高效、精准的结构化信息抽取。研究发现，提示词工程化水平显著影响LLM输出质量，精巧的程序化约束可将大模型分析准确度大幅提升。研究还系统比较了同一技术框架下为不同任务优化的LLM在逻辑遵循能力上的表现差异，验证了小样本学习的价值与效益饱和点，并揭示了LLM在精确计算等任务上的固有缺陷。研究最终提炼出一套面向口述史文本分析的包含“规则化转译”与“任务合理分工”等核心策略的LLM“规训”框架，实现了高效、精准的口述史文本结构化分析，为数字人文研究提供了一种可复现、兼具效率与深度的智能研究范式参考。

相关文章 | 多维度评价 | 评论（0）

Select

5. 重庆武隆盐井峡盐业遗址数字考古研究

邹秋实, 牛英彬, 宋海超

数字人文研究 2025, 5 (2): 31-44.

摘要（282）

PDF（pc）（3448KB）（639）

重庆武隆盐井峡盐业遗址承载着悠久的盐业生产历史，对研究古代手工业生产、区域经济、社会发展具有重要意义。文章详细阐述了在该遗址开展数字考古实践的过程，综合运用三维重建、地理信息系统（GIS）等数字技术,实现了对遗址的全面数据采集、虚拟重建与空间分析。通过数字考古，研究深入挖掘了盐井峡盐业遗址的历史文化内涵，为盐业遗址的保护、研究与展示提供了创新方法，也为同类文化遗产的数字化工作提供了可借鉴的案例。

相关文章 | 多维度评价 | 评论（0）

Select

6.

基于深度集成学习的战国楚系简帛文字识别

陈超, 李赫孜, 杨泽坤

数字人文研究 2025, 5 (2): 45-58.

摘要（543）

PDF（pc）（5188KB）（381）

楚系简帛文字的释读一直是古文字学的重点研究方向，然而目前多依赖人工手段对单字形体开展分析，缺少用计算机视觉技术对海量文字图版进行字形识别的尝试。研究针对大量楚系简帛文字图像识别困难的问题，结合楚系简帛文字的内在特征，不局限于单一深度神经网络模型和单一文字图片分析的微观视角，提出了一种基于集成学习策略的楚系简帛文字图像分类方法，即使用四种深度学习网络提取楚系简帛文字图像的共同形态学特征，并以投票形式得到最终的分类结果，从而构建了计算机自动高效识别海量楚系简帛文字图像的技术框架。应用该框架对目前出土的部分简帛材料中的文字图像进行识别，准确率高达96.72%，充分证明了该框架的可行性和有效性，为古文字研究提供了新的路径。

相关文章 | 多维度评价 | 评论（0）

Select

7.

表演艺术与数字人文：将计算分析与人类体验相匹配

扬-亨德里克·巴克尔斯, 马蒂亚斯·格罗特科普, 托马斯·舍雷尔, 贾斯珀·斯特拉蒂尔, 张佳明, 陈冬睿/译

数字人文研究 2025, 5 (2): 59-87.

摘要（362）

PDF（pc）（3466KB）（2589）

文章提出了一个将计算方法的要求与定性的、现象学的视听媒体分析方法相协调的框架。因其时间性和多模态特征，研究认为视听媒体可作为更广泛的表演艺术领域及其数字人文分析方法的范例。首先，研究主张将数字方法论明确建立在人类表演艺术体验的学术理论基础之上，并概述了一种定性方法，用于研究视听媒体中的创作模式和情感动态。为了展示这种方法，研究通过一个示例性场景分析，强调了基于对创作结构的微观层面描述来分析体验特质的具体方法。文章的主体部分阐述了使用计算工具所面临的三个核心挑战。其一，将常用的电影分析词汇重塑为机器可读的语义本体;其二，建立一个基于所开发语义本体的系统性、适用的标注程序，从而可对更大规模语料库进行人际的、一致的描述;其三，开发可视化和查询工具，以便在复杂的标注数据集中识别和追踪创作模式。文章最后通过前面的示例分析展示了可视化标注数据的好处，并思考了所概述的AdA电影本体作为更广泛数字人文研究中处理主体间经验基础的程序化起点的作用。

相关文章 | 多维度评价 | 评论（0）

栏目文章信息