数字人文研究 ›› 2021, Vol. 1 ›› Issue (2): 36-50.
• • 上一篇 下一篇
出版日期:
发布日期:
Online:
Published:
关键词: 近年来被广泛运用于史学、文学研究的LDA主题建模不仅仅可以用于发现庞大语料库的整体意义结构, 将LDA运用于哲学语料库, 再聚焦于具体文本, 还可以揭示小文本意义特征和文本间意义关系, 从而进行哲学发现, 并为一些哲学命题提供实证论据。作为一种新方法, LDA的有效性与客观性需要被检验。首先, 基于新汉典语料库, 以《论语》《孟子》《荀子》的LDA建模研究为例, 展示该研究从建模到得出推论的全过程。其次, 将模型数据和哲学推论与SN关于上述三部典籍的数字人文研究进行对比, 分析不同推论的原因, 论述运用LDA发现小文本的意义特征和文本间关系的有效性。最后, 使用控制变量法对Ctext语料库进行建模, 对比不同参数下模型所呈现的《论语》主题分布, 论述该方法的客观性条件仅与k值设置有关, 当k取值于收敛向“理想状态”的一段区间时, LDA能最大程度避免主观性因素的干扰, 保证该研究方法的客观性。
中图分类号:
font-family:DengXian
B222.2','1');return false;" target="_blank"> ">B222.2
高元昊, 王小红, 科林·艾伦, 杨钊. 主题建模辅助哲学研究的方法论探究——以《论语》《孟子》《荀子》的计算分析为例[J]. 数字人文研究, 2021, 1(2): 36-50.
0 / / 推荐
导出引用管理器 EndNote|Ris|BibTeX
链接本文: http://dhr.ruc.edu.cn/CN/
http://dhr.ruc.edu.cn/CN/Y2021/V1/I2/36