数字人文研究 ›› 2021, Vol. 1 ›› Issue (2): 36-50.

• • 上一篇    下一篇

主题建模辅助哲学研究的方法论探究——以《论语》《孟子》《荀子》的计算分析为例

  

  • 出版日期:2021-08-08 发布日期:2021-08-04

Assisting Philosophical Arguments-Taking the Computation and Analysis of the Analects of Confucius,Mencius and Xunzi as Examples

  • Online:2021-08-08 Published:2021-08-04

关键词: 近年来被广泛运用于史学、文学研究的LDA主题建模不仅仅可以用于发现庞大语料库的整体意义结构, 将LDA运用于哲学语料库, 再聚焦于具体文本, 还可以揭示小文本意义特征和文本间意义关系, 从而进行哲学发现, 并为一些哲学命题提供实证论据。作为一种新方法, LDA的有效性与客观性需要被检验。首先, 基于新汉典语料库, 以《论语》《孟子》《荀子》的LDA建模研究为例, 展示该研究从建模到得出推论的全过程。其次, 将模型数据和哲学推论与SN关于上述三部典籍的数字人文研究进行对比, 分析不同推论的原因, 论述运用LDA发现小文本的意义特征和文本间关系的有效性。最后, 使用控制变量法对Ctext语料库进行建模, 对比不同参数下模型所呈现的《论语》主题分布, 论述该方法的客观性条件仅与k值设置有关, 当k取值于收敛向“理想状态”的一段区间时, LDA能最大程度避免主观性因素的干扰, 保证该研究方法的客观性。

中图分类号: