当期目录

    2023年 第3卷 第4期    刊出日期:2023-12-28
    上一期   
    数字人文自主知识体系建构

    中国数字人文学术体系构建考察——基于实践项目的内容分析和文献研究

    夏翠娟, 祁天娇, 徐碧姗
    2023, 3(4):  3-36. 
    摘要 ( 16 )   PDF (7537KB) ( 2 )  
    相关文章 | 计量指标
    文章将以支撑中国研究为目的、可在互联网上公开访问的数据库、数据集、知识库、语料库及相应工具、平台建设的相关实践项目作为研究对象,以全面构建中国自主的数字人文“学术体系”所需的体系化理论范式为目标参照,利用内容分析法从不同维度对实践项目建设情况进行内容编码和统计分析,利用系统性文献综述法、辅以网络调查法和专家访谈法总结提炼基于实践项目所产生的理论范式构建和方法技术应用创新,利用比较研究法将中国数字人文实践置于全球数字人文发展的视野下,深入考察中国数字人文实践的现状和特点,探测热点与重点,分析痛点、难点和差距,评估方向和趋势。并尝试“以我们正在做的事情为中心”,从系统性地总结现有的实践经验出发,考察中国自主的数字人文“学术体系”的理论范式创建和方法技术创新现状,为探索数字人文领域“自主知识体系”的建构之道提供参考。
    游目骋观

    文学计算的理论、方法及发展挑战——刘洋博士访谈

    刘洋, 余思琪
    2023, 3(4):  37-48. 
    摘要 ( 14 )   PDF (1752KB) ( 2 )  
    相关文章 | 计量指标
    文学计算旨在探索如何利用大规模文本数据和计算机技术解读文学作品,是数字人文的重要分支领域,而在当下中文学界,高质量的研究仍然稀少。文章是对该领域的前沿学者——重庆大学中文系副教授刘洋博士的访谈,探讨内容包括算法批判、文学概念的量化、技术与传统文学研究结合的路径与障碍、数字工具与文学创作、数字人文教育的理想模式、未来的文学形态等。刘洋博士认为,文学作品解读虽具有主观性,但背后仍存在客观规律,任何文学概念都是可以量化的,需要的只是更精细的处理,应致力于将从其他领域迁移而来的技术与传统文学批评和文论结合起来。这其中最大的障碍并非技术难以掌握,而是文理科之间的巨大隔阂和研究者视野的局限。未来,文学计算与传统方法将逐渐融合,数字人文这类跨学科研究也将逐渐从相对边缘和非主流的状态走向主流。
    攻玉以石

    民国报纸文本基准真值制作的挑战与思考——以《晶报》为例

    谢佳, 叶淑敏
    2023, 3(4):  49-62. 
    摘要 ( 11 )   PDF (4350KB) ( 3 )  
    相关文章 | 计量指标
    欧洲和北美众多研究学者已对机器学习在光学字符识别中的应用进行了探索,许多项目也正在为此创建基准真值(ground truth, GT)数据。但对于非拉丁文本(non-Latin script)阅读材料来说,情况则有所不同。德国海德堡大学的“中国早期报刊在线数据库”(ECPO)项目于2021年开始研究如何基于中国报刊史料生成机器可读文本。ECPO采用多种机器学习方法(如卷积神经网络)开发了一个半自动流程来生成机器可读的全文文本,并选取民国时期娱乐小报《晶报》(1919—1940年)作为实验基础。文章聚焦于两方面:一是对基准真值编辑工作流程作详细阐述,包括组建编辑团队、组织工作流程、建立操作规范和确保质量控制;二是探讨制作基准真值时遇到的具体困难,包括字符编码问题、与Unicode相关的异体字符问题等。该研究项目创建了两个基准真值数据集,分别是文本型/结构化数据(全文基准真值,full-text GT)和版面分割数据(几何基准真值,geometry GT)。此外,文章还指出研究项目发现的问题及应对方案,期望提高机器学习效率,并为其他从事非拉丁文阅读材料研究的同仁提供借鉴。

    通过人工智能研究早期电影:对电影馆藏图像检索的思考

    比阿特丽斯·塔德奥·富伊卡, 奥利弗·布韦, 松克劳德·穆苏, 刘思成/译
    2023, 3(4):  63-77. 
    摘要 ( 9 )   PDF (18097KB) ( 2 )  
    相关文章 | 计量指标
    计算机工具为我们提供了观看电影的新方法,并为电影学者们创造了提出多样研究问题和展望新研究方法的机遇。文章着重关注电影史学者的研究如何能从尚未被广泛使用的人工智能的帮扶中获益,分享了利用人工智能“Snoop”在老电影语料库中进行的第一轮试验。Snoop由法国国家视听研究所(INA)和国家信息与自动化研究所(INRIA)共同开发。通过探索性的方式,Snoop使研究者能够检索老电影语料库中的共同主题。除了介绍实验中遇到的挑战和新发现外,文章亦旨在对实验进行整体评估并讨论新的研究方向。从研究史的角度而言,文章的另一目的在于评估人工智能系统是否能成为实施不同研究方法的有效工具——既能解决新的研究问题,又能重新审视旧有疑窦;且如果是,又将如何实现。
    人文新知

    明钱榖《纪行图册》、张复《水程图》之大运河现地研究与GIS呈现(之四)

    简锦松, 廖泫铭, 王勇, 张淑君, 唐宸, 严程, 谢定纮
    2023, 3(4):  78-128. 
    摘要 ( 11 )   PDF (7494KB) ( 2 )  
    相关文章 | 计量指标
    钱榖《纪行图册》以王世贞隆庆四年(1570)六月《适晋纪行》为蓝本,绘成仓山小祗园至扬州扬子桥三十二幅;张复《水程图》因王世贞于万历二年(1574)二月入领太仆之役,附舟而北,绘成邵伯至通州水程五十二幅。两卷皆以写实为之,在明人画中堪称独绝。文章以现地研究法进行三项处理:一、此次王世贞北行,正在隆庆新河既成,泇河之议方生的明代大运河变动期,文章将二人所经过之水程全部数字化;二、钱榖自言“维欲记其目前真境”,文章利用明清旅行日记、方志、古今地图及笔者现地考察所得,将各图逐一解说,指出图面所绘内容,验证画者写真实践的程度;三、此八十余幅之价值,如同发现一大箱明代的拍摄影带,文章发挥其自身的影像本色,形象化地指出明代大运河的真正面目。