Text Tools

来自Digital Sinology
Dsturgeon讨论 | 贡献2018年6月22日 (五) 08:03的版本
(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)
跳转至: 导航搜索
《墨子》中的互文

Text Tools是个线上平台,提供一连串文本分析和可视化的工具,以用于文本之上。这些分析和文本作业的工具包括n-gram的统计、正则表达式(搜索和取代)、互文的辨析、文本相似度的计算、以距离计算的文本比较,以及文本的转换处理(例如是把文本转化为序列)。以上功能都是可以通过外部的程序,用开放的API操作的。直接可用的可视化功能包括网络图、图标、文字云以及热图等,可以呈现文本互文和文本相似度,以作精读和远读。

Text Tools是嵌入浏览器的线上工具,用户只要导入文本,即刻使用这些工具。文本既可以从中国哲学书电子化计划直接以API导入,也可以在平台上上传TXT文档(或放在压缩包里的TXT文档)。由于所有的操作都是在用户的电脑上进行,所以文本库无需上传到服务器去。虽然这些是为了古代汉语文本设计的工具,这些处理的操作可用于其他语言的文本。也就是说,只要文本经过一定处理,这些分析也会适用于其他语言的文本。

以网络图呈现《墨子》、《荀子》和《庄子》的互文

链接