Text Tools
Dsturgeon(讨论 | 贡献)2018年6月4日 (一) 20:45的版本 (创建页面,内容为“thumb|《墨子》中的互文 '''Text Tools'''是個線上平台,提供一連串文本分析和可視化的工具,以用於文…”)
Text Tools是个线上平台,提供一连串文本分析和可视化的工具,以用于文本之上。这些分析和文本作业的工具包括n-gram的统计、正则表达式(搜索和取代)、互文的辨析、文本相似度的计算、以距离计算的文本比较,以及文本的转换处理(例如是把文本转化为序列)。以上功能都是可以通过外部的程序,用开放的API操作的。直接可用的可视化功能包括网络图、图标、文字云以及热图等,可以呈现文本互文和文本相似度,以作精读和远读。
Text Tools是嵌入浏览器的线上工具,用户只要导入文本,即刻使用这些工具。文本既可以从中国哲学电子书计划直接以API导入,也可以在平台上上传TXT文档(或放在压缩包里的TXT文档)。由于所有的操作都是在用户的电脑上进行,所以文本库无需上传到服务器去。虽然这些是为了古代汉语文本设计的工具,这些处理的操作可用于其他语言的文本。也就是说,只要文本经过一定处理,这些分析也会适用于其他语言的文本。