Text Tools
於 2018年6月4日 (一) 20:45 由 Dsturgeon (對話 | 貢獻) 所做的修訂 (创建页面,内容为“thumb|《墨子》中的互文 '''Text Tools'''是個線上平台,提供一連串文本分析和可視化的工具,以用於文…”)
Text Tools是個線上平台,提供一連串文本分析和可視化的工具,以用於文本之上。這些分析和文本作業的工具包括n-gram的統計、正則表達式(搜索和取代)、互文的辨析、文本相似度的計算、以距離計算的文本比較,以及文本的轉換處理(例如是把文本轉化為序列)。以上功能都是可以通過外部的程序,用開放的API操作的。直接可用的可視化功能包括網絡圖、圖標、文字雲以及熱圖等,可以呈現文本互文和文本相似度,以作精讀和遠讀。
Text Tools是嵌入瀏覽器的線上工具,用戶只要導入文本,即刻使用這些工具。文本既可以從中國哲學電子書計劃直接以API導入,也可以在平台上上傳TXT文檔(或放在壓縮包裏的TXT文檔)。由於所有的操作都是在用戶的電腦上進行,所以文本庫無需上傳到服務器去。雖然這些是為了古代漢語文本設計的工具,這些處理的操作可用於其他語言的文本。也就是說,只要文本經過一定處理,這些分析也會適用於其他語言的文本。