「TextTools」の版間の差分

提供: Digital Sinology
移動先: 案内検索
22行目: 22行目:
 
* [https://digitalsinology.org/text-tools-regex/ Regular expressions with Text Tools]
 
* [https://digitalsinology.org/text-tools-regex/ Regular expressions with Text Tools]
  
[[分類:ツール]]
+
[[Category:ツール]]
 
+
[[Category:Projects with APIs]]
[[分類:Projects with APIs]]
 
 
[[zh:Text Tools]]
 
[[zh:Text Tools]]
 
[[en:Text Tools]]
 
[[en:Text Tools]]

2018年7月5日 (木) 00:40時点における版

墨子におけるテキスト再利用

Text Toolsはテキスト解析と任意のテキストを視覚化する機能をもつオンライン上のプラットフォームです。この解析ツールは以下のものをオープンAPIを通して外部ユーザー設定可能サービスによって算出します。

  • N-gram統計
  • 正規表現と置換
  • テキストの再利用分類
  • 文章類似性
  • 編集距離によるテキスト比較
  • トークナイゼーションなどのテキストの変形

ネットワークグラフ、図表、ワードクラウド、また多様なヒートマップを用いてテキストの再利用や文章類似性を編集距離に合わせて観察するなど、データの視覚化が直接ツールによって可能です。

Text Toolはブラウザーベースのプラットフォームであるためユーザーがツールに入力したテキストコーパスで機能します。これらはAPIを通じて中国哲学書電子化計画から直接入力、または、ドラッグ・アンド・ドロップによってテキストファイル(圧縮ファイルも可)をユーザーのコンピュータから取り込むことができます。クライアントのコンピュータですべての処理を行うため、中央サーバーへのアップロードが不要です。漢文資料に用いるために作られていながら、言語に独立した処理を行うため、多様な言語で書かれた文章を適切なテキスト変形を用いて解析することができます。


ネットワークグラフによる、墨子、荀子、荘子におけるテキスト再利用の視覚化

外部リンク