TextTools

提供: Digital Sinology
2018年7月4日 (水) 15:48時点におけるKonnyaku (トーク | 投稿記録)による版
移動先: 案内検索
墨子におけるテキスト再利用

Text Toolsはテキスト解析と任意のテキストを視覚化する機能をもつオンライン上のプラットフォームです。この解析ツールは以下のものをオープンAPIを通して外部ユーザー設定可能サービスによって算出します。

  • N-gram統計
  • 正規表現と置換
  • テキストの再利用分類
  • 文章類似性
  • 編集距離によるテキスト比較
  • トークナイゼーションなどのテキストの変形

ネットワークグラフ、図表、ワードクラウド、また多様なヒートマップを用いてテキストの再利用や文章類似性を編集距離に合わせて観察するなど、データの視覚化が直接ツールによって可能です。

Text Toolはブラウザーベースのプラットフォームであるためユーザーがツールに入力したテキストコーパスで機能します。これらはAPIを通じて中国哲学書電子化計画から直接入力、または、ドラッグ・アンド・ドロップによってテキストファイル(圧縮ファイルも可)をユーザーのコンピュータから取り込むことができます。クライアントのコンピュータですべての処理を行うため、中央サーバーへのアップロードが不要です。漢文資料に用いるために作られていながら、言語に独立した処理を行うため、多様な言語で書かれた文章を適切なテキスト変形を用いて解析することができます。


ネットワークグラフによる、墨子、荀子、荘子におけるテキスト再利用の視覚化

外部リンク

分類:ツール

分類:Projects with APIs