「TextTools」の版間の差分
3行目: | 3行目: | ||
'''Text Tools'''はテキスト解析と任意のテキストを視覚化する機能をもつオンライン上のプラットフォームである。この解析ツールは以下のものをオープンAPIを通して外部ユーザー設定可能サービスによって算出する。 | '''Text Tools'''はテキスト解析と任意のテキストを視覚化する機能をもつオンライン上のプラットフォームである。この解析ツールは以下のものをオープンAPIを通して外部ユーザー設定可能サービスによって算出する。 | ||
− | + | * N-gram統計 | |
− | + | * 正規表現と置換 | |
− | + | * テキストの再利用分類 | |
− | + | * 文章類似性 | |
− | + | * 編集距離によるテキスト比較 | |
− | + | * トークナイゼーションなどのテキストの変形 | |
ネットワークグラフ、図表、ワードクラウド、また多様なヒートマップを用いてテキストの再利用や文章類似性を編集距離に合わせて観察するなど、データの視覚化が直接ツールによって可能である。 | ネットワークグラフ、図表、ワードクラウド、また多様なヒートマップを用いてテキストの再利用や文章類似性を編集距離に合わせて観察するなど、データの視覚化が直接ツールによって可能である。 |
2018年6月24日 (日) 08:56時点における版
Text Toolsはテキスト解析と任意のテキストを視覚化する機能をもつオンライン上のプラットフォームである。この解析ツールは以下のものをオープンAPIを通して外部ユーザー設定可能サービスによって算出する。
- N-gram統計
- 正規表現と置換
- テキストの再利用分類
- 文章類似性
- 編集距離によるテキスト比較
- トークナイゼーションなどのテキストの変形
ネットワークグラフ、図表、ワードクラウド、また多様なヒートマップを用いてテキストの再利用や文章類似性を編集距離に合わせて観察するなど、データの視覚化が直接ツールによって可能である。
Text Toolはブラウザーベースのプラットフォームであるためユーザーがツールに入力したテキストコーパスで機能する。これらはAPIを通じて中国哲学書電子化計画から直接入力、または、ドラッグ・アンド・ドロップによってテキストファイル(圧縮ファイルも可)をユーザーのコンピュータから取り込むことができる。クライアントのコンピュータですべての処理を行うため。中央サーバーへのアップロードが不要である。漢文資料に用いるために作られていながら、言語に独立した処理を行うため、多様な言語で書かれた文章を適切なテキスト変形を用いて解析することができる。