「TextTools」の版間の差分
(2人の利用者による、間の5版が非表示) | |||
1行目: | 1行目: | ||
[[File:Mozi-military-text.png|thumb|墨子におけるテキスト再利用]] | [[File:Mozi-military-text.png|thumb|墨子におけるテキスト再利用]] | ||
− | '''Text Tools''' | + | |
+ | |||
+ | '''Text Tools'''はテキスト解析と任意のテキストを視覚化する機能をもつオンライン上のプラットフォームです。この解析ツールは以下のものをオープンAPIを通して外部ユーザー設定可能サービスによって算出します。 | ||
・N-gram統計 | ・N-gram統計 | ||
+ | |||
・正規表現と置換 | ・正規表現と置換 | ||
+ | |||
・テキストの再利用分類 | ・テキストの再利用分類 | ||
+ | |||
・文章類似性 | ・文章類似性 | ||
+ | |||
・編集距離によるテキスト比較 | ・編集距離によるテキスト比較 | ||
+ | |||
・トークナイゼーションなどのテキストの変形 | ・トークナイゼーションなどのテキストの変形 | ||
− | + | ネットワークグラフ、図表、ワードクラウド、また多様なヒートマップを用いてテキストの再利用や文章類似性を編集距離に合わせて観察するなど、データの視覚化が直接ツールによって可能です。 | |
− | Text | + | Text Toolはブラウザーベースのプラットフォームであるためユーザーがツールに入力したテキストコーパスで機能します。これらはAPIを通じて[[中国哲学書電子化計画]]から直接入力、または、ドラッグ・アンド・ドロップによってテキストファイル(圧縮ファイルも可)をユーザーのコンピュータから取り込むことができます。クライアントのコンピュータですべての処理を行うため、中央サーバーへのアップロードが不要です。漢文資料に用いるために作られていながら、言語に独立した処理を行うため、多様な言語で書かれた文章を適切なテキスト変形を用いて解析することができます。 |
18行目: | 25行目: | ||
==外部リンク== | ==外部リンク== | ||
+ | |||
* [https://ctext.org/plugins/texttools/#help Text Tools] | * [https://ctext.org/plugins/texttools/#help Text Tools] | ||
* [https://digitalsinology.org/text-tools/ Exploring text reuse with Text Tools] | * [https://digitalsinology.org/text-tools/ Exploring text reuse with Text Tools] | ||
* [https://digitalsinology.org/text-tools-regex/ Regular expressions with Text Tools] | * [https://digitalsinology.org/text-tools-regex/ Regular expressions with Text Tools] | ||
+ | |||
[[Category:ツール]] | [[Category:ツール]] | ||
− | [[ | + | [[Category:Projects with APIs]] |
[[zh:Text Tools]] | [[zh:Text Tools]] | ||
[[en:Text Tools]] | [[en:Text Tools]] |
2018年7月12日 (木) 13:39時点における最新版
Text Toolsはテキスト解析と任意のテキストを視覚化する機能をもつオンライン上のプラットフォームです。この解析ツールは以下のものをオープンAPIを通して外部ユーザー設定可能サービスによって算出します。
・N-gram統計
・正規表現と置換
・テキストの再利用分類
・文章類似性
・編集距離によるテキスト比較
・トークナイゼーションなどのテキストの変形
ネットワークグラフ、図表、ワードクラウド、また多様なヒートマップを用いてテキストの再利用や文章類似性を編集距離に合わせて観察するなど、データの視覚化が直接ツールによって可能です。
Text Toolはブラウザーベースのプラットフォームであるためユーザーがツールに入力したテキストコーパスで機能します。これらはAPIを通じて中国哲学書電子化計画から直接入力、または、ドラッグ・アンド・ドロップによってテキストファイル(圧縮ファイルも可)をユーザーのコンピュータから取り込むことができます。クライアントのコンピュータですべての処理を行うため、中央サーバーへのアップロードが不要です。漢文資料に用いるために作られていながら、言語に独立した処理を行うため、多様な言語で書かれた文章を適切なテキスト変形を用いて解析することができます。