「TextTools」の版間の差分
16行目: | 16行目: | ||
・トークナイゼーションなどのテキストの変形 | ・トークナイゼーションなどのテキストの変形 | ||
− | |||
− | |||
ネットワークグラフ、図表、ワードクラウド、また多様なヒートマップを用いてテキストの再利用や文章類似性を編集距離に合わせて観察するなど、データの視覚化が直接ツールによって可能です。 | ネットワークグラフ、図表、ワードクラウド、また多様なヒートマップを用いてテキストの再利用や文章類似性を編集距離に合わせて観察するなど、データの視覚化が直接ツールによって可能です。 | ||
− | |||
− | |||
Text Toolはブラウザーベースのプラットフォームであるためユーザーがツールに入力したテキストコーパスで機能します。これらはAPIを通じて[[中国哲学書電子化計画]]から直接入力、または、ドラッグ・アンド・ドロップによってテキストファイル(圧縮ファイルも可)をユーザーのコンピュータから取り込むことができます。クライアントのコンピュータですべての処理を行うため、中央サーバーへのアップロードが不要です。漢文資料に用いるために作られていながら、言語に独立した処理を行うため、多様な言語で書かれた文章を適切なテキスト変形を用いて解析することができます。 | Text Toolはブラウザーベースのプラットフォームであるためユーザーがツールに入力したテキストコーパスで機能します。これらはAPIを通じて[[中国哲学書電子化計画]]から直接入力、または、ドラッグ・アンド・ドロップによってテキストファイル(圧縮ファイルも可)をユーザーのコンピュータから取り込むことができます。クライアントのコンピュータですべての処理を行うため、中央サーバーへのアップロードが不要です。漢文資料に用いるために作られていながら、言語に独立した処理を行うため、多様な言語で書かれた文章を適切なテキスト変形を用いて解析することができます。 | ||
− | |||
− | |||
− | |||
[[File:Reuse-mozi-xunzi-zhuangzi.png|thumb|ネットワークグラフによる、墨子、荀子、荘子におけるテキスト再利用の視覚化.]] | [[File:Reuse-mozi-xunzi-zhuangzi.png|thumb|ネットワークグラフによる、墨子、荀子、荘子におけるテキスト再利用の視覚化.]] | ||
− | |||
− | |||
==外部リンク== | ==外部リンク== | ||
* [https://ctext.org/plugins/texttools/#help Text Tools] | * [https://ctext.org/plugins/texttools/#help Text Tools] | ||
− | |||
* [https://digitalsinology.org/text-tools/ Exploring text reuse with Text Tools] | * [https://digitalsinology.org/text-tools/ Exploring text reuse with Text Tools] | ||
− | |||
* [https://digitalsinology.org/text-tools-regex/ Regular expressions with Text Tools] | * [https://digitalsinology.org/text-tools-regex/ Regular expressions with Text Tools] | ||
− | + | [[Category:ツール]] | |
− | [[ | + | [[Category:Projects with APIs]] |
− | |||
− | [[ | ||
− | |||
[[zh:Text Tools]] | [[zh:Text Tools]] | ||
+ | [[en:Text Tools]] |
2018年7月12日 (木) 13:39時点における最新版
Text Toolsはテキスト解析と任意のテキストを視覚化する機能をもつオンライン上のプラットフォームです。この解析ツールは以下のものをオープンAPIを通して外部ユーザー設定可能サービスによって算出します。
・N-gram統計
・正規表現と置換
・テキストの再利用分類
・文章類似性
・編集距離によるテキスト比較
・トークナイゼーションなどのテキストの変形
ネットワークグラフ、図表、ワードクラウド、また多様なヒートマップを用いてテキストの再利用や文章類似性を編集距離に合わせて観察するなど、データの視覚化が直接ツールによって可能です。
Text Toolはブラウザーベースのプラットフォームであるためユーザーがツールに入力したテキストコーパスで機能します。これらはAPIを通じて中国哲学書電子化計画から直接入力、または、ドラッグ・アンド・ドロップによってテキストファイル(圧縮ファイルも可)をユーザーのコンピュータから取り込むことができます。クライアントのコンピュータですべての処理を行うため、中央サーバーへのアップロードが不要です。漢文資料に用いるために作られていながら、言語に独立した処理を行うため、多様な言語で書かれた文章を適切なテキスト変形を用いて解析することができます。