「MARKUS」の版間の差分

提供: Digital Sinology
移動先: 案内検索
2行目: 2行目:
  
 
MARKUSは幅広い機能を持ち合わせたオンライン上のアノテーションとテキスト解析プラットフォームである。MARKUSは以下のような機能を持つ。
 
MARKUSは幅広い機能を持ち合わせたオンライン上のアノテーションとテキスト解析プラットフォームである。MARKUSは以下のような機能を持つ。
1)漢文上の人物や場所、公式タイトル、時間基準を識別し自動タグ付け
+
 
2)ユーザーの作成した全言語対応のキーワードリストによる手動タグ付け、新規タグの作成
+
* 1)漢文上の人物や場所、公式タイトル、時間基準を識別し自動タグ付け
3)テキスト解析をもとにしたキーワードの作成
+
* 2)ユーザーの作成した全言語対応のキーワードリストによる手動タグ付け、新規タグの作成
4)柔軟なタグ付けされた文章のフィルタリング
+
* 3)テキスト解析をもとにしたキーワードの作成
5)地理学、生物学データベースの他、言語、ドメイン固有辞書などの広範のオンライン参照ツールへのアクセス
+
* 4)柔軟なタグ付けされた文章のフィルタリング
6)相互運用性を保証するhtml、TEIなどの多様なフォーマットへの書き出し
+
* 5)地理学、生物学データベースの他、言語、ドメイン固有辞書などの広範のオンライン参照ツールへのアクセス
7)タグ付け内容や、中国歴代人物伝記データベース、TGAZ、TWGISの関連データの視覚化プラットフォームへの自動書き出し。連携されているVISUS視覚化インターフェース(地図、ネットワークグラフ、図表、時系列表、円グラフ、タグクラウドなど)によるタグ内容の探索と解析を行う。  
+
* 6)相互運用性を保証するhtml、TEIなどの多様なフォーマットへの書き出し
8)[[中国哲学書電子化計画]]プラグインなどを用いてDonald Sturgeonのctext.orgのような原文データベースから幅広い文章の取り込み
+
* 7)タグ付け内容や、中国歴代人物伝記データベース、TGAZ、TWGISの関連データの視覚化プラットフォームへの自動書き出し。連携されているVISUS視覚化インターフェース(地図、ネットワークグラフ、図表、時系列表、円グラフ、タグクラウドなど)によるタグ内容の探索と解析を行う。  
9)精度の改善、大規模コーパスへの想起をする機械学習
+
* 8)[[中国哲学書電子化計画]]プラグインなどを用いてDonald Sturgeonのctext.orgのような原文データベースから幅広い文章の取り込み
10)無料アカウントと柔軟なファイル管理。他のテキスト解析や視覚化プラットフォーム([http://hdlab.stanford.edu/palladio/ PALLADIO], [http://platin.mpiwg-berlin.mpg.de/ PLATIN], [http://docusky.digital.ntu.edu.tw/ DOCUSKY],[https://dh.chinese-empires.eu/comparativus/ COMPARATIVUS]など)への書き出しと同様kwリストや基本表現にタグ付けされたバッチによって行う。説明動画や教材は英語と中国語で対応しており、ユーザーのレビュー掲示板も存在する。
+
* 9)精度の改善、大規模コーパスへの想起をする機械学習
 +
* 10)無料アカウントと柔軟なファイル管理。他のテキスト解析や視覚化プラットフォーム([http://hdlab.stanford.edu/palladio/ PALLADIO], [http://platin.mpiwg-berlin.mpg.de/ PLATIN], [http://docusky.digital.ntu.edu.tw/ DOCUSKY],[https://dh.chinese-empires.eu/comparativus/ COMPARATIVUS]など)への書き出しと同様kwリストや基本表現にタグ付けされたバッチによって行う。説明動画や教材は英語と中国語で対応しており、ユーザーのレビュー掲示板も存在する。
 
MARKUSは[https://github.com/dHumanities/markus github]からダウンロードできる。
 
MARKUSは[https://github.com/dHumanities/markus github]からダウンロードできる。
  

2018年6月24日 (日) 08:59時点における版

テンプレート:Stub

MARKUSは幅広い機能を持ち合わせたオンライン上のアノテーションとテキスト解析プラットフォームである。MARKUSは以下のような機能を持つ。

  • 1)漢文上の人物や場所、公式タイトル、時間基準を識別し自動タグ付け
  • 2)ユーザーの作成した全言語対応のキーワードリストによる手動タグ付け、新規タグの作成
  • 3)テキスト解析をもとにしたキーワードの作成
  • 4)柔軟なタグ付けされた文章のフィルタリング
  • 5)地理学、生物学データベースの他、言語、ドメイン固有辞書などの広範のオンライン参照ツールへのアクセス
  • 6)相互運用性を保証するhtml、TEIなどの多様なフォーマットへの書き出し
  • 7)タグ付け内容や、中国歴代人物伝記データベース、TGAZ、TWGISの関連データの視覚化プラットフォームへの自動書き出し。連携されているVISUS視覚化インターフェース(地図、ネットワークグラフ、図表、時系列表、円グラフ、タグクラウドなど)によるタグ内容の探索と解析を行う。
  • 8)中国哲学書電子化計画プラグインなどを用いてDonald Sturgeonのctext.orgのような原文データベースから幅広い文章の取り込み
  • 9)精度の改善、大規模コーパスへの想起をする機械学習
  • 10)無料アカウントと柔軟なファイル管理。他のテキスト解析や視覚化プラットフォーム(PALLADIO, PLATIN, DOCUSKY,COMPARATIVUSなど)への書き出しと同様kwリストや基本表現にタグ付けされたバッチによって行う。説明動画や教材は英語と中国語で対応しており、ユーザーのレビュー掲示板も存在する。

MARKUSはgithubからダウンロードできる。

MARKUSは、欧州研究会議とDigging into Dataの支援のもとBrent HoとHilde De Weerdtによって開発された。キーワード抽出には国立台湾大学のHsiang Jieh、Tu Hsieh-changらの協力のもと行われた。機械学習モジュールの開発はMiao Shengfaによって行われた。

外部リンク