「MARKUS」の版間の差分

提供: Digital Sinology
移動先: 案内検索
21行目: 21行目:
 
[[Category:ツール]]
 
[[Category:ツール]]
 
[[zh:碼庫思]]
 
[[zh:碼庫思]]
 +
[[en:MARKUS]]

2018年6月22日 (金) 08:19時点における版

テンプレート:Stub

MARKUSは幅広い機能を持ち合わせたオンライン上のアノテーションとテキスト解析プラットフォームである。MARKUSは以下のような機能を持つ。 1)漢文上の人物や場所、公式タイトル、時間基準を識別し自動タグ付け 2)ユーザーの作成した全言語対応のキーワードリストによる手動タグ付け、新規タグの作成 3)テキスト解析をもとにしたキーワードの作成 4)柔軟なタグ付けされた文章のフィルタリング 5)地理学、生物学データベースの他、言語、ドメイン固有辞書などの広範のオンライン参照ツールへのアクセス 6)相互運用性を保証するhtml、TEIなどの多様なフォーマットへの書き出し 7)タグ付け内容や、中国歴代人物伝記データベース、TGAZ、TWGISの関連データの視覚化プラットフォームへの自動書き出し。連携されているVISUS視覚化インターフェース(地図、ネットワークグラフ、図表、時系列表、円グラフ、タグクラウドなど)によるタグ内容の探索と解析を行う。 8)中国哲学書電子化計画プラグインなどを用いてDonald Sturgeonのctext.orgのような原文データベースから幅広い文章の取り込み 9)精度の改善、大規模コーパスへの想起をする機械学習 10)無料アカウントと柔軟なファイル管理。他のテキスト解析や視覚化プラットフォーム(PALLADIO, PLATIN, DOCUSKY,COMPARATIVUSなど)への書き出しと同様kwリストや基本表現にタグ付けされたバッチによって行う。説明動画や教材は英語と中国語で対応しており、ユーザーのレビュー掲示板も存在する。 MARKUSはgithubからダウンロードできる。

MARKUSは、欧州研究会議とDigging into Dataの支援のもとBrent HoとHilde De Weerdtによって開発された。キーワード抽出には国立台湾大学のHsiang Jieh、Tu Hsieh-changらの協力のもと行われた。機械学習モジュールの開発はMiao Shengfaによって行われた。

外部リンク