「MARKUS」の版間の差分
1行目: | 1行目: | ||
{{stub}} | {{stub}} | ||
− | + | MARKUSは幅広い機能を持ち合わせたオンライン上のアノテーションとテキスト解析プラットフォームである。MARKUSは以下のような機能を持つ。 | |
− | |||
− | |||
− | |||
1)漢文上の人物や場所、公式タイトル、時間基準を識別し自動タグ付け | 1)漢文上の人物や場所、公式タイトル、時間基準を識別し自動タグ付け | ||
− | |||
2)ユーザーの作成した全言語対応のキーワードリストによる手動タグ付け、新規タグの作成 | 2)ユーザーの作成した全言語対応のキーワードリストによる手動タグ付け、新規タグの作成 | ||
− | |||
3)テキスト解析をもとにしたキーワードの作成 | 3)テキスト解析をもとにしたキーワードの作成 | ||
− | |||
4)柔軟なタグ付けされた文章のフィルタリング | 4)柔軟なタグ付けされた文章のフィルタリング | ||
− | |||
5)地理学、生物学データベースの他、言語、ドメイン固有辞書などの広範のオンライン参照ツールへのアクセス | 5)地理学、生物学データベースの他、言語、ドメイン固有辞書などの広範のオンライン参照ツールへのアクセス | ||
− | |||
6)相互運用性を保証するhtml、TEIなどの多様なフォーマットへの書き出し | 6)相互運用性を保証するhtml、TEIなどの多様なフォーマットへの書き出し | ||
− | + | 7)タグ付け内容や、中国歴代人物伝記データベース、TGAZ、TWGISの関連データの視覚化プラットフォームへの自動書き出し。連携されているVISUS視覚化インターフェース(地図、ネットワークグラフ、図表、時系列表、円グラフ、タグクラウドなど)によるタグ内容の探索と解析を行う。 | |
− | 7)タグ付け内容や、中国歴代人物伝記データベース、TGAZ、TWGISの関連データの視覚化プラットフォームへの自動書き出し。連携されているVISUS視覚化インターフェース(地図、ネットワークグラフ、図表、時系列表、円グラフ、タグクラウドなど) | ||
− | |||
8)[[中国哲学書電子化計画]]プラグインなどを用いてDonald Sturgeonのctext.orgのような原文データベースから幅広い文章の取り込み | 8)[[中国哲学書電子化計画]]プラグインなどを用いてDonald Sturgeonのctext.orgのような原文データベースから幅広い文章の取り込み | ||
− | |||
9)精度の改善、大規模コーパスへの想起をする機械学習 | 9)精度の改善、大規模コーパスへの想起をする機械学習 | ||
+ | 10)無料アカウントと柔軟なファイル管理。他のテキスト解析や視覚化プラットフォーム([http://hdlab.stanford.edu/palladio/ PALLADIO], [http://platin.mpiwg-berlin.mpg.de/ PLATIN], [http://docusky.digital.ntu.edu.tw/ DOCUSKY],[https://dh.chinese-empires.eu/comparativus/ COMPARATIVUS]など)への書き出しと同様kwリストや基本表現にタグ付けされたバッチによって行う。説明動画や教材は英語と中国語で対応しており、ユーザーのレビュー掲示板も存在する。 | ||
+ | MARKUSは[https://github.com/dHumanities/markus github]からダウンロードできる。 | ||
− | + | MARKUSは、欧州研究会議とDigging into Dataの支援のもとBrent HoとHilde De Weerdtによって開発された。キーワード抽出には国立台湾大学のHsiang Jieh、Tu Hsieh-changらの協力のもと行われた。機械学習モジュールの開発はMiao Shengfaによって行われた。 | |
− | |||
− | |||
− | |||
− | |||
− | |||
− | MARKUSは、欧州研究会議とDigging into Dataの支援のもとBrent HoとHilde De | ||
− | |||
− | |||
==外部リンク== | ==外部リンク== | ||
− | |||
* [http://dh.chinese-empires.eu/markus/ MARKUS] | * [http://dh.chinese-empires.eu/markus/ MARKUS] | ||
− | + | [[Category:ツール]] | |
− | |||
− | [[ | ||
− | |||
[[zh:碼庫思]] | [[zh:碼庫思]] | ||
+ | [[en:MARKUS]] |
2018年7月10日 (火) 02:29時点における最新版
MARKUSは幅広い機能を持ち合わせたオンライン上のアノテーションとテキスト解析プラットフォームである。MARKUSは以下のような機能を持つ。 1)漢文上の人物や場所、公式タイトル、時間基準を識別し自動タグ付け 2)ユーザーの作成した全言語対応のキーワードリストによる手動タグ付け、新規タグの作成 3)テキスト解析をもとにしたキーワードの作成 4)柔軟なタグ付けされた文章のフィルタリング 5)地理学、生物学データベースの他、言語、ドメイン固有辞書などの広範のオンライン参照ツールへのアクセス 6)相互運用性を保証するhtml、TEIなどの多様なフォーマットへの書き出し 7)タグ付け内容や、中国歴代人物伝記データベース、TGAZ、TWGISの関連データの視覚化プラットフォームへの自動書き出し。連携されているVISUS視覚化インターフェース(地図、ネットワークグラフ、図表、時系列表、円グラフ、タグクラウドなど)によるタグ内容の探索と解析を行う。 8)中国哲学書電子化計画プラグインなどを用いてDonald Sturgeonのctext.orgのような原文データベースから幅広い文章の取り込み 9)精度の改善、大規模コーパスへの想起をする機械学習 10)無料アカウントと柔軟なファイル管理。他のテキスト解析や視覚化プラットフォーム(PALLADIO, PLATIN, DOCUSKY,COMPARATIVUSなど)への書き出しと同様kwリストや基本表現にタグ付けされたバッチによって行う。説明動画や教材は英語と中国語で対応しており、ユーザーのレビュー掲示板も存在する。 MARKUSはgithubからダウンロードできる。
MARKUSは、欧州研究会議とDigging into Dataの支援のもとBrent HoとHilde De Weerdtによって開発された。キーワード抽出には国立台湾大学のHsiang Jieh、Tu Hsieh-changらの協力のもと行われた。機械学習モジュールの開発はMiao Shengfaによって行われた。