“碼庫思”的版本间的差异

来自Digital Sinology
跳转至: 导航搜索
 
(未显示同一用户的6个中间版本)
第1行: 第1行:
 
{{stub}}
 
{{stub}}
  
 碼庫思 (MARKUS) 為文本標記與分析線上平台,功能多元,包括:
+
 碼庫思(MARKUS)為文本標記與分析線上平台,功能多元,包括:
  
1.自動識別與標記 漢文古籍 文本所含人名、地名、官職名與時代資訊。
+
1.自動識別與標記文本所含 中國古代 人名、地名、官職名與時代資訊。
  
 
2.可自訂標記,並手動標記自訂的多種語言關鍵詞。
 
2.可自訂標記,並手動標記自訂的多種語言關鍵詞。
第15行: 第15行:
 
6.提供HTML、TEI等多樣檔案輸出格式,可確保標記成果與其他數位工具或平台相容。
 
6.提供HTML、TEI等多樣檔案輸出格式,可確保標記成果與其他數位工具或平台相容。
  
7.標記成果可連結中國人物傳記資料庫或TGAZ、TWGIS等地理資訊資料庫 相關資訊 合併匯入 資料 視覺化平台VISUS,以地圖、網絡圖像、表格、時間軸、圓餅圖、文字雲等工具探索文本 內容
+
7.標記成果可連結中國人物傳記資料庫或TGAZ、TWGIS等地理資訊資料庫 ,將 相關資訊合併匯入視覺化平台VISUS,以地圖、網絡圖像、表格、時間軸、圓餅圖、文字雲等工具 探索文本。
  
8.可藉外掛程式(plugin)由其他資料庫匯入各式文本。如內建Ctext Plugin,可自Donald Sturgeon「中國哲學書電子化計劃(Chinese Text Project)」便捷匯入文本。
+
8.可藉外掛程式(plugin)由其他資料庫匯入各式文本。如內建Ctext Plugin,可自Donald Sturgeon「[https://ctext.org/zh  中國哲學書電子化計劃(Chinese Text Project)] 」便捷匯入文本。
  
9.提供機器學習(machine learning)模組,提升大規模文本標記的 準率(precision)與召回率(recall)。
+
9.提供機器學習(machine learning)模組,提升大規模文本標記的準 率(precision)與召回率(recall)。
  
10.自由註冊使用帳號,以彈性管理文本檔案,包括:利用關鍵詞或正規表達式批次標記多項文本;或將標記成果匯出至不同文本分析與視覺化平台, 如PALLADIO, PLATIN, DOCUSKY, 與 COMPARATIVUS等。
+
10.自由註冊使用帳號,以彈性管理文本檔案,包括:利用關鍵詞或正規表達式批次標記多項文本;或將標記成果匯出至不同文本分析與視覺化平台, 如[http://hdlab.stanford.edu/palladio/ PALLADIO], [http://platin.mpiwg-berlin.mpg.de/ PLATIN], [http://docusky.digital.ntu.edu.tw/DocuSky/ds-01.home.html DOCUSKY], 與 [https://dh.chinese-empires.eu/comparativus/ COMPARATIVUS] 等。
  
  
 
+
 碼庫思提供上述功能中英文使用教學影片與說明手冊,並設有交流論壇,供使用者分享、討論使用案例與操作經驗。開發文件(documentation)詳 見[https://github.com/dHumanities/markus Github].
 碼庫思提供上述功能中英文使用教學影片與說明手冊,並設有交流論壇,供使用者分享、討論使用案例與操作經驗。開發文件(documentation)詳 見Github.
 
  
 
 碼庫思由何浩洋與魏希德共同開發,獲歐洲研究委員會(European Research Council)和「數據挖掘挑戰」計畫(Digging into Data)資助。「詞夾子」功能由臺灣大學項潔、杜協昌等提供;機器學習模組由苗聖法開發。
 
 碼庫思由何浩洋與魏希德共同開發,獲歐洲研究委員會(European Research Council)和「數據挖掘挑戰」計畫(Digging into Data)資助。「詞夾子」功能由臺灣大學項潔、杜協昌等提供;機器學習模組由苗聖法開發。
 
 以直接輸出到碼庫思系統去處理。
 
 以直接輸出到碼庫思系統去處理。
 +
  
 
==外部鏈接==
 
==外部鏈接==

2018年7月2日 (一) 08:39的最新版本

码库思(MARKUS)为文本标记与分析线上平台,功能多元,包括:

1.自动识别与标记文本所含中国古代人名、地名、官职名与时代资讯。

2.可自订标记,并手动标记自订的多种语言关键词。

3.以文本分析工具“词夹子(keyword clipper)”自动生成关键词。

4.可弹性筛选所标记资讯

5.提供多种类线上参考资源协助文本解读,包括地理资讯、人物传记资料,以及语言性与专门领域性辞典等。

6.提供HTML、TEI等多样档案输出格式,可确保标记成果与其他数位工具或平台相容。

7.标记成果可连结中国人物传记数据库或TGAZ、TWGIS等地理资讯数据库,将相关资讯合并汇入视觉化平台VISUS,以地图、网络图像、表格、时间轴、圆饼图、文字云等工具以探索文本。

8.可藉插件(plugin)由其他数据库汇入各式文本。如内建Ctext Plugin,可自Donald Sturgeon“中国哲学书电子化计划(Chinese Text Project)”便捷汇入文本。

9.提供机器学习(machine learning)模组,提升大规模文本标记的准确率(precision)与召回率(recall)。

10.自由注册使用账号,以弹性管理文本档案,包括:利用关键词或正规表达式批次标记多项文本;或将标记成果汇出至不同文本分析与视觉化平台,如PALLADIO, PLATIN, DOCUSKY, 与 COMPARATIVUS等。


码库思提供上述功能中英文使用教学影片与说明手册,并设有交流论坛,供使用者分享、讨论使用案例与操作经验。开发文件(documentation)详见Github.

码库思由何浩洋与魏希德共同开发,获欧洲研究委员会(European Research Council)和“数据挖掘挑战”计划(Digging into Data)资助。“词夹子”功能由台湾大学项洁、杜协昌等提供;机器学习模组由苗圣法开发。 以直接输出到码库思系统去处理。


外部链接