“碼庫思”的版本间的差异
Hueilanxiong(讨论 | 贡献) |
|||
第1行: | 第1行: | ||
{{stub}} | {{stub}} | ||
− | 碼庫思 | + | 碼庫思 (MARKUS) 為文本標記與分析 線上平台, 功能多元,包括: |
+ | 1. 自動識別與標記漢文古籍文本所含人名、地名、官職名與時代 資 訊。 | ||
+ | 2. 可自訂標記,並手動標記自訂的多種語言關鍵詞 。 | ||
+ | 3. 以 文本 分析工具「 詞 夾子(keyword clipper)」 自動 生成關鍵詞。 | ||
+ | 4. 可彈性篩選所 標記 資訊 | ||
+ | 5. 提供多種類線上參考資源協助文本解讀 ,包括 地理資訊、人物傳記資料,以及語言性與專門領域性辭典等。 | ||
+ | 6. 提供如HTML、TEI等多樣檔案輸出格式,可確保標記成果與其他數位工具或平台相容。 | ||
+ | 7. 標記成果可連結中國 人 物傳記資料庫或TGAZ、TWGIS等地理資訊資料庫之相關資訊,合併匯入資料視覺化平台VISUS,以地圖、網絡圖像 、 表格 、時間 軸、圓餅圖、文字雲等工具探索文本內容 。 | ||
+ | 8. 可藉外掛程式(plugin)由其他資料 庫 匯入各式文本。如內建Ctext Plugin,可將Donald Sturgeon「 中國哲學書電子化計劃(Chinese Text Project)」收錄文本便捷匯入碼庫思平台。 | ||
+ | 9. 提供 機器學習(machine learning)模組 , 提升大規模文本標記的查準率(precision)與召回率(recall)。 | ||
+ | 10. 自由註冊 使 用帳號,以彈性管理文本檔案,包括:利用關鍵詞或正規表達式批次標記多項文本;或將標記成果匯出至不同文本分析與視覺化平台,如PALLADIO, PLATIN, DOCUSKY, 與 COMPARATIVUS等。 | ||
+ | |||
+ | 碼庫思提供 上 述功能中英文使用教學影片與說明手冊,並設有交流論壇,供使用者分享、討論使用案例與操作經驗。開發 文 件(documentation)詳見Github. | ||
+ | 碼庫思由何浩洋與魏希德共同開發,獲歐洲研究委員會(European Research Council)和「數據挖掘挑戰」計畫(Digging into Data)資助。「詞夾子」功能由臺灣大學項潔、杜協昌等提供;機器學習模組由苗聖法開發。 | ||
+ | 以直接輸出到碼庫思系統去處理。 | ||
==外部鏈接== | ==外部鏈接== |
2018年7月2日 (一) 08:18的版本
这是一篇小作品。你可以通过编辑或修订扩充其内容。 |
码库思 (MARKUS) 为文本标记与分析线上平台,功能多元,包括: 1. 自动识别与标记汉文古籍文本所含人名、地名、官职名与时代资讯。 2. 可自订标记,并手动标记自订的多种语言关键词。 3. 以文本分析工具“词夹子(keyword clipper)”自动生成关键词。 4. 可弹性筛选所标记资讯 5. 提供多种类线上参考资源协助文本解读,包括地理资讯、人物传记资料,以及语言性与专门领域性辞典等。 6. 提供如HTML、TEI等多样档案输出格式,可确保标记成果与其他数位工具或平台相容。 7. 标记成果可连结中国人物传记资料库或TGAZ、TWGIS等地理资讯资料库之相关资讯,合并汇入资料视觉化平台VISUS,以地图、网络图像、表格、时间轴、圆饼图、文字云等工具探索文本内容。 8. 可藉外挂程式(plugin)由其他资料库汇入各式文本。如内建Ctext Plugin,可将Donald Sturgeon“中国哲学书电子化计划(Chinese Text Project)”收录文本便捷汇入码库思平台。 9. 提供机器学习(machine learning)模组,提升大规模文本标记的查准率(precision)与召回率(recall)。 10. 自由注册使用帐号,以弹性管理文本档案,包括:利用关键词或正规表达式批次标记多项文本;或将标记成果汇出至不同文本分析与视觉化平台,如PALLADIO, PLATIN, DOCUSKY, 与 COMPARATIVUS等。
码库思提供上述功能中英文使用教学影片与说明手册,并设有交流论坛,供使用者分享、讨论使用案例与操作经验。开发文件(documentation)详见Github. 码库思由何浩洋与魏希德共同开发,获欧洲研究委员会(European Research Council)和“数据挖掘挑战”计画(Digging into Data)资助。“词夹子”功能由台湾大学项洁、杜协昌等提供;机器学习模组由苗圣法开发。 以直接输出到码库思系统去处理。