中国歴代人物伝記データベース

提供: Digital Sinology
2018年7月7日 (土) 13:45時点におけるKonnyaku (トーク | 投稿記録)による版 (ページの作成:「'''中国歴代人物伝記データベース'''(China Biographical Database: CBDB)は7世紀から19世紀の中国史上の人物をまとめたデータベースであ...」)
(差分) ← 古い版 | 最新版 (差分) | 新しい版 → (差分)
移動先: 案内検索

中国歴代人物伝記データベース(China Biographical Database: CBDB)は7世紀から19世紀の中国史上の人物をまとめたデータベースである。CBDBは2017年8月時点で約417,000人の情報(名前、生没日、出身、学位、研究機関、親族関係や社会要素など)を蓄積している。[1]


歴史・概要

CBDBは社会史学者Robert M. Hartwell(ロバート・ハ―トウェル(1932-1996))がきっかけで始まりました。[2]ハートウェルは当初、宋王朝の社会・家系ネットワークの研究に用いることを想定していました。中期中国の社会史研究には膨大なデータセットが必要になることを予期し、自らデータ収集を行いデータ解析の歴史に新たな一歩を切り開きました。[3]この際ハートウェルは人物、地域、官僚制度、親族関係や社会要素でデータ構築をしました。


ハートウェルは死後当時25,000人、4500作品を蓄えたデータベース作成と歴史地理情報システムをハーバード燕京研究所に委託しました(ただし、研究所は後に研究を中断)。ハーバードの(Peter K. Bol)は2005年初頭にハートウェルから委託されたデータベースを公表しました。中国文学の研究する カリフォルニア大学アーバイン校のMichael A. Fullerはアプリケーションの再設計や、北京大学のDeng Xiaonanは院生Center for Research on Ancient Chinese History (北京大學中國古代史研究中心)はデータベース内の情報改訂を行った。他にも中研院歷史語言研究所(Institute of History and Philology at Academia Sinica )のLau Nap-yinは電子参照媒体の作成を行いました。以上のような努力の結果、様々な分野を包括的したデータベースの作成が行えました。現在、CBDBはハーバード大学フェアバンク中国研究センター、北京大學中國古代史研究中心の管轄にある。更なる概要、設立者、協力者の詳細はCBDB ウェブサイトを参照されたい。


概要

CBDBは膨大な数の人物伝を蓄積しています。これには人物・地名索引、歴史、鎮墓文や墓碑、個人の執筆文、政府記録を含んでいます。[4]


CBDB は長期的かつ際限のないプロジェクトとなっています。既に傳記資料索引には宋、元、明代の権威者の記録が保存されています。他にも清代の人物生没日の記録や、宋の郡守年表、1148年と1256年の明・清朝の進士記録、明朝の親族における官人保持者記録などが記録されています。2018年の段階では唐代の記録を取り組むことを目標としています。CBDBは、人名權威–人物傳記資料查詢や 京都大学の唐代人物知識ベース[5]といった他のデータベースと連携をとって相互で記録を共有しています。


現在は地方官僚と地名辞典の系統立てや清朝公式の四半期記録(縉紳錄)を整理しています。


長所・短所

CBDBはデータマイニングによって現存の資料からデータの抽出を行います。資料自体が系統立てて作られているため、データマイニングも系統立てて行われます。これはすなわち、個人による深く掘り下げた探求ではないため、他の優秀な研究者も自らの研究からCBDBに調査データを組み込むことができます。

資料の正確さよりも高い精度で資料からデータを読み取り、出力することを目的としています。そのためはじめは事実上のエラーや矛盾した情報が得られることがあります。CBDBは資料の区別は行うものの、資料ごとにどちらが有意かの判断はしません。 しかしCBDBでは長年選び抜かれてきたデータを確認することができます。

現在、CBDBでは唐代から清代(7世紀から20世紀諸島)の人物について記されています。墓誌銘は親族関係を観るには優れているものの、数万ほどしか現存しておらず、書物としてはわずかしか残っていません。その性質上、資料は政府によって改変されていることもありこれらは系統的にデータマイニングは依然として行えていません。 [6]



CBDBは多くの人物データを取り扱うものの、伝記の寄せ集めではありません。それよりもむしろ人物とその経歴、政庁への加わった経緯、親族関係、活動その他著書などから時空間の潮流の中で膨れ上がるデータの集合体です。この膨大なデータを用いての検定では、その原因が何であれエラー値は極めて小さくなります。CBDBのようなデータベースはクエリの実行や、変数へのパラメータ付与によって単なる伝記以上の情報量を有します


長きにわたってCBDBは包括的に確認されている資料を蓄積し、正確に中国史上の人物データ提示することができます。


CBDB について

CBDB 2017 Data by Period.png

右図は2018年1月現在CBDB上にある各王朝別に人物の数を記しています。データマイニングの結果、明代の進士保持者の母親(M)や父親(F)、祖父(FF)、曾祖父(FFF)、兄弟(B+/-)までまとめることが王朝時代ごとに分けることで可能となりました。

CBDBのシステム上、全王朝からの経歴を引きつぐ例がある者の、人物の生没時期から対応する王朝時代を当てはめることができます。死没日が不明な人物も存在するがそのような場合は年度指数に則ります。 年度指数 では正確でないものの、その人物の生没時期が中国暦で60歳まで生きたものと仮定します。60歳以前に死没していた場合は元々の生没時期を採用します。年度指数はCBDB上の全データ平均値をはじめとした諸々の規則性から推計されます。例えば、男性は平均的に30歳で進士の資格を保有し、2歳半若い奥さんを持ち、長男を30歳の時に迎え入れる。このように一つの家庭の在り方から年度指数を他の家庭を推測することができます。一般的にはこの法則が通用するが、世代が2つ以上違った場合はその限りではなく、年度指数も大きく信頼性が下がることになります。年度指数は一定の期間中の計測にクエリーでは欠かせない指標です。


CBDB 2017 Data by table.png

CBDBは個人に関する多様なデータを蓄積している。左図は各カテゴリーごとのデータ収集量を表しています。各カテゴリーにはデータベース内にコード表が存在します。主要な人物情報のデータ表はそれぞれの人物に他の多くのデータ表に用いられるユニークIDが付与されています。社会的要素(Social Associations)は書物、政治、学風など235種にカテゴライズされています。人物のアドレス(Biographical Address)は20種あり、生没地、埋葬地、籍貫、原籍、清代八旗、前住所などがあります。別名(Alternate Name)は、字、室名別号、諡号、戒名、輩行名、幼名を含めた17種あります。可能性のある親族関係もコードに組み込まれているが、親族関係を最も近い関係性(父と子、夫と妻など)で結び付け、家系図を描くことが課題となっています。政庁への入所(Entry into office)は、その方法(試験、推薦、恩蔭、捐納など)から分類わけがなされている。政庁への配属(Office postings)の分類は、地方での任地や、王朝での位置付けや政庁名の全てを階層的に位置づけ全役職保持者を官僚構造の中からクエリを行えるようにしています。社会区分(Social distinction)についてはその人物の政庁での位置付け関係なく、詩人、芸術家、僧侶、商人などとしての個人の著名度を用いています。文書(Texts)には現存する文書と紛失したものを合わせており、書誌も含まれている。



可視化システム

CBDBはプロソポグラフィのデータもととして使われます。[7] データはクエリーされたのちに統計分析 ツールにコピーされ可視化されます。下図はCBDB上の全人物と女性(CBDB上の10%の人物が女性)の死亡年齢における中央値を比較したものです。性別不明の場合は除いて、このデータから出産適齢期の女性は死亡者が多くなっていることがわかります。


CBDB上のデータでクエリーを実行した結果を別の分析で可視化されたものが地理情報システム社会ネットワーク分析です。これらの説明をする上で同じデータセットを3つの可視化システムに投影します。宋濂 (1310-81)の社会的要素は452個CBDB上に存在する。この社会ネットワークの可視化には、彼と別の人物が1人以上ネットワーク上でつながる人物が結び付けられているが宋濂の文学要素(例:文通)と学者的要素(例:師弟関係)しか含まれていない。左のグラフを示すのにフリーネットワーク分析ソフトのPajekを用いました。中央のグラフはGephiを用いて作成されたものでサブグループを判別するため色分けしてあります。UCInetへの書き出しも可能です。宋濂の社会要素は国家的なものではあるものの極めて局所的なネットワークです。Windows、Macのいずれでもフリーで機能するQGISと、国境や河川、標高モデルはCHGISv.6によってこのような可視化を行っています。CBDBはKMLからGoogle Earthへの書き出しも可能です。また、単純もしくは複雑なクエリーからデータを作成することもでき、ある地点から民間試験によって登用された人物について、一定の期間の中から社会的・親族的関係性を割り出すこともできます。




参照


注釈


参考文献

  • Peter K. Bol, Chao-Lin Liu, and Hongsu Wang, Mining and Discovering Biographical Information in Difangzhi with a Language-Model-based Approach[1]
  • Peter K. Bol, "The Late Robert M. Hartwell 'Chinese Historical Studies, Ltd.' Software Project," 1999[2]
  • Anne Gerritsen, "Using the CBDB for the study of women and gender? Some of the pitfalls" December 2007[3]
  • Fuller, Michael A. "The China Biographical Database User's Guide," February 28, 2015[4]
  • "Online Guide to Querying and Reporting System," Academia Sinica[5]


分類:Biographical databases

分類:Projects with APIs