【江戸時代のビッグデータで災害分析】北本朝展 人文学オープンデータ共同利用センター長 | 建設通信新聞Digital

4月28日 日曜日

公式ブログ

【江戸時代のビッグデータで災害分析】北本朝展 人文学オープンデータ共同利用センター長

北本朝展センター長。国立情報学研究所(NII)コンテンツ科学系教授も務める


◇過去の自然・社会環境を復元

 地震など発生間隔が100年以上にもなる災害を研究するには、古文書や古地図などの史料も分析する必要がある。情報・システム研究機構データサイエンス共同利用基盤施設(ROIS-DS)の人文学オープンデータ共同利用センター(CODH)は、それら史料をコンピューターで分析することで古い時代の災害を含む社会や環境を復元し、さまざまな分野で活用しやすくするプロジェクト「歴史ビッグデータ」を進めている。同センターの北本朝展センター長に、プロジェクトの現状と今後の可能性を聞いた。

 防災での史料活用は既に進んでいる例もある。安政2年10月2日(新暦1855年11月11日)に発生した安政江戸地震では、現在の東京都千代田区・墨田区・江東区、茨城県取手市、埼玉県の幸手市、千葉県浦安市・松戸市・木更津市、神奈川県横浜市に相当する地域で震度6以上の揺れがあり、江戸中の死者数約1万人という被害があったと推定できている。史料と地質調査などを組み合わせた成果である。

◇活用できているのはごく一部

 ただ、北本センター長は現状について「膨大な史料のうち活用できているのはごく一部」と語る。

 歴史ビッグデータのプロジェクトでは、歴史的なデータである史料をコンピューターで扱えるように処理し、さらに現代のビッグデータ分析手法を応用して、過去の自然・社会環境の復元を目指す。プロジェクトが進めば、史料を活用しやすくなる。

CODHが史料活用を促進する一環として開発・公開したスマートフォン・タブレット用のくずし字認識アプリ「みを(miwo)」。カメラで撮影したくずし字史料をAIが認識し、結果をテキストデータで出力する

◇膨大な史料をビッグデータとして扱う

 現状では史料の活用にハードルがあり、歴史以外の分野の専門家にとって困難がある。例えば江戸時代の史料は古文とくずし字で書かれていてなかなか読みにくく、コンピューターでの読み込みや検索も難しい。さらに江戸時代の文書は現代より表記揺れが多い。地名に関しては、同じ地点にあった村でも表記が違う場合や表記が同じでも別の地点にあった村という場合がある。史料にいつ、どこで、どんなことが起こったか記されていても、どこを示す地名が緯度・経度でどこに相当するか特定できなければ、ほかの情報も活用できない。こうしたハードルに対し、史料をコンピューターで検索・分析を可能とする処理やアルゴリズムのロバスト性(必要条件や仮定を満たしていないデータでも妥当な結果を得られる性質)向上などに同プロジェクトで挑んでいる。

 最近は同プロジェクトの中で民間企業と協力する動きもある。平凡社地図出版(東京都千代田区)が出版した50巻51冊の地名辞典『日本歴史地名大系』のうち、地名など基本的なデータを2023年10月にオープンデータとして公開した。

◇民間のデータを含む統合データベース

 具体的には、地名に対応する位置情報(推定の緯度・経度)の追加や、古い村と現在の市町村をひも付けするID(地名識別子)割り振りを行った。地名項目・位置情報のデータセット(23年11月の追加時点で8万0502件)と、行政地名変遷データセット(23年10月時点で3611件、栃木県と群馬県が先行公開)は「日本歴史地名統合データベース(れきちめ)」で全ての人がダウンロードできる。

『日本歴史地名大系』地名項目データセットが含む地名を点で示した図(一部)


 今後は、行政地名変遷データセットを47都道府県に拡大するなどの内容拡充と、国土交通省の国土数値情報など他のデータベースと接続した統合データベース化を進める。

『日本歴史地名大系』地名項目データセット(沖縄県の一部を拡大表示)


◇分野またいだ新しい研究を開拓

 史料の活用例に地震が多い理由は、古地震の研究団体が史料の整理・分析を先行して進めていた点が大きい。同プロジェクトにより史料が整理・分析しやすくなれば、地滑り、火山噴火、数百年単位の気候変動など対象が拡大する可能性がある。

 北本センター長は、歴史ビッグデータのような取り組みを進めなければ「史料は活用されないまま失われてしまう恐れがある」と危機感を示す一方、「地名には過去のさまざまな情報がひも付けられている。防災以外にも、現状では北海道や沖縄の地名の変遷がアイヌ語や琉球語研究の手掛かりとなっている」と、地域づくりの手掛かりとなる文化的資源もあると意義を指摘。人文学・理学・工学などの分野をまたいだ新しい研究を開拓している。

 

【公式ブログ】ほかの記事はこちらから

建設通信新聞電子版購読をご希望の方はこちら