2017年04月26日

凸版印刷は、江戸期以前のくずし字(ひらがな、カタカナ、漢字を崩して書いた手書き文字)で記されている古典籍(江戸時代以前に作られた、内容・形態の優れた書籍)の文字を判別し、テキストデータに変換する光学文字認識(OCR)技術を2015年に確立。大学や研究機関と共同で実証実験を行っている。

 
このほど、くずし字で書かれた歴史的資料の利活用を促進するビューア「ふみのは」を開発。2017年5月から、同ビューアを用いた公開用データ制作サービスの提供を開始する。

 
同ビューアは、一般的なWebブラウザで、歴史的資料の原本画像の上に翻刻(古典籍などの古い文献を現代の活字等を使って一般に読める形式にすること)や多言語翻訳文を重ねて表示することが可能。従来の原本画像と翻刻文の画像を重ねて表示する方法とは異なり、翻刻文をテキストとして扱えるため、全文検索やインターネット上の横断検索などにも対応している。

 

「ふみのは」による表示サンプル

「ふみのは」による表示サンプル

 

同ビューアの開発によって、くずし字で書かれた歴史的資料がテキストデータとして容易に扱えるようになり、全国各地に眠る貴重な歴史的資料の利活用推進が可能になった。

 

また、観光立国の実現に向け凸版印刷が従来提供する、訪日外国人の旅の質と利便性向上を目指す「旅道」(たびどう)プロジェクトの活動とも連携し、地方創生に向けた観光地域づくりやインバウンドビジネスなどへの活用にも取り組んでいく。
なお同ビューアは、早稲田大学坪内博士記念博物館(所在地:東京都新宿区、館長:岡室美奈子)の演劇映像学連携研究拠点「特色ある共同研究拠点の整備の推進事業(演劇映像学連携研究拠点)機能強化支援」の一環として2017年4月25日に公開(http://www.waseda.jp/prj-kyodo-enpaku/kuzushiji)される字形データセットの公開手法として採用された。今後、くずし字判読技術の習得補助や翻刻作業効率化の研究に活用される予定。

 

URL:http://www.waseda.jp/prj-kyodo-enpaku/kuzushiji

PAGE TOP