凸版印刷は2021年2月16日、Webブラウザー上で古文書や古典籍を解読するシステム「ふみのはゼミ」を発表した。AI(人工知能)を組み込んだOCR(光学的文字認識)である「AI OCR」により、90%以上の精度でくずし字を認識する。複数人の共同作業を支援する機能を備え、教育やイベントでの利用を見込む。

 ふみのはゼミはパソコンやタブレット端末のWebブラウザー画面から使う。画面上で解読したい範囲を指定するとAI OCRが連続する文字列を自動で区切り、読み取ったひらがなや漢字をくずし字の真横に表示する。目視による校正もでき、校正結果をAI OCRに再学習させて読み取り精度を高められる。他の参加者の作業をリアルタイムで表示する画面共有機能や、チャット機能、解読した文字や単語に対して質問やコメントをつける機能がある。

「ふみのはゼミ」の画面イメージ。他の参加者が編集している箇所をリアルタイムで表示する
「ふみのはゼミ」の画面イメージ。他の参加者が編集している箇所をリアルタイムで表示する
(出所:凸版印刷。文書は『伊勢物語』で印刷博物館所蔵)
[画像のクリックで拡大表示]

 AI OCRは解読済みの古文書・古典籍から集めたくずし字の形を学習させて作った。凸版印刷が今回、2015年から国文学研究資料館と研究してきたくずし字を読み取るOCRにAIを導入した。

 週1回90分の授業に使う場合、利用価格は6カ月当たり10万円(税別)から。利用形態に応じて複数のプランを用意する。同サービスをまず教育機関、博物館、資料館、地方自治体などへ向けて販売し、2021年9月までに一般利用者への提供を目指す。2023年までに関連事業を含め約10億円の売り上げを目指すとしている。