謡本版面の深層学習による翻刻と分析(2025~27年度)
- 研究代表者:藤田悟(法政大学情報科学部ディジタルメディア学科教授)
- 研究分担者:伊藤克亘(法政大学情報科学部ディジタルメディア学科教授)
【研究計画】
学習データを用いて、謡本版面からの翻刻の実証実験を行う。謡本の特徴として、謡文領域と節記号領域が近接しており、その分離が課題になる。これを正しく分離し、かつ、謡文の文字と、節記号の対応関係を判別する必要がある。精度の高い翻刻を実現するためには、いくつかの深層学習のモデルを考える必要がある。図4に、現時点でのくずし字認識システムによる認識結果を示す。それぞれの画像に対し、翻刻した結果を、その右側の列に示している。くずしの程度や時代により、認識精度に違いがあることがわかる。様々な謡本の翻刻に対応するためには、学習データを増やすだけでなく、深層学習のモデルの再検討、あるいは、時代に合わせた翻刻モデルの構築が必要になる。一方、ひとつひとつの学習には、高速な計算機を用いても数日間というレベルでの学習時間が必要になるため、確度の高いモデルを慎重に選択しながら研究を進める。
能楽の謡は、同じ謡に対して、流派や時代の違いにより作成された複数の謡本が存在する。それぞれは、漢字やかなの使い方が異なる一方、中に記された文書内容は基本的に共通する。よって、相互に比較参照しながら、自動翻刻を行うことで、認識精度を高めることが期待できる。また、節を理解するためには、漢字に読みを与える必要があり、辞書との連携が必要である。以上の理由で、形態素解析用の辞書と連携し、かつ、他の謡本と比較しながら、本文の翻刻を行う手法について、研究を進める。他の謡本との比較が可能になれば、高精度で翻刻が可能になり、それぞれの流派の違いのデータベース化を進めることができる。
データベース化に当たっては、貴研究所の所蔵データだけでなく、広く謡本のデータが必要になると考える。貴研究所に協力を依頼しつつ、他の研究所、資料館などの所蔵する画像についても、可能な限り画像データを収集し、データベースの大規模化をはかる。
