情報処理技術を活用した室町期能楽伝書キーワード集成の作成
- 研究代表者:中野遙(上智大学グローバル教育センター特任教員)
- 研究分担者:宮崎眞帆(コロンビア大学大学院 Department of East Asian Languages and Cultures、法政大学能楽研究所客員研究員)
- 富山隆広(法政大学大学院生)
- 仲村伶(明治大学大学院生)
- 黒川茉莉(上智大学大学院生)
- 研究協力者:豊島正之(上智大学文学部特別契約教授)
【2021年度 研究成果】
『能楽資料集成』所収の伝書・記録類(更に「舞正語磨」を加える)のテキストデータを、自然言語解析に広く用いられる形態素解析ソフトウェアMeCab用のUniDic近世語バージョン(国立国語研究所)を用いて解析した。その結果を吟味し、解析を誤っている箇所から、能楽特有の術語・キーワードを抜き出す事で、解析用辞書の拡張資料を作成した。拡張辞書に基づく再解析は、UniDic辞書の仕様の一部が非公開のため、うまく行かなかった。将来的に、国立国語研究所のUniDicグループにリソース共有を行うなどの方法による辞書の追加を検討している。
1.0本研究の方針と本年度の活動報告
本研究は、能楽研究と国語学研究の二つの視点・手法によって、室町期能楽伝書類のキーワード集成の作成を目指すものである。本研究では、室町期能楽伝書類のテキストデータについて、自然言語解析ソフトウェアによる文節切りを行い、その中の誤解析結果から、自然言語解析ソフトウェアでは上手く解析出来ない語=能楽伝書類のキーワードを選出し、キーワード集成を作成する事を目指す。
法政大学能楽研究所編『能楽資料集成』等のうち、次は既に電子テキスト化済みである。
『能楽資料集成』2 細川五部伝書・『能楽資料集成』3 下間少進集・『能楽資料集成』9 金春安照伝書集・『能楽資料集成』12 観世流古型付集・『能楽資料集成』13 幸正能口伝書集・『能楽資料集成』14 金春安照型付集・『能楽資料集成』15 大蔵流間之本二種・『能楽資料集成』16 大蔵流間之本二種(続)・『能楽資料集成』17 実鑑抄系伝書(上)・『能楽資料集成』18 実鑑抄系伝書(下)(未刊)・『能楽史料』舞正語磨
本年度は、これらのうち、間狂言の15・16を除いた能楽伝書類テキストデータについて、国立国語研究所作成の近世語の自然言語処理用辞書ソフトウェアである「近世語UniDic」を用い、自然言語解析に広く用いられる形態素解析ソフトウェアであるMeCabによって文節切りを行った。この作業の中で、MeCabによって解析出来ない語を、能楽伝書類に特徴的な語、つまり、キーワードとして選出した。
MeCabのみによって完全な品詞分解・文解析を行う事は困難であり、もとより、本研究の目標とするところでもなく、現在の自然言語解析ソフトウェアでは取り出せない語の中にこそ、能楽伝書独特の用語・表現が見られると考えられる。本研究は、このMeCabによる解析結果の中の誤解析箇所から、能楽伝書類のキーワードの見当をつけるという事が主眼である。
能楽伝書類のキーワード一覧としては、既に『能楽資料集成』の巻末索引などが存在してはいるものの、能楽伝書類の中には同じ語でありながら表記が揺れる例も多く存在しており、索引類には限界もある。本研究では、そうした索引の対応が困難な例も含めたキーワード集成を作成し、最終的には能楽伝書類の解析について、より正確な自動化を可能にしていく事で、謡曲本文などの他の芸能関連資料への対応も実現していきたいと考える。
2.0 能楽伝書類テキストデータの誤解析例
次に、本年度行った能楽伝書類テキストの誤解析結果の例を分類して示す。
誤解析例は、a) 辞書項目の不足による誤解析と、b) 別語の表記衝突による誤解析の、二種に大別される。
a) 辞書項目の不足による誤解析
a1) 曲名が誤解析されている例
善知鳥 善知:名詞:ゼンチ 鳥:名詞:トリ
当麻 当:接頭辞:トウ 麻:名:アサ
老松 老:名:オキナ 松:名
安宅 安:名:アン 宅:名:タク
檜垣 檜:名:ヒノキ 垣:名カキ
小袖曾我 小袖:名、曾:副:カツテ、我:代名
輪蔵 輪:名:ワ、蔵:名:クラ
a2) 能楽用語が誤解析されている例
答拝 答:動:答ふ 拝:動:拝む
喝食 喝:名 食:動:食ふ
泥眼 泥:名:ドロ 眼:名:メ
花傳抄 花:名:ハナ 傳:名:ツタエ 抄:名
安照 安:名 照:名
序破急 序:名:ツイデ 破:動:ヤブリ 急:動:イソイ
a3) その他、一般的な用語・固有名詞などで、辞書に欠けていて誤解析されている例
起請文 起:動:起つ 請文:名
卒塔婆 卒:感動 度:名 婆:名
楊貴妃 楊:名 貴:形容:貴し 妃:名
頼朝 頼:動:頼む 朝:名
楚哥の 楚:名 哥:名_の:助
a1) とa2) の例は、能楽伝書のキーワードとして数えられる語と言える。また、a3) も含め、ここまでの例については、辞書項目の追加による対処が可能である。
一方で、次に示すa4) 当時の用語・用字法の関係で誤解析されている例は、辞書への追加だけでは不十分な例と言える。
a4) 当時の用語・用字法の関係で誤解析されている例
トテノ玉フハ 推量:名_とて:助_の:助、玉ふ:動_は:助
常のうち込を打事よし 常:名_の:助、うち:名、込:名:コミ
今さら{うち込引}色も浅衣 {左りの袖を見 右へ} うち:名、込:名:コミ、引:名:ヒキ
「トテノ玉フハ」は、当時の通例の表記が原因で誤解析されている例と言える。一般的には、「のたまふ」は「宣ふ」と書かれるが、ここでは「ノ玉フ」と表記されている。当時は「宣ふ」を「の玉ふ」と書くのは通例であるが、そういった当時の用字法の特殊性から、「ノ玉フ」は誤解析されている。「うち込」の例も、「打込」と漢字表記されれば一語として解析されるが、「うち込」と平仮名と漢字表記を組み合わせて表記される事で、誤って解析されている。これらは、文脈によって解析の方法が異なる例であり、単純に辞書に項目を追加するのみでは対処が困難である。
また、次に示すb) 別語の表記衝突による誤解析についても、a4) と同様、辞書項目を追加するのみでは対応が出来ない。
b) 別語の表記衝突による誤解析
シテ シ:動:す、_テ:助
大べし 大:形状:オオキ、_べし:助動
出はの 出:動:出づ_は:助_の:助
謡教べし 謡:動:謡ふ、_教:接尾辞、_べし:助動
曲マイ 曲:名:マガリ マイ:名_ハ:助
「シテ」は、能楽の役柄としての名詞の「シテ」を指すが、ここでは動詞「す」と助詞「て」として解析されてしまっている。「大べし」も同様である。「出はの」は、「出端」の「端」が平仮名表記になっている事で、動詞「出づ」と助詞「は」とされている。「謡教べし」の「教」は、名詞の「キョウ」ではなく、動詞の「をしふ」であるが、活用語尾を表記していないために、誤解析されてしまっている。「曲マイ」は、「曲舞」と漢字表記されていれば正しく解析されているが、「舞」が片仮名表記の時、「くせまい」の一語ではなく、名詞「曲(まがり)」と名詞「まい」として、二語で解析されてしまう。
これらは、別の語でありながら、表記が一致する・衝突する語であるために、誤解析されてしまう例であり、先ほどの用字法の問題と同様、これらは文脈を踏まえなければ語の判断がしにくく、単純に辞書に項目を追加するだけで対処する事は出来ない。こうした例は、MeCabの「制限付き解析」という、問題になり得る当該部分をあらかじめ切り分け、他の部分だけを自動解析するという作業によって処理は可能であり、実際、そのように処理して切り抜けた部分もあるが、そのような解決は、本研究の直接の目的ではない。
今回の調査では、以上のような誤解析が発生したが、本研究ではこの誤解析を活かし、その中から能楽伝書類のキーワードの見当をつける事が目的であり、これら全ての誤解析を修正するという事は重要ではない。但し、これまで確認したように、能楽伝書類のキーワードとは異なる誤解析も多く含まれているため、これらの解析について、辞書項目の追加も必要となるだろう。
3.0 『能楽資料集成』の翻刻に於ける表記の問題
2.0で示した誤解析の例の他に、『能楽資料集成』の翻刻中の表記の問題がある。翻刻中に様々な右傍表記が用いられるが、その解釈が文脈依存のものであり、一律の処理は出来ない。
a) ルビ
助音[ジヨヲン]するハ、我をすてゝ人にしたがふべし。さるにより、一ツにてうたふと云
り。
舞の面白からん品{シナ}を捨て、唯あはれに舞なす事、肝要也。
b) 誤訂・異本注記
時の調子なればとて、一越、盤渉ハいかん、先ハ祝言ハ黄鏡【鐘】と心得べし
身心をなす【驚す】感を天地に【を】動すと云、てきを和ぐる所を鬼神をかんぜしむると
云り。
c) 校訂注記
字をふまへ、音曲ゆかて[本ノマゝ]肝要也。声と、器用、慢心、此三ツ、謡の病也。
是を[脱落あるか]号して、謡・囃子物肝要也。
つくり物内へ入、しやうぎをこうてこしをかくる。{{(本項は記事が前後し、原本に錯脱が
あったらしい。)}}
d) 出典(曲名)注記
三字あがりと云事、[三井寺]「うきねぞかはるこの海は、浪風も静にて」
こうした種々の右傍表記については、今後、適切な約物(括弧など)を設定し、それぞれの性格を明示するなどの対処をした上での解釈本文を作成していく事を検討している。
4.0 辞書の拡張と今後の課題
今年度は能楽伝書類テキストの誤解析結果から、能楽伝書類キーワード候補を収集するに止まった。来年度はこのキーワード候補の精査を能楽専門のメンバーの力も借りながら進めていく。また、2.0の誤解析例を鑑みても、今後は辞書の拡張が望まれるが、現時点で使用している国立国語研究所のUniDicの辞書は、こちらから項目の追加が出来ない。このため、将来的には国立国語研究のUniDicグループとの共同研究によって、辞書項目を追加していく事も検討していきたい。
現時点では、国立国語研究所には口語の狂言用UniDicはあるものの、謡曲用のUniDicの準備が無い。謡曲・能楽伝書からのキーワード抽出により、謡曲用のUniDicの作成の共同研究を進める事が出来れば、更に有益であると考えている。
【研究目的】
本研究は、能楽研究と国語学研究、二つの視点・手法を以て、室町期能楽伝書キーワード集成の作成・運用を目指すものである。本研究では、室町期能楽伝書のデータをもとに、品詞分解によるタグ付きテキストの編集を行い、その過程で得られる「単位切り用辞書」を利用して能楽伝書に用いられるキーワード集成を作成する。その目的は、大きく次の3点である。
① 能楽伝書キーワード集成の作成によって、室町期の能楽伝書に於ける術語の実態把握に資する。
② 能楽伝書キーワード集成の作成とその分析によって、室町期能楽伝授に於ける語彙・表現の観点から、当時の伝授と演出・演技の実態を明らかにする。
③ 能楽伝書の中の規範的記述に於ける語彙・用法をキーワード集成として参照・分析を可能にする事で、当時の言語規範の検討を行うと共に、キリシタン版などの室町期日本語資料に於ける語彙・用法とを対照させる事で、両者の関連性を論ずる。
① 室町期能楽伝書特有の語彙・表現をシソーラス化する事により、能楽伝書に於いて分析対象たり得る語彙を可視化する。これにより、能楽伝書に於いて特筆すべき術語の概観を得る事を目指すものである。「能楽伝書特集の語」・「特筆すべき語」は、伝書類のテキストデータを用いた統計的処理と本文の分析の、両方の手法によって抽出する。
② ①の概観と分析を踏まえ、その中の個別の術語についての室町期能楽伝授の中での位置付けと、近世以降の能楽史料への展開・受容を明らかにする。能楽伝書の語彙・表現の観点から、当時の能楽伝授の現場と、当時の演出・演技、それぞれの実態についてアプローチする事を目指す。
③ 能楽伝書はその資料の性質上、規範的記述がなされている事が期待される。この点から、能楽伝書キーワード集成の作成は、室町期に於ける日本語の語彙・表現の言語規範の解明に資するものと言える。また、同時代のキリシタン版の語彙に中世芸能語彙の影響があった事は従来も指摘されているが、その詳細な検討は、未だ十分には行われていない。本キーワード集成の作成・運用によって、能楽伝書の語彙とキリシタン版の語彙の関係を明らかにする事を試みる。