浅草寺様
西暦628年のある早朝。現在の隅田川近くに住む檜前浜成・竹成兄弟は、漁の最中にある仏像を引き上げます。この仏像をご本尊として創建された浅草寺様は、以来1400年近くに渡って東京は勿論、日本や世界中から篤い信仰と尊敬を集めると同時に、長くお寺様を中心とした華やかな浅草文化の中心として日本文化史上においても重要な役割を果たされてきました。
浅草寺様では国宝や重要文化財をはじめ、数々の文化財や貴重資料を所蔵されています。この度株式会社誠勝では、計2回に渡り浅草寺様保管の貴重書籍を電子化・テキスト化させていただきました。1回目は『大無畏』『観音世界』など戦前に出版されていた機関誌約360冊、2回目は江戸時代の浅草寺を克明に記録した『浅草寺志』です。
書籍の重要性と誠勝へご依頼頂いた経緯について、浅草寺 教化部の藤元 裕二様にお話いただきました。
戦前の浅草寺を伝える、学術的にも重要な資料
浅草寺様には計2回、これまでご依頼いただいておりますが、まず1回目に電子化した資料について教えていただけますか。
一度目にお願いしたのは浅草寺内で保管されていた過去の機関誌計360冊程度です。いずれも基本的には戦前から戦後にかけて浅草寺が毎月/毎年出していた冊子で、第二次世界大戦中に一旦休刊してはいますが、うち90%以上が戦前のもの、古いものですと大正末期まで遡る、当寺で連綿と続いてきた書籍になります。
例外は『浅草寺文化』。こちらは戦後に刊行されたもので、いわば浅草寺に関する学術論文的な内容、専門書と呼ばれるような書籍でした。
広報誌ということは、当時かなりの数が配布されていたのでしょうか。
実は、発刊当時どれほど配布していたのかは正確に分かっていません。冊子自体も現在10冊同じものが残っている号もある一方で、中には1冊しか無いものもある。恐らくかなりの数で出していたとは思いますが、実際どうなのか、というのは記録から見えにくいです。浅草寺では現在『浅草寺』という冊子を毎月発刊しており、浅草寺へ来てくださる方へ無償でお渡ししているのですが、そういった形で広く皆様にお配りしていた可能性はありますね。
戦前のお寺様の情報がある、ということは史料的価値も。
浅草寺の伽藍は昭和20年の東京大空襲でほぼ焼失しており、それ以前と以後で、資料・情報の断絶が起きてしまっているんですね。建物は当然ながら、仏様や紙資料まで焼けてしまったように思える。戦前のこと、大正や昭和初期のことを記録したこれら資料は、実は大変貴重な情報源と言えます。
空襲で焼ける前の浅草寺の情報が盛り込まれている。現在発刊している『浅草寺』もそうですが、こうした機関誌は、浅草寺の中で“次代への記録”としても意味合いが非常に強いんです。
浅草寺だけでなく、一般的にお寺では文化財や過去の遺産を大切にしています。現在境内にある文化財について、『これはいつから浅草寺にあるのか?』という情報は、大変重要です。それが文化財そのものに明記されていればいいのですが、書いてない場合はいつ奉納されたのかという記録を追っていく必要がある。しかし東京大空襲でそれも焼けてしまった…となった時に、今回電子化いただいた冊子を調べることで判明することもあります。
幾つかの冊子を横断的に見ることによりわかる情報もあります。例えば、ある浅草寺の冊子に「昭和●年に××様から仏像を寄進された」ということが書いてあるとします。そこで別の冊子を調べてみると、この方の職業や生没年、寄進頂いた他の仏像、他のお寺様や博物館にどれだけ寄進いただいたかということまで分かる例があるのです。他にも『いつどこで何の法要が行われて、どういう方々が何人来たのか』といった非常に細かい記録が沢山残されている。
一見、これらは外部の方からすれば貴重な情報には見えないかも知れません。しかし我々のような浅草寺に関わる者やその研究者が見ると、これは当時を振り返ることのできる重要な資料です。統計的にも非常に大事な資料になるのです。例えば、浅草寺の社会福祉施設は、大変古い伝統のあるものなのですが、戦前から盛んに活動していて、多くの方を救っていたことが、今回のデジタル化により一目瞭然となりました。
現在の『浅草寺』も、浅草寺の教えを広めていくという側面がある一方で我々、あるいは次の世代が見た時に有効な資料になるよう心がけています。
これら冊子は、これまでどのように保管されていましたか?
浅草寺内にある書庫で保管していました。浅草寺の住職は、寺の冊子が戦前から連綿と続いていることや、そのなかに重要な記録が掲載されていることはよく知っています。しかしその中身を全部見るのは物理的に難しいです。出来るとしても相当な労力・時間がかかる。そのため実際に冊子が使われる・取り出されることはほとんどありませんでした。
難易度の高い、旧字→新字変換への挑戦
冊子を電子化、テキスト化されたきっかけを教えてください。
実は電子化自体がここ10~15年の流れでして、誠勝さんへのお話もその中の一つでした。現在発刊されている『浅草寺』は以前から電子化されていたので、だったら『浅草寺』の”前提“である過去の機関誌をまとめて電子化しよう、という次第ですね。
先ほどお話した様に、機関誌全てにアクセスするには限界があります。PDF化され、正確なOCR処理まで施されていれば、容易に閲覧が出来るだけでなく探している対象のピックアップが検索一つで済む。それは浅草寺にとって極めて重要なことなのです。
業者はどのように探されたのでしょうか。
インターネットで、OCR処理を低価格でやっていただける業者さんを探しました。御社のHPを見ると、学術機関など比較的コンプライアンスの厳しい団体様の実績がある。そこでお見積もりを取らせていただくことにしました。
旧字が多く、自動認識のOCR処理は難しい冊子でした。
お見積もり自体、校正人数や精度に応じて何パターンか出していただいて、サンプルでOCRもお願いしました。しかし旧い文字が多いので当然自動認識では読み取れなかったと思います。
ご発注から、電子化までの間にいくつか事前作業をお願いさせていただきました。
発注後はまず対象書籍を一通り誠勝さんに送ったのですが、その中で状態が悪くスキャンが難しいとご指摘いただいた冊子に関しては、浅草寺内に残っている同じ号の別冊子をお渡ししました。私が浅草寺に来たばかりの12年ほど前に、書庫にある冊子を実際に並べて点検する作業を行いまして、この時に『どの号が何冊残っているのか』をある程度把握していたんですね。ですからスムーズに進めることが出来ました。
他にも、先ほどお話したように冊子のほとんどが旧字なので、『旧字やPCで変換できない文字は似た形の新字に置き換える』『仮名遣いはそのまま適用する』といった校正に関する仕様のリストを誠勝さんと作成しました。難しい・読めない文字はこちらでも指摘しましたが、結果的にはほぼリストだけで対応いただけたかと思います。電子化の目的が検索ですので、PC上で検索する時にわざわざ旧字を使わないだろう、ということで新字に置き換えた形ですね。
1回目の経験を活かした、2回目のテキスト化
約半年かけて作業させていただきましたが、納品データをご覧になっていかがでしたか?
検品時に各シリーズからページをピックアップして、検索語がしっかりヒットするかをテストしたんですね。すると一文字だけ、浅草寺内で頻繁に使われる旧字が検索できなかったことがありました。ただそちらも非常に良く対応していただけて、今開いているこちらのページは99.56%、ページによっては精度100%もありました。本当に僅かな誤差のレベルですね。大変良いデータを作っていただいたと思います。
ありがとうございます。2回目のご依頼は『浅草寺志』ですが、こちらの目的は?
こちらの書籍もお願いしたのは「PDF上の文字校正」ですが、資料の種類が1回目の時と少し違います。『浅草寺志』は元々江戸時代の文化年間に出来た本で、当時の大名である松平冠山が浅草寺について網羅的に調べた記録が記載されているものです。例えば本堂の大きさはこう、本堂に掛けられている額の内容はこう、その額の銘文は…などという風に、当時のお寺の状況が非常に細かく書かれている。
私が江戸時代の浅草寺について何か調べる際にはまずこの冊子を見ることにしています。非常に冷静な目で、「その時に見たままの浅草寺」を記録しているので資料的にはとても重要です。
『浅草寺志』の内容が『観音世界』などの機関誌にそのまま引用されていることもありますが、『浅草寺志』自体を丸ごとデータ化しておけば浅草寺としては非常に有効。また浅草寺の古文書を調べていただいている外部の有識者による集まりがあるのですが、そこでの研究でも同じく有効です。ということで、再び「PDF上の文字校正」をお願いしました。
1回目の流れを汲んでいるところも?
前回は旧字を似た新字に置き換え、それをご報告いただくという形にしていましたが、今回は事前に検索する際の予想や見込みをしていただき、前回出た旧字に加えて新たに登場した文字をプラスで検索できるようにしていただきました。
『浅草寺志』はDVDまで作成すると伺っています。
ちょうど、この後作成していただく予定です。非常に良いデータを作っていただいたので浅草寺の住職や研究者にとっては重要な資料。DVDは販売用ではなく、そうした方々にお配りするつもりでおります。
まだ、電子化したい資料は残っているのでしょうか。
大きなところはやっていただけましたが、ゆくゆくは出てくると思います。他にも色々な記録はあるので必要性が生じればお願いするかも知れません。
現在、浅草寺の書庫に保管されている冊子には、それほど上質の紙が使われている訳ではない。それらに文化財的な価値を認め、資金を投入し修理・保存するという方法もありますが、現実にはなかなか難しい。原本が朽ちてしまえば終わってしまいます。仮にその可能性が予見されるのであれば、その前にデータ化して、仮に原本が無くなっても情報を見られる状態にしておくのは不可欠でしょうね。