ヨハネ福音書の話とGoogleドキュメントを利用した校訂作業と

 かいつまんで説明すると、現行のヨハネ福音書には原著者(に近い人々)の文以外に、第二著者(に近い人々)の文が混在しており、それらの取り扱いやすいテキストデータを作った。という話です。

 付加部分のメモを片手に読むこともできますが、まあどうせなら取っ払ったデータと、現行データと、そこに区分記号を入れてしまおうと、ちまちま作業していました。

 

 福音書本体についてのより詳しいことは田川建三新約聖書 訳と註』作品社(第5巻がヨハネ福音書)を参照してください。腑分けして(といってもそんなにごちゃごちゃと混ざっているわけではないのでただ読む分には面倒は少ないです)読むと、私が思うに、田川さんが述べているとおり、原著者の意図するところはとてもシンプルですし、付加された部分を同じ人物(たち)が書いたとするには無理があります。

 原著者の考えは好きですよ、私は。

 

 データの作り方。

 専用のスキャン装置があれば万々歳ですが、ある物で代用。

 1.『訳と註5巻』。 2.譜面台2つ。 3.ipad。(要するに、撮影機材を固定させておきたい)

 撮った画像をGoogleドキュメントに投げ込んでテキスト化。この段階でも、まあ、そこそこのものは出てきます。技術革新。

 とはいえ、そこそこのものなのでひとつずつ改めていく必要があります。普通の文章でしたらかなりの変換といえますが、そこは聖書、節番号という厄介なものがあり、ほぼ全滅で、一つずつ入れました。

 ありがちな問題としては、拗音、促音、濁音、半濁音が安定しない。イエスヨハネ、パリサイ、ガリラヤ、他多数。節番号もつらいですが、これらの確認もなかなかつらい。日本語の文字体系のつらいところです。

 

 ちゃんと変換されない箇所のほとんどがその2系統です。ですから、普通の文章であれば(ちょっとは使いにくいにしても)充分な機能です。

 

 残りで印象に残っているのは、

・汝が女になる

・種を蒔けないで詩になる

・冒涜(旧字)や躓くあたりの密度になると変換できない

 あたりでしょうか。三つ目はしょうがないにしても、上二つがサンプル数の問題なのか、処理時間制限の問題なのかは気になるところです。