★「地名実数」ファイルのミス2019年08月18日 12:27:53

▲「地名実数」ファイル(エクセル:「★地名実数(提供用)190303」)は「全地名検査」ファイル(エクセル:「★改訂全地名検査190302」)を元に作成した。文字通り「実数」であるから同一地名は原則1回しかない。「原則」というのは、例えば「本道」だけで79、「○○本道」まで入れると246、次に多いのは「城山」19、中村11、新町10となる。
▲ミスはその資料にあるじれ事例とする一文。すべての文に8ケタの番号を振って並べるという方法は完璧であったはずである。たしかに西南之役懲役人筆記と日誌日記の2つのファイルは個人単位の一文なのでそれでよかった。問題は官軍資料「征西戦記稿」である。こちらは日付単位・旅団単位・戦闘単位等々なので元々①から⑤ぐらいまでのまとめた一文が並ぶ。そしてその最後の一文の最後に8ケタの番号が付く。つまり基本的に①から⑤までの全文が1つの塊りなのである。
▲それをワードからコピーして先ず「★改訂全地名検査190302」を作る。1つの塊りの①から⑤の文章はエクセル上では「▲①」から「▲⑤」まで5つに分断される。そして5つの文すべてに同じ8ケタの番号が付く。
▲表題のミスはここで生じる。VLOOKUP関数を用いるとこの関数は必ず「▲①」を選ぶ。私がここで欲しい「▲⑤」の文章は反映されない。これが大規模なミスになった理由である。このミス部分に「★改訂全地名検査190302」から「▲⑤」の文章をコピーして貼り付ける作業が要求されることになる。
これは画像のように2ファイルを並べ、確認しながら訂正して行く。訂正が合致すれば「✖」が「●」に替る。
▲画像は前半部部分でVLOOKUP関数のせい(?)とする。しかし後半に「✖」が特に多いのはH列「現在の原文」とS列「旧原文」との表記のずれが最大原因である。
以下事例:7月24日都城陥落の日の「征西戦記稿」記録より。
●H列「現在の原文」
▲③北るを追ふて11時都ノ城に達し、諸軍と相会し、更に向ふ所を定め、本団は高城口を担任し、隊伍を整へて庄内に帰り※高城口(タカジョウ、旧高城町高城、国道10・県道46)
●S列「旧原文」
▲③逃るを追って11時都ノ城(都城)に達し、諸軍と相会し、さらに向う所を定め、本団は高城口を担任し、隊伍を整えて庄内に帰る※高城口(タカジョウ、旧高城町高城、国道10・県道46)
◎見事に(?)翻訳されている。このことは私の悔いである。なぜそうしたのか自分に問いたい。多分半年かけた壮大な無駄作業だった。

コメント

トラックバック