★OCR作業修正続く2022年06月18日 22:01:18

▲OCRの文章はミスが出るが、その時々で違う。例えばある時は「山」は「由」の文字のミス、時には「出」とあるが、それも「由」のミス。つまり一律変換はできないのである。やっかいなのはミスである文字の本当の文字を見つけ出すのが面倒であることだ。IMEにある「IMEパッド」でマウスで文字を描き、試みるがこれがまた正解とはならない。過日は「斧鋮」とあった。「鋮」は原本資料を見ると間違である。その文字探しが始まった。何回かマウスで文字を作る作業をして失敗する。ネット情報、漢和辞典2つを駆使する。そしてその文字は「鉞(まさかり)」とわかった。そして原資料にあった「斧鉞(ふえつ)」とは「斧鉞を加える」と使われ、文章を添削する意味になるそうだ。ただ私はそもそも「斧」と「鉞」の区別は分からない。たしかあの歌では「まさかりかついだ金太郎」と歌ったような。
▲夜はmouse機で「IME」で打ち込み、昼はDELL機で「ATOK」で作業する。機能の違いを感じるがそれも勉強と思っている。今の所はまだ「IME」が使い易いのは当然である。ただATOKには昔の一太郎時代を懐かしみ、魅かれつつある。ところでDELL機のATOK上では今までの「ユーザー辞書」の単語数に加えて「自動登録」語句が入り込んでいた。それでいいのかどうかまだ分らない。ちなみに「IME」上での登録は現在5077語である。今日2つ削った結果である。削ったのは「鞁(ひ)」と「殖(うえ)」。私が「被」と出したいのに一番目に「鞁」が、同じく「上」と出したいのに「殖」が出るので。元々何故この2語が登録してあったか思い出せない。
▲画像は久し振りに撮影したJR九州の「36ぷらす3」。撮影場所に着き、カメラを取り出し、起動した時はもうそこに来ていた。慌てて撮影したが、画像を見るまでちゃんと写っているか自信はなかった。そこで加治木駅で離合するので駅へ急行したが、少しの差で再撮影はできなかった。なお画像はPrintScreenとペイントで修正作成した。

コメント

トラックバック