★直前のブログの修正として2024年05月18日 23:29:12

▲前ブログでの部分を再録し、※印以下で訂正・追加をしたい。
●キャノンで作成したPDF資料を見ながら量的には15行分位を選んでコピー(画像)。
※量的には50行余(1ページの左半分)を試みたが、勝敗半々。25行前後、つまり1ページを4分割する法が良い。
※PDFの語句を画像にする方法がDELL機とsurface機で少し異なる。
●これを「ペイント」に入れて縦横を調整して「JPEG」画像として保存する。
ファイル名は「○○市1」とした。この画像は当初は「ギャラリー」に保存された。
※画像は今はデスクトップに保存表示するようにした。画像数が増えた時は専用のフォルダーに入れて整理する。
※DELL機と違って、surface機の「ペイント」は自動的に画面に見えない、長い画像も可能だ。DELL機ではいろいろ画像に合わせて操作してから保存するのでいささか手間がかかる。
●画像を「OneNote」の「挿入」→「画像」→「ファイルから」を選び、「ギャラリー」にある画像名「○○市1」を指定する。
※今はデスクトップにある画像を指定する。
●そして読み込まれた画像を右クリックして、「画像からテキストをコピー」をクリックする。
※ここでの作業は変化なし。
●最後はワードに「○○市1」と表題して下の行に、Ctrl+Vでコピーする。
※DELL機・surface機共に数回続けると、全く得体の知れない文章が出てくる。これは読み込んだ行の最初の一文字を連続読み込んでいるようである。すぐ消してやり直すが、あきらめて機種交代もする。
※ワードに入れた語句は横に一列に繋がっており、これを1地名ずつ並べ替える作業がある。エクセルに縦一列に入れるためだ。
※そこで見つかる、あるミスの「誤と正」。
烏と鳥、大と犬、追と迫、協と脇、域と城、容と谷、梅と権。
これはOCRでは些細な事故だとあきらめて対応する心構えが必要だ。
▲今日現在の実績は鹿児島県の市町村39、総小字数34959である。作業上での悩みがある。それは前行末の語句と次行初めの語句が繋がるのか、別なのか、それが分らない時がある。角川では地名と地名の間に1字の空所があるが行末にそれがない場合は、次行の地名と1つにするか、分けて2地名とするか、判断を迫られる。だから時には地名「●●○○(●●と○○か)」とした。どうにもできないのが書にある漢字が出ていない時だ。ネットに「〇へんに□」と入れて情報を探す。見つからない時は「■(〇+□)と表現した。
▲画像はニコン(電源入らず)に代って新購入のキャノンでの初撮影画像の1枚。操作が全く異なるので戸惑っている。