ライフスタイル

知らなくて損してた!OCRがGoogleドライブで手軽にできる方法!

知らなくて損してた!OCRがGoogleドライブで手軽にできる方法!

令和の時代になっても、手渡しで配られる小学校のプリント、届くFAXはWordで書いたものをわざわざ印刷したもの、メールに添付された資料は印刷したエクセルをPDF化したもの…もううんざりですよね。

テキストのデータでぽんともらえれば早く済む仕事も、画像データで来てしまうともう一度パソコンに打ち直す必要があります。普段パソコンで仕事をしている人なら、このような事態に何度か直面したことがあるでしょう。

もちろん、「テキストデータで送って!」と言えれば、何の問題もありません。しかし相手が上司やお客さんだとなかなか言えませんし、勇気を出して伝えても、「テキストデータ?きょーゆーふぉるだ?よくわかんないけど、データは送ったよ☆」となることが多く、この悩みは尽きそうにありません。

そんなときは、画像データをテキストデータに変換できる「OCR」がおすすめです!OCRソフトには色々あり、一昔前は有償のものが主流でしたが、実は普段使っているGoogleドライブで、お手軽にOCRができてしまうんです!

そこでこの記事では、OCRをGoogleドライブに任せる方法と、実際にGoogleドライブでのOCRはどのくらいの正解率なのかをご紹介します。

GoogleドライブでOCRをおこなう方法

GoogleドライブでOCRをするイメージ

まずはOCRをGoogleドライブでやる方法をご紹介しましょう。

  1. 画像データをGoogleドライブに入れる
  2. OCRしたい画像データを右クリックアプリで開くGoogleドキュメントを選択
  3. テキスト化完了!

Googleドライブを使ったOCRの説明のイメージ

たったの3ステップです。

こちらは、Google Chromeなどのブラウザ上から行う必要があります(デスクトップ版の「Googleバックアップと同期」(旧Googleドライブ)ではできません)

パソコンで仕事をしている人でしたら、Googleのアカウントを持っている人が多いはずです。新たにOCR専用のソフトをインストールすることなく、テキスト化ができてしまいます。とても便利ですよね!

実際にOCRをGoogleドライブに任せてみた

変換のイメージ

では実際にどのくらい正確に読み取ってくれるかを検証していきましょう。

三輪奈美子
三輪奈美子

実は私、数年前にどうしてもOCRしたい問題集があって(300ページくらい)、色々試したことのあるOCR探究者です!(そのときは結局諦めました…泣)

Wordに打ち込んだ横書きの文章

まずはWordに打ち込んだ、普通の文章です。(文章は、青空文庫さんの「羅生門」をお借りしました)

羅生門のスクリーンショット

こちらをスクリーンショットで画像化し、GoogleドキュメントでOCRしてみます。

羅生門のOCR結果のイメージ

おお!できました!パッと見、ほとんど合っているような感じです。突然の英語にも、冷静に対応しているのが、とっても好感を持てますよね。

この読み込んだテキストがどのくらい合っているのか、テキストの差分を教えてくれるツールにかけてみました。

OCRの正解率検証のイメージ

かなり正解率は高いです!間違っているのは、普段はあまり使わない難しい漢字が中心ですね。

三輪奈美子
三輪奈美子

…でもサンプル文章のチョイスを間違えてしまった気がします…。

とはいえ、この程度の間違いなら、画像データを確認しながらちょいちょい直すだけです。これを全部打ち込むことを考えたら、かなりの時間短縮になりますよね。

縦書きの文章

羅生門を縦書きにしたイメージ

今度は縦書きに挑戦です。縦書きというのは日本独特の文化ですので対応が難しいのか、認識率が落ちるソフトや、無理やり横書きで読んでひどい結果になるOCRソフトがあります(遠い目)。さて、Googleさんのお手並み拝見です。

縦書きのOCR結果のイメージ

はい完了!ちなみに、このくらいのデータだと、10秒くらいでテキスト化してくれます。

横書きより、ほんの少しだけ認識率が落ちましたが、このくらいなら許容範囲です。

段組みレイアウトの文章

段踏みレイアウトのイメージ

段組みもまた、OCRソフトが苦手とするところです。段組みレイアウトであることを理解してくれず、スペースを入れて次の段を読み込んでしまうため、めっちゃくちゃな文章が出来上がることがあります。さてさて、Googleさんはどうでしょうか。

段組みレイアウトのOCR結果のイメージ

あっ…やだ、Googleさん。続けて読んじゃってる…。段組みは苦手のようですね。段同士のマージンが少し狭かったのかもしれません。

手書き文章

無謀にも、手書きにチャレンジです。

手書きテキストのOCR結果イメージ

突然入りこんだアルファベットが、まるでJ-POPの歌詞のようで何ともロックな風情です。

三輪奈美子
三輪奈美子

私の字にクセがありすぎるので、これはGoogleの敗北というよりは、私の字の敗北です…。

というか、こんなクセ字なのに、むしろよく読み取ってくれていると評価すべきでしょう。平仮名の認識率はなかなかのものですよね。

手書き風フォント

手書き風フォントのイメージ

私の字がひどすぎて検証にならなかったので、手書き風フォントを使ってみました。

手書き風フォントOCR結果のイメージ

すると、かなりの認識率!字が整った人なら、十分読み取ってくれそうです!

名刺

さてテキスト化したいものは、なにも長々した文章だけではありません。例えば、名刺。会社の名前に人の名前、それに地名。なんて読むのか分からず、さてどうやってパソコンに打ち込むか…とキーボードの前で固まってしまうこともしばしばですよね。

ということで、仮の名刺を作ってみました。これで検証してみます!(住所などはもちろん仮です)

名刺のOCR結果のイメージ

おっと!やるじゃないの、Googleドキュメント!!

段組みレイアウトの読み取りがいまいちだったので実はあまり期待していなかったんですが、かなりの認識率です。郵便番号のマーク以外は、全て正確に読み取っています!あら、すごいのね!

パンフレット

ちょうど手元にあったパンフレットを試してみました。

パンフレットのイメージ

何も考えず、スマホでパチリ。ハッキリ言って、ひどい写真です。さて、グーグルさんはどう料理してくれるんでしょうか。

パンフレット読み取り結果のイメージ

おお!意外とちゃんと読んでる!すごい!ピントもあっていないし、向きも間違っているようなひどい状態でも、頑張って読み取ってくれています!すごいね、Google!

Tシャツのプリント

Tシャツのプリントのイメージ

これは息子のTシャツのプリントです。なんでこんなものを撮ったのかというと、この英語の意味を知りたかったからです。さて、さっそくOCRをGoogleさんにしてもらいまひょか。

Tシャツの文字の読み取り結果イメージ

Great!ちゃんと読み取ってる!英語の部分はちょっとかわいいフォントですが、一言一句間違いがありません。上の方の、「00」やら「TOOMOOT」からは、この汽車のイラストをなんとかテキスト化しようとした、Googleさんの努力がうかがい知れます。ごめんね、Googleさん。そこは読み取らなくていいの。

テキスト化されていれば、このままコピペで翻訳サイトにかけられます(この後、翻訳サイトにかけて意味を知った母。息子から質問があっても堂々と答えられます)。

保育園からのお知らせ

保育園からのお知らせのイメージ

最後に、保育園からのお知らせもパチリとしてみました。こういったプリントはすぐにたまるので、後で見返すものは写真を撮っておくんですが、日々の写真に埋もれてしまって、見返したいときに探しまくるというのは、あるあるですよね。

もしテキスト化できれば、キーワードで検索できるため、とっても助かるんですが、Googleさんはやってくださるのでしょうか。お願いします!

保育園からのお知らせOCR結果のイメージ

これもやはり段組みレイアウトの上、突然の「ドナースだより」というパワーワードで出鼻をくじかれ少し心配していましたが、ちゃんと読み取ってくれています。この程度の認識率なら、感染症になった場合の登園の目安を確認するだけでしたら、十分です。

病名で検索をかければ、一発でこのプリントを探し出せますよね。これなら、「あれー?あのプリント、いつ頃配られたっけー?」と思いながら画像ストリームをスクロールしまくるストレスから解放されます。

資料がFAXで来てうんざりするイメージ

さて、OCRをGoogleドライブで簡単にする方法と、実際にいろいろなものをGoogleに読み取ってもらい、その認識率を検証しました。特にパソコンで作られた、いわゆるワープロ打ちの資料はかなりの認識率でした。

三輪奈美子
三輪奈美子

私はこの機能、最近知ったんですが、今では保育園からのお便りは全てOCR化するためにGoogleドライブにぶちこんでいます。便利~♪

テキスト化しなくてはならないデータが数百ページあるならともかく、200文字程度だったら、いちいちOCRソフトをインストールするのも面倒くさいですよね。しかし、普段使っているGoogleドライブでお手軽にできてしまうなら、試してみる価値ありです。

上司からFAXで届いた文章修正データ、お客さんと交換した名刺、保育園や小学校で配られるプリント、OCRしたいものは全部、Googleに任せてみましょう!

=== お知らせ ===

当サイト(AIZINE)を運営している大阪の人工知能の開発会社お多福ラボでは、AI(人工知能)の勉強会を開催していますので興味のある方はぜひお越しください。

お多福ラボセミナーのバナー

ライフスタイル

コメントをどうぞ

AIZINE(エーアイジン)

コメントをどうぞ

トップへ戻る
タイトルとURLをコピーしました