J-CAST ニュース ビジネス & メディアウォッチ
閉じる

画像の中の文字を一瞬で書き起こし グーグルの「魔法」か?しかも超簡単

   書類提出の締め切りが刻々と迫っている。机上には資料の山、これらすべてを文章ソフトで書き起こさないといけない。すべての文字を手作業で入力するなんて、やる気が出ない。あなたなら、どうする?

   実はグーグルに頼れば一気に片付くことを、ご存じだろうか。

画像はイメージ
画像はイメージ

「延々と書き起こす作業からオサラバ」

   グーグルが無料で提供するオンラインストレージサービス「グーグルドライブ」の「書き起こし」機能がにわかに注目を集めている。

   発端は、あるツイッターユーザーが2018年2月1日、とまどい気味に伝えた以下の内容だ。

「おれはGoogle Drivで画像を開いたと思ったらいつのまにか文字がすべて書き起こされていた な...何を言っているのかわからねーと思うがおれも何をされたのかわからなかった...」

   添付された画像を見ると、小説の1ページを撮影した画像がグーグルドライブの文章入力ソフト「グーグルドキュメント」に貼り付けられており、直下に小説の内容が文字起こしされていた。

   これは、グーグルの画像認識システムを利用したもので、使い方はいたって簡単。2MB以下の画像ファイル(PDF、JPEG、GIF、PNGのみ)をグーグルドライブにアップロードし、右クリックで最初に「アプリで開く」、次に「Googleドキュメント」を選択。すると、画像に含まれたテキストが自動的に変換される。

   前述のツイートには、「手入力」の苦労を知るユーザーから驚きの声が多数寄せられている。

「本立てに資料立てかけて延々と書き起こす作業からオサラバだ!!みらいのちからだー!!」
「渡された資料が紙のパンフレットと、アウトライン化されたaiデータ(編注:文字情報が線画に変換されたデザインソフト「イラストレーター」のデータ)。泣きながら、目視でテキストを数千文字書き起こして土日を過ごした、制作ディレクター時代の若き私に教えてあげたい」

手書きは難しい?

   実際にやってみよう。まずは、弊社の会社案内をスキャンし、PDF形式で挑戦。一番小さい文字は0.1センチメートルと小さく、URLも含まれている。大きな葉のイラストは変換の妨げにならないだろうか。

   結果は、一言一句違わず変換できた。精度はかなり高い。

   手書き風のフォントではどうか。ポップな吹き出しに「You made it!」「Fantastic!」など8つの英単語が書かれた画像で試してみると、3つが認識されなかった。活字に比べると精度は下がるようだ。

   双子ユニット「mimmam(みむまむ)」さんがJ-CAST編集部に贈呈してくれた色紙では、精度はグッと落ちた。

<原文>

「J-CAST様へ♡ mim mam ありがとうございました! 2017 8.22」

<変換後>

「J-CAST O.mam 89nti m imJuart! 2012 7 20128.22」