GoogleVisionAPIのデモ機能を使って精度検証をしました。
テキストの認識は精度が良く、横文字もしっかりと認識されていた。ただ、小さすぎる文字や色合い的に判別しづらい文字などは安定していませんでした。
今回は漫画が多かったため色の問題があったが、小説なら漫画よりもそういった事例は少なくなると思います。
認識については大きな課題は今の所なさそうですが、そもそものGVAPIの使用に関して課題点がでてきました。
まず、GVAPIが画像を対象にしているためARでリアルタイムに動かせるのか。動かせたとして認識速度的に実用的ではなさそうな点。
次に、料金が画像一枚に対して発生するのでARでリアルタイムに動かした時にとんでもない枚数、料金になる可能性がある点。
なので、アプリの仕様をちょっと考え直す必要があるのかなと思いました。
以下、検証した画像です。