やったこと
アプリの処理速度で、どこがボトルネックになっているのかを細かく調べました。
調べた結果、処理速度が遅い原因は画像のアップロード部分ではなく、アップロード後の推定部分でした。
画像のアップロード自体には0.2秒か0.3秒ほどしかかかっておらず、学習モデルのロードと推論でそれぞれ4秒ほどかかっていました。
AWSの仮想サーバーに搭載されているGPUの性能を上げることで処理速度は改善するかと思いますが、料金がかかるので一旦保留にして次に進みたいと思います。
今後の課題
推論モデルの層構成を工夫して、ファインチューニングを行っていこうと思います。