中間発表時点での問題解決
- テストデータの収集
メンバー1人あたり2品、合計6種類の対象商品を購入 - CNNで学習したモデルのWebアプリの実装
精度はあまり良くない
の2点を行いました。
VGG16のファインチューニングの学習回数の調整
VGG16のファインチューニングの学習回数を5回、10回に設定して比較しました。
学習回数が5回の方は精度が95.6%を得られましたが、一方で10回の方はおおよそ4回で収束するという結果になりました。
(下の画像は10回の学習結果)
以上のことから、テストデータの判別には学習回数5回で作成したモデルを採用しました。
テストデータで判別したときの精度
- そば
- チャーハン弁当
- チャーハンおにぎり
- 揚げ物
- おにぎり
の以上5点のテストデータを用意して判別を試したところ、
「チャーハン弁当をチャーハンおにぎりと判別してしまう」、「背景が単純でないと、思うように判別できない」ということがわかりました。
UIのコーディングとルーティングの設定
以下4画面のUIのデザインを設計し、コーディングを行いました。
また、作成したUIをFlaskで表示するためルーティングを行い、localhostで画面遷移できるようにしました。まだ選択した画像のやりとりなどは実装できていません。
サーバーについてですが、中間発表ではレンタルサーバーを検討していましたが、現在ではとりあえずlocal環境での開発という方針に変更しました。
今後の課題
モデルの精度の向上
類似商品や複雑な背景のときに正しい結果が得られない問題の解決を行う。
CNNでのモデルに関しては、ResNetを実装する。
UIと判別プログラムの結合
UI担当の堀田とサーバーサイド担当の山本で双方のコードの内容を確認して、プログラムを結合し、Webアプリの動作を完成させる。