今週やったこと
前回のエラーがどうしても直らず、アノテーションデータを再作成しても画像を変えても解決できなかったので、YOLOv5側でdogの画像を学習させて、とりあえず精度と速度を比較することにしました。
<YOLOv5>
- 画像数: train: 95枚, val: 28枚, test: 13枚
- 学習クラス: ‘dog’
- 学習回数: 200回
- モデル: yolov5s.pt(最軽量モデル)
- 学習環境: Google Colaboratory(GPU)
- 学習時間: 約17分39秒
- 推論時間(テスト用画像5枚): 約12秒
<SSD>
- 画像数: 136枚
- 学習クラス: ‘dog’
- 学習回数: 200回
- モデル: vgg16_reducedfc.pth
- 学習環境: Google Colaboratory(GPU)
- 学習時間: 約32分39秒
- 推論時間(テスト用画像5枚): 約14秒










精度自体はSSDの方が良い数値を出しており、単体の検出精度は良いですが、複数検出はできていませんでした。
YOLOv5(yolov5s)はあまり良い数値は出ていませんが、複数検出がしっかりできていて、推論速度もSSDより高速でした。
また、YOLOv5の精度に関して、学習過程をグラフで確認すると60回前後で収束していると思われるので、過学習により精度が悪くなっているのではないかと考えています。

今回の結果から、これからYOLOv5(最軽量のyolov5sモデル)を使って物体検出をやっていくことに決定しました。
来週やること
- YOLO関連の論文を読む
- 精度向上方法を探す