K19236 山本卓巳 – ページ 2 – Just another AIT MM-LAB Webs site

未分類

6/22(水) 進捗報告

今週やったこと

YOLOのモデル精度の向上方法を調査するつもりでしたが、予定を変更してSSDモデルの使用方法やYOLOと比較した精度などを調べ、以下のサイトを参考に試験的に物体検出を行っていました。

参考サイト：pytorchで物体検出モデルSSDを簡単に使用する

次回までに以前使用した硬貨のデータセットで学習させ、速度や精度を見つつ、YOLOv5とSSDのどちらを使うかを決定しようと考えています。

来週までにやること

SSDモデルで硬貨の学習
使用するモデルの決定

未分類

6/15(水) 進捗報告

今週やったこと

「Deformable Part Modelを用いた変形物体領域検出に関する研究 | 富田」(平成29年)を読みました。

論文内で記述があったように、学習データにポジティブデータだけでなくネガティブデータ（対象の物体が写っていない画像）を含めることでモデルの精度が少し上がるようなので、この部分を参考に撮影する画像や学習に使用する画像を考えます。

来週やること

labelImgを使って硬貨のアノテーションデータの作成
モデル精度向上方法の調査

未分類

6/8(水) 進捗報告

今週やったこと

「形状変形を許容するカメラ画像からの国旗検索に関する研究 | 西部, 福谷」(平成30年)
論文にあった国旗の認識の手法は、

セマンティックセグメンテーションで領域検出
検出領域を色特徴と局所特徴でDB照合を行い、検索結果を出力

同論文より、学習に使用するデータセットについては、対象の写っているサイズが統一されないように画像を用意した方が良さそうであるとわかりました。

色特徴や局所特徴についてはまだわからない部分が多いので、まずはこの2つについて調べ、物体検出に組み込めるのかどうか検討しようと考えています。

来週やること

「Deformable Part Modelを用いた変形物体領域検出に関する研究 | 富田」(平成29年)の論文を読む
学習用の画像の撮影

未分類

6/1(水) 進捗報告

今週やったこと

Google Colab上でYOLOv5の転移学習をしました。

モデル：YOLOv5s(一番小さい)
学習用画像：210枚
バッチサイズ：16
エポック(学習回数)：100

最終的なmAPは0.77でしたが、実際に検出を試してみると、全体が写っている硬貨でも検出漏れがかなり目立っていました。
光の当たり方によって硬貨の色合いが変わっている場合は精度が良くなく、特に100円玉は再現率が0.65と他に比べてかなり低い数値でした。

今回は検出するクラス数に対して学習画像が少なかったことや、ウェブスクレイピングで収集した画像ということもあって学習に適した画像が少なかったこともあったので、これを踏まえて自分で適した画像を撮影するように改善します。

来週やること

「形状変形を許容するカメラ画像からの国旗検索に関する研究 | 西部, 福谷」(平成30年)の論文を読む
学習用画像の収集

未分類

5/25(水) 進捗報告

今週やったこと

テーマ発表でいただいた意見や先生に相談したことを基に、大まかなに研究を進める方向を決定しました。

Webアプリを想定
認識対象物にレベルを設定する(紙幣の重なりや形状変化)
エンジン部分(認識技術など)を重点的に進める

下記の森本研の先輩の研究を参考に形状変化に強い認識を目指します。

「形状変形を許容するカメラ画像からの国旗検索に関する研究 | 西部, 福谷」(平成30年)
「Deformable Part Modelを用いた変形物体領域検出に関する研究 | 富田」(平成29年)

また、labelImgで硬貨の画像のデータセットを作成してGoogle Colabで試験的に学習を行いましたが、途中でAssertionErrorが出てその解決に時間がかかってしまったので、まだモデル作成までには至っていません。

現在はエラーを解決できたので、このまま試験的に現金を学習させていきます。

来週までにやること

硬貨を検出できるようにする

未分類

5/11(水) 進捗報告

今週やったこと

今週は研究計画書の作成と、YOLOv5で学習データを作成するためのツール「labelImg」のインストール・動作確認を行ないました。
参考：【labelImg：物体検出】公式READMEが当てにならない件 – Qiita

起動時のモジュールエラーなどの解決にかなり時間がかかってしまったため、まだ学習データの作成やモデルの作成自体はできてません。
次週以降、YOLOv5で独自データの学習をしていこうと考えています。

来週までにやること

labelImgで学習データを作成し、学習モデルを作成する
テーマ発表の資料作成

未分類

結果としては、YOLOかSSDを使う方が良いとわかりました。(YOLOもSSDもシンプルなネットワークで構成されているので速度も出て、精度も高い)
ただ、YOLOの場合は多オブジェクトがあると精度が低くなってしまうため、試験的にお金の検出をやってみて精度を比較し、どちらのモデルを使って物体検出をするかを決定していく形になると思っています。

もう一つ、試験的にYOLOv5を使用した物体検出をしてみました。（検出に使用した動画は拾い物です）