前回までにやったこと:今シーズンの桃の撮影、進捗発表会の準備
夏季休暇以降にやったこと:
新モデルを作成するために既存データの整理を行いました。上野先輩から引き継いだデータを整理したところ、桃画像に対応した糖度データは背景を黒色に加工した状態のものでした。iPhone側に元画像はあるのですがところどころ使われていないデータも含まれており、どの桃がどの糖度なのか対応させるのに時間がかかりそうなので、とりあえずこの背景黒の桃画像を使用することにしました。
次にViTのモデルですが、やはり多くは分類モデルとしての扱いが多かったため、ひとまず糖度を段階ごとに分けて分類モデルとしてプログラムを動作させていくことにしました。
推論プログラムとして、ViTをPytorchで実装したvit-pytorchを参考にしていくことにしました。
https://github.com/lucidrains/vit-pytorch
まず動作環境を試したかったので、2023年度の桃データと2021年の桃データを使って水増しなどはせずにプログラムを動かしてみたところ下のような結果になりました。分類クラスは3つで行なっています。
今回は実験ということで学習条件や損失関数、活性化関数の部分は参考元をそのまま使っています。
精度が悪い理由として糖度データと照らし合わせながら手動で分類していったため途中で画像と糖度がずれてしまっていたことに気づかず実行してしまったことがあります。
ひとまず動作が確認できたので、このプログラムをもとに推論を進めていきます。
今後の予定:
このまま分類のままだと損失関数等が変わってくるのでの性能評価の部分で既存モデルと比較をどうするか考える必要がある。また、プログラムを回帰問題に対応させられないかも合わせて調べています。
体調不良などで進行が遅れてきているので、中間発表までに既存データでの推論を一つ形にできるようにしようと考えています。
今年撮影した資料は今までと形式が違うのでどのように推定データに使うかも検討中です。
コメントを残す