カテゴリー
未分類

進捗10/26

進捗一覧

・2020-2023年度のデータ準備完了
・バッチサイズを変更して実験(背景黒モデル)
・バッチサイズを変更して実験(CNN+HSVモデル)
・中間発表会プレゼン資料の修正案(途中)

2020-2023年度のデータ準備完了

2020〜2023年度の実験データを準備しました。
現在は4分割交差検証で学習を進めています。
いままでは24エポックで学習していましたが、データ数が増えたので48エポックで学習をおこなっていきます。

Google Colabの無料版だとメモリ不足で学習ができず、全ての実験を有料版で行うと追加料金がかなり発生するため、ローカルで学習する準備もしたいと思います。

バッチサイズを変更して実験(背景黒モデル)

評価結果の数値が以前よりも良くない原因を調べるために、一応バッチサイズを大きくして実験を行いました。バッチサイズが16の時点でほとんど収束していたので、結果としては大きくは変わりませんでした。

・16 -> 32
・モデル構成:ハイブリッドモデル
・実験データ:黒色背景・1024データ・糖度各側面・学習データのみ拡張・テストデータは元データの2割

MAERMSER
1.27581.54680.4378

バッチサイズを変更して実験(CNN+HSVモデル)

CNNモデル(EfficientNetB3)でHSVデータを追加した実験でも、バッチサイズを16から32と64に変更して学習を行いました。若干結果は良くなったものの、バッチサイズ16でも学習は収束していたため、誤差程度だと考えています。

MAERMSER
バッチサイズ:161.401.790.25
バッチサイズ:321.101.460.43
バッチサイズ:641.191.510.39

・中間発表会プレゼン資料の作成(途中)

プレゼン内容の案を作成したため、資料を作っていきます。
来週をめどに仮で一通り作成します。

今後の予定

・全データでの学習
・ローカル環境の準備
・プレゼン資料作成

カテゴリー
未分類

進捗10/19

進捗一覧

DCON再投稿
CNN+HSV:4分割クロスバリデーション(全拡張データ使用)
糖度データの分布確認
2020~2023年度の全データでの実験の準備(途中)

DCON再投稿

DCONの再投稿が完了しました。

CNN+HSV:4分割クロスバリデーション

今後に向けた調査として、黒色画像にHSVデータを追加してファインチューニングを行いました。
条件は以下の通りです。

CNN:EfficientNetB3
画像データ:黒色画像 + HSV画像
糖度データ:各側面(平均値ではない)
エポック数:24
ランダムシード:0
評価方法:4分割クロスバリデーション
データ:学習・バリデーション・評価全てに拡張データを使用

評価関数MAERMSER
平均値1.1196 ± 0.07821.4833 ±  0.04130.4028 ± 0.0946

↓学習過程グラフの例

糖度データの分布確認

最小値4.3 
最大値25.5 
平均値11.6 
中央値11.4 
最頻値10.4 

2020~2023年度の全データでの実験の準備
(途中)

終わり次第実験を開始します。

今後の課題

・全データでの実験開始
・修論のテーマ名を決定
・中間発表会の章構成

カテゴリー
未分類

進捗10/12

進捗一覧

・DCON論文の修正(途中)
・CNN+HSVデータの実験(途中)

DCON論文の修正(途中)

DCONに再投稿する論文の修正を行っています。
15日が締め切りなので、それまでに修正して投稿します。

CNN+HSVデータの実験(途中)

今後に向けた調査として、黒色画像にHSVデータを追加してファインチューニングを行っています。
条件は以下の通りです。

CNN:EfficientNetB3
画像データ:黒色画像 + HSV画像
糖度データ:各側面(平均値ではない)
エポック数:24
ランダムシード:0
評価方法:4分割クロスバリデーション

今後の課題

・2020年度〜2023年度のデータを追加してファインチューニング
・CNN+HSVデータの実験
・DCON論文の修正