10th Place Solution

汚いコードで恐縮ですが、10位の解法を共有しておきます。
https://github.com/tak34/probspace_pollen

解法の概要としては、以下の通りです。

  • トピックで紹介されていた以下の文献を参照し、2020年の花粉の総飛散量を温度データをもとに予測。それをもとに、2017年~2019年の花粉飛散量(目的変数)が2020年の水準と同等になるように修正した。
    https://agriknowledge.affrc.go.jp/RN/2010762207.pdf
  • 特徴抽出は、トピックで上がっていたものや、可視化から思いついたものを順次試した。最終的に特徴量間の相関が高いもの(相関係数0.95以上)は省き、予測に使用。
  • モデルはLightGBM、パラメータはoptunaで調整。
  • 予測のアンサンブルなどの後処理は行っていない。

特徴抽出に結構時間を割いたのですが、あまりスコアは伸びなかったです。上位者の解法を見る限りでは、後処理の検討にもっと力を入れた方がよかったみたいですね。

Favicon
new user
コメントするには 新規登録 もしくは ログイン が必要です。