[振り返り]効いた・効かなかった解法について
皆様、お疲れさまでした。
恐らく上位の方が、解法やコードを共有してくれると思うのですが、効いた・効かなかった解法について、
軽く雑談させてください。効いた・効かなかった解法以外でも感想等でも、気軽に雑談できるスペースになればと思います。
私の場合ですが、
■効いたもの
・mini_forestさんや、magichanさんの公開コードを参考に特徴量を作成し、学習・予測としました
・下記のやったけどスコアに効かなかったものが、ほぼスコアアップに効かず、という具合でした
・予測結果を四捨五入により投稿データに変更する(これが最後に、少し効きました)
■やったけどスコアに効かなかったもの(実装が悪かった?)
・NY州の祝日でフラグを立てる(予測期間に祝日がなかったのであまり効かなかった?)
・taxi_zones.csvを用いて、地区の緯度・経度を追加
・nyc_weather_2017_2019を用いて、気象データを追加(全部追加や、気温や降水量だけ追加等複数パターン)
・上記の気象データのうち、降雪にかかわる?s等の文字がついているものを抜き出し、フラグを立てる
・予測の期間が12/1から12/7であったので、trainデータを主に冬のものだけに搾る
⇒(上記で、40個位特徴量が追加されたのですが、どんどんスコアが悪くなっていって、
結局、最後はこれらを作っていない初期の方がスコアが良いという結果となりました)
■やりたかったけど出来なかったこととして、
・ラグ特徴量や、移動平均の追加
・各特徴量の組み合わせや、効果の精査
それでは皆様、効いた解法、効かなかった解法、コメント・アドバイス、是非教えて頂ければと思います。