wakame
ベースラインが出来たので公開しました。 https://colab.research.google.com/drive/1eYI-yBha7QrvZ6XkfAZDeR7yvrp6pr3N
ベースラインを作成する上で気をつけた点として2点あります。
目的変数の分布
こちらのEDAで図示されています通り、salaryは分布が歪んでいるため正規分布に近づけるようにlog1pで対数変換をかけています。注意点として学習時は変換をかけたままの値でも問題ないですが、結果提出時はexpm1で変換をかけて元の値に戻さないとのスコア計算がおかしくなります。
ProbSpace - [Salary Prediction] Simple EDA Notebook
目的関数の最適化
lightgbmの学習時のパラメータを見てほしいのですがmaeを使っていません、代わりにfair lossを使っています。なぜ使うのかについては下記スライドのP17を見てください。
Signate - 飯田産業 土地の販売価格の推定 - 入賞モデル 1位スライド