5th place solution summary

model

  • LightGBM*5 -> SVR stacking
  • 全てStratifiedKFold
  • CVとの乖離はめんどくさいので完全無視

feature

  • 1st LightGBM
    • googletransでnameを翻訳語tf-idf
    • raw nameをtf-idf
    • 日付は分割
    • 言語判定
    • neighbourhoodで数値を集約
    • カテゴリはラベルとカウントエンコーディング
  • 2nd LightGBM
    • 1st LightGBM + nameのbertエンベディング
  • 3rd LightGBM
    • 1st LightGBM + 駅との距離
  • 4th LightGBM
    • 1st LightGBM + 経度緯度のkmeans
  • 5th LightGBM
    • 1st LightGBM + nameのxlm-roberta-largeエンベディング

Favicon
new user
コメントするには 新規登録 もしくは ログイン が必要です。