3rd Place Solution
はじめに
jamijamiと申します。
今回のコンペは、真面目に取り組んだ初めてのコンペであり、様々な手法を勉強するいいきっかけとなりました。
運営の皆様、トピック作成者様、参加者の皆様ありがとうございました。
こういった投稿は初めてで、拙い文章で申し訳ございませが、取り組みをまとめさせていただきます。
使用した外部データ
武器データの追加を行いました
https://prob.space/competitions/game_winner/discussions/e-toppo-Post0082a60376ef134af3a4
特徴量
・lobby-mode,game-versionは削除
・武器データについては、onehot-encodingを実施
・その他カテゴリ変数については、label-encoding、count-encodingを実施
・rank、levelについては、A、Bチームに分けて平均値、平均値との差/比を算出
・データをA1-weapon,period,A1-level,A1-rank,idで並べ替えて、period、A1-levelを元にA1-uidを付与し、count-encodingを実施
・A1-uid毎にtargetの累積平均値を算出
・A1-uid毎に各変数の平均値を算出
モデル
LightGBM単独
Stratified GroupKFoldを用いて、5分割のCVを実施
groupは上記で算出したA1-uidを使用
雑感
ひたすら特徴量の検討に時間を割きました。
途中詰まったりもしたのですが、そのたびにデータを眺めて、結果としてA1-uidを付与しスコア向上が実現出来たので、改めてデータを見ることの大切さを痛感しました。