一泊の適正価格はいくら?
shun2741
運営者様、参加者の皆様、お疲れ様でした。4位の解法(Public7位:0.77231,Private4位:0.71864)を共有します。ベースラインを作成するにあたって、@yuuuukiさんの公開コードを大きく参考にさせていただいていました。
name列からの特徴抽出が精度にかなり効いている印象で、NLPの処理の勉強になりました。コードを公開した参加者の皆様やコンペを開催してくださった運営者様ありがとうございました。
LightGBMのシングルモデル(Foldごとの予測結果の単純平均)
KFold(n_splits=5)host_idでGroupKFoldしたら、LBが下がったためCVとLBは大きくずれますがKFoldで検証していました。
特徴量としては下記の要素で作ったものをLightGBMのgainのimportance上位300のみを残して採用しました。
agg_feats = ['minimum_nights', 'number_of_reviews', 'reviews_per_month', 'availability_365'] key_feats = ['room_type', 'neighbourhood'] としてそれぞれの平均・分散