一泊の適正価格はいくら?
Quvotha-nndropout100
今回私は3種類の CV を試しましたが、CV vs Public LB, CV vs Private LB の相関係数は以下の通りでした。
host_id
neighbourhood
y_bin
y_bin は y を対数変換したものを5つに binning したものです。
y
同じような民泊の立地でも host_id によって y に差があるなとは思っていたので host_id によらず y を正確に予測できるような特徴量エンジニアリングが重要だったのかなとの所感です。今回のデータセットは train/test とで host_id が完全に分けられており、正直私は最後までどう対処するべきかよく分かりませんでした。
皆さんはいかがでしたか。