maruyama
Inside Airbnb
http://insideairbnb.com/get-the-data.html
下のほうに「Tokyo, Kantō, Japan」があり、この中の「listings.csv (summaryのやつ)」が本コンペの元データのようです。
※直近1年分しかアーカイブされていないため、本コンペが使っている期間のデータはダウンロードできません。
Data Dictionary for listings.csv detailed file
https://docs.google.com/spreadsheets/d/1iWCNJcSutYqpULSQHlNyGInUvHg2BoUGoNRIGa6Szc4/edit#gid=1938308660
元データのデータ辞書です。
maruyama
yshr10icさんのEDA (※) で最短宿泊日数 (
minimum_nights
) が年間の宿泊可能日数 (availability_365
) より多いレコードがたくさん見つかりましたが、データ辞書を読むととあるので、予約がいっぱいだったり、宿泊施設のホストが予約枠を解放していなかったりすることが原因のようです。
※https://comp.probspace.com/competitions/bnb_price/discussions/yshr10ic-Postd87313ec50ba696b5ae4