元データはInside Airbnb

Inside Airbnb
http://insideairbnb.com/get-the-data.html
下のほうに「Tokyo, Kantō, Japan」があり、この中の「listings.csv (summaryのやつ)」が本コンペの元データのようです。
※直近1年分しかアーカイブされていないため、本コンペが使っている期間のデータはダウンロードできません。

Data Dictionary for listings.csv detailed file
https://docs.google.com/spreadsheets/d/1iWCNJcSutYqpULSQHlNyGInUvHg2BoUGoNRIGa6Szc4/edit#gid=1938308660
元データのデータ辞書です。

Aws4 request&x amz signedheaders=host&x amz signature=27d6e3f244cd89a878b0e5b25b115de65a9f3b56b9b8b2a70b53097e5d81cc8b
maruyama

yshr10icさんのEDA (※) で最短宿泊日数 (minimum_nights) が年間の宿泊可能日数 (availability_365) より多いレコードがたくさん見つかりましたが、データ辞書を読むと

availability_365
avaliability_x. The availability of the listing x days in the future as determined by the calendar. Note a listing may not be available because it has been booked by a guest or blocked by the host.

とあるので、予約がいっぱいだったり、宿泊施設のホストが予約枠を解放していなかったりすることが原因のようです。

https://comp.probspace.com/competitions/bnb_price/discussions/yshr10ic-Postd87313ec50ba696b5ae4

Favicon
new user
コメントするには 新規登録 もしくは ログイン が必要です。