出典データと学習データに関して

[運営担当者様へ]

学習データは2017年は2月1日からデータが存在していますが、2018~2020年は2月2日からデータが始まっています。

環境省の出典データと当コンペの学習データ比較したところ、2018年以降の花粉量のデータと降水量、気温、風向、風速のデータで日付のズレが発生しているのではないかと思われます。
http://kafun.taiki.go.jp/Library.html

学習データにおいて、2018~2020年の花粉量のデータは2月1日1時以降の値が使用されているようなのですが、降水量、気温、風向、風速のデータは2月2日1時以降のデータを使っているように見えます。

これはコンペ上意図的にずらしているのか、それともデータ集計時のミスによるものなのかご教示いただけますと幸いです。
(もし意図的にずらしているのであれば、2017年のデータもずらしておくべきなのかなと思い質問した次第です)

初めてのテーブルコンペであり、質問が自体がナンセンスの場合や私の確認の仕方が間違っている場合などあればご指摘いただけますと助かります。

お手数をおかけしますが、よろしくお願いします。

Aws4 request&x amz signedheaders=host&x amz signature=30bf27f10b41a803929b0dc050970f158ddb363565d093f2990c91edb6131fc1
saru_da_mon

私も2018年のデータで確認したところ、一日、気象データと花粉量がズレてますね。これはデータ差し替えてコンペをゼロスタートしたほうが良いのでは・・・?

Icon0
umetaro

ご確認くださいましてありがとうございます!
私も誤った学習データであれば差し替えていただくのが望ましいと考えます

Aws4 request&x amz signedheaders=host&x amz signature=27a83ae710843801ff8fa8a76f787420ead096aba3b1dd7a841b57a527846bdd
ProbSpace_official

お世話になっております。ProbSpace運営事務局です。
2018年以降のデータに期ずれがあるとのご指摘、ありがとうございます。

早急に対応方針について検討し、近日中に対応についてご連絡させていただきますので、
もうしばしお待ちいただけますと幸いです。

ご迷惑おかけしておりますところ、誠に申し訳ございません。
何卒よろしくお願いいたします。

Icon0
umetaro

ご確認の連絡ありがとうございます。
対応方針についてご検討いただけるとのこと承知しました。

お忙しいことと存じますが、よろしくお願いいたします。

Aws4 request&x amz signedheaders=host&x amz signature=30bf27f10b41a803929b0dc050970f158ddb363565d093f2990c91edb6131fc1
saru_da_mon

testデータの宇都宮の降水量も違ってるように見えます。気温、風向、風速は問題なし。

Aws4 request&x amz signedheaders=host&x amz signature=27a83ae710843801ff8fa8a76f787420ead096aba3b1dd7a841b57a527846bdd
ProbSpace_official

umetaro様、saru_da_mon様

お世話になっております。
本件につきまして、データの再配布とLBリセットが妥当と判断し、
先ほどトピック 及び 参加者様へのメール配信にて、今後の対応について案内させていただきました。

(該当トピック)
https://comp.probspace.com/competitions/pollen_counts/discussions/ProbSpace_official-Postb5705e469e3423367761

この度は、大変ご迷惑をおかけいたしました。
また、データ不整合について一早くご連絡いただきましたこと、誠にありがとうございました。

引き続き、どうぞよろしくお願いいたします。

Icon0
umetaro

迅速かつ丁寧なご対応、感謝申し上げます。
引き続きよろしくお願いします。

Favicon
new user
コメントするには 新規登録 もしくは ログイン が必要です。