train.csvになくtrain_v2.csvに現れる異常値について質問
運営様
train_v2.csvの目的変数にtrain.csvには存在しない異常値があります。
例えば、train_v2.csvにおいては、2017020908、2017020909、2017020910のpollen_utsunomiyaの値がそれぞれ-9996, -9996, -9998となっています。こちらはtrain.csvでは0でした。
こちらの数値はtrain.csvにあった0と考えればよいでしょうか?それとも異常値として処理を考えるべきものでしょうか?
再配布の流れからいうと前者かと思いますが、もし全部0に直せばよいのだとしても、train_v2.csvに変更後にコンペに参加された方にはdisadvantageとなりますのでご対応いただければ幸いです(-9996等も混ざっていることで、単純に0にして良いかどうか迷う値かなと思います)。
もし何か勘違いだったらすみません。