XS330
trainデータにおいて目的変数「loan_amount」には、①25~10000の値でスケーリングされている②25の倍数であるという2つの特徴があることを発見しました。こちらの2点に関しては、testデータにおいても同様であると考えてよろしいのでしょうか?
XS330様
お世話になっております。コンペティション運営です。
以下が質問に対しての回答になりますので、ご確認ください。
①25~10000の値でスケーリングされているスケーリングしているわけではなく、分析コンペとして楽しんでいただくため、一部のハズレ値のデータはtrainとtestで同様に削除しております。
②25の倍数であるKivaは最小の貸付が25ドルからとなっていることを参考にしていただき、 考察していただければ幸いです。
ご確認のほど、よろしくお願いいたします。