気象シミュレーションデータから、各商品が何個売れるか当ててみよう!
matsunoshin
お世話になります。
本コンペティションにおいて利用可能な説明変数について、数点確認をさせていただきたく思います。
□本コンペティションではご提供いただいたデータのうち、「date」「highest」「lowest」「rain」と、これらをベースに特徴量エンジニアリングを行って得られる変数のみが、説明変数として利用可能であるという認識でよろしいでしょうか。例えば商品間の因果関係があれば目的変数以外の商品も説明変数になり得たり、外部APIを用いて天気の追加情報を得たりすることができると考えられます。
□ご提供いただいているtrain, testのデータは、西暦何年のものになりますでしょうか。もし可能であればお教え願います。
matsunoshin様
ご質問ありがとうございます。以下、質問に対してご回答いたします。
>本コンペティションではご提供いただいたデータのうち、「date」「highest」「lowest」「rain」と、これらをベースに特徴量エンジニアリングを行って得られる変数のみが、説明変数として利用可能であるという認識でよろしいでしょうか。商品の売上数情報 等、train、testデータに含まれる情報であれば、説明変数として使用いただいて問題ございません。
>商品間の因果関係があれば目的変数以外の商品も説明変数になり得たり、外部APIを用いて天気の追加情報を得たりすることができると考えられます。商品間の因果関係があれば、説明変数として利用可能となります。また、上記の回答の通り、他の商品の情報をお使いいただくことは問題ございません。一方で外部API等の、外部データについては、今回はルール上お使いいただくことはできません。用意されたデータのみを使用して、モデルを構築いただければと思います。
>ご提供いただいているtrain, testのデータは、西暦何年のものになりますでしょうか。今回のコンペティションは、人工的に作成されたシミュレーションデータを使用しております。西暦はある特定の年と想定してデータをお使いください。
ご回答ありがとうございます。お答えいただいた条件にて検討いたします。