[確認と質問]trainデータとtestデータの分け方、および案件公開後の経過時間について

コンペ概要の説明では判断できなかったので確認させてください。

trainデータ、testデータはそれぞれ

  1. 2018, 2019年に案件がクローズした(募集を終えた)データと、2020、2021年にクローズしたデータ
  2. 2018,2019年に案件が公開された(募集を開始した)データと、2020,2021年に公開されたデータ

のどちらを指すのでしょうか?

仮に2だとすると、2021年のデータの一部は案件公開後の時間が短いため十分な金額が集まっていないと推測されますが、このようなデータはtestデータから排除されているのでしょうか?

お手数ですが、よろしくご教示ください。

Aws4 request&x amz signedheaders=host&x amz signature=cb4e833a7fbd14d606cae76d68db01d26b0c0ea495142ad3eb003cc232b873f8
Akahachi

ついうっかり、誰に訊いているのかわからないようなタイトルにしてしまいましたが、運営担当者様への質問です

Aws4 request&x amz signedheaders=host&x amz signature=1ee091b58f0e893865e246e2f53630b6df5ce2c641642e772ce44309d1f7be81
ProbSpace_official

Akahachi様

ご質問ありがとうございます。
以下、回答となります。

trainデータ、testデータともに、
2.2018,2019年に案件が公開された(募集を開始した)データと、2020,2021年に公開されたデータ
となります。

またご推察の通り、案件公開後に十分な融資額が集まっていないデータについては、testデータより除外しております。

何卒よろしくお願いいたします。

Aws4 request&x amz signedheaders=host&x amz signature=cb4e833a7fbd14d606cae76d68db01d26b0c0ea495142ad3eb003cc232b873f8
Akahachi

ProbSpace_official 様

早速のご対応ありがとうございます。 ご回答の内容につき、承知いたしました。

Favicon
new user
コメントするには 新規登録 もしくは ログイン が必要です。