[確認と質問]trainデータとtestデータの分け方、および案件公開後の経過時間について

コンペ概要の説明では判断できなかったので確認させてください。

trainデータ、testデータはそれぞれ

  1. 2018, 2019年に案件がクローズした(募集を終えた)データと、2020、2021年にクローズしたデータ
  2. 2018,2019年に案件が公開された(募集を開始した)データと、2020,2021年に公開されたデータ

のどちらを指すのでしょうか?

仮に2だとすると、2021年のデータの一部は案件公開後の時間が短いため十分な金額が集まっていないと推測されますが、このようなデータはtestデータから排除されているのでしょうか?

お手数ですが、よろしくご教示ください。

Aws4 request&x amz signedheaders=host&x amz signature=ca58dff492061744e0bd1b92c59dd77e2be7f5b3c65cce42b828f208a3401e8e
Akahachi

ついうっかり、誰に訊いているのかわからないようなタイトルにしてしまいましたが、運営担当者様への質問です

Aws4 request&x amz signedheaders=host&x amz signature=4cb9b0ab62d1fa2a2774bd87199b9126f4c1cf68fbb15f7816f2fbefe17d875d
ProbSpace_official

Akahachi様

ご質問ありがとうございます。
以下、回答となります。

trainデータ、testデータともに、
2.2018,2019年に案件が公開された(募集を開始した)データと、2020,2021年に公開されたデータ
となります。

またご推察の通り、案件公開後に十分な融資額が集まっていないデータについては、testデータより除外しております。

何卒よろしくお願いいたします。

Aws4 request&x amz signedheaders=host&x amz signature=ca58dff492061744e0bd1b92c59dd77e2be7f5b3c65cce42b828f208a3401e8e
Akahachi

ProbSpace_official 様

早速のご対応ありがとうございます。 ご回答の内容につき、承知いたしました。

Favicon
new user
コメントするには 新規登録 もしくは ログイン が必要です。