[確認と質問]trainデータとtestデータの分け方、および案件公開後の経過時間について

コンペ概要の説明では判断できなかったので確認させてください。

trainデータ、testデータはそれぞれ

  1. 2018, 2019年に案件がクローズした(募集を終えた)データと、2020、2021年にクローズしたデータ
  2. 2018,2019年に案件が公開された(募集を開始した)データと、2020,2021年に公開されたデータ

のどちらを指すのでしょうか?

仮に2だとすると、2021年のデータの一部は案件公開後の時間が短いため十分な金額が集まっていないと推測されますが、このようなデータはtestデータから排除されているのでしょうか?

お手数ですが、よろしくご教示ください。

Aws4 request&x amz signedheaders=host&x amz signature=6d6f2144e03aa25ebb9c70b9c154c8cf629eb2620326ba944c0f0a7e297b02ef
Akahachi

ついうっかり、誰に訊いているのかわからないようなタイトルにしてしまいましたが、運営担当者様への質問です

Aws4 request&x amz signedheaders=host&x amz signature=4caedf958d4c10e429e7876b40e919f4b78cec1720c09bc4db5ea171e170baa3
ProbSpace_official

Akahachi様

ご質問ありがとうございます。
以下、回答となります。

trainデータ、testデータともに、
2.2018,2019年に案件が公開された(募集を開始した)データと、2020,2021年に公開されたデータ
となります。

またご推察の通り、案件公開後に十分な融資額が集まっていないデータについては、testデータより除外しております。

何卒よろしくお願いいたします。

Aws4 request&x amz signedheaders=host&x amz signature=6d6f2144e03aa25ebb9c70b9c154c8cf629eb2620326ba944c0f0a7e297b02ef
Akahachi

ProbSpace_official 様

早速のご対応ありがとうございます。 ご回答の内容につき、承知いたしました。

Favicon
new user
コメントするには 新規登録 もしくは ログイン が必要です。