[確認と質問]trainデータとtestデータの分け方、および案件公開後の経過時間について

コンペ概要の説明では判断できなかったので確認させてください。

trainデータ、testデータはそれぞれ

  1. 2018, 2019年に案件がクローズした(募集を終えた)データと、2020、2021年にクローズしたデータ
  2. 2018,2019年に案件が公開された(募集を開始した)データと、2020,2021年に公開されたデータ

のどちらを指すのでしょうか?

仮に2だとすると、2021年のデータの一部は案件公開後の時間が短いため十分な金額が集まっていないと推測されますが、このようなデータはtestデータから排除されているのでしょうか?

お手数ですが、よろしくご教示ください。

Aws4 request&x amz signedheaders=host&x amz signature=390e5ba413f2112ab0f4ae2d404e3872c07a02509e261d576a0583c8a9df1f95
Akahachi

ついうっかり、誰に訊いているのかわからないようなタイトルにしてしまいましたが、運営担当者様への質問です

Aws4 request&x amz signedheaders=host&x amz signature=07d15044d086977784315e940ca987ac4abf53105c02fce602af511d993154f5
ProbSpace_official

Akahachi様

ご質問ありがとうございます。
以下、回答となります。

trainデータ、testデータともに、
2.2018,2019年に案件が公開された(募集を開始した)データと、2020,2021年に公開されたデータ
となります。

またご推察の通り、案件公開後に十分な融資額が集まっていないデータについては、testデータより除外しております。

何卒よろしくお願いいたします。

Aws4 request&x amz signedheaders=host&x amz signature=390e5ba413f2112ab0f4ae2d404e3872c07a02509e261d576a0583c8a9df1f95
Akahachi

ProbSpace_official 様

早速のご対応ありがとうございます。 ご回答の内容につき、承知いたしました。

Favicon
new user
コメントするには 新規登録 もしくは ログイン が必要です。