[確認と質問]trainデータとtestデータの分け方、および案件公開後の経過時間について

コンペ概要の説明では判断できなかったので確認させてください。

trainデータ、testデータはそれぞれ

  1. 2018, 2019年に案件がクローズした(募集を終えた)データと、2020、2021年にクローズしたデータ
  2. 2018,2019年に案件が公開された(募集を開始した)データと、2020,2021年に公開されたデータ

のどちらを指すのでしょうか?

仮に2だとすると、2021年のデータの一部は案件公開後の時間が短いため十分な金額が集まっていないと推測されますが、このようなデータはtestデータから排除されているのでしょうか?

お手数ですが、よろしくご教示ください。

Aws4 request&x amz signedheaders=host&x amz signature=985eedd360e57aa8193d02df169da8c48b9316362b9833e6287782dd83222cff
Akahachi

ついうっかり、誰に訊いているのかわからないようなタイトルにしてしまいましたが、運営担当者様への質問です

Aws4 request&x amz signedheaders=host&x amz signature=8481f4e9fe6527ecd24a845b6dd044649241f0aac2ac4d67ac8c3319b8a885df
ProbSpace_official

Akahachi様

ご質問ありがとうございます。
以下、回答となります。

trainデータ、testデータともに、
2.2018,2019年に案件が公開された(募集を開始した)データと、2020,2021年に公開されたデータ
となります。

またご推察の通り、案件公開後に十分な融資額が集まっていないデータについては、testデータより除外しております。

何卒よろしくお願いいたします。

Aws4 request&x amz signedheaders=host&x amz signature=985eedd360e57aa8193d02df169da8c48b9316362b9833e6287782dd83222cff
Akahachi

ProbSpace_official 様

早速のご対応ありがとうございます。 ご回答の内容につき、承知いたしました。

Favicon
new user
コメントするには 新規登録 もしくは ログイン が必要です。