次の一投の行方を予測! プロ野球データ分析チャレンジ

ストライク? ヒット? それともホームラン!?

賞金: 100,000 参加ユーザー数: 384 3年弱前に終了

[運営担当者様]三振の場合のラベルは、ストライク[1] or アウト[3]?

[運営担当者様]三振の場合のラベルは、ストライク[1] or アウト[3]?

既出でしたら申し訳ございませんが、1点、ご教示ください。

予測対象の y について、ストライクの場合は「1」、アウトの場合は「3」という定義になっていますが、三振(ストライク且つアウト)の場合は、どちらになりますでしょうか。

ストライクとなる場合は、ストライクカウントに依存しないのですが、アウトとなる場合は、ストライクカウント「2」のレコードにフラグを立てるなど、特徴量追加の判断材料となるため、お伺いさせていただきました。

ちなみに、ストライクカウント「2」の時のyの分布は以下の通りとなっていました。

# ------------------------------------------------------------------------------
# ProbSpace: プロ野球データ分析チャレンジ
# ------------------------------------------------------------------------------
import pandas as pd
import numpy as np

import matplotlib.pyplot as plt
import seaborn as sns
# データ読み込み
#####################################
###### train ########################
#####################################

train = pd.read_csv('/content/drive/MyDrive/probspace/baseball/data/train_data.csv')

#####################################
#### test ###########################
#####################################

test = pd.read_csv('/content/drive/MyDrive/probspace/baseball/data/test_data.csv')

#####################################
#### test ###########################
#####################################

game = pd.read_csv('/content/drive/MyDrive/probspace/baseball/data/game_info.csv')
strike_2_df = train[train['S']==0]['y']
strike_2_df.hist()
<matplotlib.axes._subplots.AxesSubplot at 0x7f0a305c9f10>

添付データ

  • strike_feature.ipynb?X-Amz-Expires=10800&X-Amz-Date=20240329T133629Z&X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=AKIAIP7GCBGMWPMZ42PQ
  • Aws4 request&x amz signedheaders=host&x amz signature=d974a358243e7957a6516a08c6811bf693e51ae703e237c1a3f51ca6a8a7f34f
    ProbSpace_official

    Oregin様

    ご質問ありがとうございます。
    三振(ストライク且つアウト)の場合は、y=1(ストライク)としております。
    また三振の場合には、IsOuts=TRUEとしておりますので、三振のみにフラグを立てる場合にはこちらのカラムをご活用ください。

    Aws4 request&x amz signedheaders=host&x amz signature=606e6afe631fdd1eca147157a0d40a498a5deba76c7c2c465e773ffd17baebbf
    Oregin

    ご回答ありがとうございました。 三振(ストライク且つアウト)の場合は、y=1(ストライク)となる旨、拝承いたしました。 また、IsOuts=TRUEのカラムは訓練データにしかないため、特徴量としては採用できないかと。 別の方法を試みてみます。

    Favicon
    new user
    コメントするには 新規登録 もしくは ログイン が必要です。