次の一投の行方を予測! プロ野球データ分析チャレンジ

ストライク? ヒット? それともホームラン!?

賞金: 100,000 参加ユーザー数: 383 3年以上前に終了

[運営担当者様]三振の場合のラベルは、ストライク[1] or アウト[3]?

[運営担当者様]三振の場合のラベルは、ストライク[1] or アウト[3]?

既出でしたら申し訳ございませんが、1点、ご教示ください。

予測対象の y について、ストライクの場合は「1」、アウトの場合は「3」という定義になっていますが、三振(ストライク且つアウト)の場合は、どちらになりますでしょうか。

ストライクとなる場合は、ストライクカウントに依存しないのですが、アウトとなる場合は、ストライクカウント「2」のレコードにフラグを立てるなど、特徴量追加の判断材料となるため、お伺いさせていただきました。

ちなみに、ストライクカウント「2」の時のyの分布は以下の通りとなっていました。

# ------------------------------------------------------------------------------
# ProbSpace: プロ野球データ分析チャレンジ
# ------------------------------------------------------------------------------
import pandas as pd
import numpy as np

import matplotlib.pyplot as plt
import seaborn as sns
# データ読み込み
#####################################
###### train ########################
#####################################

train = pd.read_csv('/content/drive/MyDrive/probspace/baseball/data/train_data.csv')

#####################################
#### test ###########################
#####################################

test = pd.read_csv('/content/drive/MyDrive/probspace/baseball/data/test_data.csv')

#####################################
#### test ###########################
#####################################

game = pd.read_csv('/content/drive/MyDrive/probspace/baseball/data/game_info.csv')
strike_2_df = train[train['S']==0]['y']
strike_2_df.hist()
<matplotlib.axes._subplots.AxesSubplot at 0x7f0a305c9f10>

添付データ

  • strike_feature.ipynb?X-Amz-Expires=10800&X-Amz-Date=20241118T122140Z&X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=AKIAIP7GCBGMWPMZ42PQ
  • Aws4 request&x amz signedheaders=host&x amz signature=170c54733d54b657ff2b175e7de6ec8528b5a6fa3adfa377a8729eb29765ba0b
    ProbSpace_official

    Oregin様

    ご質問ありがとうございます。
    三振(ストライク且つアウト)の場合は、y=1(ストライク)としております。
    また三振の場合には、IsOuts=TRUEとしておりますので、三振のみにフラグを立てる場合にはこちらのカラムをご活用ください。

    Aws4 request&x amz signedheaders=host&x amz signature=672317ba2154e673aa8cf4af9c6035d69e2f9b47d7258f0df3e2399c60b190f6
    Oregin

    ご回答ありがとうございました。 三振(ストライク且つアウト)の場合は、y=1(ストライク)となる旨、拝承いたしました。 また、IsOuts=TRUEのカラムは訓練データにしかないため、特徴量としては採用できないかと。 別の方法を試みてみます。

    Favicon
    new user
    コメントするには 新規登録 もしくは ログイン が必要です。