同じ名前の選手が
train_data.csv, test_data.csv を見ていて気づきましたが、複数の球団で同じ名前の選手のデータがあることがたまにあるようです。網羅性は保証できませんが、私は以下を見つけました。
name |
team |
nTeams |
ロドリゲス |
中日 |
3 |
ロドリゲス |
日本ハム |
3 |
ロドリゲス |
オリックス |
3 |
DJ.ジョンソン |
楽天 |
2 |
DJ.ジョンソン |
広島 |
2 |
澤村 拓一 |
巨人 |
2 |
澤村 拓一 |
ロッテ |
2 |
小林 慶祐 |
オリックス |
2 |
小林 慶祐 |
阪神 |
2 |
メヒア |
西武 |
2 |
メヒア |
広島 |
2 |
スアレス |
阪神 |
2 |
スアレス |
ヤクルト |
2 |
エスコバー |
ヤクルト |
2 |
エスコバー |
DeNA |
2 |
調べたところ、次の通り「シーズン中にトレードされた」「同じ名前の選手が複数いる」ケースがあるようです。NPB に詳しくないですが多分合っているかなと・・・。みなさんも同様のデータを見つけられたらシェアいただけないでしょうか?
(なぜか Markdown 記法で URL リンクをうまく貼れない・・・。私の書き方の問題?)