対戦ゲームデータ分析甲子園

目指せ"Another" バトル優勝!

賞金: 100,000 参加ユーザー数: 586 2年弱前に終了

【運営担当者様】A1-levelの一部抜けについて

変数を確認しているときに気がついたので、何らかの背景があるか確認させてください。

添付したプロットは横軸にlevel、縦に出現頻度としたヒストグラムです。
プロットの通り、A1-levelのみ472から541の間と、586以上のlevelが一切出現しておらず、他のlevelの分布と異なっていました。

これは恣意的にデータを間引いた結果でしょうか?またはデータの収集の過程でこのようになる状態だったのでしょうか。
ご確認、ご回答の程どうぞよろしくお願い致します。

0f0b7a50-b00e-47ae-8b07-0f3ed6904430.png

Aws4 request&x amz signedheaders=host&x amz signature=c93ccb3123d63f689077bd7e670eae7b39ebc555c15b6ebdfb30328a6da57af4
sylk

https://prob.space/competitions/game_winner/discussions/takaito-Posta0ec91cc7dc4e956bac1

上のリンクで最新のコメントでA1の人は投稿者だからレベル+武器とかでプレイヤーが特定されるかもしれないとのことでした

Aws4 request&x amz signedheaders=host&x amz signature=a535b08fb1868553062158665fdc848218e3406c19ff4335630d5d1c0cf26dd6
ProbSpace_official

ご質問ありがとうございます。
回答としましては、こちらで意図的にデータを間引いているということはございません。
400レベルを超える投稿ユーザー数が少ないことで、分布に偏りが生じているのかなと思われます。
ご確認のほど、よろしくお願いいたします。

Aws4 request&x amz signedheaders=host&x amz signature=4c946d6c4a30f8ff9bbb59b9a9d64ac3c0a98f724de98a3d59723de9510bb0c9
masato

なるほど、ということは大まかにはデータ収集のプロセス起因が想定されうるということですね。

sylkさん 有用なコメントへのメンションありがとうございます!

Favicon
new user
コメントするには 新規登録 もしくは ログイン が必要です。