対戦ゲームデータ分析甲子園

目指せ"Another" バトル優勝!

賞金: 100,000 参加ユーザー数: 586 1年以上前に終了

【運営担当者様】A1-levelの一部抜けについて

変数を確認しているときに気がついたので、何らかの背景があるか確認させてください。

添付したプロットは横軸にlevel、縦に出現頻度としたヒストグラムです。
プロットの通り、A1-levelのみ472から541の間と、586以上のlevelが一切出現しておらず、他のlevelの分布と異なっていました。

これは恣意的にデータを間引いた結果でしょうか?またはデータの収集の過程でこのようになる状態だったのでしょうか。
ご確認、ご回答の程どうぞよろしくお願い致します。

0f0b7a50-b00e-47ae-8b07-0f3ed6904430.png

Aws4 request&x amz signedheaders=host&x amz signature=9106ecfdc554928b58418f7cec9fdb38348a93ca1f273e86327c50f9a827c721
sylk

https://prob.space/competitions/game_winner/discussions/takaito-Posta0ec91cc7dc4e956bac1

上のリンクで最新のコメントでA1の人は投稿者だからレベル+武器とかでプレイヤーが特定されるかもしれないとのことでした

Aws4 request&x amz signedheaders=host&x amz signature=7a10a9c9636c5db7b399f6e578278d357bc5d950c7f375300ab48f483fee49f6
ProbSpace_official

ご質問ありがとうございます。
回答としましては、こちらで意図的にデータを間引いているということはございません。
400レベルを超える投稿ユーザー数が少ないことで、分布に偏りが生じているのかなと思われます。
ご確認のほど、よろしくお願いいたします。

Aws4 request&x amz signedheaders=host&x amz signature=e234b3450e6426d6c6915084b968cbf443bd2fa6980e5bd280e229eaccf7bf22
masato

なるほど、ということは大まかにはデータ収集のプロセス起因が想定されうるということですね。

sylkさん 有用なコメントへのメンションありがとうございます!

Favicon
new user
コメントするには 新規登録 もしくは ログイン が必要です。