対戦ゲームデータ分析甲子園

目指せ"Another" バトル優勝!

賞金: 100,000 参加ユーザー数: 605 4年弱前に終了

【運営担当者様】A1-levelの一部抜けについて

変数を確認しているときに気がついたので、何らかの背景があるか確認させてください。

添付したプロットは横軸にlevel、縦に出現頻度としたヒストグラムです。
プロットの通り、A1-levelのみ472から541の間と、586以上のlevelが一切出現しておらず、他のlevelの分布と異なっていました。

これは恣意的にデータを間引いた結果でしょうか?またはデータの収集の過程でこのようになる状態だったのでしょうか。
ご確認、ご回答の程どうぞよろしくお願い致します。

0f0b7a50-b00e-47ae-8b07-0f3ed6904430.png

Aws4 request&x amz signedheaders=host&x amz signature=e5b8e9a16063e7d8f23a72d51f5b8211da17d4b9628883582011370581c4d83e
sylk

https://prob.space/competitions/game_winner/discussions/takaito-Posta0ec91cc7dc4e956bac1

上のリンクで最新のコメントでA1の人は投稿者だからレベル+武器とかでプレイヤーが特定されるかもしれないとのことでした

Aws4 request&x amz signedheaders=host&x amz signature=a3e4422043d3dbd1eed436d1a3bfb678404dd68c6a3b589d018135518c35ae4d
ProbSpace_official

ご質問ありがとうございます。
回答としましては、こちらで意図的にデータを間引いているということはございません。
400レベルを超える投稿ユーザー数が少ないことで、分布に偏りが生じているのかなと思われます。
ご確認のほど、よろしくお願いいたします。

Aws4 request&x amz signedheaders=host&x amz signature=1095cd521cfeee6597f8b9275b7d2c05fc2b448b3a58ca0aa8a889c9862f2741
masato

なるほど、ということは大まかにはデータ収集のプロセス起因が想定されうるということですね。

sylkさん 有用なコメントへのメンションありがとうございます!

Favicon
new user
コメントするには 新規登録 もしくは ログイン が必要です。