給与推定により人事の赤池くんの窮地を救おう
masato8823
このデータのばらつきにつて理由などあると思いますか?特に異常ではないのかどうか、どう思われますか?精度向上につながるかどうかもわかりませんが
![Figure_2.png](https://probspace-stg.s3.amazonaws.com/uploads/user/e7fa157028d9d885ed958986bda73057/images/2019-11-20-0519/Figure_2.png =300x)
個人的な解釈となりますが、このような分布を見たら特定の傾向を持ったデータが重なり合って構成されているのではないかと考えます。つまり、何らかの傾向を持った互いに平行移動で移り合う集団が同一の散布図に表現されている事でこのようなばらつきになっているのではないかと疑います。
実際に適切なセグメントを用いる事でこの散布図を分解する事ができ、有効な特徴量を構成できると思います。試してみて下さい