類似商品ごとの時系列可視化と簡単な考察
はじめに
簡単に類似商品ごとに予測対象である売上数を可視化したので,可視化結果とちょっとした考察を共有できたらと思います.
可視化結果の共有
- 個数はlog(y+1)でスケーリング
- 年の情報はデータにないため2018,2019年として表示
アイス
おでん
ホット?
- 4月〜7月,9月〜12月くらいが他の時期に比べて高い
- 自身は何の商品かよくわかっていないのでわかる方,コメントで教えて欲しいです
デザート
ドリンク
- drink1〜4の売上が低い日はdrink5〜6の売上が高いことから,冷たい飲み物とあたたかい飲み物の二種類が混在?
アルコール
スナック
- 周期性がある
- お酒のつまみとして周期性があるのかと思っていたが,アルコールの周期だけでは説明ができない
弁当
チルド
- 冷凍食品はいろいろあるので,どのような冷凍食品か他データとの分析で予想する価値があるかも?
麺
相関行列
- これまでの簡単な考察を相関からも確認することができます
おわりに
シミュレーションデータのため,詳細な分析を行うことでデータ構造に気がつくことができ,より良いスコアを出すことができるのではと思っております.
欠損値もなく,データサイズも小さいため非常に始めやすいコンペだと思いました.
週に一回くらいはトピック確認しようと思っているので,気軽にコメントなどで交流できたらと思っておりますので,コメントお待ちしております.