類似商品ごとの時系列可視化と簡単な考察

はじめに

簡単に類似商品ごとに予測対象である売上数を可視化したので,可視化結果とちょっとした考察を共有できたらと思います.

可視化結果の共有

  • 個数はlog(y+1)でスケーリング
  • 年の情報はデータにないため2018,2019年として表示

アイス

c5a2d33f-976b-48c6-a94b-a47f21c4307b.png

  • 夏は直感通り売上数が高い

おでん

9dc771c4-401a-4508-bbf5-d91b6f066696.png

  • 販売していない時期があることに注意が必要

ホット?

5f970259-08b4-4c81-baea-a25c96826817.png

  • 4月〜7月,9月〜12月くらいが他の時期に比べて高い
  • 自身は何の商品かよくわかっていないのでわかる方,コメントで教えて欲しいです

デザート

5327ca6e-8ce6-473d-b1b9-3f02a62526f9.png

  • 周期性がある

ドリンク

808613cd-8e54-430d-ad38-5cb925a2beb7.png

  • drink1〜4の売上が低い日はdrink5〜6の売上が高いことから,冷たい飲み物とあたたかい飲み物の二種類が混在?

アルコール

206daf28-8f42-4d3f-bfb3-9d9f7a9f50c3.png

  • 周期性が一番顕著に現れている

スナック

348c1390-4d01-4392-aa2b-0228f9c009bc.png

  • 周期性がある
  • お酒のつまみとして周期性があるのかと思っていたが,アルコールの周期だけでは説明ができない

弁当

97d3a466-b970-474f-981b-c25c44a02e5a.png

  • こちらも周期性がある

チルド

8a901abd-da2e-4078-bbc1-bcf6c87cde98.png

  • 冷凍食品はいろいろあるので,どのような冷凍食品か他データとの分析で予想する価値があるかも?

a83dfa1c-4063-44a5-979c-c48bbba4f336.png

  • 弁当と似た動きをしているように見える

相関行列

29c549b1-fd6b-4f1e-b619-4bc9b4ae8c10.png

  • これまでの簡単な考察を相関からも確認することができます

おわりに

シミュレーションデータのため,詳細な分析を行うことでデータ構造に気がつくことができ,より良いスコアを出すことができるのではと思っております.

欠損値もなく,データサイズも小さいため非常に始めやすいコンペだと思いました.

週に一回くらいはトピック確認しようと思っているので,気軽にコメントなどで交流できたらと思っておりますので,コメントお待ちしております.

Icon15
hida

トピック立てと、的確な考察をありがとうございます。
hotはレジ横のホットスナック系かと考えたのですが、肉まんなどを含むなら1-2月の一番寒い時期に落ち込んでいるのが謎ですね。寒くなりすぎるとおでんを買いたくなるのでしょうか……?
天気情報を含めて相関を見ると、drink1-4はhighestやlowestと相関が高く、冷たい飲み物な気がしています。一方でdrink5, 6がrainとある程度相関があることが面白いなと思ってデータを眺めていました。

>シミュレーションデータのため,詳細な分析を行うことでデータ構造に気がつくことができ,より良いスコアを出すことができるのではと思っております.

自分も同意見です。他の参加者の方々の’読み’も是非拝見したいです。

Favicon
new user
コメントするには 新規登録 もしくは ログイン が必要です。