YouTube動画視聴回数予測

YouTuberとしておさえるべきポイントとは？

賞金: 100,000 円参加ユーザー数: 639 5年以上前に終了

参加する

Lain.

マルチモーダルなコンペで工夫のしがいがあり非常に楽しいコンペでした．コンペを開催してくださった運営と，参加者の皆さん，そしてチームを組んで下さったupuraさんに感謝を申し上げます．
以下のSolutionは私の取り組みです．

like, dislike, comment_countを予測するモデルを作成し，comments_disabled, ratings_disabledがTrueであるデータを補間しました．学習には補完ありと補完なしの2種類のデータを使用してモデルを学習しました．

の3つをTargetとして学習させました．

KFoldで予測したK個のtestの予測値の分散が低いものを精度が高いと仮定して，testの予測の分散が低いもののうち30%を使用してpreudo labelingを行いました．CVは大幅に下がりLBは少しだけ改善しました．

StratifiedKFold: train.y.apply(np.log1p) // 2

LightGBMを使用．
補完ありと補完なしの2種類のデータと3種類のTargetの計6種類のModelを作成し，平均をとりました．

ベストモデルは以下の4つのモデルの平均