YouTuberとしておさえるべきポイントとは?
Lain.
マルチモーダルなコンペで工夫のしがいがあり非常に楽しいコンペでした.コンペを開催してくださった運営と,参加者の皆さん,そしてチームを組んで下さったupuraさんに感謝を申し上げます.以下のSolutionは私の取り組みです.
like, dislike, comment_countを予測するモデルを作成し,comments_disabled, ratings_disabledがTrueであるデータを補間しました.学習には補完ありと補完なしの2種類のデータを使用してモデルを学習しました.
の3つをTargetとして学習させました.
KFoldで予測したK個のtestの予測値の分散が低いものを精度が高いと仮定して,testの予測の分散が低いもののうち30%を使用してpreudo labelingを行いました.CVは大幅に下がりLBは少しだけ改善しました.
StratifiedKFold: train.y.apply(np.log1p) // 2
LightGBMを使用.補完ありと補完なしの2種類のデータと3種類のTargetの計6種類のModelを作成し,平均をとりました.
ベストモデルは以下の4つのモデルの平均
https://github.com/Lain-progressivehouse/probspace-youtube