Feature Engineeringについて(年収幅ラベルの追加)

目的変数であるsalaryを年収幅でラベル化し、分類問題として解いた後に予測したラベルをテストデータに加えて学習させたのですが、予測値が全てinfになってしまいます。 このアイデアは何か問題があるのでしょうか? Notebookはgithubにあります。

https://github.com/Maekura/ML_Competiton/blob/master/ProbSpace/Salary_Prediction/lgbm_salary_labeling.ipynb

※年収幅ラベルとは
0~200万の人は0
200〜400万の人は1
400万〜600万の人は2
といった具合のラベルです。

Aws4 request&x amz signedheaders=host&x amz signature=22e1179f783ebf4e493a4321e654a166e7a08a018e1ddbacd2ee8d13f606f089
wakame

Githubのipynbファイルがそのまま開かなかったので、新しくGoogleColab環境に内容をコピペして動かしましたが問題なく動作しました。 https://colab.research.google.com/drive/1uG9jEks84di7HYI_Os7-5oPhaStxgPM5

Icon0
退会したユーザー

確認して頂きありがとうございます。 再計算し直したところ、上手くいきました。

Favicon
new user
コメントするには 新規登録 もしくは ログイン が必要です。