BERT Base line−コメント付き (LB 0.7387 ) by Oregin
研究論文の国際学会採択予測で、件名と概要を利用した簡単なBERTのサンプルコードです。まだ、BERTについて勉強し始めたばかりなので、精度や見栄えはイマイチですが、なんとか動くものを作れました。
ご参考までご活用ください。
※Google Colab(GPU利用)で実行可能です。
LB= 0.7387 でした。
ディレクトリ構成
- base_path : このファイルを入れておくディレクトリ(各種パスの設定にて、保存した絶対パスを指定してください)
- base_path/data : test_data.csv,train_data.csv,submission.csvを入れておくディレクトリ
- base_path/model : 学習済みのモデルを保存するディレクトリ
- base_path/output : 提出用ファイルを保存するディレクトリ
Downloading (…)solve/main/vocab.txt: 0%| | 0.00/232k [00:00<?, ?B/s]
Downloading (…)okenizer_config.json: 0%| | 0.00/28.0 [00:00<?, ?B/s]
Downloading (…)lve/main/config.json: 0%| | 0.00/570 [00:00<?, ?B/s]