kenta_kuwahara
面白いコンペティションを開催いただきありがとうございます。
以下に示す学習済みモデルの使用を考えておりますので、ご検討をよろしくお願いいたします。
universal-sentence-encoder-multilingual
Reddit,Wikipedia,SNLI,webマイニングより得た翻訳ペアを学習したもの
https://tfhub.dev/google/universal-sentence-encoder-multilingual/3
pycld2,pycld3
webページを学習したもの
https://pypi.org/project/pycld2/
https://pypi.org/project/pycld3/
fasttextの言語判定モデル
Wikipedia,Tatoeba,SETimesを学習したもの
https://fasttext.cc/docs/en/language-identification.html
ProbSpace_official
ご申請ありがとうございます。
いずれの学習済みモデルにも、YouTube関連のデータが含まれていないことを確認しましたので、
ご使用いただいて問題ございません。
どうぞよろしくお願いいたします。
※チーティングにつながるデータが含まれていると判明した場合は、変更させていただく可能性もございます