YouTuberとしておさえるべきポイントとは?
anyai
エンタメ要素もある面白いコンペティションを開催いただきありがとうございます。
コンペティション初心者であるため勝手が分かっておらず本コンペティションのルールについて確認したい事項があり、質問させていただきました。
ルールにおいて「外部データの使用は禁止」となっておりますが、
に代表されるような形態素解析ツールの使用は可能でしょうか。辞書データなどを使用するため外部データに当たるのでしょうか。
本コンペティションのデータには【title (動画のタイトル)】や【description (動画の説明文)】など自然言語処理要素があるため、形態素解析は有効な特徴量エンジニアリングにつながると考えております。
お手数をおかけいたしますが、ご教示お願い致します。
ご質問ありがとうございます。MeCab, Janome 等、形態素解析モデルについては利用可とします。
ただし、テストデータの解を組み込んだ再学習モデルの利用等は禁止行為とし、また順位確定までに大きな不都合が生じた場合は、一部ルールを変更する可能性があります。
良識のもと、ご利用のほどよろしくお願いいたします。
早期ご回答ありがとうございます。 形態素解析ツールの件、承知いたしました。
申し訳ございませんが、もう1点追加でご確認させてください。 fastTextのようなword2vecツールは、「コンペ外データを用いて学習されたモデルの使用」など外部データ利用にあたるでしょうか。
お忙しいところ恐縮ですが、ご教示お願いいたします。
担当者様(yosshi様) ご回答ありがとうございます。承知いたしました。
anyai様すみません。個人アカウントから返信してしまいました。こちら、公式見解でお願いいたします。
Word2Vecにつきましても、形態素解析ツールと同様利用可とし、コンペ参加者の皆様に不都合が生じる場合は変更とするルールと致します。ご確認のほど、よろしくお願いいたします。