外部データとテストデータの被りについて
本コンペでは、テストデータ・外部データを用いた学習を許可します:
ただし、テストデータ 又は 外部データのうちテストデータと被るサンプルにおいて、ゴールドラベルを用いた学習は禁止します。
自己回帰学習や、疑似ラベル学習などにご使用ください。
以上のようにルールにはありますが、
この被りとは、外部データを224 x 224に圧縮した際に完全に一致するようなデータを指すのでしょうか?
例えばもともと同じ作者の同じ作品でもスキャンの仕方や前処理の仕方によっては一致しないnumpy ndarrayになると思いますが、この場合はテストデータと被りのないデータとして取り扱ってよいということでしょうか。