VideoBERT:ビデオと言語の表現学習のための共同モデル | Synapse