Los puntos clave no están disponibles para este artículo en este momento.
Describimos el conjunto de datos de video de acciones humanas DeepMind Kinetics. El conjunto contiene 400 clases de acciones humanas, con al menos 400 clips de video para cada acción. Cada clip dura alrededor de 10 segundos y proviene de un video diferente en YouTube. Las acciones están centradas en los humanos y cubren una amplia gama de clases, incluyendo interacciones humano-objeto, como tocar instrumentos, así como interacciones humano-humano, como darse la mano. Describimos las estadísticas del conjunto de datos, cómo fue recopilado, y ofrecemos algunas cifras de rendimiento base para arquitecturas de redes neuronales entrenadas y evaluadas para la clasificación de acciones humanas en este conjunto. También realizamos un análisis preliminar sobre si el desequilibrio en el conjunto de datos conduce a sesgos en los clasificadores.
Building similarity graph...
Analyzing shared references across papers
Loading...
Andrew Zisserman
João Carreira
Karen Simonyan
Building similarity graph...
Analyzing shared references across papers
Loading...
Zisserman et al. (vie,) estudiaron esta cuestión.
www.synapsesocial.com/papers/695eb460da3b0d67f0874b30 — DOI: https://doi.org/10.48550/arxiv.1705.06950
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: