May 19, 2017Open Access

El conjunto de datos de video de acciones humanas Kinetics

Puntos clave

Los puntos clave no están disponibles para este artículo en este momento.

Resumen

Describimos el conjunto de datos de video de acciones humanas DeepMind Kinetics. El conjunto contiene 400 clases de acciones humanas, con al menos 400 clips de video para cada acción. Cada clip dura alrededor de 10 segundos y proviene de un video diferente en YouTube. Las acciones están centradas en los humanos y cubren una amplia gama de clases, incluyendo interacciones humano-objeto, como tocar instrumentos, así como interacciones humano-humano, como darse la mano. Describimos las estadísticas del conjunto de datos, cómo fue recopilado, y ofrecemos algunas cifras de rendimiento base para arquitecturas de redes neuronales entrenadas y evaluadas para la clasificación de acciones humanas en este conjunto. También realizamos un análisis preliminar sobre si el desequilibrio en el conjunto de datos conduce a sesgos en los clasificadores.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Andrew Zisserman

João Carreira

Karen Simonyan

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

El conjunto de datos de video de acciones humanas Kinetics

Puntos clave

Resumen

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider