March 18, 2024Open Access

Enriquecimiento Semántico para Respuestas a Preguntas de Video con Redes Neuronales de Grafos Reguladas

Puntos clave

Los puntos clave no están disponibles para este artículo en este momento.

Resumen

Responder preguntas sobre videos (VideoQA) es una tarea compleja que requiere una comprensión profunda de un video para responder con precisión las preguntas. Los métodos existentes a menudo tienen dificultades para integrar eficazmente la información semántica visual y basada en el lenguaje, lo que conduce a una comprensión incompleta del contenido del video y un rendimiento subóptimo. Para abordar este desafío, presentamos un enfoque novedoso en este artículo para enriquecer la semántica de los cuadros de video, preguntas y candidatos a respuestas. Específicamente, analizamos los cuadros de video y las preguntas en grafos semánticos: grafo semántico visual y grafo semántico de la pregunta, que capturan información sobre objetos, sus atributos y relaciones. Estos grafos se codifican mediante una Red Neuronal de Grafo Regulada (GGNN). Para los candidatos a respuestas, proponemos verbalizarlos usando Modelos de Lenguaje a Gran Escala (LLMs) para inyectar más información semántica desde aspectos visuales y acústicos. Evaluamos nuestro enfoque en conjuntos de datos de referencia de VideoQA: AVQA y Music-AVQA. Los resultados experimentales muestran que nuestro enfoque supera a modelos base competitivos, logrando un rendimiento de vanguardia en varios tipos de preguntas.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Chenyang Lyu

Wenxi Li

Tianbo Ji

Actions

Institutions

Shanghai Jiao Tong University

Dublin City University

Tencent (China)

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Enriquecimiento Semántico para Respuestas a Preguntas de Video con Redes Neuronales de Grafos Reguladas

Puntos clave

Resumen

Citation Network

Connected Papers

Discussion

Authors

Actions

Institutions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider