What type of study is this?

This is a Literature Review study.

September 24, 2025Open Access

Voir au-delà de l'évidence : Une enquête sur la reconnaissance des concepts abstraits pour la compréhension vidéo

Key Points

La reconnaissance automatisée des concepts abstraits dans les vidéos améliore l'alignement avec le raisonnement et les valeurs humaines.
Les avancées dans les modèles fondamentaux offrent des conditions idéales pour aborder la compréhension des concepts abstraits.
Cette enquête passe en revue diverses tâches et ensembles de données axés sur les concepts abstraits dans l'analyse vidéo.
La recherche insiste sur l'importance de tirer parti de l'expérience communautaire pour relever des défis de longue date.

Abstract

La compréhension automatique du contenu vidéo progresse rapidement. Grâce à des réseaux neuronaux plus profonds et de grands ensembles de données, les machines sont de plus en plus capables de comprendre ce qui est concrètement visible dans les images vidéo, qu'il s'agisse d'objets, d'actions, d'événements ou de scènes. En comparaison, les humains conservent une capacité unique à regarder au-delà des entités concrètes et à reconnaître des concepts abstraits tels que la justice, la liberté et la solidarité. La reconnaissance des concepts abstraits constitue un défi majeur en compréhension vidéo, où le raisonnement sur plusieurs niveaux sémantiques basé sur l'information contextuelle est essentiel. Dans cet article, nous soutenons que les récentes avancées des modèles fondamentaux offrent un cadre idéal pour aborder la compréhension des concepts abstraits dans les vidéos. La compréhension automatisée des concepts abstraits de haut niveau est impérative car elle permet aux modèles de mieux s'aligner sur le raisonnement et les valeurs humaines. Dans cette enquête, nous étudions différentes tâches et ensembles de données utilisés pour comprendre les concepts abstraits dans le contenu vidéo. Nous observons que, périodiquement et sur une longue période, les chercheurs ont tenté de résoudre ces tâches en faisant le meilleur usage des outils à leur disposition. Nous défendons que s'appuyer sur des décennies d'expérience communautaire nous aidera à éclairer ce défi important et à éviter de « réinventer la roue » alors que nous commençons à le revisiter à l'ère des modèles fondamentaux multimodaux.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Gowreesh Mago

Pascal Mettes

Stevan Rudinac

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Voir au-delà de l'évidence : Une enquête sur la reconnaissance des concepts abstraits pour la compréhension vidéo

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider