What type of study is this?

This is a Quantitative Study study.

October 1, 2025Open Access

AdaViP : Alignement des LLM multi-modaux via l’Optimisation Adaptative des Préférences Améliorée par la Vision

Key Points

AdaViP réduit significativement les taux d’hallucination dans les modèles de langage large multimodaux.
La méthode combine la construction de paires de préférences basées sur la vision avec une optimisation adaptative des préférences.
Des évaluations étendues montrent des réductions de 93,7 % et 96,4 % des hallucinations sur le benchmark Object HalBench.
AdaViP répond aux limites des méthodes existantes d’alignement des préférences en intégrant le contexte visuel.

Abstract

L’alignement des préférences via l’Optimisation Directe des Préférences (DPO) a démontré une efficacité significative dans l’alignement des modèles de langage large multimodaux (MLLMs) avec les préférences humaines. Cependant, les méthodes existantes se concentrent principalement sur les préférences linguistiques tout en négligeant le contexte visuel critique. Dans cet article, nous proposons une optimisation adaptative des préférences améliorée par la vision (AdaViP) qui répond à ces limites grâce à deux innovations clés : (1) la construction de paires de préférences basée sur la vision, qui intègre plusieurs modèles fondamentaux visuels afin de supprimer stratégiquement des éléments visuels clés de l’image, améliorant la sensibilité des MLLMs aux détails visuels ; et (2) une optimisation adaptative des préférences qui équilibre dynamiquement les préférences basées sur la vision et le langage pour un alignement plus précis. Des évaluations étendues sur différents benchmarks démontrent notre efficacité. Notamment, notre AdaViP-7B atteint des réductions de 93,7 % et 96,4 % au niveau des réponses et du niveau des mentions respectivement sur l’Object HalBench, surpassant significativement les méthodes actuelles d’état de l’art.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Jinda Lu

Jingrui Li

Yuan Gao

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

AdaViP : Alignement des LLM multi-modaux via l’Optimisation Adaptative des Préférences Améliorée par la Vision

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider