What type of study is this?

This is a Quantitative Study study.

September 29, 2025Open Access

تعديل المطالبات بدون تحيّز في نموذج الرؤية واللغة بدون تعليقات توضيحية

Key Points

الطريقة تحسن دقة أسوأ مجموعة في نماذج الرؤية واللغة من خلال معالجة الترابطات الزائفة.
تؤكد التجارب على مجموعات بيانات مثل CelebA وWaterbirds تقدمات كبيرة في متانة المجموعات.
استخدام التعرف على الصور بدون إطلاق يساعد في تحديد الميزات الزائفة بدون تعليقات يدوية.
النهج يقلل بفعالية من فجوة المتانة بين الدقة الإجمالية ودقة أسوأ مجموعة في مهام الرؤية واللغة.

Abstract

أظهر تعديل المطالبات في نماذج الرؤية واللغة (VLMs) مثل CLIP القدرة على التكيف السريع مع مهام مختلفة لاحقة. ومع ذلك، تشير الدراسات الحديثة إلى أن نماذج VLM المعدلة قد تعاني من مشكلة الترابطات الزائفة، حيث يعتمد النموذج على ميزات زائفة (مثلاً الخلفية والنوع) في البيانات. قد يؤدي ذلك إلى تدني متانة النموذج عند التعامل مع بيانات خارج التوزيع. الطرق التقليدية لإزالة الترابطات الزائفة عادةً ما تتطلب معرفة تسميات الصفات الزائفة لكل عينة، وهو أمر صعب في الواقع. في هذا العمل، نستكشف تحسين متانة المجموعات لتعديل المطالبات في نماذج VLM بدون الاعتماد على التعليقات التوضيحية اليدوية للميزات الزائفة. نلاحظ قدرة نماذج VLM على التعرف على الصور بشكل صفر-طلقة ونستخدم هذه القدرة لتحديد الميزات الزائفة، متجنبين بذلك تكلفة التعليقات اليدوية. من خلال الاستفادة من تعليقات توضيحية زائفة للصفات الزائفة، نقترح أيضًا طريقة لضبط أوزان التدريب لمجموعات مختلفة تلقائيًا. تُظهر التجارب الواسعة أن نهجنا يحسّن بكفاءة دقة أسوأ مجموعة على مجموعات بيانات CelebA وWaterbirds وMetaShift، محققًا أفضل فجوة متانة بين دقة أسوأ مجموعة والدقة الإجمالية.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Chaoquan Jiang

Yunfan Yang

Rui Hu

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

تعديل المطالبات بدون تحيّز في نموذج الرؤية واللغة بدون تعليقات توضيحية

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider