Key points are not available for this paper at this time.
مع استمرار نماذج اللغة في التوسع، أظهرت نماذج اللغة الكبيرة (LLMs) قدرات ناشئة في التعلم ضمن السياق (ICL)، مما مكنها من حل مهام اللغة عن طريق تقديم بعض العروض التوضيحية ضمن السياق (ICDs) كبادئة للسياق. مستوحى من هذه التطورات، قام الباحثون بتوسيع هذه التقنيات لتطوير نماذج متعددة الوسائط كبيرة (LMMs) بقدرات ICL. ومع ذلك، فإن تطبيق ICL عادة يواجه تحديين رئيسيين: 1) استخدام المزيد من ICDs يزيد بشكل كبير من وقت الاستنتاج و2) الأداء حساس لاختيار ICDs. تتفاقم هذه التحديات بشكل أكبر في LMMs بسبب دمج أنواع بيانات متعددة وتعقيد التوليف للـ ICDs متعددة الوسائط. مؤخرًا، لمواجهة هذه التحديات، قدمت بعض الدراسات في معالجة اللغات الطبيعية متجهات سياقية غير قابلة للتعلم (ICVs) التي تستخلص معلومات مهمة للمهمة من ICDs في متجه واحد ثم تُدرج في LLM لمساعدة في حل المهمة المقابلة. ومع ذلك، على الرغم من فائدتها في المهام البسيطة في NLP، تفشل هذه الطرق غير القابلة للتعلم في التعامل مع المهام المعقدة متعددة الوسائط مثل الإجابة على الأسئلة البصرية (VQA). في هذه الدراسة، نقترح متجه سياقي قابل للتعلم (L-ICV) لاستخلاص معلومات مهمة من العروض التوضيحية، مما يحسن أداء ICL في LMMs. تُظهر التجارب أن L-ICV يمكن أن يقلل بشكل كبير من التكاليف الحاسوبية مع تعزيز الدقة في مهام VQA مقارنة بـ ICL التقليدي وطرق ICV غير القابلة للتعلم الأخرى.
Building similarity graph...
Analyzing shared references across papers
Loading...
Yingzhe Peng
Chenduo Hao
Xu Yang
Building similarity graph...
Analyzing shared references across papers
Loading...
درس بينغ وآخرون (الثلاثاء) هذا السؤال.
www.synapsesocial.com/papers/68e64537b6db6435875d6f0e — DOI: https://doi.org/10.48550/arxiv.2406.13185
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: