Key points are not available for this paper at this time.
تقدم النماذج المدربة مسبقًا على نطاق واسع والتي تعتمد على المقارنة بين الرؤية واللغة نموذج الصفر-شوت الذي يحقق أداء تنافسي عبر مجموعة من مهام تصنيف الصور دون الحاجة للتدريب على بيانات لاحقة. أكدت الأعمال الحديثة أنه في حين أن تحسين التعديل الإضافي للنموذج الصفر-شوت على بيانات المرجع يؤدي إلى تحسين الأداء اللاحق، فإنه يضر بمتانة النموذج تجاه تغييرات التوزيع. تبدأ تحقيقاتنا بفحص الشروط اللازمة لتحقيق أهداف التحسين الدقيق القوي، مستخدمين أوصافًا مبنية على نظرية تشويه الميزات والنماذج المشتركة القائمة على الطاقة. بعد ذلك، نقترح خوارزمية تحسين دقيق قوية جديدة، Lipsum-FT، تستفيد بفعالية من جانب نمذجة اللغة في النماذج المدربة مسبقًا للرؤية واللغة. تؤكد التجارب الواسعة التي أجريت على سيناريوهات تغير التوزيع في DomainNet وImageNet تفوق نهج Lipsum-FT المقترح مقارنة بأساليب التحسين الدقيق القوي الموجودة.
Building similarity graph...
Analyzing shared references across papers
Loading...
Giung Nam
Byeongho Heo
Ju Ho Lee
Building similarity graph...
Analyzing shared references across papers
Loading...
درس نام وآخرون هذه المسألة.
www.synapsesocial.com/papers/68e718ecb6db643587692396 — DOI: https://doi.org/10.48550/arxiv.2404.00860
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: