Key points are not available for this paper at this time.
حظي توليد النص إلى صورة المخصص باهتمام كبير لقدراته على توليد بورتريهات عالية الدقة لهويات محددة بناءً على مطالبات يعرفها المستخدم. عادةً ما تشمل الطرق الحالية تعديلًا دقيقًا أثناء الاختبار أو إدخال فرع مدرب مسبقًا إضافي. ومع ذلك، تواجه هذه الأساليب صعوبة في تلبية متطلبات الكفاءة، ودقة الهوية، والحفاظ على القدرات التوليدية الأصلية للنموذج في الوقت نفسه. في هذه الورقة، نقترح DiffLoRA، نهجًا جديدًا يستفيد من نماذج الانتشار كشبكة فائقة لتوقع أوزان التكيف منخفضة الرتبة (LoRA) المخصصة استنادًا إلى الصور المرجعية. من خلال دمج هذه الأوزان في نموذج النص إلى صورة، يحقق DiffLoRA التخصيص أثناء الاستدلال دون الحاجة لتدريب إضافي. بالإضافة إلى ذلك، نقترح خط أنابيب بناء أوزان LoRA موجهة نحو الهوية لتسهيل تدريب DiffLoRA. باستخدام مجموعة البيانات التي ينتجها هذا الخط، يقوم DiffLoRA بانتظام بتوليد أوزان LoRA ذات أداء عال ودقة مرتفعة. تظهر التقييمات الشاملة فعالية طريقتنا، محققة كفاءة زمنية مع الحفاظ على دقة الهوية طوال عملية التخصيص.
Building similarity graph...
Analyzing shared references across papers
Loading...
Yujia Wu
Yiming Shi
Jiwei Wei
Building similarity graph...
Analyzing shared references across papers
Loading...
درس وو وزملاؤه (الثلاثاء،) هذا السؤال.
www.synapsesocial.com/papers/68e5c971b6db64358755f94e — DOI: https://doi.org/10.48550/arxiv.2408.06740
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: