Key points are not available for this paper at this time.
व्यक्तिगतकरण टेक्स्ट-टू-इमेज जनरेशन में एक महत्वपूर्ण विषय है, विशेषतः चुनौतीपूर्ण बहु-संकल्पना व्यक्तिगतकरण। वर्तमान बहु-संकल्पना विधियाँ पहचान संरक्षण, अवरोध और अग्रभूमि व पृष्ठभूमि के बीच सामंजस्य को लेकर संघर्ष कर रही हैं। इस कार्य में, हम OMG प्रस्तावित करते हैं, एक अवरोध-सहज व्यक्तिगत सृजन फ्रेमवर्क जिसे एक ही छवि में कई संकल्पनाओं को सहजता से सम्मिलित करने के लिए डिजाइन किया गया है। हम एक नवीन दो-चरण नमूना समाधान प्रस्तुत करते हैं। पहला चरण लेआउट सृजन और दृश्य समझ जानकारी एकत्रित करने का प्रभारी है ताकि अवरोधों को संभाल सके। दूसरा चरण प्राप्त दृश्य समझ जानकारी और डिज़ाइन किए गए शोर मिश्रण का उपयोग करके अवरोधों को ध्यान में रखते हुए कई संकल्पनाओं को एकीकृत करता है। हमने यह भी पाया कि शोर मिश्रण के लिए आरंभिक डिनॉइजिंग टाइमस्टेप पहचान संरक्षण और लेआउट के लिए महत्वपूर्ण है। इसके अतिरिक्त, हमारी विधि विभिन्न एक-संकल्पना मॉडलों जैसे LoRA और InstantID के साथ बिना अतिरिक्त ट्यूनिंग के संयोजित की जा सकती है, विशेषतः civitai.com पर उपलब्ध LoRA मॉडलों का सीधे उपयोग किया जा सकता है। व्यापक प्रयोगों से पता चलता है कि OMG बहु-संकल्पना व्यक्तिगतकरण में श्रेष्ठ प्रदर्शन प्रदर्शित करता है।
Building similarity graph...
Analyzing shared references across papers
Loading...
Zhe Kong
Yong Zhang
Tianyu Yang
Building similarity graph...
Analyzing shared references across papers
Loading...
कांग et al. (Sat,) ने इस प्रश्न का अध्ययन किया।
www.synapsesocial.com/papers/68e73cb2b6db6435876b5bbb — DOI: https://doi.org/10.48550/arxiv.2403.10983
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: