Los puntos clave no están disponibles para este artículo en este momento.
A pesar de su impresionante rendimiento generativo, los métodos de prueba virtual de ropa (VTON) basados en modelos de difusión latente carecen de fidelidad a detalles cruciales de la ropa, como el estilo, el patrón y el texto. Para aliviar estos problemas causados por la naturaleza estocástica de la difusión y la supervisión latente, proponemos un novedoso Modelo de Difusión Latente Fiel para VTON, denominado FLDM-VTON. FLDM-VTON mejora el proceso convencional de difusión latente en tres aspectos principales. Primero, proponemos incorporar la ropa deformada como punto de partida y condición local, suministrando al modelo información previa fiel de la ropa. Segundo, introducimos una novedosa red de aplanamiento de ropa para restringir las imágenes generadas de prueba, proporcionando una supervisión fiel consistente con la ropa. Tercero, diseñamos un muestreo posterior de ropa para una inferencia fiel, mejorando aún más el rendimiento del modelo respecto al muestreo gaussiano convencional independiente de la ropa. Amplios resultados experimentales en los conjuntos de datos de referencia VITON-HD y Dress Code demuestran que nuestro FLDM-VTON supera a las líneas base del estado del arte y es capaz de generar imágenes de prueba foto-realistas con detalles de ropa fieles.
Building similarity graph...
Analyzing shared references across papers
Loading...
Chenhui Wang
Tao Chen
Zhihao Chen
Building similarity graph...
Analyzing shared references across papers
Loading...
Wang et al. (Mon,) estudiaron esta cuestión.
www.synapsesocial.com/papers/68e6e2eeb6db64358765ec5a — DOI: https://doi.org/10.48550/arxiv.2404.14162
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: