Key points are not available for this paper at this time.
Textstiltransfer (TST) umfasst die Veränderung des sprachlichen Stils eines Textes bei gleichzeitiger Bewahrung seines Kerninhalts. Dieses Papier konzentriert sich auf den Sentimenttransfer, eine wichtige TST-Teilaufgabe (Mukherjee et al., 2022a), über ein Spektrum indischer Sprachen hinweg: Hindi, Magahi, Malayalam, Marathi, Punjabi, Odia, Telugu und Urdu, und baut auf früheren Arbeiten zum Englisch-Bangla Sentimenttransfer (Mukherjee et al., 2023) auf. Wir stellen spezielle Datensätze mit je 1.000 positiven und 1.000 negativen stil-parallelen Sätzen für jede dieser acht Sprachen vor. Anschließend bewerten wir die Leistung verschiedener Benchmark-Modelle, die in parallele, nicht-parallele, cross-linguale und gemeinsame Lernansätze kategorisiert sind, darunter die großen Sprachmodelle Llama2 und GPT-3.5 (LLMs). Unsere Experimente heben die Bedeutung paralleler Daten im TST hervor und zeigen die Effektivität des Masked Style Filling (MSF)-Ansatzes (Mukherjee et al., 2023) bei nicht-parallelen Techniken. Darüber hinaus zeigen cross-linguale und gemeinsame mehrsprachige Lernmethoden vielversprechende Ergebnisse und bieten Einblicke in die Auswahl optimaler Modelle, die auf die jeweilige Sprache und Aufgabenstellung zugeschnitten sind. Soweit wir wissen, stellt diese Arbeit die erste umfassende Untersuchung der TST-Aufgabe als Sentimenttransfer über eine vielfältige Sprachgruppe dar.
Building similarity graph...
Analyzing shared references across papers
Loading...
Sourabrata Mukherjee
Atul Kr. Ojha
Akanksha Bansal
Building similarity graph...
Analyzing shared references across papers
Loading...
Mukherjee et al. (Fr.,) untersuchten diese Fragestellung.
www.synapsesocial.com/papers/68e6785bb6db6435876029fd — DOI: https://doi.org/10.48550/arxiv.2405.20805
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: