Key points are not available for this paper at this time.
Nous avons testé la robustesse des modèles de détection du sarcasme en examinant leur comportement lorsqu'ils sont affinés sur quatre ensembles de données de sarcasme contenant des caractéristiques variées de sarcasme : source des étiquettes (auteurs vs tiers), domaine (médias sociaux/en ligne vs conversations/dialogues hors ligne), style (moquerie agressive vs humoristique). Nous avons testé leur performance de prédiction sur le même ensemble de données (intra-ensemble) et à travers différents ensembles (cross-ensemble). Pour les prédictions intra-ensemble, les modèles ont systématiquement mieux performé lorsqu'ils étaient affinés avec des étiquettes tierces plutôt qu'avec des étiquettes d'auteurs. Pour les prédictions cross-ensemble, la plupart des modèles n'ont pas réussi à bien généraliser aux autres ensembles, ce qui implique qu'un type d'ensemble ne peut pas représenter tous les types de sarcasme avec différents styles et domaines. Comparativement aux ensembles existants, les modèles affinés sur le nouvel ensemble que nous publions dans ce travail ont montré la généralisation la plus élevée à d'autres ensembles. Avec une inspection manuelle des ensembles et une analyse post-hoc, nous avons attribué la difficulté de généralisation au fait que le sarcasme existe en réalité dans différents domaines et styles. Nous soutenons que les recherches futures sur le sarcasme devraient prendre en compte l'étendue large du sarcasme.
Building similarity graph...
Analyzing shared references across papers
Loading...
Hyewon Jang
Diego Frassinelli
Building similarity graph...
Analyzing shared references across papers
Loading...
Jang et al. (Tue,) ont étudié cette question.
www.synapsesocial.com/papers/68e6febab6db643587679021 — DOI: https://doi.org/10.48550/arxiv.2404.06357
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: