Les approches actuelles d'annotation des émotions musicales reposent encore largement sur le labelling manuel, un processus qui impose des charges importantes en ressources et en travail, limitant sévèrement l'échelle des données annotées disponibles. Cette étude examine la faisabilité et la fiabilité de l'utilisation d'un grand modèle de langage (GPT-4o) pour l'annotation des émotions dans la musique. Nous avons annoté GiantMIDI-Piano, une base de données de musique piano classique en MIDI, selon un cadre valence-arousal à quatre quadrants en utilisant GPT-4o, puis comparé ces annotations à celles de trois experts humains. Nous avons mené des évaluations approfondies pour mesurer la performance et la fiabilité des annotations émotionnelles générées par GPT, incluant l'exactitude standard, l'exactitude pondérée tenant compte de l'accord inter-experts, les métriques d'accord entre annotateurs, et la similarité distributionnelle des labels générés. Bien que les performances d'annotation de GPT soient inférieures à celles des experts humains en exactitude globale et manifestent moins de nuances dans la catégorisation des états émotionnels spécifiques, les métriques de fiabilité inter-évaluateurs indiquent que la variabilité de GPT reste dans la fourchette des désaccords naturels entre experts. Ces résultats soulignent à la fois les limites et le potentiel de l'annotation basée sur GPT : malgré ses insuffisances actuelles par rapport à la performance humaine, sa rentabilité et son efficacité en font une alternative évolutive prometteuse pour l'annotation des émotions musicales.
Building similarity graph...
Analyzing shared references across papers
Loading...
Meng Yang
Jon McCormack
Maria Teresa Llano
Building similarity graph...
Analyzing shared references across papers
Loading...
Yang et al. (Mon,) ont étudié cette question.
www.synapsesocial.com/papers/68d913a34ddcf71ba560ba06 — DOI: https://doi.org/10.48550/arxiv.2508.12626
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: