Key points are not available for this paper at this time.
Ces dernières années ont vu une montée en popularité des produits commerciaux d'IA basés sur des systèmes d'IA génératifs et polyvalents promettant une approche unifiée pour intégrer des modèles d'apprentissage automatique (ML) dans la technologie. Cependant, cette ambition de « généralité » a un coût environnemental élevé, étant donné la quantité d'énergie requise par ces systèmes et la quantité de carbone qu'ils émettent. Dans ce travail, nous proposons la première comparaison systématique du coût d'inférence continue de différentes catégories de systèmes ML, couvrant à la fois les modèles spécifiques à une tâche (c'est-à-dire des modèles affinés exécutant une seule tâche) et les modèles « polyvalents » (c'est-à-dire ceux entraînés pour plusieurs tâches). Nous mesurons le coût de déploiement comme la quantité d'énergie et de carbone nécessaire pour effectuer 1 000 inférences sur un jeu de données de référence représentatif en utilisant ces modèles. Nous constatons que les architectures génératives polyvalentes sont d'un ordre de grandeur plus coûteuses que les systèmes spécifiques à une tâche pour diverses tâches, même en contrôlant le nombre de paramètres du modèle. Nous concluons par une discussion sur la tendance actuelle au déploiement de systèmes ML génératifs polyvalents et avertissons que leur utilité devrait être plus intentionnellement évaluée face à l'augmentation des coûts en termes d'énergie et d'émissions. Toutes les données de notre étude sont accessibles via une démo interactive permettant une exploration et une analyse approfondies.
Building similarity graph...
Analyzing shared references across papers
Loading...
Alexandra Sasha Luccioni
Yacine Jernite
Emma Strubell
Hugging Face
Building similarity graph...
Analyzing shared references across papers
Loading...
Luccioni et al. (Mon,) ont étudié cette question.
www.synapsesocial.com/papers/68e665ecb6db6435875f204e — DOI: https://doi.org/10.1145/3630106.3658542
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: