RÉSUMÉ La conception d'algorithmes de planification adaptatifs et conscients de l'énergie pour des flux de travail scientifiques est devenue de plus en plus importante à mesure que les systèmes de calcul haute performance (HPC) évoluent vers des architectures hétérogènes à grande échelle. Cet article propose PPO–KAN, un cadre hybride de planification de flux de travail qui intègre l'optimisation de politique proximale (PPO) avec des réseaux Kolmogorov–Arnold (KAN) afin d'optimiser conjointement le temps de réalisation et la consommation d'énergie. PPO permet l'apprentissage adaptatif des politiques dans des environnements de ressources dynamiques, tandis que la représentation de politique basée sur KAN améliore l'expressivité en modélisant des relations complexes non linéaires entre tâches et ressources. Le cadre proposé prend en charge trois formulations de récompense : axées sur le temps de réalisation, axées sur l'énergie et multi-objectifs pondérées, permettant un contrôle explicite sur les compromis d'optimisation. Des expériences approfondies menées sur quatre benchmarks de flux de travail scientifiques : Épigénomique (904 tâches), LIGO (922 tâches), Montage (902 tâches) et SIPHT (1004 tâches) - utilisant des clusters HPC hétérogènes simulés montrent que PPO–KAN réalise jusqu'à 41,7 % de réduction du temps de réalisation et 28,3 % de réduction de la consommation d'énergie par rapport à NSGA–II et PPO avec des réseaux de neurones à propagation avant. De plus, l'analyse de convergence montre un apprentissage plus rapide et plus stable, avec des politiques se stabilisant dans 50-100 épisodes. Des études d'ablation confirment également que les améliorations architecturales augmentent l'efficacité énergétique et la robustesse des politiques. Globalement, les résultats indiquent que PPO–KAN fournit une solution efficace et évolutive pour la planification de flux de travail multi-objectifs dans des environnements HPC hétérogènes.
Saurav et al. (Ven,) ont étudié cette question.