Charakterisierung von Leistungs-Energie-Abwägungen großer Sprachmodelle in Multi-Request-Workflows | Synapse