Energieüberlegungen bei der Inferenz großer Sprachmodelle und Effizienzoptimierungen | Synapse