What question did this study set out to answer?

The central aim is to explore strategies for reducing token consumption in large language model-based software engineering agents without significantly affecting performance.

January 18, 2026Open Access

Reducing Token Usage of Software Engineering Agents

Key Points

The central aim is to explore strategies for reducing token consumption in large language model-based software engineering agents without significantly affecting performance.
Investigated strategies to reduce context size in software engineering agents.
Applied code-minification transformations to diminish non-essential lexical elements in code.
Integrated transformations into a software engineering agent and evaluated on SWE-bench Verified Benchmark using GPT-4.1 and GPT-5-mini.
Conducted experiments to compare average input token consumption before and after applying the transformations.
Minification strategies reduced average input token consumption by 42%.
Performance degradation was only 12% despite the reduction in token use.
Demonstrated significant efficiency gains with minimal impact on effectiveness.

Abstract

Auf LLMs basierende Agenten werden zunehmend eingesetzt, um Aufgaben in der Softwareentwicklung, wie die Behebung von Bugs oder die Implementierung neuer Funktionen, zu automatisieren. Solche Systeme müssen Informationen aus großen Code-Repositorien verarbeiten, wodurch ihr Arbeitskontext schnell anwächst. Ein langer Kontext ist jedoch teuer und kann die Modellleistung beeinträchtigen, da LLMs Schwierigkeiten haben, irrelevante Informationen zu ignorieren. Diese Arbeit untersucht Strategien zur Reduktion der Kontextgröße und damit des Tokenverbrauchs in Agenten für die Softwareentwicklung, bei möglichst geringem Einfluss auf die Performanz. Eine Voranalyse zeigt, dass Code-Tokens den größten Anteil des gesamten Tokenverbrauchs im gewählten Setup ausmachen. Aus diesem Grund schlagen wir vor, eine Reihe von Code-Minifikationstransformationen anzuwenden, die nicht essenzielle lexikalische Elemente entfernen oder verkürzen, ohne die Programmsemantik zu verändern. Die vorgeschlagenen Transformationen werden in einen Agenten für die Softwareentwicklung integriert und systematisch auf der SWE-bench Verified Benchmark, unter Verwendung von GPT-4.1 und GPT-5-mini, evaluiert. Die Experimente zeigen, dass Minifikation den durchschnittlichen Eingabe-Tokenverbrauch um 42% reduziert, bei einem Leistungsverlust von lediglich 12%. Diese Ergebnisse verdeutlichen, dass einfache Code-Transformationen erhebliche Effizienzgewinne bei gleichzeitig hoher Leistungsfähigkeit ermöglichen und somit einen vielversprechenden Ansatz für kosteneffizientere Agenten darstellen.

Read Full Paperexternally

Bookmark

View Full Paper

Cite This Study

Nicolas Hrubec (Mon,) studied this question.

synapsesocial.com/papers/696c776ceb60fb80d1395b20 https://doi.org/https://doi.org/10.34726/hss.2025.136382

Bookmark

View Full Paper