Große Denkmodelle (LRMs) wie OpenAI o1 und DeepSeek R1 haben beeindruckende Leistungen bei komplexen Denkaufgaben wie Mathematik und Programmierung mit langen Chain-of-Thought (CoT)-Denkketten (langsames Denken) gezeigt, im Vergleich zu traditionellen großen Sprachmodellen (schnelles Denken). Diese Denkmodelle stehen jedoch vor der Herausforderung, auch für triviale Fragen unnötig lange und redundante Denkketten zu erzeugen. Dieses Phänomen führt zu erheblichen Ressourcenverschwendungen bei der Inferenz, erhöht die Antwortzeiten bei einfachen Anfragen und behindert die praktische Anwendung von LRMs in realen Produkten. Daher ist es entscheidend, lange Denkketten zu verkürzen und adaptives Denken zwischen schnellem und langsamem Denken basierend auf der Eingabeschwierigkeit zu erlernen. In dieser Übersicht geben wir einen umfassenden Überblick über aktuelle Fortschritte im prägnanten und adaptiven Denken für effizientes Denken von LRMs, einschließlich Methodiken, Benchmarks und Herausforderungen für zukünftige Untersuchungen. Wir hoffen, dass diese Übersicht Forschern hilft, das Feld schnell zu überblicken und neue Ideen für adaptives Denken inspiriert, um eine bessere Nutzung von LRMs zu ermöglichen.
Building similarity graph...
Analyzing shared references across papers
Loading...
Ji Zhu
Hongyu Li
Building similarity graph...
Analyzing shared references across papers
Loading...
Zhu et al. (Sun,) haben diese Fragestellung untersucht.
www.synapsesocial.com/papers/68de5da283cbc991d0a20a18 — DOI: https://doi.org/10.48550/arxiv.2507.09662
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: