What type of study is this?

This is a Quantitative Study study.

September 29, 2025Open Access

생각할까요 아니면 말까요? 정보 이론적 관점에서 본 대규모 추론 모델의 사고 효율성 탐구

Key Points

긴 추론 연쇄는 높은 정보 편향과 낮은 정보 획득을 보여 비효율성을 나타냅니다.
제안된 적응형 사고 전략은 효율성을 개선하며, 정확도는 1.10% 향상되고 토큰 사용량은 50.80% 감소합니다.
6개 벤치마크 과제에 대한 실험 분석에서 기존 방법 대비 우수한 추론 성능을 입증했습니다.
본 연구 결과는 다양한 응용에서 대규모 추론 모델 최적화를 위한 엔트로피 기반 기법의 잠재력을 강조합니다.

Abstract

최근 대규모 추론 모델(LRMs)의 부상은 다단계 추론 성능을 크게 향상시켰으나, 종종 지나치게 긴 추론 연쇄를 생성하는 비용을 수반합니다. 본 논문은 정보 이론적 관점에서 이러한 추론 과정의 효율성을 재고하며, 추론 길이와 의미적 효율성 간의 근본적 상충관계를 밝혀냅니다. 우리는 이상적인 추론 경로와의 편차 및 단계별 정보 기여도를 각각 정량화하기 위해 InfoBias와 InfoGain 두 가지 지표를 제안합니다. 실험 분석 결과, 긴 추론 연쇄는 특히 오답에 대해 정보 편향이 크고 정보 획득이 감소하는 경향이 나타났습니다. 이러한 발견에 기반하여, 우리는 신뢰도가 충분히 높아지면 동적으로 추론을 중단하는 엔트로피 기반 적응형 사고 전략을 도입하여 경쟁력 있는 정확도를 유지하면서 효율성을 향상시켰습니다. 기본 모드인 Vanilla Think 방식과 비교할 때, 우리의 전략은 QwQ-32B에서 6개 벤치마크 과제로 구성된 다양한 추론 유형과 난이도에 걸쳐 평균 정확도를 1.10% 향상시키고 토큰 사용량을 50.80% 감소시켜 뛰어난 효율성과 추론 성능을 입증했습니다. 이러한 결과는 대형 언어 모델 배치 시 정확도와 비용 효율성을 동시에 향상시킬 수 있는 엔트로피 기반 방법의 가능성을 강조합니다.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Xixian Yong

Xiao Zhou

Yingying Zhang

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

생각할까요 아니면 말까요? 정보 이론적 관점에서 본 대규모 추론 모델의 사고 효율성 탐구

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider