What type of study is this?

This is a Quantitative Study study.

October 20, 2025Open Access

LLM에서의 앵커링 효과에 대한 실증 연구: 존재, 메커니즘, 그리고 잠재적 완화 방법

Key Points

LLM은 일반적으로 앵커링 효과를 나타내어 초기 정보에 의존하여 판단함을 의미합니다.
본 연구는 SynAnchors 데이터셋을 도입하고 세밀화된 평가 지표를 사용하여 인기 있는 LLM을 벤치마킹합니다.
기존 전략들은 앵커링 편향을 제거하지 못하였으며, 평가에 인지 심리학적 통찰이 필요함을 강조합니다.
추론이 앵커링 편향 완화에 잠재력을 보이며, LLM 평가 개선의 길을 제시합니다.

Abstract

ChatGPT와 같은 대형 언어 모델(LLM)의 등장은 자연어 처리를 발전시켰지만, 인지 편향에 대한 우려도 커지고 있습니다. 본 논문에서는 첫 정보에 과도하게 의존하여 영향받은 판단을 내리는 인지 편향인 앵커링 효과를 조사합니다. LLM이 앵커링의 영향을 받는지, 그 기저 메커니즘과 잠재적 완화 전략을 탐구합니다. 앵커링 효과에 대한 대규모 연구를 촉진하기 위해 새로운 데이터셋 SynAnchors를 도입합니다. 세밀하게 다듬어진 평가 지표를 결합하여 현 널리 사용되는 LLM을 벤치마킹했습니다. 연구 결과, LLM에서 앵커링 편향이 흔히 존재하며 얕은 층에서 작용하고 기존 전략으로는 제거되지 않으나, 추론은 일부 완화를 제공할 수 있음을 보여줍니다. 인지심리학을 통한 이러한 재맥락화는 LLM 평가가 표준 벤치마크나 과도하게 최적화된 견고성 테스트에 집중할 것이 아니라, 인지 편향을 인지하는 신뢰성 평가에 집중할 것을 촉구합니다.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Yiming Huang

Biquan Bie

Z Na

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

LLM에서의 앵커링 효과에 대한 실증 연구: 존재, 메커니즘, 그리고 잠재적 완화 방법

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider