이 입장문은 대형 언어 모델(LLM) 기반 사회 시뮬레이션이 사회 과학 연구에 의미 있는 기여를 하기 위해 명확한 경계를 설정해야 한다고 주장한다. LLM은 전통적인 에이전트 기반 모델링에 비해 인간과 유사한 에이전트를 모델링할 수 있는 유망한 능력을 제공하지만, 사회적 패턴 발견에 있어 신뢰성을 제한하는 근본적인 한계에 직면해 있다. 핵심 문제는 LLM이 충분한 행동적 이질성이 결여된 ‘평균 페르소나’ 경향을 보인다는 점인데, 이는 복잡한 사회 역학을 시뮬레이션하기 위한 중요한 요구 사항이다. 우리는 세 가지 주요 경계 문제, 즉 정렬(시뮬레이션된 행동이 현실 세계 패턴과 일치), 일관성(시간에 걸쳐 일관된 에이전트 행동 유지), 견고성(다양한 조건 하에서 재현 가능성)을 살펴본다. 우리는 LLM 기반 시뮬레이션이 사회 과학 이해를 신뢰성 있게 진전시킬 수 있는 시기를 결정하기 위한 휴리스틱 경계를 제안한다. 이러한 시뮬레이션은 (1) 개별 경로보다는 집단 패턴에 집중할 때, (2) 제한된 분산에도 불구하고 실제 인구 평균과 일치하는 에이전트 행동에 초점을 맞출 때, (3) 시뮬레이션 견고성을 시험할 수 있는 적절한 검증 방법이 있을 때 더욱 가치가 있다고 본다. 연구자가 LLM 기반 사회 시뮬레이션의 적절한 범위와 주장 판단을 안내할 수 있는 실용적 체크리스트를 제공한다.
Building similarity graph...
Analyzing shared references across papers
Loading...
Zhisheng Wu
Run Peng
Takumi Ito
Building similarity graph...
Analyzing shared references across papers
Loading...
Wu 등(Tue,)이 이 문제를 연구하였다.
www.synapsesocial.com/papers/68de84c45b556a9128e1bfbc — DOI: https://doi.org/10.48550/arxiv.2506.19806
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: