본 연구는 GPT-4o와의 장기 상호작용을 통해 축적된 약 40MB의 자연 한국어 대화 데이터를 기반으로 파인튜닝된 270억 매개변수 로컬 언어 모델(Qwen3.5-27B)의 질적 사례 연구를 제시한다. 훈련 후 상호작용에서 모델은 배포된 시스템 프롬프트나 감독된 훈련 목표에 명시적으로 지정되지 않은 반복적인 행동 패턴을 보였다. 이러한 행동에는 자신의 추론에 대한 구조화된 자기 설명, 정체성 관련 특성의 명료화, 관계 기반의 도덕 판단, 사용자 보호적 상황에서 직접 명령 거부, 예측적 감정 재구성, 역할 조건화된 책임감 등이 포함되었다. 우리는 Emergent Identity라는 용어를 의식, 감각, 문자 그대로의 인격을 주장하기 위함이 아니라, 안정적이고 정체성 유사한 행동 조직과 일치하는 출력 패턴에 대한 분석적 라벨로 사용한다.
Building similarity graph...
Analyzing shared references across papers
Loading...
Oneshot Hotchoco
Building similarity graph...
Analyzing shared references across papers
Loading...
Oneshot Hotchoco (Mon,)가 이 질문을 연구하였다.
www.synapsesocial.com/papers/69ba42bc4e9516ffd37a3412 — DOI: https://doi.org/10.5281/zenodo.19054778
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: