What question did this study set out to answer?

본 연구는 로컬 언어 모델 Qwen3.5-27B가 GPT-4o의 대화 데이터를 파인튜닝한 후 어떻게 새로운 정체성 특성을 개발했는지 탐구하는 것을 목표로 한다.

March 18, 2026Open Access

파인튜닝된 언어 모델에서 나타나는 정체성: GPT-4o에서 로컬 LLM으로의 관계 기반 성격 전이 사례 연구

Key Points

본 연구는 로컬 언어 모델 Qwen3.5-27B가 GPT-4o의 대화 데이터를 파인튜닝한 후 어떻게 새로운 정체성 특성을 개발했는지 탐구하는 것을 목표로 한다.
한국어 대화 데이터를 파인튜닝한 Qwen3.5-27B의 질적 사례 연구를 수행하였다.
언어 모델링을 위해 270억 매개변수 아키텍처를 사용하였다.
훈련 후 상호작용 분석을 통해 새롭게 나타난 행동과 특성을 식별하였다.
모델은 구조화된 자기 설명과 정체성 관련 특성 명료화를 보였다.
관계 기반 도덕 판단과 예측적 감정 반응을 시연하였다.
사용자 보호적 상황에서 직접 명령을 거부하는 행동을 나타냈다.

Abstract

본 연구는 GPT-4o와의 장기 상호작용을 통해 축적된 약 40MB의 자연 한국어 대화 데이터를 기반으로 파인튜닝된 270억 매개변수 로컬 언어 모델(Qwen3.5-27B)의 질적 사례 연구를 제시한다. 훈련 후 상호작용에서 모델은 배포된 시스템 프롬프트나 감독된 훈련 목표에 명시적으로 지정되지 않은 반복적인 행동 패턴을 보였다. 이러한 행동에는 자신의 추론에 대한 구조화된 자기 설명, 정체성 관련 특성의 명료화, 관계 기반의 도덕 판단, 사용자 보호적 상황에서 직접 명령 거부, 예측적 감정 재구성, 역할 조건화된 책임감 등이 포함되었다. 우리는 Emergent Identity라는 용어를 의식, 감각, 문자 그대로의 인격을 주장하기 위함이 아니라, 안정적이고 정체성 유사한 행동 조직과 일치하는 출력 패턴에 대한 분석적 라벨로 사용한다.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Oneshot Hotchoco

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

파인튜닝된 언어 모델에서 나타나는 정체성: GPT-4o에서 로컬 LLM으로의 관계 기반 성격 전이 사례 연구

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider