What type of study is this?

This is a Quantitative Study study.

September 23, 2025Open Access

CoMoE: 파라미터 효율적 미세조정을 위한 전문가 혼합 모델에서의 대비 표현

Key Points

CoMoE는 전문가 혼합의 용량을 향상시켜 모델 훈련에서 전문가 간의 더 나은 특수화를 촉진합니다.
실험 결과 다양한 벤치마크에서 성능 개선이 확인되어 이종 데이터셋에서의 향상된 성능을 시사합니다.
이 방법은 활성화된 전문가와 비활성화된 전문가 간 정보 격차를 회복하는 대비 학습 목표를 사용합니다.
본 연구는 전문가 용량을 최적으로 활용하기 위한 효과적인 모듈 훈련의 중요성을 강조합니다.

Abstract

파라미터 효율적 미세조정에서, 서로 다른 전문가에게 기능을 특화시키고 적절히 희소 활성화하는 전문가 혼합(MoE)은 모델 용량과 계산 부하 간의 균형을 맞추는 유망한 접근법으로 널리 채택되고 있습니다. 그러나 현재의 MoE 변형들은 전문가들이 유사한 지식을 학습할 수 있음을 간과하여 이종 데이터셋에서 한계가 있으며, 이로 인해 MoE 용량이 제대로 활용되지 못하고 있습니다. 본 논문에서는 CoMoE(Contrastive Representation for MoE)라는 새로운 방법을 제안하는데, 이는 top-k 라우팅으로 활성화된 전문가와 비활성화된 전문가를 샘플링하여 대비 학습 목표를 함께 훈련함으로써 MoE 내 모듈화와 특수화를 촉진합니다. 우리는 이러한 대비 학습 목표가 입력과 두 종류의 전문가 간 상호정보 격차를 회복함을 입증합니다. 여러 벤치마크 및 다중 작업 환경에서의 실험 결과, CoMoE가 MoE의 용량을 지속적으로 향상시키고 전문가 간의 모듈화를 촉진함을 보여줍니다.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Jinyuan Feng

Chaopeng Wei

Tenghai Qiu

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

CoMoE: 파라미터 효율적 미세조정을 위한 전문가 혼합 모델에서의 대비 표현

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider