What type of study is this?

This is a Experimental Study study.

October 16, 2025Open Access

잠재 프로토타입 라우팅: 전문가 혼합(Mixture-of-Experts)에서 거의 완벽한 부하 분산 달성

Key Points

잠재 프로토타입 라우팅은 전문가 혼합 아키텍처의 부하 분산을 크게 향상시켜 거의 완벽한 전문가 활용을 달성합니다.
실험 결과 LPR은 전문가 부하의 지니 계수를 0.70에서 0.035로 감소시켜 부하 분산을 상당히 향상시켰음을 보여줍니다.
제안된 방법은 전문가 라우팅에 새로운 클러스터링 관점을 적용하여 부하 불균형 문제를 효과적으로 해결하는 새로운 접근법을 제공합니다.
최소-최대 전문가 부하 비율을 1e-6에서 0.70으로 개선한 점은 LPR이 모델 용량 활용 최적화에 효과적임을 강조합니다.

Abstract

전문가 혼합(MoE) 아키텍처는 대형 언어 모델(LLM)을 효율적으로 확장하기 위한 핵심 전략으로 부상했습니다. 그러나 현재 MoE 시스템은 심각한 부하 불균형 문제를 겪고 있으며, 훈련 및 추론 과정에서 소수의 전문가만 일관되게 활성화되어 모델 용량과 계산 자원이 크게 저활용되고 있습니다. 본 연구에서는 클러스터링 관점에서 전문가 라우팅을 재검토하고, 기존 방식을 일반화하면서도 하위 작업 성능을 저해하지 않고 전문가 활용의 균형을 촉진하는 새로운 라우팅 프레임워크인 잠재 프로토타입 라우팅(LPR)을 제안합니다. DeepSeek-V3, Qwen3-MoE, Mixtral을 포함한 다수의 오픈소스 MoE 모델에 대한 광범위한 실험 결과, LPR은 전문가 부하의 지니 계수를 평균 0.70에서 0.035로 감소시키고, 최소-최대 전문가 부하 비율을 1e-6에서 0.70으로 개선하여 거의 완벽한 부하 분산을 달성함을 보여줍니다.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Jinge Yang

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

잠재 프로토타입 라우팅: 전문가 혼합(Mixture-of-Experts)에서 거의 완벽한 부하 분산 달성

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider