What type of study is this?

This is a Experimental Study study.

October 16, 2025Open Access

潜在原型路由：实现在专家混合模型中的近乎完美负载均衡

Key Points

潜在原型路由显著改善了专家混合架构的负载均衡，实现了近乎完美的专家利用率。
实验显示，LPR将专家负载的基尼系数从0.70降低至0.035，显示了负载均衡的显著提升。
提出的方法采用了关于专家路由的新颖聚类视角，提供了一种有效解决负载不均衡的新途径。
专家负载的最小-最大比从1e-6改善至0.70，凸显了LPR在优化模型容量利用率方面的效果。

Abstract

专家混合（MoE）架构已成为高效扩展大型语言模型（LLMs）的关键策略。然而，当前的MoE系统存在严重的负载不均衡问题，训练和推理过程中仅有一小部分专家被持续激活，导致模型容量和计算资源的大量未充分利用。本文从聚类视角重新审视专家路由，提出潜在原型路由（LPR），这是一种新颖的路由框架，能够泛化现有方法，同时促进专家的均衡利用而不影响下游性能。在包括DeepSeek-V3、Qwen3-MoE和Mixtral等多个开源MoE模型上的大量实验表明，LPR将专家负载的基尼系数从0.70降低至平均0.035，最小-最大专家负载比从1e-6提升至0.70，实现了近乎完美的负载均衡。

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Jinge Yang

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

潜在原型路由：实现在专家混合模型中的近乎完美负载均衡

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider