Los puntos clave no están disponibles para este artículo en este momento.
Proponemos la política de compositor experto, un marco para expandir confiablemente el repertorio de habilidades de agentes cuadrúpedos. La política de compositor vincula pares de expertos mediante transiciones hacia un estado objetivo muestreado, permitiendo componer expertos de manera secuencial. Cada experto se especializa en una sola habilidad, como un patrón de locomoción o un movimiento de salto. En lugar de una arquitectura jerárquica o mezcla de expertos, entrenamos una única política de compositor en un proceso independiente que no está condicionado por las políticas de expertos. Al reutilizar la misma política de compositor, nuestro enfoque permite agregar nuevos expertos sin afectar a los existentes, posibilitando una expansión incremental del repertorio y preservando la calidad del movimiento original. Medimos la tasa de éxito de transición de 72 pares de transición y alcanzamos una tasa promedio de éxito del 99.99 %, que es más del 10 % superior al enfoque aleatorio base y supera a otros métodos de última generación. Usando randomización de dominio durante el entrenamiento aseguramos una transferencia exitosa al mundo real, donde logramos una tasa promedio de éxito de transición del 97.22 % (N=360) en nuestros experimentos.
Building similarity graph...
Analyzing shared references across papers
Loading...
Guilherme Christmann
Ying‐Sheng Luo
Wei‐Chao Chen
Building similarity graph...
Analyzing shared references across papers
Loading...
Christmann et al. (Sun,) estudiaron esta cuestión.
www.synapsesocial.com/papers/68e73a8db6db6435876b49a3 — DOI: https://doi.org/10.48550/arxiv.2403.11412
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: