Reconfigurer le raisonnement dans les LLM : une analyse théorique de la dynamique d'entraînement par RL via la sélection de schémas | Synapse