LLMs são agentes gananciosos: Efeitos do ajuste fino por RL nas habilidades de tomada de decisão | Synapse