Modelos Dinâmicos Baseados em Difusão para Desdobramento de Longo Horizonte em Aprendizado por Reforço Offline | Synapse