Självkorrigerande belöningsutformning med språkmodeller för förstärkningsinlärningsagenter i spel | Synapse