RRHF: मानव प्रतिक्रिया के साथ भाषा मॉडलों को संरेखित करने के लिए प्रतिक्रियाओं को रैंक करें, आसानी से | Synapse