LLMLingua : Compression des invites pour une inférence accélérée des grands modèles de langage | Synapse