Cached Transformers: Verbesserung von Transformern mit differenzierbarem Speicher-Cache | Synapse