Sparsamer ist schneller und weniger ist mehr: Effiziente sparse Attention für Langstrecken-Transformer | Synapse