Tensor Attention Training: Nachweislich effizientes Lernen höherwertiger Transformer | Synapse