SqueezeAttention: Gestão 2D do KV-Cache na Inferência de LLM via Orçamento Óptimo por Camada | Synapse