SurgXBench:手術のための説明可能な視覚言語モデルベンチマーク | Synapse