生成的人工知能の時代における大規模言語モデルベンチマークの不備 | Synapse