100-LongBench: Bewerten de facto Long-Context-Benchmarks buchstäblich die Fähigkeit zum Umgang mit langem Kontext? | Synapse