Bewertung der Zuverlässigkeit von Selbsterklärungen in großen Sprachmodellen | Synapse