Dieses Papier analysiert die Erhaltung von Invarianten in probabilistischen Inferenzsystemen, einschließlich großer Sprachmodelle, durch die Linse der Bayesschen Aktualisierung und Informationsgeometrie. Wir kontrastieren monotone Deduktion (bei der Schlussfolgerungen unter hinzugefügten Prämissen erhalten bleiben) mit nicht-monotoner Bayesscher Aktualisierung (bei der neue Evidenz das Vertrauen in die Posterioren verringern kann). Sequenzielle Aktualisierungen bilden einen multiplikativen Prozess, der durch das geometrische Mittel der Likelihood-Verhältnisse gesteuert wird. Wir zeigen, dass, wenn das erwartete Log-Likelihood-Verhältnis für die Erhaltung der Invariante negativ ist, die Posterior-Masse, die der invarianten Hypothese zugeordnet wird, exponentiell mit der Anzahl der Aktualisierungen abnimmt. Unter der Annahme, dass die Aktualisierungsevidenz von einer Hintergrund-"Median-Generator"-Verteilung Q generiert wird, die keine domänenspezifische Invariante kodiert, entspricht dieses erwartete Log-Likelihood-Verhältnis -DKL (Q || PH), wobei PH die invariantenerhaltende Verteilung darstellt. Dies identifiziert eine präzise hinreichende Bedingung für invarianten Drift in ausschließlich optimierungsbasierten Systemen ohne explizite Durchsetzung von Einschränkungen.
Building similarity graph...
Analyzing shared references across papers
Loading...
Alwyn Aswin
Advanced Research Projects Agency - Energy
Building similarity graph...
Analyzing shared references across papers
Loading...
Alwyn Aswin (Fr,) untersuchte diese Fragestellung.
www.synapsesocial.com/papers/69a3d8b8ec16d51705d2fde6 — DOI: https://doi.org/10.5281/zenodo.18807898
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: