What question did this study set out to answer?

The aim is to develop a model-independent method for creating personalized explanations that enhance understanding of AI models.

March 8, 2026Open Access

Information theory for personalised explainable AI

Key Points

The aim is to develop a model-independent method for creating personalized explanations that enhance understanding of AI models.
Developed a framework based on information theory for generating user-adaptive explanations.
Conducted experiments with simulated users varying in model understanding.
Utilized information-theoretic metrics to measure improvement in understanding.
Addressed output encoding issues related to previous explanation methods.
Demonstrated that personalized explanations significantly improved model understanding among users.
Identified and provided solutions for output encoding problems in existing explanation frameworks.

Abstract

Ein wichtiger Aspekt der weit verbreiteten Verwendung von AI-Modellen ist die steigende Nachfrage nach ihrer Interpretierbarkeit, weshalb erklärbare künstliche Intelligenz (XAI) in den letzten Jahren einen sprunghaften Anstieg des Interesses verzeichnet hat. Infolgedessen bringt der Bereich der XAI ständig eine Vielzahl von Methoden hervor, um Erklärungen für die ständig wachsende Zahl der eingesetzten AI-Modelle zu liefern. Viele dieser Methoden behaupten, das Verständnis dieser Modelle durch ihre Nutzer zu verbessern, liefern jedoch keine quantitative Begründung in Form einer theoretischen Motivation oder einer rigorosen Evaluation für diese Behauptung. Um diesen Mangel an fundierten Erklärungsmethoden zu beheben, stellt diese Masterarbeit auf der Grundlage von Begriffen aus der Informationstheorie die unseres Wissens nach erste modellunabhängige Methode zur Erstellung lokaler, nutzeradaptiver Erklärungen vor. Unsere Methode ermöglicht es den Nutzern, ihr Modellverständnis durch personalisierte Erklärungen zu verbessern, die an ihr vorhandenes Wissen über das Modell angepasst sind, und wird durch eine starke theoretische Begründung und strenge Evaluierungsmethoden untermauert, die zusammen mit ihr eingeführt werden. Um die Nutzeradaptivität unserer Erklärungsmethode zu demonstrieren, führen wir Experimente mit einer Reihe von simulierten Nutzern durch, die verschiedene Niveaus des Modellverständnisses repräsentieren, und verwenden informationstheoretische Metriken, um die durch die Erklärungen erzielte Verbesserung des Modellverständnisses zu messen. Da es außerdem notwendig ist um die Richtigkeit der mit unserer Methode erstellten Erklärungen sicherzustellen, identifizieren wir das Problem des output encoding in Erklärungen, die mit dem L2X-Framework (Chen et al., 2018) erstellt wurden, entwickeln informationstheoretische Werkzeuge, um es zu beheben, und liefern eine empirische Charakterisierung seines Auftretens. Insgesamt leistet diese Arbeit einen Beitrag dazu, Nutzern ein besseres Verständnis der von ihnen verwendeten AI-Modelle zu ermöglichen und unser informationstheoretisches Verständnis von Erklärungen für AI-Modelle insgesamt zu verbessern.

Read Full Paperexternally

Bookmark

View Full Paper

Cite This Study

Lukas Anton Karner (Thu,) studied this question.

synapsesocial.com/papers/69ada8c2bc08abd80d5bc102 https://doi.org/https://doi.org/10.25365/thesis.80574

Bookmark

View Full Paper