Ein wichtiger Aspekt der weit verbreiteten Verwendung von AI-Modellen ist die steigende Nachfrage nach ihrer Interpretierbarkeit, weshalb erklärbare künstliche Intelligenz (XAI) in den letzten Jahren einen sprunghaften Anstieg des Interesses verzeichnet hat. Infolgedessen bringt der Bereich der XAI ständig eine Vielzahl von Methoden hervor, um Erklärungen für die ständig wachsende Zahl der eingesetzten AI-Modelle zu liefern. Viele dieser Methoden behaupten, das Verständnis dieser Modelle durch ihre Nutzer zu verbessern, liefern jedoch keine quantitative Begründung in Form einer theoretischen Motivation oder einer rigorosen Evaluation für diese Behauptung. Um diesen Mangel an fundierten Erklärungsmethoden zu beheben, stellt diese Masterarbeit auf der Grundlage von Begriffen aus der Informationstheorie die unseres Wissens nach erste modellunabhängige Methode zur Erstellung lokaler, nutzeradaptiver Erklärungen vor. Unsere Methode ermöglicht es den Nutzern, ihr Modellverständnis durch personalisierte Erklärungen zu verbessern, die an ihr vorhandenes Wissen über das Modell angepasst sind, und wird durch eine starke theoretische Begründung und strenge Evaluierungsmethoden untermauert, die zusammen mit ihr eingeführt werden. Um die Nutzeradaptivität unserer Erklärungsmethode zu demonstrieren, führen wir Experimente mit einer Reihe von simulierten Nutzern durch, die verschiedene Niveaus des Modellverständnisses repräsentieren, und verwenden informationstheoretische Metriken, um die durch die Erklärungen erzielte Verbesserung des Modellverständnisses zu messen. Da es außerdem notwendig ist um die Richtigkeit der mit unserer Methode erstellten Erklärungen sicherzustellen, identifizieren wir das Problem des output encoding in Erklärungen, die mit dem L2X-Framework (Chen et al., 2018) erstellt wurden, entwickeln informationstheoretische Werkzeuge, um es zu beheben, und liefern eine empirische Charakterisierung seines Auftretens. Insgesamt leistet diese Arbeit einen Beitrag dazu, Nutzern ein besseres Verständnis der von ihnen verwendeten AI-Modelle zu ermöglichen und unser informationstheoretisches Verständnis von Erklärungen für AI-Modelle insgesamt zu verbessern.
Lukas Anton Karner (Thu,) studied this question.