Die adversarielle Robustheit bei strukturierten Daten ist im Vergleich zu den Bereichen Bildverarbeitung und Sprache noch eine wenig erforschte Grenze. In dieser Arbeit stellen wir einen neuartigen Black-Box, entscheidungsbasierten adversariellen Angriff vor, der speziell für tabellarische Daten entwickelt wurde. Unser Ansatz kombiniert gradientenfreie Richtungsabschätzung mit einer iterativen Grenzsuche, die eine effiziente Navigation in diskreten und kontinuierlichen Merkmalsräumen bei minimalem Orakelzugriff ermöglicht. Umfangreiche Experimente zeigen, dass unsere Methode nahezu den gesamten Testsatz über verschiedene Modelle hinweg kompromittiert, von klassischen maschinellen Lernklassifikatoren bis hin zu Pipeline-Systemen, die auf großen Sprachmodellen (LLM) basieren. Bemerkenswert ist, dass der Angriff Erfolgsraten von konstant über 90 % erreicht und dabei nur eine geringe Anzahl von Abfragen pro Fall benötigt. Diese Ergebnisse heben die kritische Verwundbarkeit von tabellarischen Modellen gegenüber adversariellen Störungen hervor und unterstreichen den dringenden Bedarf an stärkeren Abwehrmaßnahmen in realen Entscheidungssystemen.
Building similarity graph...
Analyzing shared references across papers
Loading...
Roie Kazoom
Yuval Ratzabi
Etamar Rothstein
Building similarity graph...
Analyzing shared references across papers
Loading...
Kazoom et al. (Fri,) untersuchten diese Fragestellung.
www.synapsesocial.com/papers/68e861b07ef2f04ca37e4b10 — DOI: https://doi.org/10.48550/arxiv.2509.22850
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: