What type of study is this?

This is a Quantitative Study study.

October 3, 2025Open Access

Methode zur Erkennung adversarieller Angriffe bei tabellarischen Daten

Key Points

Die Methode erkennt sowohl bekannte als auch unbekannte adversarielle Angriffe effizient mit hoher balancierter Genauigkeit.
Analysen bei 22 Datensätzen zeigten niedrige false negative Raten zwischen 0,02 und 0,10 in der binären Detektion.
Der Einsatz eines Surrogatmodells verbessert die Erkennung subtiler adversarieller Angriffe auf Machine-Learning-Modelle.
Der Ansatz betont die Notwendigkeit effektiver Abwehrmaßnahmen gegen Bedrohungen der Integrität von Machine Learning.

Abstract

Adversarielle Angriffe beinhalten, dass böswillige Akteure absichtliche Störungen in Machine-Learning (ML)-Modelle einführen, was unbeabsichtigtes Verhalten verursacht. Dies stellt eine erhebliche Bedrohung für die Integrität und Vertrauenswürdigkeit von ML-Modellen dar und erfordert die Entwicklung robuster Erkennungstechniken, um Systeme vor potenziellen Gefahren zu schützen. Das Paper schlägt einen neuen Ansatz zur Erkennung adversarieller Angriffe vor, der ein Surrogatmodell und diagnostische Attribute nutzt. Die Methode wurde auf 22 tabellarischen Datensätzen getestet, auf denen vier verschiedene ML-Modelle trainiert wurden. Zudem wurden verschiedene Angriffe durchgeführt, die zu manipulierten Daten führten. Der vorgeschlagene Ansatz zeichnet sich durch eine hohe Effizienz bei der Erkennung bekannter und unbekannter Angriffe aus – die balancierte Genauigkeit lag über 0,94, bei sehr niedrigen false negative Raten (0,02–0,10) in der binären Detektion. Sensitivitätsanalysen zeigen, dass auf diagnostischen Attributen trainierte Klassifikatoren auch sehr subtile adversarielle Angriffe erkennen können.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Łukasz Wawrowski

Piotr Biczyk

Dominik Ślęzak

Journals

Machine Learning and Knowledge Extraction

Actions

Institutions

University of Warsaw

University of Silesia in Katowice

Silesian University of Technology

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Methode zur Erkennung adversarieller Angriffe bei tabellarischen Daten

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Journals

Actions

Institutions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider