Obwohl Computer Vision-Lösungen durch Künstliche Intelligenz revolutioniert wurden, stoßen auch diese Systeme an ihre Grenzen. KI-basierte Algorithmen des maschinellen Lernens benötigen große Datenmengen für ihr Training, deren Mangel einen erheblichen Engpass im Trainingsprozess darstellen kann. Ein Lösungsansatz besteht darin, mithilfe verschiedener Computer-Algorithmen synthetische Daten zu erzeugen. Diese sind zwar möglicherweise weniger genau als reale Daten, aber deutlich leichter zugänglich. In dieser Arbeit untersuche ich eine mögliche Methodik zur Generierung synthetischer Daten, insbesondere im Hinblick auf deren Verwendung zum Trainieren von Software zur Graffiti-Erkennung im Eisenbahnbereich. Graffiti können Eisenbahnunternehmen Probleme bereiten, da sie Züge beschädigen, zu einem negativen öffentlichen Image des Unternehmens führen und notwendige Markierungen und Schilder verdecken können, die außen an den Zügen sichtbar sein müssen. Daher wäre ein System, das das Unternehmen automatisch über Graffiti an Zügen informiert, von großem Nutzen. Allerdings existieren keine großen öffentlichen Datensätze mit Bildern von Zügen mit Graffiti. Da Graffiti zudem in Form, Größe und Farbe sehr vielfältig sind, sollte ein entsprechender Datensatz eine ähnliche Vielfalt aufweisen. Diese Arbeit zeigt die Machbarkeit der Erzeugung synthetischer Graffiti mithilfe von Computerprogrammen, die die Objekterkennung beschleunigen können. Die Graffiti werden hierfür mit einem Online-Tool zur KI-gestützten Text-zu-Bild-Konvertierung generiert. Ein umfangreicher Trainings-datensatz mit Segmentierungsmasken wird verwendet, und mithilfe dieser Masken werden die Graffiti überlagert. Dieser neu erstellte Datensatz dient anschließend zum Trainieren eines auf YOLOv9 basierenden Objekterkennungstools. Die Ergebnisse dieses Trainings werden anhand eines kleinen realen Datensatzes getestet. Darüber hinaus werden in dieser Arbeit verschiedene Methoden zur Datenanreicherung untersucht, um die Effizienz des Trainings zu verbessern, sowie eine neue Evaluierungsmethode zur besseren Beurteilung der Trainingsergebnisse. Mit rein synthetischen Daten konnte die Präzision von 20% auf 40% und der mAP@0,5-Wert von 10% auf 30% im Vergleich zu einem Basismodell, das mit einem kleinen, öffentlich verfügbaren Graffiti-Datensatz trainiert wurde, gesteigert werden. Als der synthetische Datensatz mit 5566 Bildern um lediglich 128 reale Graffiti-Bilder ergänzt wurde, stiegen sowohl die Präzision als auch der mAP@.5-Wert auf 60%.
Building similarity graph...
Analyzing shared references across papers
Loading...
Ádám Gergelyi
TU Wien
Building similarity graph...
Analyzing shared references across papers
Loading...
Ádám Gergelyi (Sun,) studied this question.
www.synapsesocial.com/papers/69df2c50e4eeef8a2a6b1605 — DOI: https://doi.org/10.34726/hss.2026.135131