Es ist nicht einfach, den Wert einer Münze allein zu bestimmen, da dies Computer Vision, Deep Learning und Technologien erfordert, die Menschen unterstützen. Das Basismodell ICDRNet ist für die Erkennung indischer Münzen konzipiert und nutzt DenseNet-Feature-Propagation sowie tiefenweise separierbare Faltungen mit CBAM-Attention sowie ein Dilation Enabled Inverse Bottleneck (DEIB)-Modul. Obwohl das System gewichtete F1-Scores von über 97 % auf den Benchmark-Datensätzen IMCD, ICCD, ICDD und CIDCIC erreicht hat, ist es jedoch auf Ein-Münz-Fälle beschränkt und wird durch Münzen vor unruhigen Hintergründen beeinträchtigt. Außerdem begrenzt das Fehlen eines transformerbasierten globalen Kontextmodells die Systemrepräsentation. Um diese Probleme zu mildern, schlagen wir ein hybrides CNN-Transformer Multi-Scale Attention Fusion (MSAF) Framework vor, das YOLO-basierte Münzlokalisierung, adaptive dilatierte Pyramidalkonvolutionen und eine Transformer-Token-Fusionsschicht kombiniert. Diese Strategie zielt darauf ab, die Erkennung mehrerer Münzen zu bewältigen, die Vordergrundisolierung zu verbessern und die Klassifikation in mobiler Assistenztechnologie zu optimieren.
Building similarity graph...
Analyzing shared references across papers
Loading...
Dr. Raja K
A.chandra kanth reddy
Syed Reahan
Building similarity graph...
Analyzing shared references across papers
Loading...
K et al. (Mon,) untersuchten diese Fragestellung.
www.synapsesocial.com/papers/69df2c50e4eeef8a2a6b1523 — DOI: https://doi.org/10.5281/zenodo.19557743
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: