Les détecteurs d'objets les plus précis à ce jour sont basés sur une approche en deux étapes popularisée par R-CNN, où un classificateur est appliqué à un ensemble épars de localisations candidates d'objets. En revanche, les détecteurs en une étape, appliqués sur un échantillonnage régulier et dense de localisations potentielles d'objets, ont le potentiel d’être plus rapides et plus simples, mais ont jusqu'à présent été moins précis que les détecteurs en deux étapes. Dans cet article, nous examinons pourquoi c’est le cas. Nous découvrons que le déséquilibre extrême entre les classes premier plan et arrière-plan rencontré lors de l'entraînement des détecteurs denses est la cause principale. Nous proposons de traiter ce déséquilibre de classes en remodelant la fonction de perte d'entropie croisée standard de manière à réduire le poids de la perte attribuée aux exemples bien classifiés. Notre nouvelle Perte Focale concentre l’entraînement sur un ensemble clairsemé d’exemples difficiles et empêche le nombre considérable de négatifs faciles d’écraser le détecteur durant l'entraînement. Pour évaluer l’efficacité de notre perte, nous avons conçu et entraîné un détecteur dense simple que nous appelons RetinaNet. Nos résultats montrent que lorsqu'il est entraîné avec la perte focale, RetinaNet peut égaler la vitesse des détecteurs en une étape précédents tout en surpassant la précision de tous les détecteurs en deux étapes à la pointe de la technologie existants.
Building similarity graph...
Analyzing shared references across papers
Loading...
Tsung-Yi Lin
Priya Goyal
Ross Girshick
Meta (Israel)
Building similarity graph...
Analyzing shared references across papers
Loading...
Lin et al. (Sun,) ont étudié cette question.
www.synapsesocial.com/papers/696015fd61a0d350516be86e — DOI: https://doi.org/10.1109/iccv.2017.324
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: