Key points are not available for this paper at this time.
Apresentamos DINO (DETR com Caixas de Âncora de Desruído Aprimoradas), um detector de objetos de ponta a ponta de última geração. DINO melhora em relação aos modelos anteriores do tipo DETR em desempenho e eficiência ao usar um método contrastivo para treinamento de desruído, um método misto de seleção de consultas para inicialização das âncoras e um esquema "look forward twice" para previsão das caixas. DINO alcança 49,4 AP em 12 épocas e 51,3 AP em 24 épocas no COCO com backbone ResNet-50 e recursos em múltiplas escalas, resultando em uma melhoria significativa de +6,0 AP e +2,7 AP, respectivamente, comparado ao DN-DETR, o modelo DETR-like anterior de melhor desempenho. DINO escala bem tanto em tamanho de modelo quanto em tamanho de dados. Sem artifícios, após pré-treinamento no conjunto de dados Objects365 com backbone SwinL, DINO obtém os melhores resultados em COCO val2017 (63,2 AP) e test-dev (63,3 AP). Comparado a outros modelos no ranking, DINO reduz significativamente o tamanho do modelo e o tamanho dos dados de pré-treinamento enquanto alcança melhores resultados. Nosso código estará disponível em https://github.com/IDEACVR/DINO.
Building similarity graph...
Analyzing shared references across papers
Loading...
Hao Zhang
Feng Li
Shilong Liu
Building similarity graph...
Analyzing shared references across papers
Loading...
Zhang et al. (Mon,) estudaram esta questão.
www.synapsesocial.com/papers/6a0155de413f0c047f2d8b7d — DOI: https://doi.org/10.48550/arxiv.2203.03605