Donar para arXiv

Título:Redes Pirâmide de Característica para Detecção de Objetos

Autores:Tsung-Yi Lin, Piotr Dollár, Ross Girshick, Kaiming He, Bharath Hariharan, Serge Belongie

Download PDF

Resumo: As pirâmides de características são um componente básico nos sistemas de reconhecimento para a detecção de objectos em diferentes escalas. Mas os recentes detectores de objetos de aprendizagem profunda têm evitado representações em pirâmide, em parte porque são computacionais e de memória intensiva. Neste artigo, exploramos a inerente pirâmide multi-escala de redes profundas e convolutivas para construir pirâmides de características com custo extra dehmarginal. Uma arquitetura de cima para baixo com conexões laterais é desenvolvida para construir mapas de características semânticas de alto nível em todas as escalas. Esta arquitetura, chamada de Feature Pyramid Network (FPN), mostra um avanço significativo como um extractor de características genéricas em várias aplicações. Utilizando a FPN num sistema Faster R-CNN básico, o nosso método atinge resultados de modelo único no benchmark de detecção COCO sem sinos e assobios, superando todas as entradas de modelo único existentes, incluindo as dos vencedores do desafio COCO 2016. Além disso, nosso método pode ser executado a 5 FPS em uma GPU e, portanto, é uma solução prática e precisa para a detecção de objetos em várias escalas.

Subjetos: Visão Computadorizada e Reconhecimento de Padrões (cs.CV)
Cite as: arXiv:1612.03144
(ou arXiv:1612.03144v2 para esta versão)

Leave a Reply