Donate to arXiv
Title:Feature Pyramid Networks for Object Detection
Descargar PDF
Resumen: Las pirámides de características son un componente básico en los sistemas de reconocimiento para detectarobjetos a diferentes escalas. Pero los recientes detectores de objetos de aprendizaje profundo han evitado las representaciones piramidales, en parte porque son intensivas en computación y memoria. En este trabajo, explotamos la jerarquía piramidal inherente a las redes convolucionales profundas para construir pirámides de características con un coste adicional mínimo. Se desarrolla una arquitectura descendente con conexiones laterales para construir mapas de características semánticas de alto nivel a todas las escalas. Esta arquitectura, llamada Feature Pyramid Network (FPN), muestra una mejora significativa como extractor de características genérico en varias aplicaciones. Utilizando la FPN en un sistema básico de R-CNN más rápido, nuestro método logra resultados de un solo modelo en la prueba de detección COCO sin campanas ni silbidos, superando todas las entradas de un solo modelo existentes, incluidas las de los ganadores del desafío COCO 2016. Además, nuestro método puede ejecutarse a 5 FPS en una GPU y, por tanto, es una solución práctica y precisa para la detección de objetos a escala múltiple.El código se pondrá a disposición del público.
Temas: | Visión por ordenador y reconocimiento de patrones (cs.CV) |
Cite as: | arXiv:1612.03144 |
(o arXiv:1612.03144v2 para esta versión) |
Leave a Reply