Donate to arXiv

Title:Feature Pyramid Networks for Object Detection

Authors:Tsung-Yi Lin, Piotr Dollár, Ross Girshick, Kaiming He, Bharath Hariharan, Serge Belongie

Download PDF

Abstract: Merkmalspyramiden sind eine grundlegende Komponente in Erkennungssystemen zur Erkennung von Objekten in verschiedenen Maßstäben. Jüngste Deep-Learning-Objektdetektoren haben jedoch Pyramidendarstellungen vermieden, zum Teil weil sie rechen- und speicherintensiv sind. In diesem Papier nutzen wir die inhärente Multi-Skala, pyramidalhierarchy von tiefen Faltungsnetzwerken zu konstruieren Funktion Pyramiden mitmarginalen zusätzlichen Kosten. Es wird eine Top-Down-Architektur mit lateralen Verbindungen entwickelt, um hochrangige semantische Merkmalskarten auf allen Skalen zu erstellen. Diese Architektur, die als Feature Pyramid Network (FPN) bezeichnet wird, zeigt eine deutliche Verbesserung als generischer Feature Extractor in verschiedenen Anwendungen. Durch die Verwendung von FPN in einem grundlegenden Faster R-CNN-System erzielt unsere Methode beim COCO-Erkennungsbenchmark ohne Schnickschnack Ergebnisse, die auf dem neuesten Stand der Technik sind, und übertrifft damit alle bestehenden Einzelmodell-Einträge, einschließlich derer der Gewinner der COCO 2016 Challenge. Darüber hinaus kann unsere Methode bei 5 FPS auf einem Grafikprozessor ausgeführt werden und ist somit eine praktische und genaue Lösung für die Erkennung von Objekten in mehreren Größenordnungen.code wird öffentlich zugänglich gemacht werden.

Subjects: Computer Vision and Pattern Recognition (cs.CV)
Cite as: arXiv:1612.03144
(oder arXiv:1612.03144v2 für diese Version)

Leave a Reply