Donate to arXiv

Title:Feature Pyramid Networks for Object Detection

Authors:Tsung-Yi Lin, Piotr Dollár, Ross Girshick, Kaiming He, Bharath Hariharan, Serge Belongie

Ladda ner PDF

Sammanfattning: Funktionspyramider är en grundläggande komponent i igenkänningssystem för att upptäcka objekt i olika skalor. Men nyligen utvecklade objektdetektorer för djupinlärning har undvikit pyramidrepresentationer, delvis på grund av att de är beräknings- och minneskrävande. I den här artikeln utnyttjar vi den inneboende flerskaliga, pyramidala hierarkin i djupa konvolutionella nätverk för att konstruera funktionspyramider med en marginell extrakostnad. En top-down-arkitektur med sidoförbindelser utvecklas för att bygga semantiska funktionskartor på hög nivå i alla skalor. Denna arkitektur, som kallas Feature Pyramid Network (FPN), visar betydande förbättringar som en generisk funktionsextraktor i flera tillämpningar. Genom att använda FPN i ett grundläggande Faster R-CNN-system uppnår vår metod toppmoderna resultat med en enda modell på COCO-detektionsriktmärket utan klockor och floskler, vilket överträffar alla befintliga bidrag med en enda modell, inklusive dem från vinnarna av COCO 2016-utmaningen. Dessutom kan vår metod köras med 5 FPS på en GPU och är därmed en praktisk och exakt lösning för objektdetektering i flera skalor.Koden kommer att göras allmänt tillgänglig.

Ämnen: Datorseende och mönsterigenkänning (cs.CV)
Cite as: arXiv:1612.03144
(eller arXiv:1612.03144v2 för denna version)

Leave a Reply