Donate to arXiv
Title:Feature Pyramid Networks for Object Detection
Ladda ner PDF
Sammanfattning: Funktionspyramider är en grundläggande komponent i igenkänningssystem för att upptäcka objekt i olika skalor. Men nyligen utvecklade objektdetektorer för djupinlärning har undvikit pyramidrepresentationer, delvis på grund av att de är beräknings- och minneskrävande. I den här artikeln utnyttjar vi den inneboende flerskaliga, pyramidala hierarkin i djupa konvolutionella nätverk för att konstruera funktionspyramider med en marginell extrakostnad. En top-down-arkitektur med sidoförbindelser utvecklas för att bygga semantiska funktionskartor på hög nivå i alla skalor. Denna arkitektur, som kallas Feature Pyramid Network (FPN), visar betydande förbättringar som en generisk funktionsextraktor i flera tillämpningar. Genom att använda FPN i ett grundläggande Faster R-CNN-system uppnår vår metod toppmoderna resultat med en enda modell på COCO-detektionsriktmärket utan klockor och floskler, vilket överträffar alla befintliga bidrag med en enda modell, inklusive dem från vinnarna av COCO 2016-utmaningen. Dessutom kan vår metod köras med 5 FPS på en GPU och är därmed en praktisk och exakt lösning för objektdetektering i flera skalor.Koden kommer att göras allmänt tillgänglig.
Ämnen: | Datorseende och mönsterigenkänning (cs.CV) |
Cite as: | arXiv:1612.03144 |
(eller arXiv:1612.03144v2 för denna version) |
Leave a Reply