Donate to arXiv
Title:Feature Pyramid Networks for Object Detection
Download PDF
Abstract: Feature piramides zijn een basiscomponent in herkenningssystemen voor het detecteren vanobjecten op verschillende schalen. Maar recente deep learning objectdetectoren hebben piramide-representaties vermeden, gedeeltelijk omdat ze reken- en geheugenintensief zijn. In dit artikel maken we gebruik van de inherente multi-scale, piramidale hiërarchie van diepe convolutionele netwerken om kenmerkpiramides te construeren met geringe extra kosten. Een top-down architectuur met laterale verbindingen is ontwikkeld voor het bouwen van high-level semantische functie kaarten op alle schalen. Deze architectuur, Feature Pyramid Network (FPN) genoemd, laat een significante verbetering zien als een generieke feature extractor in verschillende toepassingen. Door FPN te gebruiken in een basis Faster R-CNN systeem, behaalt onze methode state-of-the-art single-model resultaten op de COCO detectie benchmark zonder toeters en bellen, en overtreft daarmee alle bestaande single-model inzendingen inclusief die van deCOCO 2016 challenge winnaars. Bovendien kan onze methode draaien op 5 FPS op een GPU en is dus een praktische en nauwkeurige oplossing voor multi-scale objectdetectie.Code zal publiekelijk beschikbaar worden gesteld.
Onderwerpen: | Computer Vision and Pattern Recognition (cs.CV) |
Cite as: | arXiv:1612.03144 |
(of arXiv:1612.03144v2 voor deze versie) |
Leave a Reply