Donate to arXiv
Title:Feature Pyramid Networks for Object Detection
Download PDF
Resumé: Funktionspyramider er en grundlæggende komponent i genkendelsessystemer til detektering af objekter i forskellige skalaer. Men nyere deep learning objektdetektorer har undgået pyramiderepræsentationer, bl.a. fordi de er beregnings- og hukommelsesintensive. I denne artikel udnytter vi det iboende multiskala-pyramidehierarki i dybe konvolutionelle netværk til at konstruere funktionspyramider med marginale ekstraomkostninger. Der udvikles en top-down-arkitektur med laterale forbindelser til opbygning af semantiske funktionskort på højt niveau på alle skalaer. Denne arkitektur, kaldet et Feature Pyramid Network (FPN), viser en betydelig forbedring som en generisk feature ekstractor i flere applikationer. Ved at bruge FPN i et grundlæggende Faster R-CNN-system opnår vores metode state-of-the-art-resultater med en enkelt model på COCO-detektionsbenchmark uden klokker og fløjter og overgår alle eksisterende enkeltmodeller, herunder dem fra vinderne af COCO 2016-udfordringen. Desuden kan vores metode køre med 5 FPS på en GPU og er således en praktisk og præcis løsning til objektdetektion i flere skalaer.Koden vil blive gjort offentligt tilgængelig.
Fag: | Computer Vision and Pattern Recognition (cs.CV) | |
Cite as: | arXiv:1612.03144 | |
(eller arXiv:1612.03144v2 for denne version) |
Leave a Reply