Donate to arXiv

Title:Feature Pyramid Networks for Object Detection

Authors:Tsung-Yi Lin, Piotr Dollár, Ross Girshick, Kaiming He, Bharath Hariharan, Serge Belongie

Download PDF

Abstract: Feature pyramids are a basic component in recognition systems for detectingobjects at different scales. Jednak ostatnie detektory obiektów oparte na głębokim uczeniu unikają reprezentacji piramid, po części dlatego, że są one obliczeniowo i pamięciowo intensywne. W tym artykule wykorzystujemy naturalną wieloskalową, piramidalną hierarchię głębokich sieci konwolucyjnych do konstruowania piramid cech przy minimalnych kosztach dodatkowych. Opracowana została architektura top-down z połączeniami bocznymi do budowy wysokopoziomowych semantycznych map cech we wszystkich skalach. Architektura ta, zwana Feature Pyramid Network (FPN), wykazuje znaczącą poprawę jako ogólny ekstraktor cech w kilku zastosowaniach. Używając FPN w podstawowym systemie Faster R-CNN, nasza metoda osiąga najnowocześniejsze wyniki pojedynczego modelu w benchmarku wykrywania COCO bez dzwonków i gwizdów, przewyższając wszystkie istniejące wyniki pojedynczego modelu, w tym te od zwycięzców wyzwania COCO 2016. Ponadto, nasza metoda może działać z prędkością 5 FPS na GPU, dzięki czemu jest praktycznym i dokładnym rozwiązaniem do wykrywania obiektów w wielu skalach.Kod zostanie udostępniony publicznie.

Przedmioty: Computer Vision and Pattern Recognition (cs.CV)
Cite as: arXiv:1612.03144
(lub arXiv:1612.03144v2 dla tej wersji)

.

Leave a Reply