Donate to arXiv
Title:Feature Pyramid Networks for Object Detection
Download PDF
Abstract: Feature pyramids are a basic component in recognition systems for detectingobjects at different scales. Jednak ostatnie detektory obiektów oparte na głębokim uczeniu unikają reprezentacji piramid, po części dlatego, że są one obliczeniowo i pamięciowo intensywne. W tym artykule wykorzystujemy naturalną wieloskalową, piramidalną hierarchię głębokich sieci konwolucyjnych do konstruowania piramid cech przy minimalnych kosztach dodatkowych. Opracowana została architektura top-down z połączeniami bocznymi do budowy wysokopoziomowych semantycznych map cech we wszystkich skalach. Architektura ta, zwana Feature Pyramid Network (FPN), wykazuje znaczącą poprawę jako ogólny ekstraktor cech w kilku zastosowaniach. Używając FPN w podstawowym systemie Faster R-CNN, nasza metoda osiąga najnowocześniejsze wyniki pojedynczego modelu w benchmarku wykrywania COCO bez dzwonków i gwizdów, przewyższając wszystkie istniejące wyniki pojedynczego modelu, w tym te od zwycięzców wyzwania COCO 2016. Ponadto, nasza metoda może działać z prędkością 5 FPS na GPU, dzięki czemu jest praktycznym i dokładnym rozwiązaniem do wykrywania obiektów w wielu skalach.Kod zostanie udostępniony publicznie.
Przedmioty: | Computer Vision and Pattern Recognition (cs.CV) |
Cite as: | arXiv:1612.03144 |
(lub arXiv:1612.03144v2 dla tej wersji) |
.
Leave a Reply