Donate to arXiv

Title:Feature Pyramid Networks for Object Detection

Authors:Tsung-Yi Lin, Piotr Dollár, Ross Girshick, Kaiming He, Bharath Hariharan, Serge Belongie

Download PDF

Abstract: Feature pyramids are a basic component in recognition systems for detectionobjects at different scales. A legújabb mélytanulásos objektumdetektorok azonban elkerülték a piramisreprezentációkat, részben azért, mert azok számítás- és memóriaigényesek. Ebben a tanulmányban kihasználjuk a mély konvolúciós hálózatokban rejlő több skálájú, piramishierarchiát, hogy a jellemzőpiramisokat minimális többletköltséggel építsük fel. Egy felülről lefelé irányuló, oldalirányú kapcsolatokkal rendelkező architektúrát fejlesztettünk ki a magas szintű szemantikus jellemzőtérképek építéséhez minden skálán. Ez a funkciópiramis-hálózatnak (FPN) nevezett architektúra több alkalmazásban is jelentős javulást mutat általános jellemző-kivonóként. Az FPN egy alapvető Faster R-CNN rendszerben történő alkalmazásával módszerünk a COCO detektálási benchmarkon a legmodernebb egymodelles eredményeket ér el harangok és sípok nélkül, felülmúlva az összes létező egymodelles pályázatot, beleértve aCOCO 2016 kihívás győzteseinek eredményeit is. Ráadásul a módszerünk 5 FPS sebességgel futtatható GPU-n, és így praktikus és pontos megoldást jelent a több skálájú tárgyak észlelésére.A kódot nyilvánosan elérhetővé tesszük.

Témakörök: Computer Vision and Pattern Recognition (cs.CV)
Cite as: arXiv:1612.03144
(vagy arXiv:1612.03144v2 ehhez a változathoz)

Leave a Reply