Donate to arXiv
Title:Feature Pyramid Networks for Object Detection
Download PDF
Abstract: Feature pyramids are a basic component in recognition systems for detectionobjects at different scales. A legújabb mélytanulásos objektumdetektorok azonban elkerülték a piramisreprezentációkat, részben azért, mert azok számítás- és memóriaigényesek. Ebben a tanulmányban kihasználjuk a mély konvolúciós hálózatokban rejlő több skálájú, piramishierarchiát, hogy a jellemzőpiramisokat minimális többletköltséggel építsük fel. Egy felülről lefelé irányuló, oldalirányú kapcsolatokkal rendelkező architektúrát fejlesztettünk ki a magas szintű szemantikus jellemzőtérképek építéséhez minden skálán. Ez a funkciópiramis-hálózatnak (FPN) nevezett architektúra több alkalmazásban is jelentős javulást mutat általános jellemző-kivonóként. Az FPN egy alapvető Faster R-CNN rendszerben történő alkalmazásával módszerünk a COCO detektálási benchmarkon a legmodernebb egymodelles eredményeket ér el harangok és sípok nélkül, felülmúlva az összes létező egymodelles pályázatot, beleértve aCOCO 2016 kihívás győzteseinek eredményeit is. Ráadásul a módszerünk 5 FPS sebességgel futtatható GPU-n, és így praktikus és pontos megoldást jelent a több skálájú tárgyak észlelésére.A kódot nyilvánosan elérhetővé tesszük.
Témakörök: | Computer Vision and Pattern Recognition (cs.CV) |
Cite as: | arXiv:1612.03144 |
(vagy arXiv:1612.03144v2 ehhez a változathoz) |
Leave a Reply