Donate to arXiv

Title:Feature Pyramid Networks for Object Detection

Authors:Tsung-Yi Lin, Piotr Dollár, Ross Girshick, Kaiming He, Bharath Hariharan, Serge Belongie

Download PDF

Abstract: Le piramidi di caratteristiche sono un componente di base nei sistemi di riconoscimento per il rilevamento di oggetti a diverse scale. Ma i recenti rivelatori di oggetti di deep learning hanno evitato le rappresentazioni piramidali, in parte perché sono computabili e impegnative in termini di memoria. In questo articolo, sfruttiamo la multi-scala inerente, la gerarchia piramidale delle reti convoluzionali profonde per costruire piramidi di caratteristiche con un costo extra marginale. Un’architettura top-down con connessioni laterali è sviluppata per costruire mappe di caratteristiche semantiche di alto livello a tutte le scale. Questa architettura, chiamata Feature Pyramid Network (FPN), mostra significativi miglioramenti come estrattore generico di caratteristiche in diverse applicazioni. Utilizzando FPNin un sistema di base Faster R-CNN, il nostro metodo raggiunge lo stato dell’arte dei risultati del singolo modello sul benchmark di rilevamento COCO senza campane e fischietti, superando tutte le voci esistenti del singolo modello compresi quelli dei vincitori della sfidaCOCO 2016. Inoltre, il nostro metodo può essere eseguito a 5 FPS su una GPU e quindi è una soluzione pratica e accurata per il rilevamento di oggetti su più scale.

Soggetti: Computer Vision e Pattern Recognition (cs.CV)
Cita come: arXiv:1612.03144
(o arXiv:1612.03144v2 per questa versione)

Leave a Reply