Donate to arXiv
Title:Feature Pyramid Networks for Object Detection
Download PDF
Abstract: Le piramidi di caratteristiche sono un componente di base nei sistemi di riconoscimento per il rilevamento di oggetti a diverse scale. Ma i recenti rivelatori di oggetti di deep learning hanno evitato le rappresentazioni piramidali, in parte perché sono computabili e impegnative in termini di memoria. In questo articolo, sfruttiamo la multi-scala inerente, la gerarchia piramidale delle reti convoluzionali profonde per costruire piramidi di caratteristiche con un costo extra marginale. Un’architettura top-down con connessioni laterali è sviluppata per costruire mappe di caratteristiche semantiche di alto livello a tutte le scale. Questa architettura, chiamata Feature Pyramid Network (FPN), mostra significativi miglioramenti come estrattore generico di caratteristiche in diverse applicazioni. Utilizzando FPNin un sistema di base Faster R-CNN, il nostro metodo raggiunge lo stato dell’arte dei risultati del singolo modello sul benchmark di rilevamento COCO senza campane e fischietti, superando tutte le voci esistenti del singolo modello compresi quelli dei vincitori della sfidaCOCO 2016. Inoltre, il nostro metodo può essere eseguito a 5 FPS su una GPU e quindi è una soluzione pratica e accurata per il rilevamento di oggetti su più scale.
Soggetti: | Computer Vision e Pattern Recognition (cs.CV) |
Cita come: | arXiv:1612.03144 |
(o arXiv:1612.03144v2 per questa versione) |
Leave a Reply