Donner à arXiv

Titre:Réseaux de pyramides de caractéristiques pour la détection d’objets

Auteurs :Tsung-Yi Lin, Piotr Dollár, Ross Girshick, Kaiming He, Bharath Hariharan, Serge Belongie

Télécharger le PDF

Résumé : Les pyramides de caractéristiques sont un composant de base dans les systèmes de reconnaissance pour détecter desobjets à différentes échelles. Mais les récents détecteurs d’objets par apprentissage profond ont évité les représentations pyramidales, en partie parce qu’elles sont gourmandes en calcul et en mémoire. Dans cet article, nous exploitons la hiérarchie pyramidale multi-échelle inhérente aux réseaux convolutifs profonds pour construire des pyramides de caractéristiques avec un coût supplémentaire minime. Une architecture descendante avec des connexions latérales est développée pour construire des cartes de caractéristiques sémantiques de haut niveau à toutes les échelles. Cette architecture, appelée Feature Pyramid Network (FPN), montre une amélioration significative en tant qu’extracteur de caractéristiques génériques dans plusieurs applications. En utilisant le FPN dans un système R-CNN Faster de base, notre méthode obtient des résultats à l’état de l’art sur un seul modèle pour le benchmark de détection COCO sans cloche ni sifflet, surpassant toutes les entrées à modèle unique existantes, y compris celles des gagnants du challenge COCO 2016. En outre, notre méthode peut fonctionner à 5 FPS sur un GPUet constitue donc une solution pratique et précise pour la détection d’objets multi-échelles.Le code sera mis à la disposition du public.

Sujets: Vision par ordinateur et reconnaissance des formes (cs.CV)
Cite as: arXiv:1612.03144
(ou arXiv:1612.03144v2 pour cette version)

.

Leave a Reply