Donate to arXiv

Title:Feature Pyramid Networks for Object Detection

Authors:Tsung-Yi Lin, Piotr Dollár, Ross Girshick, Kaiming He, Bharath Hariharan, Serge Belongie

Download PDF

Abstract: 特徴ピラミッドは異なるスケールでオブジェクトを検出するための認識システムの基本コンポーネントである。 しかし、最近の深層学習による物体検出では、計算とメモリに負荷がかかるという理由から、ピラミッド表現を避けている。 本論文では、深層畳み込みネットワークに内在するマルチスケール、ピラミッド階層構造を利用し、わずかな追加コストで特徴ピラミッドを構築する。 横方向の接続を持つトップダウンアーキテクチャを開発し、すべてのスケールで高レベルの意味的特徴マップを構築する。 このアーキテクチャは特徴ピラミッドネットワーク(FPN)と呼ばれ、いくつかのアプリケーションにおいて汎用特徴抽出器として著しい改善を示している。 基本的なFaster R-CNNシステムでFPNを使用すると、我々の方法は、ベルと笛なしでCOCO検出ベンチマークで最先端の単一モデルの結果を達成し、COCO 2016チャレンジウィナーからのものを含む既存のすべての単一モデルのエントリーを上回った。 さらに、我々の手法はGPU上で5FPSで実行できるため、マルチスケール物体検出の実用的で正確なソリューションとなります。コードは一般に公開される予定です。

課題: Computer Vision and Pattern Recognition (cs.CV)
Cite as: arXiv:1612.XXX.XXX.XXX.XXX.XXX.XXX.XXX.XXX.XXX.XXX.XXX.XXX.XXX.XXX.03144
(or this version for arXiv:1612.03144v2)

Leave a Reply