FPN (1/4) 発明の概要

はぐれ弁理士 PA Tora-O です。今回のテーマとして、物体検出の一手法であるFPNを題材に取り上げていきます。

背景

畳み込みニューラルネットワーク(CNN)を導入した物体検出モデルは、[1]One-Stage Detector と、[2]Two-Stage Detector の2種類に大別されます。この2種類の違いは、関心領域(ROI)の提案機能及び物体の検出機能を一度に同時に行うか、あるいは二段階に分けて行うかにあります。後者(Two-Stage)の例として、RPN(Region Proposal Network)と呼ばれるニューラルネットワークを用いてROIの提案を行う Faster R-CNN が知られています。

なお、RPNの詳細については、以下の記事が参考になります。
 Faster R-CNN(3/5)RPNの実施例<前半>
 Faster R-CNN(4/5)RPNの実施例<後半>

問題

ところが、Faster R-CNN では、サイズが大きい物体の検出精度が良好であるものの、サイズが小さい物体の検出精度がそれほど高くないという問題がありました。例えば、COCOデータセットを用いた平均適合率(AP)は、大サイズで約64%であるのに対して、小サイズで約32%にすぎません。

解決手段

そこで、上記した問題を解決すべく、Tsung-Yi Lin 氏らによりFPNFeature Pyramid Networks)が提案されました。FPNの機能ブロック図は、例えば、次の図1に示す通りです。

【図1】FPNの機能ブロック図

実は、図1は、Faster R-CNN のROI設定部を、RPNからFPNに置き換えた機能ブロックを示しています。本論文では、Two-Stage Detectors(Faster R-CNN/Fast R-CNN)に適用した例が示されていますが、FPNは、RetinaNet を含む One-Stage Detectors にも応用可能な技術です。なお、RetinaNet は、次回の事例検討(#025)で取り上げる予定です。

【図2】FPNの導入効果(ベンチマーク)

出展:Feature Pyramid Networks for Object Detection 一部加工

図2に示す通り、FPNの導入によって、中サイズ(APm)と小サイズ(APs)の検出結果が飛躍的に向上しました、特に、小サイズ(APs)では、32%から45%と劇的に改善されました。

 

以上、今回(第1回)は、FPNの概要について説明しました。次回(第2回)は、FPNの実施例について説明します。

↓ブログランキングに参加しています。よろしければ1クリックお願いします。

にほんブログ村 士業ブログ 弁理士へ
にほんブログ村

にほんブログ村 IT技術ブログ IT技術メモへ
にほんブログ村