FPN(4/4)総括

はぐれ弁理士 PA Tora-O です。前回(第3回)では、FPNの特許性について検討しました。改めて復習されたい方は、こちらのリンクから確認をお願いします。今回(第4回)は、クレームを含む発明ストーリーを作成し、これまで3回分の検討を総括します。

発明ストーリー

【従来技術】
畳み込みニューラルネットワーク(CNN)を導入した物体検出手法の一例として、R-CNN(Regions with CNN features)、Fast R-CNN、Faster R-CNN などが挙げられる。これらのモデルは、[1]関心領域(ROI;Region Of Interest)の提案機能と、[2]物体の検出機能と、が独立して設けられる点で共通する。
その一方、上記した提案機能および検出機能を1つのネットワークに統合することで、検出処理の高速化を図ろうとするモデルも出現している。例えば、中間的に生成された特徴マップに対して畳み込み演算を行いながら、物体の推定結果を示す推定マップを段階的に出力するSSD(Single Shot MultiBox Detector)が提案されている。

【問題点と課題】
問題点は、SSDでは、物体サイズが小さいほど検出精度が相対的に低下すること。
課題は、サイズが小さい物体の検出精度を向上すること。

【クレーム骨子】(FPN)
 物体を含む画像から特徴マップを生成する生成部と、
 階層型ニューラルネットワークを用いて、生成された特徴マップに対して畳み込み演算または逆畳み込み演算を行いながら、物体の推定結果を示す推定マップを出力する推定部と、
 を備え、
 推定部は、階層が深くなるにつれて空間解像度が次第に高くなるように、複数の推定マップを出力することを特徴とする情報処理装置。(170文字)

【作用効果】
一般的に言えば、階層型ニューラルネットワークでは、畳み込み演算または逆畳み込み演算の回数が増加するにつれて、物体の検出精度が高くなる傾向がある。そこで、階層が深くなるにつれて空間解像度が次第に高くなるように複数の推定マップを出力することで、小サイズの物体の検出により適した、高い空間解像度を有する推定マップであるほど上記した演算の回数が多くなる。これにより、サイズが小さい物体の検出精度が高くなる。

作者コメント

FPNは、通説では、「ピラミッド階層型の特徴量+スキップ接続」が特徴的であると言われていますが、今回の事例検討では、特許的な観点から、通説と若干異なる切り口でFPNの技術的特徴を捉えてみました。

あと、SSDの事例検討でも軽く触れたのですが、CNNの研究トレンドについてもう一度述べておきましょう。

【図】CNNモデルの変遷

CNNの初期モデルでは、特徴量を生成する「ConvNet」と、特徴マップから検出結果を出力する「全結合層(FC)」の二段構成を採用していました。一方、ResNet(厳密には、Residual Block の技術)の登場によって前段ネットワークの深層化手法が概ね確立されると、今度は、後段ネットワークを改良する方向に研究トレンドが遷移していきます。つまり、SSDやFPNの登場を起点として、後段ネットワークのマルチスケール化深層化がさらに進むと理解すればよいでしょう。

 

以上をもちまして、FPNの事例検討を終了します。次回から、また別のテーマに移ります。

↓ブログランキングに参加しています。よろしければ1クリックお願いします。

にほんブログ村 士業ブログ 弁理士へ
にほんブログ村

にほんブログ村 IT技術ブログ IT技術メモへ
にほんブログ村