FPN (3/4) 特許性の検討

はぐれ弁理士 PA Tora-O です。前回(第2回)では、FPNの実施例について説明しました。改めて復習されたい方は、こちらのリンクから確認をお願いします。今回(第3回)は、FPNの特許性について検討します。

 

前回(第2回)では、FPNは、SSDとU-Netを組み合わせた技術であって特許性(進歩性)がないと述べました。しかし、よくよく検討すれば、両者の相違点が浮かび上がってきます。まず、3種類のモデル構造を模式的に表現してみましょう。以下の図1では、スキップ接続(skip-connection)を省略しています。その理由は、スキップ接続が、今回の事例検討における主要な特徴事項ではないからです。

【図1】3種類のモデル比較

ところで、バックボーンネットワーク(Backbone Network;以下、単に「バックボーン」)とは、画像の特徴量を抽出する「抽出器」を意味します。そうすると、バックボーン以降の構造は、抽出器の出力物である「特徴マップ」を用いて物体の推定(回帰または分類)を行う「推定器」に相当します。以下、2つの学習器の機能を区別するため、推定器が段階的または最終的に生成するマップを「推定マップ」と呼ぶことにします。なお、推定マップは、本発明の特徴事項を説明するために本事例中で導入した「造語」です。

図1において、緑色のバーは、推定マップのサイズを示しており、また階層が深いほど色が濃くなっています。SSDの例では、次の順番で処理を実行し、物体のサイズに適した推定結果を得ます。
 [s1]推定マップ(大)を用いて、1番目の推定結果(Out1)を出力し、
 [s2]推定マップ(大)から推定マップ(中)を生成し、
 [s3]推定マップ(中)を用いて、2番目の推定結果(Out2)を出力し、
 [s4]推定マップ(中)から推定マップ(小)を生成し、
 [s5]推定マップ(小)を用いて、3番目の推定結果(Out3)を出力します。

一方、FPNの例では、次の順番で処理を実行します。
 [f0]・・・・(省略)
 [f1]推定マップ(小)を用いて、3番目の推定結果(Out3)を出力し、
 [f2]推定マップ(小)から推定マップ(中)を生成し、
 [f3]推定マップ(中)を用いて、2番目の推定結果(Out2)を出力し、
 [f4]推定マップ(中)から推定マップ(大)を生成し、
 [f5]推定マップ(大)を用いて、1番目の推定結果(Out1)を出力します。

どうやら、この部分が大きく異なりそうです。この関係性を図2に示してみます。

【図2】マップ解像度と階層数の関係

グラフの横軸は、推定マップの画像解像度(ここでは、入力画像との間の相対サイズ)を示しています。一方、グラフの横軸は、推定結果を得るための推定マップの生成に要する階層数を示しています。この図から理解されるように、SSDでは右肩下がりの曲線を描く一方、FPNでは右肩上がりの曲線を描いています。なお、U-Netでは、FPN曲線上の1点をプロットしているにすぎません。

あとは、この傾向を上手に表現すれば、FPNの特許性を謳えそうです。特に、この推定マップは、特徴マップの場合と同様に、画像解像度が高くなるほど小さいサイズの物体を検出しやすくなる、という点を留意すればOKです。

以上、今回(第3回)は、FPNの特許性について検討し、従来技術(SSD/U-Net)と差別化可能な特徴事項を見出しました。テーマ最終回(第4回)は、過去3回分の検討結果を踏まえ、クレーム骨子を含む発明ストーリーを作成してみます。

↓ブログランキングに参加しています。よろしければ1クリックお願いします。

にほんブログ村 士業ブログ 弁理士へ
にほんブログ村

にほんブログ村 IT技術ブログ IT技術メモへ
にほんブログ村